Principais Modelos de IA Ficaram para Trás em Tarefas Corporativas Rotineiras, Diz a Databricks; Modelos Menores e Especializados Têm Melhor Desempenho

Mensagem do Gate News, 20 de abril — Os principais modelos de IA se destacam ao resolver problemas complexos como matemática de olimpíada, mas têm dificuldade com o trabalho corporativo rotineiro, segundo David Meyer, da Databricks. Alguns modelos podem corrigir um número de fatura incorreto em vez de sinalizá-lo como erro, enquanto ferramentas de codificação como Claude também podem ficar aquém em tarefas de engenharia de dados.

A lacuna se origina de diferenças fundamentais entre os dados corporativos e o texto público da web usado para treinar modelos grandes. Os dados corporativos frequentemente têm rótulos de colunas pouco claros, muitos campos em branco e códigos armazenados como texto simples. Em um estudo acadêmico, a pontuação F1 de um modelo de IA, que equilibra precisão e recall, caiu de 0,94 em dados públicos para 0,07 em dados corporativos para uma tarefa de engenharia de dados. Além disso, modelos grandes tendem a voltar a padrões familiares do treinamento; alguns voltaram a Structured Query Language (SQL) mesmo depois de receber instruções e documentação para a linguagem proprietária de consultas de uma empresa.

Modelos menores de código aberto, ajustados com aprendizado por reforço, conseguem lidar com tarefas específicas de forma mais eficiente e com custos de treinamento significativamente menores do que modelos gerais grandes. A Databricks está construindo agentes de IA menores para fluxos de trabalho específicos, como KARL, que usa aprendizado por reforço para raciocínio em múltiplas etapas com documentos da empresa. A indústria está mudando da dependência de modelos gigantes para arquiteturas híbridas, em que modelos pequenos e eficientes lidam com o volume rotineiro e, então, escalam apenas casos pouco claros ou complexos para sistemas maiores e mais caros.

A Databricks adquiriu recentemente a Quotient AI para ajudar grandes empresas a executar agentes de IA com mais confiabilidade. A competição no negócio de IA agora se concentra em executar todo o ciclo de vida da IA, incluindo sistemas de feedback para rastrear erros e melhorar continuamente os modelos ao longo do tempo, tornando ferramentas de avaliação e ajuste cada vez mais valiosas após a implantação.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Parceiros da AWS Coinbase e Stripe para pagamentos em USDC por agentes de IA

A Amazon Web Services anunciou na quinta-feira uma parceria com Coinbase e Stripe para permitir que agentes de inteligência artificial executem transações usando stablecoins, marcando uma integração significativa da infraestrutura de pagamentos baseada em blockchain por um grande provedor de nuvem. A AWS revelou o “Amazon Bedrock Ag

CryptoFrontier4h atrás

CZ diz que a YZi Labs aloca 70% para blockchain e 20% para IA na Consensus Miami 2026

De acordo com o ChainCatcher, na Consensus Miami 2026, Zhao Changpeng (CZ) afirmou que a YZi Labs destina 70% do financiamento à blockchain, 20% à IA e 10% à biotecnologia. CZ acrescentou que a BNB deve ser posicionada como uma moeda nativa para agentes de IA, e que todas as blockchains precisam estar “prontas para IA” para suportar

GateNews5h atrás

A Zypher Network integra a AIDEN para melhorar a acessibilidade ao conhecimento sobre blockchain

De acordo com o anúncio oficial da IQ AI em 6 de maio, a Zypher Network integrou a AIDEN, um agente de inteligência artificial desenvolvido pela IQ AI, para melhorar a acessibilidade do conhecimento sobre blockchain e fortalecer a auditabilidade dentro de ecossistemas alimentados por IA. A colaboração apresenta uma página wiki dedicada

GateNews5h atrás

Virtuals Protocol lança o airdrop OpenGradient Titan, distribuindo 500 mil OPG hoje

De acordo com o anúncio oficial do Virtuals Protocol, o lançamento do airdrop OpenGradient Titan já está ao vivo a partir de 7 de maio. Usuários elegíveis podem reivindicar tokens OPG diretamente em suas contas do Virtuals. Um total de 500.000 tokens OPG está sendo distribuído hoje para recompensar os colaboradores do Virtuals

GateNews9h atrás

A NVIDIA lança o Nemotron 3 Nano Omni open source multimodal

A NVIDIA anunciou o Nemotron 3 Nano Omni, um modelo multimodal de código aberto, integrando visão, voz e linguagem em um único modelo, como camada de percepção para agentes de IA. O núcleo é o MoE 30B-A3B, com context 256K e 9x de taxa de transferência (throughput), com suporte a entradas de texto, imagem, áudio e vídeo, entre outras, e saída em texto. Em conjunto com o Nemotron 3 Super/Ultra, é voltado para cenários como operação de computador, inteligência de documentos e compreensão audio-visual, além de disponibilizar pesos e dados de treinamento, com implantação cobrindo o ambiente local, o NIM e plataformas de terceiros.

ChainNewsAbmedia10h atrás

NeoSoul e AllScale anunciam parceria estratégica em crédito de agentes e liquidação de stablecoin hoje

De acordo com a ChainCatcher, o projeto NeoSoul da AI Agent Economy anunciou hoje (7 de maio) uma parceria estratégica com a AllScale para explorar mecanismos de formação de crédito e liquidação com stablecoins para a colaboração autônoma entre agentes. A parceria vai se concentrar em automatizar os fluxos de pagamento entre Agentes—tais

GateNews10h atrás
Comentário
0/400
Sem comentários