Os principais modelos de IA ficam aquém em tarefas empresariais rotineiras, diz a Databricks: modelos especializados e mais pequenos superam

Mensagem do Gate News, 20 de abril — Os principais modelos de IA destacam-se na resolução de problemas complexos, como a matemática das olimpíadas, mas têm dificuldades com o trabalho empresarial rotineiro, de acordo com David Meyer da Databricks. Alguns modelos podem corrigir um número de factura incorrecto em vez de o sinalizarem como erro, enquanto ferramentas de programação como a Claude também podem ter desempenho inferior em tarefas de engenharia de dados.

A lacuna resulta de diferenças fundamentais entre os dados empresariais e o texto público da web usado para treinar grandes modelos. Os dados empresariais têm frequentemente rótulos de colunas pouco claros, inúmeras campos em branco e códigos armazenados como texto simples. Num estudo académico, a pontuação F1 de um modelo de IA, que equilibra precisão e recall, caiu de 0.94 em dados públicos para 0.07 em dados empresariais para uma tarefa de engenharia de dados. Além disso, grandes modelos tendem a recorrer por defeito a padrões familiares do treino; alguns deram como resposta Structured Query Language (SQL) mesmo depois de receber instruções e documentação para a linguagem proprietária de consultas de uma empresa.

Modelos de código aberto mais pequenos, ajustados com aprendizagem por reforço, conseguem lidar com tarefas específicas com mais eficiência e a custos de treino significativamente inferiores do que modelos gerais maiores. A Databricks está a construir agentes de IA mais pequenos para fluxos de trabalho específicos, como o KARL, que usa aprendizagem por reforço para raciocínio multi-etapas com documentos da empresa. A indústria está a passar da dependência de modelos gigantes para arquitecturas híbridas, em que modelos pequenos e eficientes tratam o volume rotineiro e, só depois, elevam apenas os casos pouco claros ou complexos para sistemas maiores e mais dispendiosos.

A Databricks adquiriu recentemente a Quotient AI para ajudar grandes empresas a executar agentes de IA com mais fiabilidade. A concorrência no negócio de IA centra-se agora em gerir todo o ciclo de vida da IA, incluindo sistemas de feedback para monitorizar erros e melhorar continuamente os modelos ao longo do tempo, tornando ferramentas de avaliação e afinação cada vez mais valiosas após a implementação.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

A NVIDIA lançou o Nemotron 3 Nano Omni, uma solução de multimodalidade de código aberto

A NVIDIA divulga o Nemotron 3 Nano Omni, um modelo multimodal aberto, integrando visão, voz e linguagem num único modelo, como camada de perceção para agentes de IA. O núcleo é um MoE 30B-A3B, com context 256K e capacidade de processamento 9x, suportando entradas como texto, imagens, áudio e vídeos, com saídas em texto. Em colaboração com os Nemotron 3 Super/Ultra, é aplicável a cenários como operação de computadores, inteligência documental e compreensão de áudio e vídeo, e também disponibiliza pesos e dados de treino, com uma implementação que abrange o local, NIM e plataformas de terceiros.

ChainNewsAbmedia20m atrás

A NeoSoul e a AllScale Anunciam uma Parceria Estratégica em Crédito de Agentes e Liquidação de Stablecoins Hoje

De acordo com a ChainCatcher, o projecto NeoSoul da AI Agent Economy anunciou hoje (7 de maio) uma parceria estratégica com a AllScale para explorar mecanismos de criação de crédito e de liquidação em stablecoin para a colaboração autónoma de agentes. A parceria irá centrar-se na automatização dos fluxos de pagamento entre os agentes—tal

GateNews1h atrás

A FIS e a Anthropic desenvolvem agentes de IA para combater a lavagem de dinheiro, com implementação no BMO e no Amalgamated Bank no 2.º semestre de 2026

A FIS e a Anthropic estão a desenvolver agentes de IA concebidos para automatizar investigações de crimes financeiros, começando pelas operações de combate à lavagem de dinheiro. O Agente de IA para Crimes Financeiros irá recolher dados de sistemas bancários, avaliar transacções face a tipologias conhecidas e ajudar os investigadores na análise de al

GateNews2h atrás

A Prime Intellect Lab lança a disponibilidade geral a 7 de Maio, concluindo mais de 10.000 execuções de treino na fase beta

De acordo com a Prime Intellect, a plataforma Lab da empresa saiu da fase beta a 7 de maio de 2026, passando para disponibilidade geral como um ambiente de treino ponta a ponta para agentes de IA autoaperfeiçoados. O pipeline unificado consolida fluxos de trabalho de melhoria de modelos, permitindo aos utilizadores definir tarefas, configurar

GateNews2h atrás

A Cloudflare despoleta 1 mil milhões de respostas HTTP 402 diárias no Consensus 2026 e lança o Agent Trust Framework com a Visa e a Experian

De acordo com a Foresight News, a gestora executiva de tecnologia (CSO) da Cloudflare, Stephanie Cohen, anunciou no Consensus 2026 que a plataforma desencadeia aproximadamente mil milhões de respostas HTTP 402 por dia, reflectindo a procura dos agentes de IA por acesso pago ao conteúdo web. A empresa, juntamente com a Visa e a Experian, apresentou o Agent Trust

GateNews5h atrás

Reid Hoffman: Os agentes de IA vão precisar de sistemas de confiança em cripto

Reid Hoffman, parceiro da Greylock e cofundador do LinkedIn, afirmou que os agentes autónomos vão precisar de sistemas de confiança baseados em cripto para transaccionar através da internet aberta, sugerindo que este desenvolvimento poderá permitir um regresso dos NFTs. A declaração de Hoffman liga o surgimento de agentes autónomos ao

CryptoFrontier6h atrás
Comentar
0/400
Nenhum comentário