Alibaba lança modelo AgenticQwen em open-source: versão 8B aproxima desempenho de 235B através de dual data flywheels

GateNews

Mensagem da Gate News, 27 de abril — A equipa PAI da Alibaba lançou e disponibilizou em open-source o AgenticQwen, um modelo de linguagem agentico de pequena escala concebido para aplicações industriais de tool-calling. O modelo existe em duas versões: 8B e 30B-A3B. Treinado através de um inovador framework de aprendizagem por reforço “dual data flywheel”, o AgenticQwen atinge capacidades agenticas a nível de modelos próximas de um trilião de parâmetros, reduzindo significativamente os custos de inferência.

O mecanismo dual data flywheel resolve o problema de homogeneização em dados sintéticos tradicionais. O reasoning flywheel gera automaticamente variantes mais difíceis a partir de erros do modelo, enquanto o agentic flywheel expande workflows lineares simples (como processos de reserva única) para comportamento em árvores com múltiplos ramos com restrições, rejeições e condições adversariais, simulando cenários reais complexos de tomada de decisão. Os benchmarks mostram que o AgenticQwen-8B obteve 47,4 em benchmarks de ambientes reais de ferramentas (TAU-2 e BFCL-V4), muito acima do Qwen3-8B base (23,8) e aproximando o Qwen3-235B (52,0). O AgenticQwen-30B-A3B (com apenas 3B parâmetros ativados) obteve 50,2.

O modelo foi implementado em sistemas de produção internos semelhantes ao Manus, reduzindo significativamente a distância face aos modelos de 235B no tempo de inferência ponta a ponta. No entanto, o modelo é limitado por um comprimento de contexto nativo de 40K tokens, o que condiciona o desempenho em tarefas de pesquisa profunda.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

CZ diz que a YZi Labs aloca 70% para a blockchain e 20% para a IA no Consensus Miami 2026

De acordo com a ChainCatcher, na Consensus Miami 2026, Zhao Changpeng (CZ) afirmou que a YZi Labs atribui 70% do financiamento a blockchain, 20% a IA e 10% a biotecnologia. CZ acrescentou que a BNB deve ser posicionada como uma moeda nativa para agentes de IA, e que todas as blockchains precisam de estar “prontas para IA” para suportar

GateNews47m atrás

A Zypher Network integra a AIDEN para melhorar a acessibilidade do conhecimento sobre blockchain

De acordo com o anúncio oficial da IQ AI a 6 de maio, a Zypher Network integrou a AIDEN, um agente de inteligência artificial desenvolvido pela IQ AI, para melhorar a acessibilidade ao conhecimento sobre blockchain e reforçar a auditabilidade em ecossistemas potenciados por IA. A colaboração apresenta uma página wiki dedicada

GateNews49m atrás

O Virtuals Protocol lança o OpenGradient Titan Airdrop, distribuindo 500 mil OPG hoje

De acordo com o anúncio oficial do Virtuals Protocol, o airdrop do OpenGradient Titan Launch já está ativo a partir de 7 de maio. Os utilizadores elegíveis podem reclamar tokens OPG diretamente a partir das suas contas no Virtuals. No total, estão a ser distribuídos hoje 500 mil tokens OPG para recompensar os contribuidores do Virtuals

GateNews4h atrás

A NVIDIA lançou o Nemotron 3 Nano Omni, uma solução de multimodalidade de código aberto

A NVIDIA divulga o Nemotron 3 Nano Omni, um modelo multimodal aberto, integrando visão, voz e linguagem num único modelo, como camada de perceção para agentes de IA. O núcleo é um MoE 30B-A3B, com context 256K e capacidade de processamento 9x, suportando entradas como texto, imagens, áudio e vídeos, com saídas em texto. Em colaboração com os Nemotron 3 Super/Ultra, é aplicável a cenários como operação de computadores, inteligência documental e compreensão de áudio e vídeo, e também disponibiliza pesos e dados de treino, com uma implementação que abrange o local, NIM e plataformas de terceiros.

ChainNewsAbmedia5h atrás

A NeoSoul e a AllScale Anunciam uma Parceria Estratégica em Crédito de Agentes e Liquidação de Stablecoins Hoje

De acordo com a ChainCatcher, o projecto NeoSoul da AI Agent Economy anunciou hoje (7 de maio) uma parceria estratégica com a AllScale para explorar mecanismos de criação de crédito e de liquidação em stablecoin para a colaboração autónoma de agentes. A parceria irá centrar-se na automatização dos fluxos de pagamento entre os agentes—tal

GateNews5h atrás

A FIS e a Anthropic desenvolvem agentes de IA para combater a lavagem de dinheiro, com implementação no BMO e no Amalgamated Bank no 2.º semestre de 2026

A FIS e a Anthropic estão a desenvolver agentes de IA concebidos para automatizar investigações de crimes financeiros, começando pelas operações de combate à lavagem de dinheiro. O Agente de IA para Crimes Financeiros irá recolher dados de sistemas bancários, avaliar transacções face a tipologias conhecidas e ajudar os investigadores na análise de al

GateNews7h atrás
Comentar
0/400
Nenhum comentário