Modelo Ling-2.6-flash da Ant Group disponibilizado como código aberto: 104B de parâmetros com 7,4B ativos, alcança múltiplos benchmarks SOTA

Mensagem do Gate News, 29 de abril — Os pesos do modelo flash Ling-2.6 da Ant Group agora foram disponibilizados como código aberto, após anteriormente estarem disponíveis apenas via API. O modelo tem 104 bilhões de parâmetros no total, com 7,4 bilhões ativados por inferência, uma janela de contexto de 256K e licenciamento MIT. Versões de precisão BF16, FP8 e INT4 estão disponíveis no HuggingFace e no ModelScope.

O Ling-2.6-flash introduz melhorias híbridas de atenção linear sobre o Ling 2.0, atualizando o GQA original para uma arquitetura híbrida 1:7 MLA mais Lightning Linear, combinada com MoE altamente esparso. A eficiência da inferência excede significativamente a de modelos comparáveis: a velocidade máxima de geração chega a 340 tokens/s em 4 GPUs H20, com throughput de prefill e decode aproximadamente 4x maior do que em modelos comparáveis de código aberto. Benchmarks relacionados a agentes mostram forte desempenho: BFCL-V4, TAU2-bench, SWE-bench Verified (61.2%), Claw-Eval e PinchBench atingem ou se aproximam de níveis SOTA. Em toda a suíte de benchmarks do Artificial Analysis, o consumo total de tokens é de apenas 15 milhões. No AIME 2026, o modelo marcou 73,85%.

O site oficial da Ant Group também lista a versão carro-chefe Ling-2.6-1T (trilion-parameter) e a versão leve Ling-2.6-mini (lightweight version), embora, até a publicação, seus pesos permaneçam não lançados no HuggingFace, com apenas a série flash disponível para download.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

A OpenAI revoga o certificado de assinatura do macOS amanhã, 8 de maio, desativando aplicativos desatualizados

De acordo com Beating, o certificado de assinatura do macOS da OpenAI será revogado em 8 de maio, tornando versões desatualizadas do ChatGPT Desktop, Codex, Codex CLI e Atlas inoperáveis e incapazes de receber atualizações. Os usuários com versões do Mac devem atualizar imediatamente por meio de atualizações no aplicativo ou fazendo download a partir do Ope

GateNews4m atrás

Chrome 偷裝 4GB de IA, apaga e reinstala; pesquisador diz que viola leis de privacidade da UE

De acordo com a Decrypt em 7 de maio, o Google Chrome baixou silenciosamente, sem obter o consentimento do usuário, cerca de 4 GB do modelo de IA Gemini Nano em dispositivos que se enquadravam nos critérios. O pesquisador de privacidade Alexander Hanff identificou a ação ao realizar uma auditoria automatizada de perfis de novos usuários, indicando que isso pode violar a Diretiva de Privacidade Eletrônica da União Europeia.

MarketWhisper16m atrás

Documentos judiciais mostram que Altman propôs a aquisição da Microsoft para manter o cargo de CEO em novembro de 2023

De acordo com documentos judiciais divulgados em 7 de maio, os documentos do caso Musk v. Altman revelaram mensagens de texto entre Sam Altman e a então CTO Mira Murati de 19 de novembro de 2023, quando o conselho da OpenAI removeu, de repente, Altman do cargo de CEO. Durante a crise, Altman propôs que a Microsoft adquirisse a OpenAI para

GateNews20m atrás

Maior CEX adiciona negociação pré-IPO da SpaceX, OpenAI e Anthropic

De acordo com reportagens, uma exchange centralizada líder lançou hoje (7 de maio) os pares de negociação SPACEX/USDT, OPENAI/USDT e ANTHROPIC/USDT para pré-IPO. A plataforma oferece negociação com alavancagem nesses instrumentos.

GateNews28m atrás

A Cloudflare dispara 1 bilhão de respostas HTTP 402 por dia no Consensus 2026 e lança o Framework de Confiança de Agentes com a Visa e a Experian

De acordo com a Foresight News, a diretora de tecnologia (CSO) da Cloudflare, Stephanie Cohen, anunciou na Consensus 2026 que a plataforma gera aproximadamente 1 bilhão de respostas HTTP 402 por dia, refletindo a demanda dos agentes de IA por acesso pago ao conteúdo da web. A empresa, junto com Visa e Experian, apresentou o Agent Trust

GateNews44m atrás

Parlamento de Singapura se compromete com crescimento sem desemprego na era da IA após um debate de 7 horas

De acordo com a CNA, o Parlamento de Singapura, em 6 de maio, aprovou por unanimidade uma moção que pede crescimento inclusivo durante a transição para a IA após mais de sete horas de debate envolvendo 24 MPs, incluindo sete do Partido dos Trabalhadores. A moção, apresentada pelo líder trabalhista Ng Chee Meng e mais três outros

GateNews1h atrás
Comentário
0/400
Sem comentários