A série MiMo-V2.5 da Xiaomi vai para o código aberto: 1T de parâmetros com eficiência de token superior vs GPT-5.4

Mensagem do Gate News, 27 de abril — A equipe MiMo da Xiaomi disponibilizou em código aberto a série de modelos de linguagem de grande porte MiMo-V2.5 sob licença MIT, com suporte a implantação comercial, treinamento contínuo e ajuste fino. Ambos os modelos apresentam uma janela de contexto de 1 milhão de tokens. O MiMo-V2.5-Pro é um modelo de especialistas mistos de texto puro (MoE) com 1,02 trilhão de parâmetros totais e 42 bilhões de parâmetros ativos, enquanto o MiMo-V2.5 é um modelo multimodal nativo com 310 bilhões de parâmetros totais e 15 bilhões de parâmetros ativos, com suporte à compreensão de texto, imagem, vídeo e áudio.

O MiMo-V2.5-Pro mira tarefas complexas de agentes e de programação. Nos benchmarks ClawEval, ele obteve 64% de Pass@3 consumindo aproximadamente 70.000 tokens por trajetória de tarefa — 40% a 60% menos tokens do que Claude Opus, Gemini 3.1 Pro e GPT-5.4. O modelo obteve 78,9 no SWE-bench Verified. Em uma demonstração, o V2.5-Pro implementou de forma independente um compilador completo de SysY para RISC-V para um projeto de curso do compilador da Universidade de Pequim em 4,3 horas, com 672 chamadas de ferramenta, alcançando uma pontuação perfeita de 233/233 em conjuntos de testes ocultos.

O MiMo-V2.5 foi projetado para cenários de agentes multimodais, equipado com um codificador de visão dedicado (729 milhões de parâmetros) e um codificador de áudio (261 milhões de parâmetros), com pontuação 62,3 no subconjunto geral Claw-Eval. Ambos os modelos empregam uma arquitetura híbrida que combina atenção por janela deslizante (SWA) e atenção global (GA), acompanhada por um módulo de predição de múltiplos tokens em 3 camadas (MTP) para inferência acelerada. Os pesos do modelo estão disponíveis no Hugging Face.

Junto ao lançamento de código aberto, a equipe MiMo lançou o “Orbit Quadrillion Token Creator Incentive Program”, oferecendo 100 quadrilhões de tokens gratuitos ao longo de 30 dias para usuários globais. Desenvolvedores individuais, equipes e empresas podem se inscrever via a página do programa, com um ciclo de avaliação de aproximadamente 3 dias úteis; os benefícios aprovados são distribuídos como Token Plans ou créditos diretos, compatíveis com ferramentas como Claude Code e Cursor.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

CoreWeave supera as estimativas de receita do 1º trimestre com US$ 2,08 bilhões, ação sobe 3%

De acordo com a Reuters, a CoreWeave reportou receita no primeiro trimestre de US$ 2,08 bilhões em 7 de maio, superando a estimativa média dos analistas de US$ 1,97 bilhões. A forte demanda por computação de alto desempenho usada para treinar e executar modelos de IA impulsionou o crescimento da provedora de nuvem. As ações da empresa subiram 3% nas negociações estendidas

GateNews13m atrás

A OpenAI muda o modelo padrão do ChatGPT para o GPT-5.5 instantâneo, reduz alucinações em 52,5%

De acordo com a OpenAI, a empresa mudou o modelo padrão do ChatGPT para GPT-5.5 Instant em 8 de maio. Em testes internos, o modelo gerou 52,5% menos afirmações alucinatórias do que o GPT-5.3 Instant em prompts de alto risco, enquanto reduziu em 37,3% as afirmações imprecisas em conversas sinalizadas pelos usuários por erro factual.

GateNews23m atrás

CEO da Nvidia, Huang: A infraestrutura de IA de próxima geração exige conexões ópticas extensas; cobre é insuficiente em 8 de maio

De acordo com a BlockBeats, em 8 de maio, o CEO da Nvidia, Jensen Huang, afirmou que a infraestrutura de IA de próxima geração exigirá extensas conexões ópticas, já que o cobre não consegue atender às crescentes demandas computacionais. Huang elogiou a nova parceria da Nvidia com a Corning, chamando-a de uma oportunidade importante

GateNews28m atrás

A Cloudflare demite mais de 1.100 funcionários (20% da força de trabalho) para migrar para operações orientadas por IA

De acordo com a Reuters, a Cloudflare demitiu mais de 1.100 funcionários, o que representa aproximadamente 20% de sua força de trabalho, em 8 de maio, para reestruturar as operações em torno de ferramentas de IA. O CEO Matthew Prince afirmou que a empresa está redesenhando todas as equipes e funções para se adaptar a uma era de IA agentic, destacando o uso interno de IA

GateNews41m atrás

O Google Lança o Fitbit Air por US$ 99,99; o rastreador sem tela se torna o hub do Gemini Health Coach em 26 de maio

De acordo com Beating, a Google lançou o Fitbit Air, um rastreador de saúde sem tela, com preço de US$ 99,99, com previsão de envio para 26 de maio. O dispositivo pesa apenas 5,2 gramas e conta com uma bateria de 7 dias, com capacidade de recarga rápida de 5 minutos. Os sensores rastreiam a frequência cardíaca 24 horas, detecção de fibrilação atrial, oxigênio no sangue, h

GateNews43m atrás

OpenAI lança três modelos de voz na API em tempo real; GPT-Realtime-2 oferece janela de contexto de 128K

Segundo Beating, a OpenAI lançou três modelos de voz na sua Realtime API: GPT-Realtime-2 para conversas por voz com raciocínio, GPT-Realtime-Translate para tradução em tempo real e GPT-Realtime-Whisper para transcrição em streaming. O GPT-Realtime-2 é o primeiro modelo de voz da OpenAI com nível de GPT-5-level de re

GateNews59m atrás
Comentário
0/400
Sem comentários