La série MiMo-V2.5 de Xiaomi passe en open source : 1 000 milliards de paramètres avec une efficacité en jetons supérieure à GPT-5.4

Message de Gate News, le 27 avril — L’équipe MiMo de Xiaomi a publié en open source la série de modèles de langage MiMo-V2.5 sous licence MIT, prenant en charge le déploiement commercial, l’entraînement continu et l’affinage. Les deux modèles présentent une fenêtre de contexte de 1 million de jetons. MiMo-V2.5-Pro est un modèle mélange d’experts pure-texte (MoE) avec 1,02 trillion de paramètres au total et 42 milliards de paramètres actifs, tandis que MiMo-V2.5 est un modèle natif multimodal avec 310 milliards de paramètres au total et 15 milliards de paramètres actifs, prenant en charge la compréhension du texte, de l’image, de la vidéo et de l’audio.

MiMo-V2.5-Pro vise des tâches d’agents complexes et de programmation. Sur les benchmarks ClawEval, il a obtenu 64% de Pass@3 tout en consommant environ 70 000 jetons par trajectoire de tâche — 40% à 60% de jetons en moins que Claude Opus, Gemini 3.1 Pro et GPT-5.4. Le modèle a obtenu 78,9 sur SWE-bench Verified. Lors d’une démonstration, V2.5-Pro a implémenté indépendamment un compilateur complet SysY-to-RISC-V pour un projet de cours du compilateur de l’Université de Pékin en 4,3 heures avec 672 appels d’outils, atteignant un score parfait de 233/233 sur des jeux de tests cachés.

MiMo-V2.5 est conçu pour des scénarios d’agents multimodaux, doté d’un encodeur visuel dédié (729 millions de paramètres) et d’un encodeur audio (261 millions de paramètres), obtenant 62,3 sur le sous-ensemble général Claw-Eval. Les deux modèles emploient une architecture hybride combinant l’attention à fenêtre glissante (SWA) et l’attention globale (GA), associée à un module de prédiction multi-jetons à 3 couches (MTP) pour une inférence accélérée. Les poids du modèle sont disponibles sur Hugging Face.

En plus de la publication open source, l’équipe MiMo a lancé le « Orbit Quadrillion Token Creator Incentive Program », offrant 100 quadrillions de jetons gratuitement sur 30 jours aux utilisateurs du monde entier. Les développeurs individuels, les équipes et les entreprises peuvent postuler via la page du programme, avec un cycle d’évaluation d’environ 3 jours ouvrés ; les avantages approuvés sont distribués sous forme de Token Plans ou de crédits directs, compatibles avec des outils comme Claude Code et Cursor.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

CZ déclare que YZi Labs alloue 70 % à la blockchain et 20 % à l’IA lors de Consensus Miami 2026

D’après ChainCatcher, lors de Consensus Miami 2026, Zhao Changpeng (CZ) a déclaré que YZi Labs alloue 70 % de ses financements à la blockchain, 20 % à l’IA et 10 % à la biotechnologie. CZ a ajouté que BNB devrait être positionné comme une monnaie native pour les agents IA, et que toutes les blockchains doivent être « prêtes pour l’IA » afin de soutenir

GateNewsIl y a 4h

Le public acquiert l’application Treasury d’une plateforme d’investissement en IA pour développer le trading crypto

D’après ChainCatcher, Public a annoncé l’acquisition de la plateforme de services d’investissement en IA Treasury App afin de renforcer son activité de courtage axée sur l’IA. Le montant de l’acquisition n’a pas été divulgué. Public prend actuellement en charge le trading d’actions, d’obligations et de cryptomonnaies, notamment Bitcoin, Ethereum, un

GateNewsIl y a 6h

Blitzy finalise le tour de financement $200M mené par Northzone

D'après ChainCatcher, Blitzy, une société de codage par IA cofondée par l’ancien architecte de Nvidia Sid Pardeshi, a achevé un tour de financement de 200 millions de dollars mené par Northzone. Battery Ventures, Jump Capital et Morgan Creek Digital ont participé à ce tour. La plateforme peut analyser des systèmes complexes avec

GateNewsIl y a 6h

L’UE interdit la pornographie deepfake générée par IA le 7 mai

Selon l'agence de presse Xinhua, le 7 mai, des membres du Parlement européen et des États membres sont parvenus à un accord pour interdire aux systèmes d'intelligence artificielle de générer du contenu pornographique deepfake. L'interdiction sera intégrée aux amendements de la loi de 2024 sur l'intelligence artificielle. Parlement européen

GateNewsIl y a 7h

Tether publie le modèle d’IA médicale MedPsy QVAC, atteignant un score de 62,62 sur la version de 17 milliards de paramètres

D'après Odaily, le groupe de recherche en IA de Tether a publié QVAC MedPsy, un modèle d'IA médicale conçu pour fonctionner localement sur des smartphones et des appareils portables sans dépendance au cloud. La version de 1,7 milliard de paramètres a obtenu 62,62 sur sept références médicales, surpassant MedGemma-1.5-4B de Google de 11,42 poi

GateNewsIl y a 7h

Lancement de l’API B.AI avec quatre nouveaux modèles, dont GPT-5.5 Instant, dans les 48 heures suivant la sortie de OpenAI

L’API de B.AI a lancé quatre nouveaux modèles : GPT-5.5 Instant, DeepSeek-v3.2, MiniMax-M2.7 et GLM-5.1. GPT-5.5 Instant a terminé l’adaptation sous-jacente et l’intégration de l’interface dans les 48 heures suivant la sortie d’OpenAI, permettant un accès sans délai à

GateNewsIl y a 7h
Commentaire
0/400
Aucun commentaire