Повідомлення Gate News, 27 квітня — команда Xiaomi MiMo оприлюднила з відкритим кодом серію MiMo-V2.5 великих мовних моделей під ліцензією MIT, що підтримує комерційне розгортання, подальше навчання та доопрацювання. Обидві моделі мають контекстне вікно розміром 1 мільйон токенів. MiMo-V2.5-Pro — це модель суміші експертів із чистим текстом (MoE) з 1,02 трильйонами загальних параметрів і 42 мільярдами активних параметрів, тоді як MiMo-V2.5 — нативна мультимодальна модель із 310 мільярдами загальних параметрів і 15 мільярдами активних параметрів, що підтримує розуміння тексту, зображень, відео та аудіо.
MiMo-V2.5-Pro орієнтована на складні агентні та програмістські задачі. У бенчмарках ClawEval вона досягла 64% Pass@3, споживаючи приблизно 70 000 токенів на траєкторію задачі — на 40%–60% менше токенів, ніж Claude Opus, Gemini 3.1 Pro та GPT-5.4. Модель набрала 78,9 на SWE-bench Verified. У демонстрації V2.5-Pro самостійно реалізувала повний компілятор SysY-to-RISC-V для проєкту курсу компіляторів Пекінського університету за 4,3 години, використавши 672 виклики інструментів, і досягла ідеального результату 233/233 на прихованих тестових наборах.
MiMo-V2.5 призначена для сценаріїв мультимодальних агентів, оснащена виділеним візуальним енкодером (729 мільйонів параметрів) та аудіоенкодером (261 мільйон параметрів), набравши 62,3 на Claw-Eval загальному піднаборі. Обидві моделі використовують гібридну архітектуру, що поєднує sliding window attention (SWA) та глобальну увагу (GA), разом із модулем 3-шарової багатотокенної передбачуваності (MTP) для прискореного виведення. Ваги моделі доступні на Hugging Face.
Поряд із випуском із відкритим кодом команда MiMo запустила «Orbit Quadrillion Token Creator Incentive Program», пропонуючи 100 квадрильйонів токенів безкоштовно протягом 30 днів для користувачів у всьому світі. Окремі розробники, команди та підприємства можуть подати заявку через сторінку програми, з циклом оцінювання приблизно 3 робочих дні; схвалені переваги розподіляються як Token Plans або прямі кредити, сумісні з інструментами на кшталт Claude Code та Cursor.
Пов'язані статті
CZ заявив, що YZi Labs виділяє 70% на блокчейн і 20% на ШІ на Consensus Miami 2026
Публічна компанія придбала AI-інвестиційну платформу Treasury App, щоб розширити криптовалютну торгівлю
Blitzy завершила раунд фінансування $200M під керівництвом Northzone
ЄС забороняє порнографію з дипфейками, створеними за допомогою ШІ, 7 травня
Tether випускає медичну AI-модель QVAC MedPsy та досягає оцінки 62,62 на версії з 17 млрд параметрів
B.AI запускає чотири нові моделі, зокрема GPT-5.5 Instant, протягом 48 годин після релізу OpenAI