Meituan запускає відкритий тест трильйонної моделі з підтримкою внутрішніх обчислювальних кластерів

24 квітня галузеві джерела повідомили, що базова модель наступного покоління Meituan, LongCat-2.0-Preview, відкрилася для тестування, перевищивши загальний масштаб параметрів у один трильйон, що ставить її серед провідних великих моделей у світі. За словами інсайдерів, DeepSeek також випустила свою модель V4 наступного покоління у той самий день, яка має загальну кількість параметрів і активних параметрів, що в значній мірі відповідають LongCat-2.0-Preview від Meituan. Окрім масштабу параметрів, значним проривом нової базової моделі Meituan є те, що її навчання та інференція цілком підтримуються вітчизняними обчислювальними кластерами. Джерела зазначили, що кількість обчислювальних карт, використаних під час цього етапу навчання, коливалася між 50 000 і 60 000, що є найбільшим завершеним завданням з навчання великих моделей на вітчизняних обчислювальних ресурсах на сьогоднішній день. (Джерело: Jiemian)

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити