Модель Ling-2.6-flash від Ant Group відкрито у вихідному коді: 104B параметрів із 7,4B активними, досягає кількох орієнтирів SOTA

Повідомлення Gate News, 29 квітня — вагові коефіцієнти моделі Ling-2.6-flash від Ant Group тепер відкрито у вихідному коді, раніше вони були доступні лише через API. Модель має 104 мільярди загальних параметрів із 7,4 мільярда активованих на кожен запит, вікно контексту 256K і ліцензію MIT. Доступні версії точності BF16, FP8 та INT4 на HuggingFace і ModelScope.

Ling-2.6-flash упроваджує вдосконалення гібридної лінійної уваги поверх Ling 2.0, оновлюючи початкову GQA до архітектури 1:7 MLA плюс Lightning Linear у поєднанні з дуже розрідженою MoE. Ефективність інференсу значно перевищує показники зіставних моделей: пікова швидкість генерації досягає 340 токенів/с на 4x GPU H20, а пропускна здатність prefill і decode приблизно в 4 рази вища, ніж у зіставних відкритих моделей. Бенчмарки, пов’язані з агентами, демонструють сильну продуктивність: BFCL-V4, TAU2-bench, SWE-bench Verified (61.2%), Claw-Eval і PinchBench досягають або наближаються до рівня SOTA. У всьому комплексі бенчмарків Artificial Analysis загальне споживання токенів становить лише 15 мільйонів. На AIME 2026 модель набрала 73,85%.

Офіційний вебсайт Ant Group також вказує флагманську версію Ling-2.6-1T (з трильйоном параметрів) і полегшену версію Ling-2.6-mini (lightweight version), однак станом на момент публікації їхні вагові коефіцієнти залишаються нерозміщеними на HuggingFace, доступним для завантаження є лише серія flash.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

OpenAI відкликає сертифікат підписання для macOS завтра, 8 травня, вимикаючи застарілі застосунки

За даними Beating, сертифікат підпису macOS від OpenAI буде відкликано 8 травня, через що застарілі версії ChatGPT Desktop, Codex, Codex CLI та Atlas стануть непрацездатними й не зможуть отримувати оновлення. Користувачам із версіями Mac слід оновитися негайно через вбудовані оновлення або завантаживши з Ope

GateNews13хв. тому

Chrome таємно встановив і видалив 4 ГБ ШІ, а потім перевстановив; дослідник заявив про порушення європейського закону про конфіденційність

За повідомленням Decrypt від 7 травня, Google Chrome без отримання згоди користувача непомітно завантажив приблизно 4 ГБ AI-моделі Gemini Nano на пристрої, які підпадають під певні умови. Дослідник приватності Александр Ханфф під час автоматизованого аудиту налаштувань нових профілів користувачів виявив цю дію та зазначив, що вона може порушувати європейську Директиву ЄС про електронну приватність.

MarketWhisper25хв. тому

Судові документи показують, що Алтман у листопаді 2023 року запропонував придбання Microsoft, щоб зберегти посаду CEO

Згідно з матеріалами судових подань, оприлюдненими 7 травня, документи у справі Musk проти Altman розкрили текстові повідомлення між Семом Альтманом і тодішньою CTO Мірою Мураті від 19 листопада 2023 року, коли рада OpenAI раптово усунула Альтмана з посади CEO. Під час кризи Альтман запропонував, щоб Microsoft придбала OpenAI, щоб

GateNews29хв. тому

Крупна CEX додає передбіржову торгівлю SpaceX, OpenAI та Anthropic

За повідомленнями, провідна централізована біржа сьогодні (7 травня) запустила торгові пари SPACEX/USDT, OPENAI/USDT та ANTHROPIC/USDT у рамках Pre-IPO. Платформа підтримує торгівлю з кредитним плечем на цих інструментах.

GateNews37хв. тому

Cloudflare запускає щодня 1 мільярд HTTP-відповідей 402 у Consensus 2026 та випускає фреймворк довіри агентів з Visa і Experian

Згідно з Foresight News, техдиректорка Cloudflare (CSO) Стефані Коен оголосила на Consensus 2026, що платформа генерує приблизно 1 мільярд HTTP 402-відповідей щодня, відображаючи попит AI-агентів на платний доступ до вебконтенту. Компанія разом із Visa та Experian представила Agent Trust

GateNews53хв. тому
Прокоментувати
0/400
Немає коментарів