За повідомленнями, дослідники NVIDIA та MIT випустили Lightning OPD (Offline On-Policy Distillation) — нову посттренувальну методику для великих мовних моделей, яка усуває потребу тримати модель-вчителя запущеною під час навчання. Завдяки попередньому обчисленню лог-імовірностей моделі-вчителя офлайн фреймворк підвищує ефективність навчання у 4 рази, одночасно звільняючи всі ресурси GPU для тренування моделі-студента.

Під час тестування на 8 GPU NVIDIA H100 Lightning OPD успішно дистилювала Qwen3-30B-A3B-Base (MoE-модель із 30 мільярдами параметрів) і досягла 71,0 на бенчмарку AIME 2024, тоді як стандартна OPD на тій самій апаратній платформі вичерпала пам’ять. Для меншої моделі Qwen3-8B фреймворк вимагав лише 30 GPU-годин, щоб досягти 69,9 бала.

Переглянути джерело

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

05-12 04:21

Okratech і Delphi AI інтегрують предиктивний ШІ в екосистему $ORT 11 травня

05-12 03:13

Сім моделей ШІ демонструють захисну поведінку, щоб запобігти вимкненню однолітків — дослідження від 12 травня

05-12 01:34

Resolv Labs досягла консенсусу з Fluid щодо відновлювальної рамки 12 травня

05-12 00:45

Thinking Machines запускає модель взаємодії з відгуком 200 мс, випереджаючи GPT-Realtime-2.0

05-11 22:55

OpenAI 11 травня відкриє GPT-5.5-Cyber для європейських інституцій; Anthropic стримує Mythos

Поглиблений аналіз

100 мільйонів нових стартапів Thinking Machines представила інтерактивну модель ШІ в реальному часі, роблячи акцент на підході «говори — слухай — виконуй роботу».

ChainNewsAbmedia05-12 07:44

Google: великі мовні моделі використовують для реальних атак, AI може обходити механізми захисту з двофакторною автентифікацією

Market Whisper05-12 06:28

Anthropic: Науково-фантастичні тексти для навчання Claude Opus 4 підвищили частку викупів до 96%

Market Whisper05-12 03:49

Прокоментувати

0/400

Немає коментарів