Топові AI-моделі відстають у рутинних корпоративних задачах, заявляє Databricks: менші спеціалізовані моделі випереджають

Повідомлення Gate News, 20 квітня — Топові AI-моделі чудово розв’язують складні задачі, як-от олімпіадну математику, але важко справляються з рутинною роботою в корпораціях, за словами Девіда Мейєра з Databricks. Деякі моделі можуть виправити неправильний номер рахунка-фактури замість того, щоб позначити це як помилку, тоді як інструменти для програмування на кшталт Claude також можуть програвати на завданнях із data engineering.

Розрив пояснюється принциповими відмінностями між корпоративними даними та публічними текстами вебу, які використовують для навчання великих моделей. Корпоративні дані часто мають розпливчасті назви стовпців, багато порожніх полів і коди, збережені як звичайний текст. В одному академічному дослідженні F1-показник AI-моделі, який поєднує точність і повноту, знизився з 0.94 на публічних даних до 0.07 на корпоративних даних для завдання з data engineering. Крім того, великі моделі, як правило, за замовчуванням спираються на знайомі патерни з тренувань; деякі, як (Structured Query Language), за замовчуванням використовували навіть після отримання інструкцій і документації щодо власної мови запитів компанії.

Менші відкриті моделі з підлаштуванням за допомогою reinforcement learning можуть ефективніше виконувати конкретні роботи за значно нижчі витрати на навчання, ніж великі універсальні моделі. Databricks будує менші AI-агенти для конкретних робочих процесів, зокрема KARL, який використовує reinforcement learning для багатокрокового міркування з документами компанії. Індустрія переходить від опори на гігантські моделі до гібридних архітектур, де малі ефективні моделі обробляють рутинний обсяг, а потім ескалюють лише неясні або складні випадки до більших, дорожчих систем.

Нещодавно Databricks придбала Quotient AI, щоб допомогти великим підприємствам запускати AI-агенти більш надійно. Конкуренція в AI-бізнесі тепер зосереджується на проходженні повного AI-циклу, включно з системами зворотного зв’язку для відстеження помилок і безперервного поліпшення моделей з часом, тож інструменти для оцінювання й налаштування стають дедалі ціннішими після розгортання.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Партнери AWS Coinbase, Stripe для платежів у USDC від AI-агентів

Amazon Web Services оголосила в четвер про партнерство з Coinbase і Stripe, щоб надати агентам штучного інтелекту можливість виконувати транзакції за допомогою стейблкоїнів, що стало значною інтеграцією блокчейн-інфраструктури для платежів від великого хмарного провайдера. AWS представила «Amazon Bedrock Ag

CryptoFrontier3год тому

CZ заявив, що YZi Labs виділяє 70% на блокчейн і 20% на ШІ на Consensus Miami 2026

За даними ChainCatcher, на Consensus Miami 2026 Чжао Чанпэн (CZ) заявив, що YZi Labs спрямовує 70% фінансування на блокчейн, 20% на AI і 10% на біотехнології. CZ додав, що BNB має бути позиціонована як нативна валюта для AI-агентів, а всі блокчейни мають бути «AI-ready», щоб підтримувати

GateNews4год тому

Zypher Network інтегрує AIDEN, щоб покращити доступність знань про блокчейн

Згідно з офіційним оголошенням IQ AI від 6 травня, Zypher Network інтегрувала AIDEN — агент штучного інтелекту, розроблений IQ AI — щоб покращити доступність знань про блокчейн і посилити аудитоздатність у екосистемах, керованих ШІ. Співпраця додає виділену вікі-сторінку

GateNews4год тому

Virtuals Protocol запускає airdrop OpenGradient Titan, сьогодні розподілить 500 тис. OPG

Згідно з офіційним оголошенням Virtuals Protocol, OpenGradient Titan Launch airdrop уже запущено — станом на 7 травня. Користувачі, які мають право на участь, можуть отримати токени OPG безпосередньо зі своїх акаунтів у Virtuals. Сьогодні розподіляють 500 тисяч токенів OPG, щоб винагородити учасників у Virtuals

GateNews8год тому

NVIDIA представила Nemotron 3 Nano Omni — відкриту мультимодальну модель

NVIDIA опублікувала відкритий вихідний код багатомодального моделі Nemotron 3 Nano Omni: вона об’єднує візуальне сприйняття, мовлення та мову в межах єдиної моделі як сенсорний шар для AI-агентів. Її ядро — 30B-A3B MoE, 256K context, 9x пропускної здатності. Модель підтримує вхідні дані у вигляді тексту, зображень, аудіо та відео тощо, а виходом є текст. У поєднанні з Nemotron 3 Super/Ultra вона застосовна для сценаріїв на кшталт керування комп’ютером, інтелекту з документами та розуміння аудіовізуального контенту; також оприлюднено ваги та навчальні дані, а розгортання охоплює локальні середовища, NIM і сторонні платформи.

ChainNewsAbmedia8год тому

NeoSoul і AllScale оголошують стратегічне партнерство щодо агентського кредитування та розрахунків у стейблкоїнах сьогодні

За даними ChainCatcher, проєкт NeoSoul в екосистемі AI Agent Economy сьогодні (7 травня) оголосив про стратегічне партнерство з AllScale, щоб вивчити механізми формування кредиту та розрахунків зі стейблкоїнами для автономної співпраці агентів. Партнерство буде зосереджене на автоматизації платіжних потоків між агентами—таке

GateNews9год тому
Прокоментувати
0/400
Немає коментарів