Ramp Labs пропонує нове рішення для спільного використання пам’яті між багатьма агентами, витрати токенів знижуються максимум на 65%

GateNews

Оновлення Gate News: 11 квітня компанія з інфраструктури для AI Ramp Labs опублікувала результати дослідження «Latent Briefing». Вона забезпечує ефективний обмін пам’яттю між багатосистемними агентами шляхом прямого стиснення KV-кешу великих мовних моделей, значно зменшуючи витрати на Token без втрати точності. У більшості поширених архітектур багатосистемних агентів оркестратор (Orchestrator) розкладає завдання на частини та неодноразово викликає модель робітника (Worker). У міру того, як ланцюжок міркувань постійно подовжується, обсяг Token стрімко зростає експоненційно. Ключова ідея Latent Briefing полягає в тому, щоб за допомогою механізму уваги визначити в контексті справді важливі фрагменти, а в шарі представлення прямо відкидати надлишкову інформацію, а не покладатися на повільні LLM-зведення або ненадійний RAG-пошук. У бенчмарку LongBench v2 цей підхід показав вражаючі результати: витрати Token у моделі Worker знизилися на 65%, а медіанна економія Token для документів середньої довжини (32k до 100k) досягла 49%. Загальна точність підвищилася приблизно на 3 відсоткові пункти порівняно з базовим рівнем, тоді як додатковий час на кожне стиснення становить лише близько 1,7 секунди, що прискорює роботу приблизно у 20 разів порівняно з початковим алгоритмом. Експерименти проводилися з Claude Sonnet 4 як оркестратором і Qwen3-14B як моделлю робітника, охоплюючи сценарії з документами різних типів, зокрема наукові статті, юридичні документи, романи та урядові звіти. Дослідження також виявило, що оптимальний поріг стиснення залежить від складності завдання та довжини документа: для складних задач підходить більш агресивне стиснення, щоб відфільтрувати шум спекулятивного міркування, а для довгих документів краще підходить м’яке стиснення, щоб зберегти розосереджену ключову інформацію.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Cloudflare запускає щодня 1 мільярд HTTP-відповідей 402 у Consensus 2026 та випускає фреймворк довіри агентів з Visa і Experian

Згідно з Foresight News, техдиректорка Cloudflare (CSO) Стефані Коен оголосила на Consensus 2026, що платформа генерує приблизно 1 мільярд HTTP 402-відповідей щодня, відображаючи попит AI-агентів на платний доступ до вебконтенту. Компанія разом із Visa та Experian представила Agent Trust

GateNews39хв. тому

Рейд Гоффман: AI-агентам знадобляться криптовалютні довірчі системи

Рейд Гофман, партнер Greylock і співзасновник LinkedIn, заявив, що автономним агентам знадобляться криптографічні системи довіри, щоб здійснювати транзакції через відкритий інтернет, припускаючи, що цей розвиток може дати шанс на повернення NFT. Заява Гофмана пов’язує появу автономних агентів із

CryptoFrontier2год тому

B.AI перевищує 1,7 мільйона користувачів станом на 7 травня та запускає програму винагород

За даними B.AI, платформа інфраструктури ШІ перевищила 1,7 мільйона користувачів 7 травня. Платформа, яка фокусується на захисті приватності та інфраструктурі agent economy, надає новим користувачам 500 тис. безкоштовних кредитів після реєстрації, ціновий націн без надбавок для всіх моделей і обмежену в часі 1:1

GateNews2год тому

a16z запустив 5-й раунд криптофонду на 2,2 мільярда доларів, очоливши інвестиції в три нові AI-компанії

Згідно з повідомленням a16z (Andreessen Horowitz) від 5 травня, венчурна інвестиційна компанія офіційно запустила п’ятий спеціалізований криптовалютний фонд «Crypto Fund 5», обсяг залучення коштів — 2,2 мільярда доларів. У той самий період a16z оголосила про участь у раунді як провідного інвестора в AI-інтеграційну компанію Tessera Labs, платформу для AI-найму Ethos та AI-креативну платформу Glif.

MarketWhisper3год тому

Засновник Cardano: AI-агенти перевершать активність людського інтернету до 2035 року, порушивши моделі, засновані на рекламі

За даними CoinDesk, засновник Cardano Чарльз Госкінсон на конференції Consensus 7 травня спрогнозував, що AI-агенти перевершать людську активність у пошукових запитах в інтернеті, комерції та транзакціях до 2035 року. Оскільки AI-агенти не клікають рекламу і не виявляють уподобань до брендів, Госкінсон сказав це в

GateNews6год тому

Керівник Claude Code Борис: AI-агенти підвищують людську продуктивність, переписують історію розробки програмного забезпечення

Керівник Claude Code Борис Черни в інтерв’ю CNBC зазначив, що інструменти для AI-агентів на кшталт Co-Work можуть передавати AI рутинні завдання, а інженер з оператора перетворюється на наставника. Це дає змогу одночасно запускати кілька агентів для виконання дебагу й суттєво підвищує продуктивність. Компаніям потрібно перебудувати процеси, зробивши AI центральним елементом. AI вже демонструє цінність у всіх сферах діяльності: розробка ПЗ переходить від написання коду до спільної роботи, де логіка та діалог підказують напрям. Технічні пороги знижуються, а інновації та стартапи почнуть зростати вибуховими темпами.

ChainNewsAbmedia7год тому
Прокоментувати
0/400
Немає коментарів