Ramp Labs выдвигает новое решение для совместного использования памяти мультиагентами, при этом расход токенов снижается максимум на 65%

Новости Gate News: 11 апреля компания по инфраструктуре ИИ Ramp Labs опубликовала результаты исследования «Latent Briefing». Они достигаются за счет прямого сжатия KV-кэша больших языковых моделей для эффективного обмена памятью между многоагентными системами — при этом точность не снижается, а потребление токенов существенно уменьшается. В большинстве распространенных архитектур многоагентных систем оркестратор (Orchestrator) разбивает задачу и многократно вызывает модели рабочих (Worker). По мере того как цепочка рассуждений постоянно удлиняется, количество токенов растет экспоненциально. Ключевая идея Latent Briefing — использовать механизм внимания, чтобы выявлять в контексте действительно важные части, а на уровне представлений напрямую отбрасывать избыточную информацию, а не полагаться на LLM-сводки, которые работают медленно, или на RAG-поиск, который отличается нестабильностью. На бенчмарке LongBench v2 этот подход показал впечатляющие результаты: потребление токенов у модели Worker снизилось на 65%, для документов средней длины (от 32k до 100k) медианный объем сэкономленных токенов составил 49%, общая точность относительно базовой линии выросла примерно на 3 процентных пункта, при этом дополнительное время на каждое сжатие — лишь около 1,7 секунды, что ускоряет исходный алгоритм примерно в 20 раз. Эксперименты проводились с Claude Sonnet 4 в роли оркестратора и Qwen3-14B в роли модели рабочего, охватывая разнообразные сценарии документов, включая научные статьи, юридические документы, романы и правительственные отчеты. Исследование также выявило, что оптимальные пороги сжатия зависят от сложности задачи и длины документа: для сложных задач подходит более агрессивное сжатие, чтобы отфильтровать спекулятивный шум рассуждений, а для длинных документов лучше применять более легкое сжатие, чтобы сохранить разрозненные ключевые сведения.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Основатель Cardano: AI-агенты превзойдут активность людей в интернете к 2035 году, нарушив модели, основанные на рекламе

По данным CoinDesk, основатель Cardano Чарльз Хоскинсон на конференции Consensus 7 мая спрогнозировал, что AI-агенты к 2035 году превзойдут человеческую активность в интернет-поиске, коммерции и транзакциях. Поскольку AI-агенты не кликают по рекламе и не демонстрируют предпочтений к брендам, Хоскинсон сказал это w

GateNews10м назад

Руководитель Claude Code Борис: ИИ-агенты повышают производительность людей и переписывают историю разработки программного обеспечения

Руководитель Claude Code Борис Черны в интервью CNBC отметил, что инструменты для AI-агентов, такие как Co-Work, могут передавать ИИ рутинные задачи, а инженеры из операторов превращаются в наставников; это позволяет одновременно запускать несколько агентов для отладки, заметно повышая производительность. Компании должны перестроить процессы, рассматривая AI как центральное звено; AI демонстрирует ценность во всех отраслях. Разработка ПО сместится от написания к совместной работе, где логика и диалог задают направление, технический порог снизится, а инновации и стартапы начнут расти взрывными темпами.

ChainNewsAbmedia55м назад

Рид Хоффман: NFT могут вернуться, поскольку AI-агентам нужен криптодоверие

Рид Хоффман, партнер в Greylock и сооснователь LinkedIn, заявил, что автономным агентам понадобятся основанные на криптографии системы доверия, чтобы проводить сделки через открытый интернет, предположив, что NFT могут вернуться, об этом говорится в его заявлении. AI-агенты и инфраструктура доверия Замечания Хоффмана указывают на потенциальное

CryptoFrontier2ч назад

IBM расширяет набор корпоративных AI-инструментов с новыми агентными решениями на Think 2026

По данным IBM, компания объявила о расширении своих корпоративных возможностей ИИ на конференции Think 2026 в Бостоне, запуская новые агентные инструменты, чтобы помочь организациям внедрять искусственный интеллект в повседневные операции. Context Studio, теперь доступный в общем пользовании, позволяет предприятиям

GateNews3ч назад

Мечты Claude от Anthropic: агент сам упорядочивает память между задачами, устраняет дубликаты и противоречия

Anthropic на мероприятии Code with Claude объявила Dreams: чтобы Claude Managed Agents автоматически систематизировали воспоминания, устраняли дубликаты и противоречия между несколькими сессиями, а также обновляли устаревшие записи, выводя проверяемую сводную базу воспоминаний; входной лимит — 100 сессий и 4 096 символов, асинхронное выполнение, занимает от нескольких минут до нескольких десятков минут, поддерживает наблюдение в режиме стриминга. Исследовательский превью-тест нужно подать отдельно; пока что доступна только поддержка claude-opus-4-7 и claude-sonnet-4-6, дата официального релиза не определена.

ChainNewsAbmedia6ч назад

Cloudflare в партнёрстве со Stripe запускает автономные агенты: ИИ может создавать аккаунты, покупать домены и разворачивать приложения

Cloudflare и Stripe 30 апреля совместно запустили новый протокол, позволяющий AI-агентам без участия человека самостоятельно создавать аккаунты Cloudflare, оформлять подписки на платные планы, регистрировать домены, получать API-токены и напрямую развертывать приложения. Официальный блог Cloudflare поясняет, что весь процесс от начала до конца не требует выхода людей в админку, копирования-вставки токена или ввода данных кредитной карты; пользователю нужно лишь заранее дать разрешения и принять условия использования Cloudflare. На этой неделе данное объявление на Hacker News набрало 548 баллов и стало одной из знаковых новостей о инфраструктуре для автономного выполнения задач AI-агентами. Трёхуровневая архитектура протокола: обнаружение сервисов, авторизация личности, платежное токенизирование Cloudflare-Stripe

ChainNewsAbmedia6ч назад
комментарий
0/400
Нет комментариев