Ramp Labs 提出多智能体记忆共享新方案,Token 消耗最高降低 65%

GateNews

Gate News 消息,4 月 11 日,AI 基础设施公司 Ramp Labs 发布研究成果「Latent Briefing」,通过直接压缩大模型 KV 缓存实现多智能体系统间的高效记忆共享,在不损失准确率的前提下大幅降低 Token 消耗。在主流多智能体架构中,编排者(Orchestrator)将任务拆解并反复调用工作者(Worker)模型,随着推理链路不断延伸,Token 用量呈指数级膨胀。Latent Briefing 的核心思路是借助注意力机制识别上下文中真正关键的部分,在表示层直接丢弃冗余信息,而非依赖速度慢的 LLM 摘要或稳定性差的 RAG 检索。在 LongBench v2 基准测试中,该方法表现亮眼:Worker 模型 Token 消耗降低 65%,中等长度文档(32k 至 100k)的 Token 节省中位数达 49%,整体准确率较基线提升约 3 个百分点,而每次压缩的额外耗时仅约 1.7 秒,较原始算法提速约 20 倍。实验以 Claude Sonnet 4 作为编排者、Qwen3-14B 作为工作者模型,覆盖学术论文、法律文书、小说及政府报告等多类文档场景。研究还发现,最优压缩阈值因任务难度和文档长度而异——难题适合激进压缩以过滤投机性推理噪声,长文档则更适合轻度压缩以保留分散的关键信息。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

FIS 和 Anthropic 开发用于反洗钱的 AI 代理,并将在 2026 年下半年向 BMO 和 Amalgamated Bank 推出

FIS 和 Anthropic 正在开发旨在自动化金融犯罪调查的 AI 代理,从反洗钱行动开始。金融犯罪 AI 代理将从银行系统中提取数据,将交易与已知作案手法进行评估,并协助调查人员审查 al

GateNews1 分钟前

Prime Intellect Lab 在 5 月 7 日推出全面可用,并在测试版中完成 10,000+ 次训练运行

根据 Prime Intellect,该公司 的 Lab 平台于 2026 年 5 月 7 日退出测试版,迁移到全面可用,作为用于自我改进型 AI 代理的端到端训练环境。统一管道整合了模型改进工作流,使用户能够定义任务,配置

GateNews32 分钟前

Cloudflare 在 2026 年共识大会(Consensus 2026)每天触发 10 亿次 HTTP 402 响应,并与 Visa 和 Experian 一同推出代理信任框架

据 Foresight News 报道,Cloudflare 首席安全官 Stephanie Cohen 在 2026 年 Consensus 上宣布,该平台每天触发约 10 亿次 HTTP 402 响应,反映了 AI 代理对付费访问网页内容的需求。该公司与 Visa 和 Experian 一同发布了 Agent Trust

GateNews2小时前

里德·霍夫曼:AI 代理将需要加密信任系统

雷德·霍夫曼,Greylock 合伙人以及 LinkedIn 联合创始人表示,自主代理将需要基于加密货币的信任系统,才能在开放互联网中进行交易,这意味着这一发展可能会为 NFT 的回归铺平道路。 霍夫曼的表述将自主代理的出现与

Crypto Frontier4小时前

B.AI 在 5 月 7 日用户数突破 170 万,并推出奖励计划

据 B.AI 称,AI 基础设施平台在 5 月 7 日用户数突破 170 万。该平台聚焦隐私保护和代理经济基础设施,向新用户注册即提供 50 万个免费积分,并在所有模型上实行零加价定价,同时推出限时 1:1,

GateNews5小时前

a16z 第五期推出 22 亿美元加密基金,领投三家 AI 新创公司

根据 a16z(Andreessen Horowitz)于 5 月 5 日公告,该风险投资机构正式推出第五期加密货币专属基金“Crypto Fund 5”,募资规模达 22 亿美元。同期,a16z 宣布领投企业 AI 整合公司 Tessera Labs、AI 招聘平台 Ethos 及 AI 创作平台 Glif 融资。

Market Whisper5小时前
评论
0/400
暂无评论