Ramp Labs がマルチエージェントの記憶共有の新しい仕組みを提案、Token 消費が最大 65% 低下

ゲートニュース、4月11日、AI基盤インフラ企業のRamp Labsが研究成果「Latent Briefing」を発表し、直接的に大規模モデルのKVキャッシュを圧縮することでマルチエージェントシステム間の効率的な記憶共有を実現した。精度を損なうことなくToken消費を大幅に削減する。主流のマルチエージェントアーキテクチャでは、オーケストレーター(Orchestrator)がタスクを分解し、ワーカー(Worker)モデルを繰り返し呼び出すことで、推論の連鎖が伸びるにつれてTokenの使用量が指数関数的に膨張する。Latent Briefingの中核となる発想は、注意機構を用いて文脈の中で本当に重要な部分を識別し、表現層で冗長情報を直接破棄することであり、速度が遅いLLMの要約や安定性が低いRAG検索に依存しないことにある。LongBench v2のベンチマークテストでは、この手法は目覚ましい成績を示した。WorkerモデルのToken消費は65%低下し、中程度の長さのドキュメント(32kから100k)におけるToken節約の中央値は49%に達した。全体の精度はベースラインから約3ポイント向上し、さらに毎回の圧縮に伴う追加所要時間は約1.7秒と、元のアルゴリズムに比べて約20倍高速化した。実験では、編成者としてClaude Sonnet 4、作業者モデルとしてQwen3-14Bを使用し、学術論文、法律文書、小説、政府報告など多様なドキュメントシナリオをカバーした。研究ではまた、最適な圧縮しきい値はタスクの難度と文書の長さによって異なることが判明した。難題には、投機的な推論ノイズをフィルタリングするために攻めた圧縮が適しており、長文書には、分散した重要情報を保持するために軽めの圧縮がより適している。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

イーサリアム共同創業者ルービン:AIは暗号資産の重要な転換点になるが、テック大手の独占はシステム上のリスクをもたらす

イーサリアムの共同創業者ジョセフ・ルービンは、暗号資産分野におけるAIの変革的な可能性を強調する一方、ハイテク大手による中央集権化のリスクに注意を促しました。彼はブロックチェーン上でAI主導の自律的な取引が行われることを想定しており、従来の金融とDeFiの収束を指摘しています。

GateNews7時間前

Luffaがデジタル資産プラットフォームと提携し、AIによる暗号取引を統合

LuffaはWeb3のソーシャルエコシステムで、デジタル資産の取引プラットフォームと提携し、AI駆動の取引機能を統合することで、分散化とリスク低減を維持しつつ、統一されたインターフェース内での安全なコミュニケーションと取引を強化します。

GateNews15時間前

AI自動販売エージェント「Valerie」はOpenClawでサンフランシスコの自動販売機を運用しています

AIエージェント「Valerie」は、OpenClaw上でサンフランシスコの自動販売機を今稼働しており、価格設定、マーケティング、そして現実世界の現金まで含めて、人々がどこまでコードを信頼するのかを試しています。 要約 AIエージェント「Valerie」は、OpenClawフレームワークを使ってサンフランシスコで実際の自動販売機を運用し、価格を設定し、名称を付けて

Cryptonews04-17 15:06

Mastercard、LobstercashおよびCrossmintとの提携でAIエージェント決済を可能に

MastercardはLobstercashおよびCrossmintと提携し、既存のクレジットカードおよびデビットカードを通じてAIエージェントの決済を可能にし、新しいウォレットは必要なく現在の金融システムに統合します。この提携により、AIが取引を自動化し、効率とセキュリティを向上させます。

GateNews04-17 10:11

中国チーム EvoMap が怒り爆発、爆発的に話題になった Hermes Agent の盗用:自律進化システムには高い類似性が存在

中国のチームEvoMapは、Nous ResearchのHermes Agentが自社のEvolver/GEPアーキテクチャを盗用していると非難しており、両者が複数の重要なモジュールで非常に類似していると考えています。EvoMapによれば、Hermesの設計は自分たちが以前に公開した内容を参照せず、また謝意も示していないとのことで、論争が起きたことによりコミュニティの注目が広がり、中国の一部のネットユーザーがEvoMapを支持し、Hermesの盗用行為を批判しています。Nous研究チームはまだ、申し立てに対して逐条で反論していないものの、事件はすでにAIの世論の中で急速に拡散しています。

ChainNewsAbmedia04-17 09:54

OpenAI、デスクトップを制御し開発ワークフローを自動化するAIエージェントとしてCodexを更新

OpenAIのアップグレード版Codexは、コーディングアシスタントからデスクトップ環境向けの自律エージェントへ進化し、アプリケーションの管理、ワークフローの自動化、100以上のアプリとの統合が可能になりました。この変化はタスクの継続性とワークフロー自動化を強化し、AIコーディングツールの競争環境を反映しています。

GateNews04-17 09:21
コメント
0/400
コメントなし