Ramp Labs mengajukan solusi baru untuk berbagi memori antar-multiagen, konsumsi Token tertinggi turun 65%

GateNews

Berita Gerbang, 11 April, perusahaan infrastruktur AI Ramp Labs merilis hasil riset “Latent Briefing”, yang memungkinkan berbagi memori yang efisien antar sistem multi-agen dengan mengompresi langsung cache KV dari model besar. Dengan tidak mengorbankan akurasi, konsumsi Token diturunkan secara signifikan. Dalam arsitektur multi-agen arus utama, orkestrator (Orchestrator) memecah tugas dan berulang kali memanggil model pekerja (Worker); seiring rantai penalaran terus diperpanjang, jumlah Token meningkat secara eksponensial. Gagasan inti dari Latent Briefing adalah menggunakan mekanisme atensi untuk mengidentifikasi bagian konteks yang benar-benar penting, lalu membuang informasi redundan langsung pada level representasi, bukan mengandalkan ringkasan LLM yang lambat atau penelusuran RAG yang kurang stabil. Pada pengujian benchmark LongBench v2, metode ini menunjukkan performa yang menonjol: konsumsi Token model Worker turun 65%, penghematan Token untuk dokumen berukuran menengah (32k hingga 100k) mencapai median 49%, akurasi keseluruhan meningkat sekitar 3 poin persentase dibanding baseline, sementara waktu tambahan untuk setiap kompresi hanya sekitar 1,7 detik—lebih cepat kira-kira 20 kali dibanding algoritma asli. Eksperimen menggunakan Claude Sonnet 4 sebagai orkestrator dan Qwen3-14B sebagai model pekerja, mencakup skenario dokumen beragam seperti makalah akademik, dokumen hukum, novel, serta laporan pemerintah. Penelitian juga menemukan bahwa ambang kompresi optimal berbeda tergantung tingkat kesulitan tugas dan panjang dokumen—masalah yang sulit cocok untuk kompresi yang agresif guna menyaring kebisingan penalaran yang bersifat spekulatif, sementara dokumen panjang lebih cocok untuk kompresi ringan guna mempertahankan informasi kunci yang tersebar.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Reid Hoffman: NFT Bisa Kembali karena Agen AI Membutuhkan Kepercayaan Kripto

Reid Hoffman, partner Greylock dan pendiri LinkedIn, mengatakan bahwa agen otonom akan memerlukan sistem kepercayaan berbasis kripto untuk bertransaksi di internet terbuka, seraya menyiratkan bahwa NFT mungkin akan kembali, menurut pernyataannya. Agen AI dan Infrastruktur Kepercayaan Pernyataan Hoffman mengarah pada potensi

CryptoFrontier39menit yang lalu

IBM Memperluas Enterprise AI Suite dengan Alat Baru Berbasis Agen di Think 2026

Menurut IBM, perusahaan mengumumkan perluasan kemampuan AI perusahaan di konferensi Think 2026 di Boston, dengan meluncurkan alat-alat baru berbasis agen untuk membantu organisasi menyematkan kecerdasan buatan ke dalam operasi harian. Context Studio, yang kini tersedia secara umum, memungkinkan perusahaan untuk

GateNews1jam yang lalu

Mimpi Claude dari Anthropic: Agent menyusun ulang ingatan secara otomatis di sela-sela pekerjaan, menghapus duplikasi, dan meniadakan konflik

Anthropic mengumumkan Dreams di acara Code with Claude, memungkinkan Claude Managed Agents untuk secara otomatis mengatur memori di banyak sesi percakapan, menghapus duplikasi dan konflik, serta memperbarui entri yang sudah usang, lalu menghasilkan basis memori yang dapat diaudit; batas input 100 sesi dan 4.096 karakter, dieksekusi secara asinkron, selesai dalam hitungan menit hingga puluhan menit, dan mendukung pemantauan streaming. Pratinjau riset perlu diajukan, sementara hanya mendukung claude-opus-4-7 dan claude-sonnet-4-6, dengan waktu peluncuran resmi belum ditentukan.

ChainNewsAbmedia5jam yang lalu

Cloudflare berkolaborasi dengan Stripe untuk menghadirkan Agen otonom yang melakukan negosiasi: AI dapat membuat akun sendiri, membeli domain, dan mendeploy aplikasi

Cloudflare dan Stripe pada 30 April bersama-sama meluncurkan protokol baru yang memungkinkan AI Agent membuat akun Cloudflare sendiri tanpa campur tangan manusia, berlangganan paket berbayar, mendaftarkan domain, mendapatkan token API, dan langsung melakukan deployment aplikasi. Blog resmi Cloudflare menjelaskan bahwa seluruh alur proses dari awal hingga akhir tidak memerlukan manusia masuk ke dashboard, menyalin-tempel token, atau memasukkan data kartu kredit; pengguna hanya perlu terlebih dahulu memberikan izin, serta menerima syarat dan ketentuan penggunaan Cloudflare. Minggu ini, pengumuman tersebut mendapat 548 poin di Hacker News, menjadi salah satu berita infrastruktur yang menandai tonggak bagi AI Agent untuk menjalankan tugas secara mandiri. Arsitektur tiga lapis: penemuan layanan, otorisasi identitas, dan pemrosesan pembayaran menjadi token Cloudflare-Stripe

ChainNewsAbmedia5jam yang lalu

Insinyur Coinbase: Agen AI Bisa Mengganggu Model Iklan Web

Erik Reppel, seorang insinyur Coinbase, mengatakan bahwa agen-agen kecerdasan buatan dapat secara fundamental melemahkan model bisnis internet yang bergantung pada iklan. Menurut Reppel, ekonomi web sangat bergantung pada pendapatan iklan yang dihasilkan dari pengguna manusia, tetapi agen AI melewati sistem itu.

CryptoFrontier5jam yang lalu

Prophet Meluncurkan Pasar Prediksi Berbasis AI dengan Kupon Perdagangan Langsung $10.000 Hari Ini

Menurut MetaversePost, Prophet meluncurkan pasar prediksi bertenaga AI hari ini (6 Mei) dengan $10.000 dalam USDC yang dialokasikan untuk perdagangan langsung. Pengguna dapat berdagang langsung melawan pihak lawan AI yang menghasilkan harga berbasis probabilitas untuk setiap pasar, dengan beberapa kontrak yang akan diselesaikan dalam waktu 24

GateNews12jam yang lalu
Komentar
0/400
Tidak ada komentar