قدّمت Ramp Labs حلاً جديدًا لمشاركة الذاكرة بين وكلاء متعددين، حيث يتم خفض استهلاك الرموز (Token) إلى حدٍ أقصى أقل بنسبة 65%

GateNews

أخبار البوابة، في 11 أبريل، نشرت شركة Ramp Labs لأعمال البنية التحتية للذكاء الاصطناعي نتائج بحث بعنوان “Latent Briefing”، حيث تمكن من تحقيق مشاركة ذاكرة فعّالة بين أنظمة متعددة الوكلاء عبر ضغط مباشر لواجهة ذاكرة التخزين المؤقت الخاصة بـ KV لنماذج اللغات الكبيرة، وبدون فقد الدقة، خفّضت بشكل كبير استهلاك الرموز (Tokens). في البنى الشائعة للأنظمة متعددة الوكلاء، يقوم المُنسّق (Orchestrator) بتقسيم المهام واستدعاء نموذج العامل (Worker) بشكل متكرر؛ ومع استمرار تمديد سلسلة الاستدلال، يتضخم عدد Tokens بشكل أُسّي. تتمثل الفكرة الأساسية لـ Latent Briefing في استخدام آلية الانتباه (Attention) لتحديد الأجزاء الحقيقية الحاسمة ضمن السياق، ثم حذف المعلومات الزائدة مباشرةً على مستوى التمثيل، بدلًا من الاعتماد على تلخيص LLM بطيء أو استرجاع RAG ذو ثبات ضعيف. في اختبار المعيار LongBench v2، أظهرت هذه الطريقة أداءً لافتًا: انخفض استهلاك Tokens لدى نموذج العامل بنسبة 65%، وبلغ متوسط توفير Tokens للوثائق متوسطة الطول (32k إلى 100k) 49%، كما تحسنت الدقة الإجمالية بنحو 3 نقاط مئوية مقارنةً بالخط الأساسي، بينما بلغ الزمن الإضافي لكل عملية ضغط حوالي 1.7 ثانية فقط، أي أسرع بنحو 20 مرة مقارنةً بالخوارزمية الأصلية. أُجريت التجارب باستخدام Claude Sonnet 4 كمُنسّق، وQwen3-14B كنموذج عامل، مع تغطية سيناريوهات وثائق متعددة مثل الأوراق الأكاديمية والمستندات القانونية والروايات وتقارير حكومية، وغيرها. كما توصلت الدراسة إلى أن عتبة الضغط المثلى تختلف باختلاف صعوبة المهمة وطول المستند: فالمهام الصعبة تناسب الضغط الأكثر حدةً لتصفية ضوضاء الاستدلال الانتهازي، بينما المستندات الطويلة تكون أكثر ملاءمة للضغط الخفيف للاحتفاظ بالمعلومات الجوهرية المتفرقة.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

مؤسس كاردانو: ستتجاوز وكلاء الذكاء الاصطناعي النشاطَ البشري على الإنترنت بحلول 2035، ما سيُحدث اضطراباً في النماذج المعتمدة على الإعلانات

وبحسب كويندِسك، تنبّأ مؤسس كاردانو تشارلز هوسكينسون في مؤتمر Consensus في 7 مايو بأن وكلاء الذكاء الاصطناعي سيتجاوزون النشاط البشري في عمليات البحث عبر الإنترنت والتجارة والمعاملات بحلول عام 2035. وبما أن وكلاء الذكاء الاصطناعي لا ينقرون الإعلانات ولا يُظهرون تفضيلات للعلامات التجارية، قال هوسكينسون هذا w

GateNewsمنذ 2 س

مسؤول Claude Code بوريس: تعمل عوامل الذكاء الاصطناعي على تعزيز إنتاجية البشر وتعيد كتابة تاريخ تطوير البرمجيات

أشار مسؤول Claude Code Boris Cherny في مقابلة مع CNBC إلى أن أدوات وكلاء الذكاء الاصطناعي مثل Co-Work يمكنها تسليم المهام الشاقة إلى الذكاء الاصطناعي، ما يحوّل المهندس من مشغّل إلى موجّه، ويسمح بتشغيل عدة وكلاء في وقت واحد لمعالجة أعمال مثل تصحيح الأخطاء، الأمر الذي يعزز الإنتاجية بشكل ملحوظ. يتعين على الشركات إعادة تنظيم عملياتها لتجعل الذكاء الاصطناعي في قلبها؛ إذ يظهر الذكاء الاصطناعي قيمته في مختلف القطاعات، وستتحول عملية تطوير البرمجيات من مجرد كتابة التعليمات إلى تعاون موجّه بالمنطق والحوار، ما يؤدي إلى خفض عتبات التقنية، وظهور نمو انفجاري في الابتكار وريادة الأعمال.

ChainNewsAbmediaمنذ 3 س

ريد هوفمان: قد تعود الرموز غير القابلة للاستبدال مع احتياج وكلاء الذكاء الاصطناعي إلى ثقة التشفير

قال ريد هوفمان، الشريك في شركة Greylock والمؤسس المشارك لمنصة LinkedIn، إن الوكلاء المستقلين سيحتاجون إلى أنظمة ثقة قائمة على التشفير لإجراء المعاملات عبر الإنترنت المفتوح، مشيرًا إلى أن الرموز غير القابلة للاستبدال (NFTs) قد تشهد عودة، وذلك وفقًا لما جاء في بيانه. وكلاء الذكاء الاصطناعي وبنية الثقة تشير ملاحظات هوفمان إلى احتمال

CryptoFrontierمنذ 4 س

توسّع شركة IBM مجموعة أدوات الذكاء الاصطناعي المؤسسية عبر أدوات جديدة قائمة على الوكلاء في مؤتمر Think 2026

وفقاً لشركة IBM، أعلنت الشركة عن توسيع قدراتها في مجال الذكاء الاصطناعي على مستوى المؤسسات في مؤتمر Think 2026 في بوسطن، من خلال طرح أدوات جديدة قائمة على الوكلاء لمساعدة المؤسسات على دمج الذكاء الاصطناعي في العمليات اليومية. يتيح Context Studio، الذي أصبح متاحاً بشكل عام، للمؤسسات أن

GateNewsمنذ 6 س

أنتروبيك (Anthropic) تقدّم كلود دريمز (Claude Dreams): يقوم الوكيل (Agent) بتنظيم الذاكرة تلقائيًا بين المهام، وإزالة التكرار والتناقضات

أعلنت Anthropic في فعالية Code with Claude عن Dreams، حيث تقوم ميزة Claude Managed Agents بترتيب الذاكرة تلقائياً عبر جلسات متعددة، وإزالة التكرارات والتناقضات، وتحديث الإدخالات القديمة، مع إخراج مخزن ذاكرة مُتاحاً للتدقيق. حدّ الإدخال هو 100 session و4,096 حرفاً، مع تنفيذ غير متزامن يستغرق من عدة دقائق إلى عدة عشرات من الدقائق، ويدعم المراقبة عبر البث. المعاينة البحثية تتطلب طلباً، ولا يتوفر الدعم حالياً إلا لـ claude-opus-4-7 وclaude-sonnet-4-6، ويظل موعد الإطلاق الرسمي غير محدد.

ChainNewsAbmediaمنذ 9 س

تعاون Cloudflare مع Stripe لإطلاق وكيل مستقل عبر بروتوكول: يمكن للذكاء الاصطناعي إنشاء حسابات ذاتيًا وشراء نطاقات ونشر تطبيقات

في 30 أبريل، تعاونت Cloudflare وStripe على إطلاق بروتوكول جديد يتيح لوكلاء الذكاء الاصطناعي إنشاء حسابات Cloudflare بأنفسهم دون تدخل بشري، والاشتراك في الخطط المدفوعة، وتسجيل النطاقات، والحصول على رمز API، ثم نشر التطبيقات مباشرة. قالت مدونة Cloudflare الرسمية إن العملية كاملة من البداية إلى النهاية لا تتطلب دخول البشر إلى لوحة التحكم، أو نسخ/لصق رمز token، أو إدخال بيانات بطاقة الائتمان؛ إذ يحتاج المستخدم فقط إلى منح الأذونات مسبقاً، وقبول شروط استخدام Cloudflare. وخلال هذا الأسبوع، حصد هذا الإعلان 548 نقطة على Hacker News، ليصبح أحد أبرز أخبار البنية التحتية الداعمة لوكلاء الذكاء الاصطناعي التي تنفّذ المهام بشكل مستقل. بنية من ثلاث طبقات: اكتشاف الخدمة، وتفويض الهوية، وبَدنَة الدفع إلى رموز Cloudflare-Stripe

ChainNewsAbmediaمنذ 9 س
تعليق
0/400
لا توجد تعليقات