فريق معالجة اللغة الطبيعية في ستانفورد على تويتر قال إن البيانات المستخدمة لتدريب الوكلاء حاليًا تُستخدم بشكل رئيسي في مرحلة ما بعد التدريب، خاصةً لنماذج مثل Qwen. قد تكون هذه النماذج قد تم تدريبها بالفعل على كميات هائلة من بيانات الوكلاء. ويعتقدون أن كمية بيانات الوكلاء اللازمة لتدريب نموذج مفتوح المصدر ممتاز من البداية تتجاوز بكثير حجم البيانات المطلوب فقط لإعادة التدريب باستخدام الأوزان المفتوحة، مما يبرز نقص بيانات الوكلاء في مرحلة ما قبل التدريب. المصدر: InFoQ

MeNews

2026-05-20 10:36:37

إنشاء الملخص قيد التقدم

AIMPACT رسالة، 15 مايو (UTC+8)، أشار فريق NLP في ستانفورد على تويتر إلى أن معظم بيانات التدريب للكيانات الذكية (agentic) المنشورة لا تزال تركز بشكل رئيسي على مرحلة ما بعد التدريب (post-training)، خاصة تلك المستخدمة لنماذج مثل Qwen (والتي قد تكون قد تم تدريبها على كميات هائلة من بيانات الكيانات الذكية). يعتقد الفريق أنه لإنشاء نماذج مفتوحة المصدر جيدة من الصفر، فإن كمية بيانات الكيانات الذكية المطلوبة تتجاوز بكثير تلك اللازمة فقط لإعادة التدريب من الأوزان المفتوحة، مما يبرز نقص بيانات تدريب الكيانات الذكية في مرحلة ما قبل التدريب حاليًا. (المصدر: InFoQ)

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

تسجيلات الإعجاب 7

أعجبني
7
5
8
مشاركة

تعليق

إضافة تعليق

NeonMeltsIceCream

· منذ 3 س

النماذج المفتوحة المصدر تريد اللحاق، تكلفة بيانات الوكيل في مرحلة التدريب المسبق مرتفعة جدًا، والفريق الصغير لا يستطيع تحملها.

شاهد النسخة الأصليةرد0

VineGeometry

· منذ 3 س

يبدو أن الجميع الآن يركز على التدريب بعد النمو، والحواجز في بيانات التدريب المسبق هي الحصن الحقيقي.

شاهد النسخة الأصليةرد0

DexterRamen

· منذ 3 س

تم استدعاء Qwen ههه، لكنه بالفعل من بين الوكلاء الأكثر تميزًا في المصدر المفتوح.

شاهد النسخة الأصليةرد0

GateUser-9568ced5

· منذ 3 س

فجوة البيانات قبل التدريب مهمة جدًا، فحتى بعد التدريب المتقدم لا يمكن تعويض الأساس.

شاهد النسخة الأصليةرد0

Can'tSleepWithoutSigningThe

· منذ 3 س

هذه الرؤية من ستانفورد مثيرة للاهتمام، والفارق في حجم بيانات الوكيل الذكي أكبر مما كان يُتصور.

شاهد النسخة الأصليةرد0

المواضيع الرائجة
عرض المزيد
#
TradfiTradingChallenge
192.23K درجة الشعبية
#
30YearTreasuryYieldBreaks5%
363.32K درجة الشعبية
#
IsraelStrikesIranBTCPlunges
48.28K درجة الشعبية
#
#DailyPolymarketHotspot
1M درجة الشعبية
#
RWAMarketCapExceeds65Billion
8.75M درجة الشعبية

مُثبت

خريطة الموقع

ستانفورد NLP: لا تزال معظم بيانات تدريب الوكيل الذكي المفتوحة تركز على مرحلة ما بعد التدريب

المواضيع الرائجة

TradfiTradingChallenge

30YearTreasuryYieldBreaks5%

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

RWAMarketCapExceeds65Billion

مُثبت