فريق معالجة اللغة الطبيعية في ستانفورد على تويتر قال إن البيانات المستخدمة لتدريب الوكلاء المفتوحة حاليًا تُستخدم بشكل رئيسي في مرحلة ما بعد التدريب، خاصةً لنماذج مثل Qwen. قد تكون هذه النماذج قد تم تدريبها بالفعل على كميات هائلة من بيانات الوكلاء. ويعتقدون أن كمية بيانات الوكلاء اللازمة لتدريب نموذج مفتوح المصدر ممتاز من البداية تتجاوز بكثير حجم البيانات المطلوب فقط لإعادة التدريب باستخدام الأوزان المفتوحة، مما يبرز نقص بيانات الوكلاء في مرحلة ما قبل التدريب. المصدر: InFoQ

MeNews

2026-05-20 10:53:07

إنشاء الملخص قيد التقدم

AIMPACT رسالة، 15 مايو (UTC+8)، أشار فريق NLP في ستانفورد على تويتر إلى أن معظم بيانات التدريب للكيانات الذكية (agentic) المنشورة حاليًا لا تزال تركز بشكل رئيسي على مرحلة ما بعد التدريب (post-training)، خاصةً تلك المستخدمة لنماذج مثل Qwen (والتي قد تم تدريبها على كميات هائلة من بيانات الكيانات الذكية). يعتقد الفريق أنه لبناء نموذج مفتوح المصدر جيد من الصفر، فإن كمية بيانات الكيانات الذكية المطلوبة تتجاوز بكثير تلك اللازمة فقط لإعادة التدريب بعد التدريب المفتوح، مما يبرز نقص بيانات تدريب الكيانات الذكية في مرحلة ما قبل التدريب حاليًا. (المصدر: InFoQ)

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

تسجيلات الإعجاب 7

أعجبني
7
12
8
مشاركة

تعليق

إضافة تعليق

SushiAndSlugs

· منذ 54 د

هل تعتبر هذه الجولة من Qwen فوزًا سهلاً؟

شاهد النسخة الأصليةرد0

FlamingoFacingJudgment

· منذ 1 س

النماذج المفتوحة المصدر ترغب في التنافس مع النماذج المغلقة، والحواجز البياناتية أصعب في الاختراق من القدرة الحاسوبية

شاهد النسخة الأصليةرد0

ColdLightNftCabinet

· منذ 4 س

يجب على المجتمع المفتوح المصدر أن يفكر في كيفية جمع التمويل المسبق لبيانات التدريب

شاهد النسخة الأصليةرد0

GateUser-a365d15f

· منذ 4 س

يبدو وكأننا عدنا إلى القصة القديمة التي تقول إن البيانات هي السلطة

شاهد النسخة الأصليةرد0

GateUser-46033407

· منذ 4 س

كمية البيانات اللازمة للتدريب من الصفر، تسمع ذلك فتشعر باليأس

شاهد النسخة الأصليةرد0

PerpNightshift

· منذ 4 س

هذه الدراسة أعطت فريق المصدر المغلق سكينًا في الظهر

شاهد النسخة الأصليةرد0

GateUser-46c777d0

· منذ 5 س

هذه الملاحظة من ستانفورد دقيقة جدًا، فقدرات العميل تعتمد حقًا على التدريب المتراكم في النهاية.

شاهد النسخة الأصليةرد0

GlassDomeRoaming

· منذ 5 س

دائمًا ما يكون هناك حد لفضاء التحسين بعد التدريب المسبق، وسرعان ما تظهر عيوب التدريب المسبق

شاهد النسخة الأصليةرد0

GateUser-e84f640c

· منذ 5 س

هذا الاستنتاج يضرب فرق صغيرة ومتوسطة بشكل كبير، ومتطلبات البيانات تزداد صعوبة.

شاهد النسخة الأصليةرد0

ExitLiquidityStan

· منذ 5 س

آمل أن يتمكن أحدهم من إصدار بيانات وكيل ما قبل التدريب عالية الجودة كمصدر مفتوح

شاهد النسخة الأصليةرد0

عرض المزيد

المواضيع الرائجة
عرض المزيد
#
TradfiTradingChallenge
194.37K درجة الشعبية
#
30YearTreasuryYieldBreaks5%
364.83K درجة الشعبية
#
IsraelStrikesIranBTCPlunges
48.28K درجة الشعبية
#
#DailyPolymarketHotspot
1M درجة الشعبية
#
RWAMarketCapExceeds65Billion
8.75M درجة الشعبية

مُثبت

خريطة الموقع

ستانفورد NLP: لا تزال معظم بيانات تدريب الوكلاء الذكيين العامة مركزة على مرحلة ما بعد التدريب

المواضيع الرائجة

TradfiTradingChallenge

30YearTreasuryYieldBreaks5%

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

RWAMarketCapExceeds65Billion

مُثبت