Databricks称:顶级AI模型在日常企业任务中落后 更小的专业化模型表现更好

Gate News消息,4月20日——根据Databricks的David Meyer所述,顶级AI模型擅长解决奥林匹克数学等复杂问题,但在处理日常企业工作时却会遇到困难。某些模型可能会改正错误的发票号码,而不是将其标记为错误;同时,像Claude这样的编码工具在数据工程任务上也可能表现不佳。

这种差距源于企业数据与用于训练大模型的公开网页文本之间存在根本性差异。企业数据往往包含含糊的字段标签、大量空白字段,以及以纯文本形式存储的代码。在一项学术研究中,用于数据工程任务的AI模型的F1分数(在精确率与召回率之间取得平衡)从公共数据上的0.94降至企业数据上的0.07。此外,大模型通常会默认套用训练中熟悉的模式;即便在收到针对某家公司专有查询语言的指令和文档之后,有些模型仍然默认使用结构化查询语言 (SQL)。

经过强化学习微调的小型开源模型可以以更高效率、显著更低的训练成本来处理特定工作,而大型通用模型则难以做到这一点。Databricks正在为特定工作流构建更小的AI代理,例如KARL,它使用强化学习来借助公司文档进行多步骤推理。行业正从依赖超大型模型转向混合架构:由小型高效模型负责处理日常的海量任务,然后仅在遇到不明确或复杂的情况时才升级到更大、更昂贵的系统。

Databricks最近收购了Quotient AI,以帮助大型企业更可靠地运行AI代理。AI业务中的竞争如今聚焦于运行完整的AI生命周期,包括用于追踪错误的反馈系统,并随着时间持续改进模型;因此,在部署之后,评估与调优工具的价值也变得愈发重要。

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

تقوم شبكة Zypher بدمج AIDEN لتحسين إتاحة المعرفة المتعلقة بسلاسل الكتل

بحسب الإعلان الرسمي لـIQ AI في 6 مايو، قامت Zypher Network بدمج AIDEN، وكيل ذكاء اصطناعي طوّرته IQ AI، لتحسين إتاحة المعرفة الخاصة بسلسلة الكتل وتعزيز قابلية التدقيق داخل النظم البيئية التي تعمل بالذكاء الاصطناعي. يقدّم هذا التعاون صفحة ويكي مخصصة

GateNewsفقط الآن

أطلق Virtuals Protocol حملة إيردروب OpenGradient Titan لتوزيع 500K OPG اليوم

وفقاً للإعلان الرسمي من Virtuals Protocol، أصبح توزيع أوبنغراديانت تيتان (OpenGradient Titan) الآن مباشرًا اعتبارًا من 7 مايو. يمكن للمستخدمين المؤهلين المطالبة بتوكنات OPG مباشرة من حساباتهم في Virtuals. يتم اليوم توزيع إجمالي 500,000 توكن من OPG كمكافأة للمساهمين في Virtuals

GateNewsمنذ 3 س

أعلنت NVIDIA عن Nemotron 3 Nano Omni مفتوح المصدر متعدد الوسائط

أعلنت NVIDIA عن نموذج Nemotron 3 Nano Omni مفتوح المصدر متعدد الوسائط، يدمج الرؤية والصوت واللغة في نموذج واحد، بوصفه طبقة الإدراك لوكلاء الذكاء الاصطناعي. يتمحور حول 30B-A3B MoE بسياق 256K، وبسرعة إنتاج 9x، ويدعم مدخلات تشمل النص والصور والصوت والفيديو وغيرها، بينما تكون المخرجات نصاً. وبالتكامل مع Nemotron 3 Super/Ultra، يُستخدم في سيناريوهات مثل التحكم بالكمبيوتر وذكاء المستندات وفهم الصوت والصورة، مع إتاحة الأوزان وبيانات التدريب، ويغطي النشر الخيارات المحلية وNIM والمنصات التابعة لجهات خارجية.

ChainNewsAbmediaمنذ 4 س

تعلن NeoSoul وAllScale شراكة استراتيجية اليوم بشأن ائتمان الوكلاء وتسوية العملات المستقرة

ذكرت ChainCatcher أن مشروع اقتصاد وكلاء الذكاء الاصطناعي NeoSoul أعلن اليوم (7 مايو) شراكة استراتيجية مع AllScale لاستكشاف آليات تكوين الائتمان وتسوية العملات المستقرة للتعاون التلقائي بين الوكلاء. ستتجه الشراكة إلى التركيز على أتمتة تدفقات المدفوعات بين الوكلاء—بحسب

GateNewsمنذ 5 س

تطوير وكالات الذكاء الاصطناعي لمكافحة غسل الأموال من شركة FIS وشركة Anthropic، مع بدء الطرح لبنك BMO وبنك Amalgamated Bank في النصف الثاني من عام 2026

تعمل FIS وAnthropic على تطوير وكلاء ذكاء اصطناعي مخصصين لأتمتة التحقيقات في الجرائم المالية، بدءاً بعمليات مكافحة غسل الأموال. وسيقوم وكيل «الجرائم المالية» بجلب البيانات من أنظمة البنوك، وتقييم المعاملات مقابل أنماط معروفة، والمساعدة في دعم المحققين أثناء مراجعة الأدلة المتعلقة ب

GateNewsمنذ 6 س

يطلق Prime Intellect Lab الإتاحة العامة في 7 مايو، ويُنهي أكثر من 10,000 جلسة تدريبية في مرحلة الاختبار

وفقاً لـ Prime Intellect، غادرت منصة Lab التابعة للشركة مرحلة الاختبار التجريبي في 7 مايو 2026، لتنتقل إلى الإتاحة العامة بوصفها بيئة تدريب شاملة لنُظم الوكلاء الذكاء الاصطناعي ذاتية التحسّن. تعمل قناة العمل الموحدة على توحيد سير عمل تحسين النماذج، ما يتيح للمستخدمين تحديد المهام وتكوين

GateNewsمنذ 6 س
تعليق
0/400
لا توجد تعليقات