蚂蚁集团 Ling-2.6-flash 模型开源:104B 参数、7.4B 激活,达成多项 SOTA 基准

Gate 新闻消息,4月29日——蚂蚁集团的 Ling-2.6-flash 模型权重现已开源;此前仅通过 API 提供。该模型总计包含 1040 亿参数,每次推理激活 74 亿参数,拥有 256K 的上下文窗口,并采用 MIT 许可。BF16、FP8 和 INT4 精度版本可在 HuggingFace 和 ModelScope 上获取。

Ling-2.6-flash 相较于 Ling 2.0 引入了混合线性注意力改进,将原始 GQA 升级为 1:7 MLA 加 Lightning Linear 的混合架构,并结合高度稀疏的 MoE。推理效率显著超过可比模型:在 4x H20 GPU 上峰值生成速度达到 340 tokens/s,预填充(prefill)与解码(decode)的吞吐量约为可比开源模型的 4 倍。与智能体相关的基准测试显示出强劲表现:BFCL-V4、TAU2-bench、SWE-bench Verified (61.2%)、Claw-Eval 和 PinchBench 达到或接近 SOTA 水平。在完整的 Artificial Analysis 基准测试套件中,总令牌消耗仅为 1500 万。在 AIME 2026 上,该模型得分为 73.85%。

蚂蚁集团的官方网站也列出了 Ling-2.6-1T (万亿参数旗舰版本) 以及 Ling-2.6-mini (轻量版本);不过截至发布时,其权重仍未在 HuggingFace 上释出,只有 flash 系列可用于下载。

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

تتعاون xAI مع شركة Anthropic لتوفير وصول إلى حوسبة Colossus

وبحسب بيانات رسمية صادرة عن xAI وAnthropic، فقد أنشأت الشركتان شراكة حوسبة جديدة. وقّعت xAI التابعة لـ SpaceX اتفاقاً يتيح لـ Anthropic الوصول إلى موارد الحوسبة الخاصة بـ Colossus. يعتزم لدى Anthropic الاستفادة من هذه السعة الحوسبية الإضافية من أجل

GateNewsمنذ 8 د

أعلنت OpenAI عن بروتوكول شبكة حاسوب فائق من طراز MRC! بالتعاون مع Nvidia وAMD وMicrosoft لبناء بنية Stargate الأساسية

أعلنت OpenAI بروتوكول شبكة حوسبة فائقة للذكاء الاصطناعي MRC، بالتعاون مع AMD وMicrosoft وNVIDIA وغيرهم، وفتحه كمصدر مفتوح عبر OCP. يجزّئ MRC البيانات لتمريرها عبر مسارات متعددة في آن واحد، مع تجنب العوائق على مستوى الميكروثانية، والحد من الازدحام، والمحافظة على تزامن وحدات GPU، لمعالجة اختناقات نقل البيانات في عناقيد التدريب واسعة النطاق. تم بالفعل نشر واجهات بسرعة 800Gb/s في قواعد مثل Stargate تكساس Abilene، وتم البدء بتدريبات عملية.

ChainNewsAbmediaمنذ 33 د

منصة توظيف بالذكاء الاصطناعي Ethos تُنجز جولة تمويل من الفئة A بقيمة 22.75 مليون دولار بقيادة a16z في 6 مايو

وفقاً لـ BlockBeats، أكملت منصة توظيف الذكاء الاصطناعي في لندن Ethos جولة تمويل من الفئة A بقيمة 22.75 مليون دولار في 6 مايو، قادها Andreessen Horowitz (a16z) بمشاركة General Catalyst. تستخدم المنصة الذكاء الاصطناعي لإجراء مقابلات مع المرشحين وتحلل

GateNewsمنذ 1 س

أطلقت OpenAI بروتوكول شبكة MRC بالشراكة مع AMD وIntel وNVIDIA؛ ويدعم أكثر من 100,000 وحدة معالجة رسومية (GPU)

وبحسب إعلان OpenAI في 6 مايو، تعاقدت الشركة مع AMD وBroadcom وIntel وMicrosoft وNVIDIA لإطلاق Multipath Reliable Connection (MRC)، وهو بروتوكول شبكات مفتوح لاتصال وحدات معالجة الرسوميات (GPU) بينية في تدريب نماذج الذكاء الاصطناعي على نطاق واسع. يقوم البروتوكول بتقسيم عمليات إرسال البيانات الواحدة عبر

GateNewsمنذ 2 س

قفزت أسهم Hut 8 بنسبة 34% على صفقة إيجار لمراكز بيانات للذكاء الاصطناعي بقيمة 9.8 مليار دولار

وفقاً لـ The Block، قفزت أسهم Hut 8 Corp. بنسبة 34% إلى 107.87 دولار في تداول ما قبل افتتاح السوق اليوم، بعد أن وقّعت الشركة عقد إيجار بقيمة 9.8 مليار دولار لحرم مركز بيانات مخصص للذكاء الاصطناعي في مقاطعة نوايسز، تكساس، صُمم ليتوافق مع بنية الحوسبة لدى NVIDIA. ويمثل هذا الاتفاق المرحلة الأولى من Hu

GateNewsمنذ 2 س

المدير التقني لشركة CleanSpark: يتطلب البنية التحتية للذكاء الاصطناعي والحوسبة عالية الأداء موارد شبكية أكبر من تعدين بيتكوين

وفقًا لمقابلة مع CoinDesk، صرّح كبير مسؤولي التكنولوجيا في CleanSpark تايلور مونّيج بأن الانتقال من تعدين البيتكوين إلى بنية تحتية للذكاء الاصطناعي/HPC يتطلب مزيدًا من التكرار وانخفاضًا في الارتجال. «إن ليف الشبكة الخاص برف واحد يفوق ما لدى مرفق تعدين بيتكوين كامل»، مونّيج

GateNewsمنذ 2 س
تعليق
0/400
لا توجد تعليقات