Gate News 消息,4 月 24 日——DeepSeek 已在 MIT 许可下发布 V4 系列开源模型,权重现已在 Hugging Face 和 ModelScope 上提供。该系列包含两个专家混合 (MoE) 模型:V4-Pro 总参数 1.6 万亿,按每个 token 激活 49 亿;以及 V4-Flash 总参数 2840 亿,按每个 token 激活 130 亿。两者都支持 100 万 token 的上下文窗口。
该架构包含三项关键升级:一种混合注意力机制,结合压缩稀疏注意力 (CSA) 和高度压缩注意力 (HCA),从而显著降低长上下文开销——V4-Pro 在 1M 上下文下的推理 FLOPs 仅为 V3.2 的 27%,用于在推理过程中存储历史信息的 KV 缓存 (VRAM) 仅为 V3.2 的 10%;用流形约束超连接 (mHC) 替代传统残差连接,以增强跨层信号传播稳定性;以及 Muon 优化器以实现更快的训练收敛。预训练使用了超过 32 万亿 tokens 的数据。
后训练采用两阶段方法:首先通过监督微调 (SFT) 和 GRPO 强化学习训练领域特定专家,然后通过在线蒸馏将它们合并为单一模型。V4-Pro-Max (最高推理模式) 声称是最强的开源模型,拥有顶级代码基准,并在推理和智能体任务上显著缩小了与闭源前沿模型的差距。V4-Flash-Max 在算力充足的情况下实现了 Pro 级推理性能,但在纯知识和复杂智能体任务上受限于参数规模。权重以混合 FP4+FP8 精度存储。
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى
إخلاء المسؤولية.
مقالات ذات صلة
تعتزم Nvidia الاستثمار بما يصل إلى 2.1 مليار دولار في شركة مراكز بيانات IREN
وفقاً لـ Bloomberg Terminal، أعلنت إنفيديا الخميس أنها ستستثمر ما يصل إلى 2.1 مليار دولار في مطوّر مراكز البيانات IREN Ltd. ضمن شراكة تهدف إلى تسريع بناء بنية تحتية للذكاء الاصطناعي. وقد منحت IREN إنفيديا مذكرة حق شراء لمدة خمس سنوات لاقتناء ما يصل إلى 30 مليون ش
GateNewsمنذ 29 د
قال CZ إن شركة YZi Labs تخصص 70% لسلسلة الكتل و20% للذكاء الاصطناعي في مؤتمر Consensus Miami 2026
وفقاً لـChainCatcher، قال تشاو تشانغبينغ (CZ) في مؤتمر Consensus Miami 2026 إن YZi Labs تخصص 70% من التمويل للبلوك تشين، و20% للذكاء الاصطناعي، و10% للتكنولوجيا الحيوية. وأضاف CZ أنه ينبغي وضع BNB بوصفه عملةً أصلية لوكلاء الذكاء الاصطناعي، وأن جميع سلاسل الكتل يجب أن تكون "جاهزة للذكاء الاصطناعي" لدعم
GateNewsمنذ 6 س
تستحوذ شركة Public على تطبيق Treasury لمنصة استثمار في مجال الذكاء الاصطناعي لتوسيع التداول في العملات المشفرة
ووفقاً لـChainCatcher، أعلنت Public عن الاستحواذ على منصة خدمة استثمار الذكاء الاصطناعي Treasury App لتعزيز أعمالها في الوساطة المرتكزة على الذكاء الاصطناعي. لم يُكشف عن قيمة عملية الاستحواذ. تدعم Public حالياً التداول في الأسهم والسندات والرموز المشفرة، بما في ذلك Bitcoin وEthereum و
GateNewsمنذ 7 س
أتمت بلِتزي جولة تمويل $200M بقيادة شركة نورث زون.
وفقاً لـ ChainCatcher، أكملت Blitzy، وهي شركة لتطوير البرمجيات بالذكاء الاصطناعي شارك في تأسيسها المهندس المعماري السابق في Nvidia سيد بارديشي، جولة تمويل بقيمة 200 مليون دولار بقيادة Northzone. شاركت في الجولة كل من Battery Ventures وJump Capital وMorgan Creek Digital. تتيح المنصة تحليل الأنظمة المعقدة مع
GateNewsمنذ 8 س
الاتحاد الأوروبي يحظر المواد الإباحية المُصنّعة بالذكاء الاصطناعي على شكل تقليد عميق في 7 مايو
وذكرت وكالة أنباء شينخوا أنه في 7 مايو، توصل أعضاء البرلمان الأوروبي والدول الأعضاء إلى توافق على حظر أنظمة الذكاء الاصطناعي من إنشاء محتوى إباحي مزيف عبر تقنيات التزييف العميق. وسيتم إدراج هذا الحظر في تعديلات قانون الذكاء الاصطناعي لعام 2024. البرلمان الأوروبي
GateNewsمنذ 8 س
طرحت Tether نموذج الذكاء الاصطناعي الطبي للقوى QVAC MedPsy، وحققت درجة 62.62 في نسخة تضم 17 مليار معلمة
وفقاً لـ Odaily، أطلقت مجموعة أبحاث Tether AI QVAC MedPsy، وهو نموذج ذكاء اصطناعي طبي مصمم للعمل محلياً على الهواتف الذكية والأجهزة القابلة للارتداء دون الاعتماد على السحابة. سجلت نسخة 1.7 مليار مُعلم 62.62 على سبعة اختبارات طبية، متفوقة على MedGemma-1.5-4B من Google بفارق 11.42 poi
GateNewsمنذ 9 س