DeepSeek开源TileKernels:面向大模型训练与推理的GPU内核库

Gate 新闻消息,4月23日——DeepSeek已在MIT许可证下开源TileKernels,这是一套用TileLang编写的GPU内核库,面向大语言模型的训练与推理。TileLang是tile-ai团队开发的一种领域专用语言,用于在Python中表达高性能GPU内核。DeepSeek表示,该库中的大多数内核在计算密度和内存带宽方面已接近硬件性能上限,其中部分内核已部署在内部的训练与推理操作中。

该库包含六类内核:MoE (专家混合) 的门控与路由,包括Top-k专家选择、从token到专家的映射,以及融合的expand/shrink并配合权重归一化;支持FP8、FP4和E5M6格式的量化,提供逐token、逐块与逐通道量化,并包含融合的SwiGLU+量化操作;批量转置;Engram门控,融合RMSNorm的前向/反向传播与权重梯度归约;Manifold HyperConnection,采用Sinkhorn归一化并进行混合的split/apply;以及高层autograd接口,将底层内核封装为可训练的层。

Engram和Manifold HyperConnection是DeepSeek模型架构中的专有组件,首次公开披露了实现细节。该库需要NVIDIA SM90或SM100架构的GPU (H100/H200或Blackwell系列)、CUDA Toolkit 13.1或更高,以及PyTorch 2.10或更高。

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

Jupiter Lend ترفع حد الاقتراض JLP/JupUSD إلى $40 مليون

بوابة الأخبار، 27 أبريل — قامت Jupiter Lend بزيادة حد الاقتراض الخاص بها لـ JLP/JupUSD من $25 مليون إلى $40 مليون. يمكن للمستخدمين الآن الاقتراض بنسبة تصل إلى 85% من LTV أو إجراء عمليات تكرارية على JLP. أعلنت البروتوكول عن التعديل عبر وسائل التواصل الاجتماعي

GateNewsمنذ 16 د

أعلنت Polymarket عن ترقية في 28 أبريل: سيتم ترحيل الأصول المرهونة إلى pUSD، وسيتم إيقاف التداول لمدة حوالي ساعة واحدة

وفقًا للإعلان الرسمي الذي نشره مطورو Polymarket في 27 أبريل على منصة X، ستقوم Polymarket في 28 أبريل الساعة 11:00 بتوقيت UTC ببدء ترقية شاملة للبنية التحتية للمنصة، وسيتم إيقاف التداول لمدة تقارب ساعة واحدة. وتشمل عملية الترقية هذه عقود تداول الجيل الجديد، وإعادة هيكلة دفتر الأوامر، بالإضافة إلى تقديم رمز الضمان الجديد pUSD، حيث سيتم نقل الأصول الضمانية الحالية في المنصة من USDC.e إلى pUSD.

MarketWhisperمنذ 17 د

Polymarket于4月28日升级平台,将抵押品从USDC.e迁移至pUSD

Gate 新闻消息,4月27日——Polymarket宣布将于2026年4月28日约19:00 UTC对其平台进行升级,在维护窗口期间交易将暂停约一小时。此次升级包括新一代交易合约 (CTF Exchange V2)、重建的订单簿

GateNewsمنذ 1 س

Curve 提出基于市场的恢复方案:用于 $700K CRV-long LlamaLend 市场中的坏账()

Gate News 消息,4 月 27 日——Curve 团队在 4 月 27 日披露了一项治理提案,旨在处理来自 CRV-long LlamaLend 市场、发生于 2025 年 10 月 10 日的约 $700,000 坏账。所提议的回收机制利用 CRV-long 质押金库资产的期权性:当 CRV 价格上涨时,金库价值上升,但价格下跌时不会遭受额外损失。

GateNewsمنذ 1 س

تم استغلال عقد V2 المهمل الخاص بـ Scallop، وبعد سرقة 150 ألف SUI أعلنوا التعويض الكامل

بروتوكول الإقراض اللامركزي Scallop على شبكة Sui أعلن عبر منصة X في 26 أبريل (الأحد) عن بيان رسمي، مؤكدًا أنه تم التعرض لهجوم استغلال ثغرة. قام المهاجم باستخراج حوالي 150,000 SUI من عقد مكافآت مهجور مرتبط بـ sSUI spool. ووفقًا للتصريحات الرسمية، فإن مجمع رأس المال الأساسي وإيداعات المستخدمين لم تتأثر. تم استعادة قدرة البروتوكول على الإيداع والسحب، مع تأكيد أنه سيتم تعويض جميع الخسائر بالكامل باستخدام أموال الشركة.

MarketWhisperمنذ 1 س

AAVE متاحة الآن على شبكة Solana، متوفرة على Phantom وJupiter

خبر بوابة، 27 أبريل — أصبحت AAVE الآن مباشرة على شبكة Solana، مع دعم تداول رمز الحوكمة الخاص بـ DeFi على منصات تشمل Phantom وJupiter. Aave هو بروتوكول سيولة غير وصي يسمح للمستخدمين بكسب الفائدة من خلال تزويد الأصول إلى البروتوكول أو الاقتراض مقابل ضمانات.

GateNewsمنذ 2 س
تعليق
0/400
لا توجد تعليقات