螞蟻集團 Ling-2.6-flash 模型開源:1040 億參數、啟用 74 億參數,達成多項最新最先進(SOTA)基準

Gate 新聞訊息,4 月 29 日——螞蟻集團的 Ling-2.6-flash 模型權重現已開源釋出;此前該模型的權重僅可透過 API 使用。該模型具備 1040 億(104 billion)總參數,每次推論啟用 74 億(7.4 billion)參數,並提供 256K 上下文視窗,且採用 MIT 授權。HuggingFace 與 ModelScope 提供 BF16、FP8 與 INT4 精度版本。

Ling-2.6-flash 相較 Ling 2.0 引入混合線性注意力改進(hybrid linear attention),將原本的 GQA 升級為「1:7 MLA + Lightning Linear」混合架構,並結合高度稀疏的 MoE。推論效率顯著優於同類模型:在 4x H20 GPU 上,峰值生成速度達到 340 tokens/s;預填充(prefill)與解碼(decode)的吞吐量約為可比開源模型的 4 倍。與代理(Agent)相關的基準測試顯示強勁表現:BFCL-V4、TAU2-bench、SWE-bench Verified (61.2%)、Claw-Eval 與 PinchBench 均達到或接近最新最先進(SOTA)水準。在完整的 Artificial Analysis 基準測試套件中,總 token 消耗僅為 15 million。在 AIME 2026 上,該模型得分為 73.85%。

螞蟻集團官方網站亦列出了 Ling-2.6-1T (trillion-parameter 旗艦版本) 與 Ling-2.6-mini (lightweight 版本);不過截至發布之時,其權重仍未在 HuggingFace 上釋出,僅提供 flash 系列供下載。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

白宮在 24 小時內撤回對 AI 模型預先審查的作法,但擴大自願評估

根據《紐約時報》和 Politico 報導,白宮國家經濟委員會(National Economic Council)主任 Kevin Hassett 週三提出,要求美國政府為 AI 模型實施類似 FDA 的上市前審查。到週四,一名高級官員宣稱 Hassett 的言論被斷章取義、脫離脈絡,

GateNews2分鐘前

Lori Greiner 警告 Gmail AI 預設掃描郵件,谷歌已緊急更新

據《富比士》於 5 月 7 日報道,《創智贏家》(Shark Tank)明星 Lori Greiner 上週末在 Instagram 發帖警告,Google 旗下 Gmail AI 預設掃描郵件。對此,Google 已進行了更新,強調 Gemini 不會使用用戶郵件訓練 AI 模型,處理後也不留存任何資料。

Market Whisper20分鐘前

OpenAI 未能確保 180 億美元的自訂晶片計畫融資

根據《The Information》,OpenAI 近期未能確保約 180 億美元的外部融資,該融資原本用於支持與 Broadcom 合作開發的客製晶片的早期部署。該專案旨在部署 10 吉瓦的 OpenAI 設計晶片產能,這是核心策略之一,供其(原文未完整)

GateNews31分鐘前

Cloudflare 宣布全球裁員 20%,AI 使用量三個月增逾 600%

據路透社於 5 月 7 日報道,美國網路基礎設施及安全公司 Cloudflare(NYSE:NET)宣布裁員約 20% 的全球員工,即逾 1,100 人,理由為圍繞 AI 工具應用進行業務重組。Cloudflare 執行長 Matthew Prince 聲明,公司在過去三個月內 AI 使用量增逾 600%。

Market Whisper34分鐘前

Jie Yue Xingchen 於 5 月 8 日與產業夥伴(包含 Huaqin、ZTE)完成 25 億美元的募資輪次

根據界面新聞,中國 AI 模型公司「傑躍星辰」於 5 月 8 日完成一輪約 25 億美元的融資,業界合作夥伴包括華勤、龍旗、奧姆尼視覺(OmniVision)和中興,以及香港投資管理公司(HKIC)。該公司也已刪除其

GateNews34分鐘前
留言
0/400
暫無留言