2026-06-06 00:31:33
华为 Ascend 910C 完成深度求索-V4-Pro 全参数后训练,参数规模达 1.6 万亿
据深圳市政府消息,6 月 5 日,一个研究团队包括华为技术,使用该公司的 Ascend 910C 芯片完成了对 DeepSeek-V4-Pro 的全参数后训练。该项目在一个由 1,000 多颗华为芯片驱动的集群上运行了 DeepSeek 迄今为止最大的模型,参数规模为 1.6 万亿。团队成员包括华为、深圳市量子环路研究院、哈尔滨工业大学深圳校区以及深圳市大数据研究院。这标志着中国在美国出口限制下,借助国产硬件从 AI 推理迈向模型训练的努力又迈出了一步。