爱唯侦察论坛bt工厂 并列 H100!硅基流动上线基于昇腾云 CloudMatrix 超节点的 DeepSeek-R1

发布日期:2025-04-16 04:26    点击次数:165

爱唯侦察论坛bt工厂 并列 H100!硅基流动上线基于昇腾云 CloudMatrix 超节点的 DeepSeek-R1

  近日爱唯侦察论坛bt工厂,硅基流动首创东说念主袁进辉在华为云生态大会上晓喻,硅基流动蚁集华为云基于 CloudMatrix 384 超节点昇腾云处事和高性能推理框架 SiliconLLM ,用大范畴众人并行最好推行致密上线 DeepSeek-R1。

  该处事在保证单用户 20 TPS 水平前提下,单卡 Decode 模糊冲突 1920 Tokens/s,可并列 H100 部署性能。同期,经由主流测试集考据及大范畴线上盲测,在昇腾算力部署 DeepSeek-R1 的模子精度与 DeepSeek 官方保抓一致。

探花内射

  其中,通过架构的全面革命,基于新式高速总线架构的 CloudMatrix 超节点集群在总算力、互联带宽、内存带宽上越过业界。

  此前,硅基流动在大模子云处事平台 SiliconCloud 首发推出了基于昇腾云的褂讪坐褥级 DeepSeek-V3 & R1 推理处事,并撑抓模子特有化集群部署爱唯侦察论坛bt工厂,此次互助鞭策基于国产算力的 DeepSeek-R1 推理处事抓续升级。

  DeepSeek 风暴席卷民众,相配所以其高效、低老本的 MoE 架构为应酬大模子推理挑战绽开了表情。不外,如若莫得普遍的 AI Infra 时候才智,要念念部署好 DeepSeek 并非易事。

  DeepSeek 使用了大范畴众人并行(Expert Parallelism,大 EP 并行)的 MoE 模子架构,若弃取单机部署决策,最终的性能远不如 DeepSeek 官方公布的部署决策,且至少罕见倍老本差距。更具挑战的是,诚然 DeepSeek 公开了大 EP 并行决策,但时候难度较大,业内还莫得其他团队快速复现这一部署次序。

  针对这些清贫,硅基流动与华为云蚁集攻关竣事了时候冲突。咱们在 CloudMatrix 384 超节点昇腾云处事上部署 DeepSeek-R1 时遴选了大范畴众人并行决策,通过多众人负载平衡和极致通讯优化,竣事高模糊及更高性能,大幅提高了用户体验。同期,咱们使用昇腾高性能算子库,以及硅基流动推理加快框架 SiliconLLM 在模子、机制、算子上的协同优化,竣事在国产算力上,不赔本模子精度的情况下, 得回 DeepSeek-R1 推理成果与资源讹诈率的权臣提高。

  硅基流动与华为云的互助不仅提供坚实的世界产软硬件体系部署决策,让 DeepSeek 推理处事更经济高效,也展现了 AI 生态互助的普遍能量。硅基流动将接续加深与华为云的蚁集革命,共同提高居品体验,加快模子在更多场景落地。

  (着手:资讯中国)

包袱剪辑:何奎良 爱唯侦察论坛bt工厂



栏目分类



Powered by AI换脸 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群 © 2013-2024