as22 发表于 2025-2-27 15:45:25

DeepSeek开源周第四日,DeepSeek开源Optimized Parallelism Strategies

本帖最后由 as22 于 2025-2-27 16:12 编辑

今天是DeepSeek开源周第四日,DeepSeek宣布开源了Optimized Parallelism Strategies。

据DeepSeek介绍,DualPipe是一种用于V3/R1训练中计算与通信重叠的双向管道并行算法; EPLB是一种针对V3/R1的专家并行负载均衡器。
据了解,DeepSeek第一天开源了FlashMLA代码‌,第三天:开源了DeepEP通信库,第三天开源了DeepGEMM‌。

页: [1]
查看完整版本: DeepSeek开源周第四日,DeepSeek开源Optimized Parallelism Strategies