DeepSeek开源周第四日,DeepSeek开源Optimized Parallelism Strategies
本帖最后由 as22 于 2025-2-27 16:12 编辑今天是DeepSeek开源周第四日,DeepSeek宣布开源了Optimized Parallelism Strategies。
据DeepSeek介绍,DualPipe是一种用于V3/R1训练中计算与通信重叠的双向管道并行算法; EPLB是一种针对V3/R1的专家并行负载均衡器。
据了解,DeepSeek第一天开源了FlashMLA代码,第三天:开源了DeepEP通信库,第三天开源了DeepGEMM。
页:
[1]