DeepSeek开源周第二日,开源代码库DeepEP
本帖最后由 as22 于 2025-2-25 14:42 编辑今天是DeepSeek开源周的第二天,DeepSeek开源代码库DeepEP。
据了解,DeepEP是首个用于MoE模型训练和推理的开源EP通信库。
据介绍,DeepEP的特点包括:高效、优化的全员沟通;节点内和节点间均支持NVLink和RDMA;用于训练和推理预填充的高吞吐量内核;用于推理解码的低延迟内核;原生FP8调度支持;灵活的GPU资源控制,实现计算-通信重叠。
DeepSeek此前宣布,将在本周会陆续开源5个代码库。昨日DeepSeek公布了开源周的第一个项目:FlashMLA。
页:
[1]