返回列表 发布新帖
查看: 177|回复: 0

[人工智能] DeepSeek开源第三日,开源DeepGEMM

发表于 2025-2-26 13:52:51 | 查看全部 |阅读模式

这里或许是互联网从业者的最后一片净土,随客社区期待您的加入!

您需要 登录 才可以下载或查看,没有账号?立即注册

×
本帖最后由 as22 于 2025-2-26 13:56 编辑

今日,是DeepSeek“开源周”的第三天,其开源了DeepGEMM。

据介绍,DeepGEMM,一个支持密集和MoE(专家混合模型)GEMM(通用矩阵乘法)的FP8 (8位浮点数)GEMM库,为V3/R1训练和推理提供支持。

在HopperGPU上可实现高达1350+ FP8 TFLOPS性能,无复杂依赖,代码简洁如教程,完全采用即时编译技术(Just-In-Time),核心代码仅约300行 —— 在大多数矩阵尺寸下超越了专家优化的内核,支持稠密布局和两种 MoE 布局。

此前,DeepSeek开源了DeepEP,第一个用于MoE模型训练和推理的开源EP通信库。


141634pz012a4recw6za88.png
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Copyright © 2001-2025 Suike Tech All Rights Reserved. 随客交流社区 (备案号:津ICP备19010126号) |Processed in 0.134571 second(s), 11 queries , Gzip On, MemCached On.
关灯 在本版发帖返回顶部
快速回复 返回顶部 返回列表