as22 发表于 2025-2-24 15:42:09

DeepSeek开源周正式启动,开源FlashMLA

本帖最后由 as22 于 2025-2-24 15:43 编辑

今日,DeepSeek正式启动“开源周”,并公布首个开源代码。

据悉,首个开源的代码库为FlashMLA,这是针对 Hopper GPU 优化的高效 MLA 解码内核,针对可变长度序列进行了优化,目前已投入生产。

据介绍,FlashMLA 的灵感来自FlashAttention 2&3和cutlass项目。

此前2月21日,DeepSeek宣布,从下周开始,他们将开源5个代码库,以完全透明的方式与全球开发者社区分享他们的研究进展,每日都有新内容解锁。




页: [1]
查看完整版本: DeepSeek开源周正式启动,开源FlashMLA