DeepSeek开源周正式启动,开源FlashMLA
本帖最后由 as22 于 2025-2-24 15:43 编辑今日,DeepSeek正式启动“开源周”,并公布首个开源代码。
据悉,首个开源的代码库为FlashMLA,这是针对 Hopper GPU 优化的高效 MLA 解码内核,针对可变长度序列进行了优化,目前已投入生产。
据介绍,FlashMLA 的灵感来自FlashAttention 2&3和cutlass项目。
此前2月21日,DeepSeek宣布,从下周开始,他们将开源5个代码库,以完全透明的方式与全球开发者社区分享他们的研究进展,每日都有新内容解锁。
页:
[1]