DeepSeek 推出了 FlashMLA，这是一款专为 Hopper GPU 设计的新解码内核，标志着其开源周的开始。FlashMLA 旨在提高 AI 模型的效率，支持 BF16，采用 64 块大小的分页 KV 缓存，并在 H800 GPU 上实现 3000 GB/s 的内存带宽和 580 TFLOPS 的高性能。该内核针对可变长度序列进行了优化，大幅降低计算需求，同时提升 AI 任务的速度

#DeepSeek #FlashMLA #HopperGPU #AI #开源 #BF16 #H800GPU #高性能计算

相关新闻

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

6小时前

确定这个没用AI修过水花？

Colin Wu

7小时前

腾讯研究院文章观点：AI 可能使我们每个人成为有闲者，走向无工作社会（UBI）。文章浪漫地说：人类将有大量的多余时间去享受闲暇，享受创造性有意义的生活，而非无聊繁琐的工作事务。突然想到一个不恰当的类比：内地外劳来香港，印度码农去美国，本地人就变成了有闲阶级，不再需要工作了吗？为了社会稳定，似乎需要人们工作，而不是闲着。另外，技术革命不会让工作消失，只会让工作转移。就像移动互联网催生了滴

sitin

8小时前

以前直播只卖课，挺累的，来回讲重复内容，今天直播很轻松演示代码，讲产品讲工具，顺带推课，很开心，感谢 AI 时代。🙏

Gorden Sun

9小时前

AI资讯日报，11月15日：

Gorden Sun

10小时前

Code wiki：谷歌的Github Wiki 类似DeepWiki和智谱的Zread，AI整理了Github仓库的内容，可以快速上手、了解架构，支持提问。特色是有类似NotebookLM生成的视频介绍。在线使用：