
10%公司
国家知识产权局:多方恶意抢注DeepSeek商标被驳回,具有明显“蹭热点”、谋取不当利益意图

首次亮相发布会,司长念了一首用DeepSeek作的诗

医学博主自嘲“天都塌了”,DeepSeek看病开处方靠谱吗?

我使用LLM的历程:ChatGPT出来后第一时间弄了账号,玩了几手觉得暂时没什么用弃置很久。等到我终于感觉它们有用时Gemini出来了,后者更快些;Gemini和GPT交替用了几个月,DeepSeek出世,确实更聪明而且不限制香港IP,用了两周;Grok3来了,比DS强,而且在审查自由度上让前三者都成了狗屎,果断跳坑。
DeepSeek 推出了 FlashMLA,这是一款专为 Hopper GPU 设计的新解码内核,标志着其开源周的开始。FlashMLA 旨在提高 AI 模型的效率,支持 BF16,采用 64 块大小的分页 KV 缓存,并在 H800 GPU 上实现 3000 GB/s 的内存带宽和 580 TFLOPS 的高性能。
该内核针对可变长度序列进行了优化,大幅降低计算需求,同时提升 AI 任务的速度
DeepSeek开源FlashMLA,意味着什么?

