2025-04-16 03:22:33
长篇技术科普第三篇,关于注意力机制。 上周DeepSeek和Kimi发布了最新研究工作,我们对DeepSeek NSA、Kimi MoBA、MiniMax-01,最近的3篇注意力机制论文逐篇精读。(嘉宾松琳在MIT做注意力机制研究方向)——希望和你一起领略科技平权,感受技术之美,也希望我们能与AI共同进步🤩
2025-04-16 03:22:33
2025-04-15 09:53:55
2025-04-14 20:41:16
2025-04-14 17:42:40
2025-04-13 21:59:13
2025-04-13 12:16:54