張小珺 Xiaojùn 0 关注者 关注 8个月前 长篇技术科普第三篇,关于注意力机制。 上周DeepSeek和Kimi发布了最新研究工作,我们对DeepSeek NSA、Kimi MoBA、MiniMax-01,最近的3篇注意力机制论文逐篇精读。(嘉宾松琳在MIT做注意力机制研究方向)——希望和你一起领略科技平权,感受技术之美,也希望我们能与AI共同进步🤩 #技术科普 #注意力机制 #AI #DeepSeek #Kimi #科技平权 前往原网页查看