張小珺 Xiaojùn

張小珺 Xiaojùn

0 关注者

1年前

长篇技术科普第三篇,关于注意力机制。 上周DeepSeek和Kimi发布了最新研究工作,我们对DeepSeek NSA、Kimi MoBA、MiniMax-01,最近的3篇注意力机制论文逐篇精读。(嘉宾松琳在MIT做注意力机制研究方向)——希望和你一起领略科技平权,感受技术之美,也希望我们能与AI共同进步🤩

#技术科普 #注意力机制 #AI #DeepSeek #Kimi #科技平权

相关新闻

placeholder

大帅老猿

3小时前

GROK 果然还是能力最大的那个 AI

placeholder

Ding

5小时前

其实他们优化的还挺好的,Kimi 应该再把 Composer 2 拿回来,以更便宜的价格卖给我们😂

placeholder

ginobefun

16小时前

快手分享了通过「柯南 AI」实现大前端性能治理智能化的实践。核心涵盖利用 Holmes 捕捉 UI 视图线索、通过 AI 优化火焰图瓶颈识别效率,以及利用 Ekko 系统在崩溃瞬间实现精准现场恢复与逻辑跳过。 该方案通过 Agent 策略消化复杂的排障参数,将专家绝技转化为团队标配工具,能够显著缩短故障处置周期。

placeholder

Larry & Leo & Lucky 🍀

20小时前

java 26 都发布了,回想自己从 java 1.1 用到 26 … 现在自己都要用AI 来革程序员的命了💻

placeholder

野原新之栋 Sintone

20小时前

我以前很喜欢 n8n,因为它把自动化流程真正“可视化”了。 但现在我越来越觉得:如果 n8n 跟不上 AI,它很可能会被迅速边缘化。 原因很简单: AI 直接生成 n8n 节点,效果并不理想; 而 vibe coding 这半年进化太快,很多时候直接连服务、边写边调,比一个个拖节点更快。 我心里更理想的形态其实是: 先用自然语言 / 代码把流程跑通,再自动生成一条可视化节点链,方便非程序员理解

© 2025 news.news. All rights reserved. 0.18617 秒. v1.0.46
我的评论