阿泽KK

阿泽KK

0 关注者

4个月前

ACL 2025 最佳论文前两天公布了,俗话说:错过ACL 2025 = 在AI 2.0时代掉队🤣 于是今天一早,在 G 老师的协助下,火速拜读了由 DeepSeek & 北大等联合发表的论文:《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》。 📝 一句话总结:这篇论文不仅提出

#ACL 2025 #长上下文处理 #稀疏注意力 #DeepSeek #硬件对齐优化

相关新闻

placeholder

Gorden Sun

4周前

DeepSeek线上模型已更新

placeholder

李老师不是你老师

1个月前

网友投稿 Deepseek,有中国特色社会主义思想觉悟的AI。

placeholder

LL

1个月前

对了,张震岳成都演唱会前排坐了一对母子,小孩哥帮母亲录视频的间隙,在用Github和Deepseek编程!我真的震惊了,看年纪顶多高一,更大可能是初中生,这个世界好疯狂

placeholder

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

1个月前

math确实是最适合符号智能的了,也不用考虑什么符号接地之类的东西 看看deepseek的超长上下文版本什么时候出来!

placeholder

陈少举 (🦣 @[email protected] )

1个月前

咋回事啊,这么多人用Deepseek的嘛。🤔 搜了一下微博,发现Deepseek炸了,我还以为是我的问题太复杂了。😂

© 2025 news.news. All rights reserved. 0.05246 秒. v1.0.46
我的评论