阿泽KK

阿泽KK

0 关注者

3个月前

ACL 2025 最佳论文前两天公布了,俗话说:错过ACL 2025 = 在AI 2.0时代掉队🤣 于是今天一早,在 G 老师的协助下,火速拜读了由 DeepSeek & 北大等联合发表的论文:《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》。 📝 一句话总结:这篇论文不仅提出

#ACL 2025 #长上下文处理 #稀疏注意力 #DeepSeek #硬件对齐优化

相关新闻

placeholder

偶像派作手

1天前

AI大模型能做到这么自然生动的翻译了(基于DeepSeek)

placeholder

Rocky

6天前

中国 #AI 模型Kimi K2 Thinking ,这次居然超越了GPT-5、Grok4、Claude 4.5!🥸🥸 再一次见证DeepSeek时刻!据说只用了460万美元,跑通了1T参数的 MoE 架构,这不是给我美股伤疤撒盐嘛?😭 话说中国 #AI 芯片,真的实现了自产自给?🤔感觉有点不可思议!

placeholder

陈少举 (🦣 @[email protected] )

6天前

#原神 从玉衡杯数据库将杜林的技能丢给DeepSeek和ChatGPT,DS建议优先考虑绝缘,而GPT则建议优先考虑魔女。 发现DS真的很喜欢推荐绝缘套。🤔 DS: GPT: 。

placeholder

Larry & Leo Bro - Eagle of Full Stack

1周前

昨天晚上优化了下 prompt,结果一宿一单都没开,纯纯给 deepseek 送了一晚上 apj 钱,这会儿正在让 ai 反思呢!

placeholder

大帅老猿

1周前

今天空头方向是吃美了,这个默认的 promp 就偏向做空。Deepseek 的花费总计到了 5 块人民币。

© 2025 news.news. All rights reserved. 0.11268 秒. v1.0.46
我的评论