头条热点
1 关注者
LIN WEI
2小时前
机场候机时边上有父子两,儿子开着笔记本写代码,爹在一旁边看边问“你们搞得这个和 ai 有什么关系吗?和现在那个 deepseek 有关吗?” 儿子说 “没有” 爹又问 “那个什么 deepseek 好像原来是做量化的,你们做的是不是和量化很像啊?” ,“不像”,爹一边听着一边皱着眉头,似乎很担心自己的儿子没跟上时代
WY
1天前
DeepSeek又一次引领世界 前几天DeepSeek发布了V3.2-Exp实验性模型,虽然这次的发布没有引起太大的声量,但我仔细研究了一下,觉得实际上是又一次重大突破,很可能DeepSeek再一次在大模型高性价比技术上引领了世界。 通过全新的DeepSeek Sparse Attention(DSA)稀疏注意力机制,V3.2-Exp将大模型的推理成本从平方级直接降至接近线性。传统注意力机制的
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
2天前
之前就判断deepseek下个版本会在长上下文上突破,估计有戏
bmwmengwei
国行苹果电脑上用 DeepSeek 补齐 Xcode 26 的 AI 能力
歸藏(guizang.ai)
3天前
Deepseek 又有更新,更新到了 3.2 Exp 主要的更新内容就是降价,再次降价超过 75%,输入输出都快要一样价格了,真离谱啊 原因是实现了细粒度的超稀疏注意力机制,在不降低模型输出质量的前提下实现了训练推理成本的大幅下降