WY 0 关注者 关注 3小时前 DeepSeek又一次引领世界 前几天DeepSeek发布了V3.2-Exp实验性模型,虽然这次的发布没有引起太大的声量,但我仔细研究了一下,觉得实际上是又一次重大突破,很可能DeepSeek再一次在大模型高性价比技术上引领了世界。 通过全新的DeepSeek Sparse Attention(DSA)稀疏注意力机制,V3.2-Exp将大模型的推理成本从平方级直接降至接近线性。传统注意力机制的 #DeepSeek #V3.2-Exp #稀疏注意力机制 #线性推理成本 #国产AI 前往原网页查看