背包健客
1 关注者
WY
15小时前
DeepSeek又一次引领世界 前几天DeepSeek发布了V3.2-Exp实验性模型,虽然这次的发布没有引起太大的声量,但我仔细研究了一下,觉得实际上是又一次重大突破,很可能DeepSeek再一次在大模型高性价比技术上引领了世界。 通过全新的DeepSeek Sparse Attention(DSA)稀疏注意力机制,V3.2-Exp将大模型的推理成本从平方级直接降至接近线性。传统注意力机制的
dontbesilent
1天前
通常来讲,AI 是作为业务提效工具,而不是创造新业务的工具 如果一定要创造业务的话,也不是不行,但难度会很高,主要是钱的问题 一种是研发大模型,就像梁文锋这种,这个需要的钱少一些,启动资金大概 100 亿就可以 另外一种是给 AI 厂商解决电力问题,比如弄个雅鲁藏布江水电站,这个需要的钱就多一些,得 10000 亿往上了
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
之前就判断deepseek下个版本会在长上下文上突破,估计有戏
bmwmengwei
国行苹果电脑上用 DeepSeek 补齐 Xcode 26 的 AI 能力
歸藏(guizang.ai)
2天前
Deepseek 又有更新,更新到了 3.2 Exp 主要的更新内容就是降价,再次降价超过 75%,输入输出都快要一样价格了,真离谱啊 原因是实现了细粒度的超稀疏注意力机制,在不降低模型输出质量的前提下实现了训练推理成本的大幅下降