meng shao 0 关注者 关注 1天前 DeepSeek 最新的两篇论文「mHC」和「Engram」都看到了创始人「梁文锋」的署名,虽然 DeepSeek V4 还没来(不会真的要踩春节时间吧..),但能看出 DeepSeek 在模型“计算效率”和“能力扩展”上持续的研究,不受限于 Transformer 的认知范围。 mHC:为“激进”的架构加上“安全阀” DeepSeek 提出的 mHC (Manifold-Constrained 前往原网页查看