DeepSeek推出新型数学推理模型DeepSeekMath-V2，采用可自我验证的训练框架。模型基于DeepSeek-V3.2-Exp-Base构建，通过LLM验证器自动审查生成的数学证明，并利用高难度样本持续优化性能。在IMO 2025和CMO 2024中均达到金牌水平，Putnam 2024获118/120分。团队表示，该成果验证了自验证推理路径的可行性，为构建可靠数学智能系统提供新方向。

#DeepSeekMath-V2 #数学推理模型 #自验证训练框架 #IMO金牌 #数学智能系统

相关新闻

小互

3个月前

DeepSeek 开源了一个数学推理大模型：DeepSeek-Math-V2 超越 Gemini 获得 IMO 金牌它不仅能给出正确答案，而且还能验证自己的推理是否合理核心创新是开发了一个“生成 + 验证+复审”的自我验证系统” 模型能：自动生成数学证明；自行检查每一步是否合理；修正推理错误后再输出最终证明。 DeepSeek-Math-V2 在多个高难度数学测试上表现优异

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

7个月前

总结总而言之，这个Prompt之所以能引导AI取得IMO金牌级的表现，关键在于它超越了“解题”本身，而是构建了一个模拟顶尖数学思维模式的系统。其核心思路可以概括为：通过“创造者-批判者”的认知双重角色分离，辅以对严谨性毫不妥协的准则和一套精细化的错误“损伤控制”流程，最终以高度结构化的方式呈现一个逻辑上完美无瑕的论证。这套方法论不仅能找出正确答案，更能确保通往答案的路径是坚不可摧的。这正