#DeepSeek-Math-V2

2个月前

DeepSeek 又开源了个新东西：DeepSeek-Math-V2。我简单看了下，他们这次的重点不是“算得更准”，而是让模型把自己当成一个会较真的人：做题要写步骤、自己检查、自己挑毛病，错了不能糊弄过去。还专门训练了个“查老师”的模型，防止验证环节自己犯糊涂。说白了，就是逼模型把推理过程讲清楚、讲通顺、讲得经得住自己反复推敲。效果挺猛，IMO、CMO 都到了金牌线，Putnam 也差不多满分。我觉得这方向比单纯堆参数靠谱得多：模型到底算对没对，不重要；推理过程能不能自洽，才是关键。

深度学习模型升级引发AI能力大跃进，行业迎新变革· 143 条信息

#DeepSeek-Math-V2 #开源 #数学模型 #推理过程 #自我验证

2个月前

DeepSeek 开源了一个数学推理大模型：DeepSeek-Math-V2 超越 Gemini 获得 IMO 金牌它不仅能给出正确答案，而且还能验证自己的推理是否合理核心创新是开发了一个“生成 + 验证+复审”的自我验证系统” 模型能：自动生成数学证明；自行检查每一步是否合理；修正推理错误后再输出最终证明。 DeepSeek-Math-V2 在多个高难度数学测试上表现优异在五大数学领域（代数、几何、数论、组合、不等式）中： DeepSeekMath-V2 全面超越 GPT-5-Thinking 和 Gemini 2.5 Pro。竞赛表现 IMO 2025（国际数学奥赛）：解出 6 题中 5 题，金牌水平。 CMO 2024（中国数学奥赛）：解出 4 题 + 1 题部分得分，金牌水平。 Putnam 2024（美国大学数学赛）：118/120 分，几乎满分。

#DeepSeek-Math-V2 #数学推理大模型 #IMO金牌 #自我验证系统 #超越Gemini