时政
财经
科技
虚拟货币
其他
登录
#DeepSeek-Math-V2
关注
sitin
6小时前
DeepSeek 又开源了个新东西:DeepSeek-Math-V2。 我简单看了下,他们这次的重点不是“算得更准”,而是让模型把自己当成一个会较真的人: 做题要写步骤、自己检查、自己挑毛病,错了不能糊弄过去。 还专门训练了个“查老师”的模型,防止验证环节自己犯糊涂。 说白了,就是逼模型把推理过程讲清楚、讲通顺、讲得经得住自己反复推敲。 效果挺猛,IMO、CMO 都到了金牌线,Putnam 也差不多满分。 我觉得这方向比单纯堆参数靠谱得多: 模型到底算对没对,不重要;推理过程能不能自洽,才是关键。
深度学习模型升级引发AI能力大跃进,行业迎新变革· 141 条信息
#DeepSeek-Math-V2
#开源
#数学模型
#推理过程
#自我验证
分享
评论 0
0
小互
12小时前
DeepSeek 开源了一个数学推理大模型:DeepSeek-Math-V2 超越 Gemini 获得 IMO 金牌 它不仅能给出正确答案,而且还能验证自己的推理是否合理 核心创新是开发了一个“生成 + 验证+复审”的自我验证系统” 模型能: 自动生成数学证明; 自行检查每一步是否合理; 修正推理错误后再输出最终证明。 DeepSeek-Math-V2 在多个高难度数学测试上表现优异 在五大数学领域(代数、几何、数论、组合、 不等式)中: DeepSeekMath-V2 全面超越 GPT-5-Thinking 和 Gemini 2.5 Pro。 竞赛表现 IMO 2025(国际数学奥赛):解出 6 题中 5 题,金牌水平。 CMO 2024(中国数学奥赛):解出 4 题 + 1 题部分得分,金牌水平。 Putnam 2024(美国大学数学赛):118/120 分,几乎满分。
#DeepSeek-Math-V2
#数学推理大模型
#IMO金牌
#自我验证系统
#超越Gemini
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞