sitin

sitin

0 关注者

6小时前

DeepSeek 又开源了个新东西:DeepSeek-Math-V2。 我简单看了下,他们这次的重点不是“算得更准”,而是让模型把自己当成一个会较真的人: 做题要写步骤、自己检查、自己挑毛病,错了不能糊弄过去。 还专门训练了个“查老师”的模型,防止验证环节自己犯糊涂。 说白了,就是逼模型把推理过程讲清楚、讲通顺、讲得经得住自己反复推敲。 效果挺猛,IMO、CMO 都到了金牌线,Putna

相关新闻

关联事件