DeepSeek 又开源了个新东西：DeepSeek-Math-V2。我简单看了下，他们这次的重点不是“算得更准”，而是让模型把自己当成一个会较真的人：做题要写步骤、自己检查、自己挑毛病，错了不能糊弄过去。还专门训练了个“查老师”的模型，防止验证环节自己犯糊涂。说白了，就是逼模型把推理过程讲清楚、讲通顺、讲得经得住自己反复推敲。效果挺猛，IMO、CMO 都到了金牌线，Putna

#DeepSeek-Math-V2 #开源 #数学模型 #推理过程 #自我验证

相关新闻

Gorden Sun

2个月前

GELab-Zero：完全开源的GUI Agent解决方案集成了模型和基础设施，支持本地部署，提供完整的隐私控制。简化了手机GUI Agent的工程复杂度。能实现查找任务、操作APP等手机端任务。 Github：

Geek

2个月前

FluidVoice 完全开源的 macOS 语音转文字听写输入应用核心功能： 🔹实时语音转录：Parakeet TDT v3 模型，悬浮窗预览。 🔹AI文本增强：支持OpenAI、Groq等API优化。 🔹多语言：25+种，自动检测。 🔹全局快捷键：随时捕捉语音。 🔹智能输入：文本直接输入任意应用

小互

2个月前

DeepSeek 开源了一个数学推理大模型：DeepSeek-Math-V2 超越 Gemini 获得 IMO 金牌它不仅能给出正确答案，而且还能验证自己的推理是否合理核心创新是开发了一个“生成 + 验证+复审”的自我验证系统” 模型能：自动生成数学证明；自行检查每一步是否合理；修正推理错误后再输出最终证明。 DeepSeek-Math-V2 在多个高难度数学测试上表现优异

初码

3个月前

完犊子了，我又想通了一个逻辑，既然我都笃信伴随着工程极速爆炸后的肉体永生可行性，那我真的太傻了，我竟然没想到光刻机层面的研发突破，难度可能也差不多，所以10-15年，一定会发展到由中国带领，全球都在卷最高级光刻机，工程全开源的程度，所以结论是啥，那就是台湾完犊子，就算不卖台，也危矣！

Gorden Sun

3个月前

通义开源的Z-Image-Turbo图片模型太强了仅6B大小，1秒出图，但是质量却非常非常高，人物真实、美学在线，天然认识各种名人，没有审核，绝对是本地AI绘画的首选模型。模型：在线使用：

关联事件

深度学习模型升级引发AI能力大跃进，行业迎新变革

143

深Seek R1模型完成“小版本”升级，显著增强代码能力、语义理解和复杂逻辑推理，带来性能提升。此次升级由官方宣布，用户可在官网和APP体验，模型在训练基础上基于V3-0324版本，效果明显优于之前版本。尽管期待大版本更新，但此次小升级已引发行业关注，显示出深度学习技术不断突破的趋势。未来，模型升级或将推动AI在编程、文本理解等领域的广泛应用，影响行业发展方向。