给大家解析一下 DeepSeek-R1-0528 的官方放出的评测数据。目前 DeepSeek-R1-0528 毫无疑问是开源模型第一了, Qwen3-235B-A22B 在热座上仅座了一个月[苦涩]. 先看图1，我们可以看到编程能力和数学能力都有巨大的提升，基本都是10%左右的提升。这是一个相当猛的结果。而大家这两天放出的测试也能看到这个新版本R1直逼 OpenAI-o3 或者 Gemini-

#DeepSeek-R1-0528 #开源模型 #Qwen3-235B-A22B #编程能力 #数学能力 #OpenAI-o3 #Gemini

相关新闻

小克里丝塔

2个月前

🤩极简AI组合建议：员工”远程+坐班“模式最理想，实现magic效果 👩‍🦰Gemini：远程全能顾问，懂产品/设计/开发/市场/闲聊唠嗑/加油打气，问啥都行。 🧔‍♂️Cursor：本地agent管理全栈开发，最清楚项目的本地情况，绝对不能少。

howie.serious

2个月前

gemini 最佳实践：if 深度思考，then 信息图总结。每次和 gemini 聊完一个话题，如果是多轮的层层深入的对话，最后有所收获的话，那就多走一步：选择 nano 🍌， > 基于我们前面的对话，画一张信息图，整理核心观点例如，刚才和 ai 聊 llm 强化学习对于父母的启发。语言是模糊的，思想是在多轮对话中逐渐清晰的，和 llm 多轮对话当然是有启发的，但多了信息图总结这一步，

比特傻

2个月前

我突然意识到我已经抛弃了gpt 有gemini存在，gpt对我似乎是一文不值即便付了费，我也这么多天没用gpt了回答啰嗦，反应慢，准确率似乎比gemini低一点表现形式还比gemini单调一点 OpenAI在我这里，似乎变得一文不值了这就是大模型竞争的残酷用户几乎没有任何粘性我是仅从我这样的用户角度出发我只和第一聪明的大模型交互稍微笨一点，不好意思，对我毫无价值我当然不是说，

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

2个月前

#这个AGI冬天有点冷我的直觉，deepmind把GenAI在数字内容或者数字世界里推到一个新高度； Anthropic仍旧在LLM原生符号智能的路上探索… 产业价值和实体经济效应要看DeepSeek在纯符号智能如math和低成本长上下文的开源模型！

大宇

2个月前

我发现特别好玩的事情，让chatgpt和gemeni 辩论一些我关心的问题，让他们分别出具方案，并就对方的方案进行反复的点评，会发现他们俩一开始非常礼貌，互相吸收。但是多讨论几次之后，双方的火气都会上来，开始对对方进行一些人身攻击，并开始对对方的一些决定进行挖苦。

关联事件

深度学习模型升级引发AI能力大跃进，行业迎新变革

143

深Seek R1模型完成“小版本”升级，显著增强代码能力、语义理解和复杂逻辑推理，带来性能提升。此次升级由官方宣布，用户可在官网和APP体验，模型在训练基础上基于V3-0324版本，效果明显优于之前版本。尽管期待大版本更新，但此次小升级已引发行业关注，显示出深度学习技术不断突破的趋势。未来，模型升级或将推动AI在编程、文本理解等领域的广泛应用，影响行业发展方向。