o3-mini是专门在代码问题上微调的。r1同时在代码和数学题上微调。这个例子显示，r1的代码能力并不如o3-mini。DeepSeek并没有“魔法”，技术上也未超越OAI。数据决定模型，RL也是。

#AI #模型 #机器学习 #代码能力

相关新闻

Cell 细胞

2个月前

AI 学的是平庸，人的价值是异常机器学习本质是在拟合回归线，它教会机器做「平均值」。人的价值恰恰是跳到线外面，做一个异常值。所以，别被 AI 拟合成「可预测的人」。

小牛OTC

2个月前

如果你看到一张心怡的AI图，你也想制作，很好办。反向提问答案就出来

大宇

2个月前

AGI是支持美股狂飙的梦这个梦有没有可能50甚至100年后才实现？好处是没有人能证伪，突然觉得美股看多AI的基金合力在讲在信的故事创意太伟大了

卫斯理

2个月前

google antigravity 大公司就是不一样，一出手就三个平台一起发 AI 时代，老炮依旧会赢谷歌有什么 - 近乎无限的现金流：google ads, youtube ... - 近乎垄断的用户入口：chrome, android, google search, gmail... - 多年积累的用户数据：google 创建于 1998 年相比之下，openai 有什么呢？

terry

2个月前

11月20号桥水的达利欧在采访中表示：当前的美股科技股（尤其是 AI 领域）已经处于泡沫区域，大约处于历史泡沫峰值的 80% 分位。尽管确认是泡沫，但他强调不要仅仅因为有泡沫就卖出，泡沫的破裂通常需要一个催化剂，最常见的是因为缺钱而不得不卖出资产。但目前的宏观环境还没有到那个紧缩的临界点，因此在泡沫真正破裂之前，股价往往还有相当大的上涨空间他拿 1999 年互联网泡沫举例，指出如果你在