勃勃OC 0 关注者 关注 8个月前 o3-mini是专门在代码问题上微调的。r1同时在代码和数学题上微调。这个例子显示,r1的代码能力并不如o3-mini。DeepSeek并没有“魔法”,技术上也未超越OAI。数据决定模型,RL也是。 #AI #模型 #机器学习 #代码能力 前往原网页查看