o3-mini是专门在代码问题上微调的。r1同时在代码和数学题上微调。这个例子显示,r1的代码能力并不如o3-mini。DeepSeek并没有“魔法”,技术上也未超越OAI。数据决定模型,RL也是。
o3-mini是专门在代码问题上微调的。r1同时在代码和数学题上微调。这个例子显示,r1的代码能力并不如o3-mini。DeepSeek并没有“魔法”,技术上也未超越OAI。数据决定模型,RL也是。
Jesse Lau 遁一子
13分钟前
我让GPT画一张小说场景图。ta先给我画了下面这张名言图 结合我这个赛博朋克的小说摘要,有点像GPT在告知我这个信息😎 “凡我所想,皆是真实”
Olivert
7小时前
多学点人工智能技术知识。 吴恩达老师的机器学习课程个人笔记
Gorden Sun
10小时前
AI资讯日报,8月16日: