首页点击榜热搜榜通知我的

#数据重要性

2025-02-02 00:02:37

o3-mini是专门在代码问题上微调的。r1同时在代码和数学题上微调。显然r1的代码能力不如o3-mini。这表明DeepSeek并没有魔法，数据决定模型，RL也是。
#机器学习 #深度学习 #模型训练 #强化学习 #代码能力 #数据重要性

热搜榜

24小时点击排行

1

秋雨告恙，无法一起泡澡，摸不到他的肥肚子了 😇😇😇

2

这就是心斋桥：

3

全国射击手枪冠军赛激战正酣，国际射联主席罗西点赞

4

可爱鹿鹿

5

买一大盒放。扔第一个就有了教训，要先看下风向，不然吹回来差点把自己炸了。

6

网传“重庆北碚将建迪士尼”？官方回应：系谣言

7

聚焦｜青春不散场！U20国足解散新一届国奥队雏形已现

8

技术攻坚“起春潮”——云南重大水利工程建设见闻

9

“科技赋能”与勤劳双手共谱春耕备耕“新序曲”

10

现在还有几个推友发私信问我王伟恒去哪里了，我的回复他就是个骗子，至今还欠我1200美金。推友说他还不起，其实根本不是，美国送外卖一周800-1000毛利还是有的，诚心还几个月也能还清，这孙子就是个骗子，到处借钱，还了几个人我不知道，我的一天没还我都有权利骂他是个骗子

热门事件

俄乌战争专题

特朗普，马斯克相关事件跟踪

巴以冲突最新进展

尹锡悦弹劾案全纪录

比亚迪”黑奴工”事件

香港47人案

各种举报事件汇总

AI热点追踪

加密货币热点跟踪

推荐信息源

网易新闻-红星新闻