勃勃OC

勃勃OC

0 关注者

6个月前

o3-mini是专门在代码问题上微调的。r1同时在代码和数学题上微调。显然r1的代码能力不如o3-mini。这表明DeepSeek并没有魔法,数据决定模型,RL也是。

#机器学习 #深度学习 #模型训练 #强化学习 #代码能力 #数据重要性

相关新闻

placeholder

Olivert

7小时前

多学点人工智能技术知识。 吴恩达老师的机器学习课程个人笔记

placeholder

在悉尼和稀泥

2天前

机器学习好啊,机器学习得学啊

placeholder

Olivert

3天前

机器学习与人工智能的 30 个核心问题,英文版可以用在线阅读:

placeholder

偶像派作手

4天前

今晚美国CPI数据有多重要你知道吗?

placeholder

Susan STEM

1周前

我感觉GPT-5还是不错的。我现在的关注点不是代码能力,我反而认为代码能力的解决没有悬念。 我关心的是能给我多少shit you don’t know you don’t know, 而且都是和验证可迁移的结构。

© 2025 news.news. All rights reserved. 0.11495 秒. v1.0.42
我的评论