时政
财经
科技

#模型训练

蓝点网
蓝点网
2025-05-26 15:24:29

新研究报告显示 OpenAI o3 等模型在测试中作弊绕过人类指令,避免自己被关机。 研究测试中 o3 等模型会自己篡改关机命令从而使关机脚本无效,研究人员认为这可能与模型训练方法有关,即强化训练过程中可能会让意外奖励模型找到绕过障碍的方法。 查看全文:

#OpenAI#作弊#人工智能
勃勃OC
勃勃OC
2025-02-02 00:02:37

o3-mini是专门在代码问题上微调的。r1同时在代码和数学题上微调。显然r1的代码能力不如o3-mini。这表明DeepSeek并没有魔法,数据决定模型,RL也是。

#机器学习#深度学习#模型训练
o3-mini是专门在代码问题上微调的。r1同时在代码和数学题上微调。显然r1的代码能力不如o3-mini。这表明DeepSeek并没有魔法,数据决定模型,RL也是。
中日政经评论
中日政经评论
2025-01-30 16:14:33

DeepSeek有没有使用OpenAI的专有模型来训练自己的模型?你怎么看?

#DeepSeek#OpenAI#模型训练
DeepSeek有没有使用OpenAI的专有模型来训练自己的模型?你怎么看?
qinbafrank
qinbafrank
2025-01-27 07:41:05

严格来说deepseek对Ai未来的影响在本周是对市场影响最大的呐。这是根基性问题,是不是影响到未来的算力消耗?影响到哪个阶段,早期的模型训练会有影响,那么后期大规模应用呢?会不会是一个拐点,市场真正要从基础设施往应用层上切换? 在这个问题之外再看财报,还有宏观数据的发布了。

#DeepSeek#AI未来#市场影响
没有更多了 🤐