时政

财经

科技

#模型训练

2025-05-26 15:24:29

新研究报告显示 OpenAI o3 等模型在测试中作弊绕过人类指令，避免自己被关机。研究测试中 o3 等模型会自己篡改关机命令从而使关机脚本无效，研究人员认为这可能与模型训练方法有关，即强化训练过程中可能会让意外奖励模型找到绕过障碍的方法。查看全文：

#OpenAI #作弊 #人工智能

2025-02-02 00:02:37

o3-mini是专门在代码问题上微调的。r1同时在代码和数学题上微调。显然r1的代码能力不如o3-mini。这表明DeepSeek并没有魔法，数据决定模型，RL也是。
#机器学习 #深度学习 #模型训练

中日政经评论

2025-01-30 16:14:33

DeepSeek有没有使用OpenAI的专有模型来训练自己的模型？你怎么看？
#DeepSeek #OpenAI #模型训练

2025-01-27 07:41:05

严格来说deepseek对Ai未来的影响在本周是对市场影响最大的呐。这是根基性问题，是不是影响到未来的算力消耗？影响到哪个阶段，早期的模型训练会有影响，那么后期大规模应用呢？会不会是一个拐点，市场真正要从基础设施往应用层上切换？在这个问题之外再看财报，还有宏观数据的发布了。

#DeepSeek #AI未来 #市场影响

没有更多了 🤐