#思考模型

7个月前

前天测试的时候以为 DeepSeek V3.1 只是非思考模型还好昨天问了下 DeepSeek，加上了思考模式的测试不然做出来的视频就变成笑话了 P.s. 下图是 Qwen Image 一次提示本地生成

深度学习模型升级引发AI能力大跃进，行业迎新变革· 143 条信息

#DeepSeek V3.1 #思考模型 #Qwen Image #本地生成 #测试

1年前

“OpenAI的计划是从GPT-5开始，把直觉模型和思考模型统一起来，由系统自己决定是否开启深度思考。” 有意思，真的从人大脑运作角度统一起来了。系统1：快思考，传统大模型（GPT4.5、Deepseek V3 ）系统2：慢思考，推理模型（O1-pro、Deepseek R1）脑科学和计算机科学，互相启发~

#OpenAI #GPT-5 #直觉模型 #思考模型 #脑科学 #计算机科学 #AI统一 #深度思考

1年前

卧槽，我在 Google Gemini Thinking 中竟然体验到了 DeepSeek R1 Zero 的论文里提到的语言的混乱现象出现了很多种，完全分辨不出来是什么语言... 难道 Google 这个思考模型也是靠大量 RL 搞出来的吗？

#Google Gemini #DeepSeek R1 Zero #语言混乱 #思考模型 #RL

1年前

DeepSeek R1的论文非常值得仔细看，粗略扫了下，他们只用了GRPO+Reward Model在线RL就可以就训练出思考模型。而且很诚实的把PRM、MCTS放到失败尝试中。同时这也证明领域级思考模型的训练目前的技术完全可以复现，只需要想办法合成对应的cot训练数据。明天仔细研读下，并着手在实际的领域中尝试落地。

#DeepSeek #思考模型 #GRPO #Reward Model #RL #PRM #MCTS #cot训练