Tony出海 0 关注者 关注 1个月前 ➕科普,什么是大模型RL? “大模型RL”通常指**大语言模型(LLM)结合强化学习(Reinforcement Learning, RL)**的技术路线,尤其是近年来在ChatGPT、Grok、Claude 和 DeepSeek 系列等顶级大模型中广泛使用的核心训练范式。 最经典、影响力最大的就是 **RLHF**(Reinforcement Learning from Human Feed 前往原网页查看