Mr Panda 0 关注者 关注 1个月前 大模型在预训练阶段是没有人类价值观约束的, 我的理解就是没限制级的。 真正被用来商业化的模型, 是在预训练之后, 通过监督微调和强化学习对齐,将人类的偏好和安全规范引入模型。 我真是很期待那种没有限制的模型,都可以用来做什么? 前往原网页查看