0 关注者

1个月前

大模型在预训练阶段是没有人类价值观约束的，我的理解就是没限制级的。真正被用来商业化的模型，是在预训练之后，通过监督微调和强化学习对齐，将人类的偏好和安全规范引入模型。我真是很期待那种没有限制的模型，都可以用来做什么？

热门新闻