Mr Panda

Mr Panda

0 关注者

1个月前

大模型在预训练阶段是没有人类价值观约束的, 我的理解就是没限制级的。 真正被用来商业化的模型, 是在预训练之后, 通过监督微调和强化学习对齐,将人类的偏好和安全规范引入模型。 我真是很期待那种没有限制的模型,都可以用来做什么?

热门新闻