Barret李靖

Barret李靖

0 关注者

2小时前

“AI 味”这件事,本质上是语言模型逃不掉的命运。因为它从诞生的第一刻起,就不是在“表达自己”,而是在“复刻统计平均”。模型的训练目标只是预测下一个词最可能是什么,它不会思考“我为什么要说这句话”,也没有任何主观意图。于是,它的语言天然带着一种“概率最优解”的味道——对,但平,准,但无魂。 更致命的是,后期的 RLHF 奖励机制会进一步放大这种味道。人类标注者倾向于给那些“中庸、安全、全面”的答

相关新闻

关联事件