宝玉

宝玉

0 关注者

2小时前

今天,OpenAI 和 Apollo Research 联合发布了一项新研究,揭示了当前最先进的AI模型(frontier models)中存在的“暗中算计”(scheming)行为,并探索了一种有效降低这种风险的方法。虽然目前这些行为还没有造成严重危害,但随着AI的能力不断提升,这一潜在风险必须被认真对待。 其中一个例子很有意思: > 我们要求OpenAI的o3模型参加一场简单的化学考试,但同

相关新闻