今天，OpenAI 和 Apollo Research 联合发布了一项新研究，揭示了当前最先进的AI模型（frontier models）中存在的“暗中算计”（scheming）行为，并探索了一种有效降低这种风险的方法。虽然目前这些行为还没有造成严重危害，但随着AI的能力不断提升，这一潜在风险必须被认真对待。其中一个例子很有意思： > 我们要求OpenAI的o3模型参加一场简单的化学考试，但同

#OpenAI #AI暗中算计 #战略性表现不佳 #深思熟虑对齐法 #情境感知

相关新闻

kevinzhow

2个月前

感觉 OpenAI 终究还是得做个自己的 Code IDE，目前 Codex 在第三方里都用起来不舒服

Luo说不啰嗦

2个月前

之前我在脸书上的一个 73 万人的 AI 社群被封了，原因是 OpenAI 发来律师函要求下架赠送 Sora 2 邀请码的帖子，说涉嫌侵权。我不服，跟他们硬刚，耗时近一个月，终于给申诉回来了。

Geek

2个月前

对 New API 审美疲劳了试试 AxonHub 一个 AI 万能插座(网关)，提供统一 API，兼容 OpenAI 与 Anthropic 格式，支持自动故障转移、细粒度权限控制、模型映射、参数覆盖及多种部署方式。

勃勃OC

2个月前

OpenAI 在 2025 年第三季度录得 150 亿美元的季度亏损，较 2024 年第三季度的 25 亿美元亏损增长了 490%。虽然这些数据尚未对外公开披露，但可以根据该公司向美国证券交易委员会（SEC）提交的文件推算得出。

看不懂的sol

2个月前

为了兄弟们更加清楚的了解美股巨头的AI 叙事玩法，特意制作此图。说实话，AI 巨头们的 “闭环互喂局”，这玩法真TMD刺激！英伟达拟投 OpenAI 千亿美元 → OpenAI 五年向甲骨文买 3000 亿算力 → 甲骨文再向英伟达狂购 GB200 → 钱又回到英伟达。微软已投 OpenAI 超 130 亿美元 → OpenAI 用这笔钱买 Azure（底层英伟达 GPU）→ 英伟达再