#思维链忠诚度

OpenAI 昨晚开了场直播,Sam Altman、首席科学家 Jakub 和联合创始人 Wojciech 三个人聊了很多。 大聪明用 ListenHub 的 API 把原版重新配了中文音。Jakub 原声实在是...配音版体验竟然超过了原版 🤣。 收听地址:【中文配音完整版】OpenAI 完成了资本重组,并以最大尺度进行了一场直播】 另外把核心信息整理成了 QA,挑几个重点说说。 研究时间表 OpenAI 内部定了两个时间点: • 2026 年 9 月前:做出"AI 研究实习生",能有意义地加速研究员工作 • 2028 年 3 月前:实现完全自动化的 AI 研究员 Sam 说这些日期完全可能搞错,但这就是他们现在的思考方式。 Jakub 用"时间跨度"来衡量模型能力,就是普通人完成同样任务需要多久。现在这一代模型大约是 5 小时。 距离超级智能还有多远?Jakub 说不到十年。 基础设施投入 Sam 公布的数字: • 略高于 30 吉瓦的基础设施工厂计划 • 未来很多年里,总共约 1.4 万亿美元的财务责任 终极愿景是建立一个"基础设施工厂",每周生产 1 吉瓦的算力,成本降到大约每吉瓦 200 亿美元。 Sam 开玩笑说:可能得重新规划一下机器人技术的思路,让它们来帮忙建数据中心。 1 吉瓦是什么概念?Sam 展示了德克萨斯州 Abilene 正在建设的数据中心,第一个"星际之门"站点。每天有成千上万的人在工地工作,可能还有几十万甚至几百万人在供应链上工作。 安全技术突破 关键技术是思维链忠诚度。 核心想法是,让模型内部推理的一部分过程不受监督,训练期间不去干预它。这样它就能保持对其内部过程的真实反映。 OpenAI 克制自己,不去引导模型产生"好的想法",从而让它对自己的真实想法保持忠诚。 这个技术在 OpenAI 内部大量使用,用来理解模型是如何训练的,它们的倾向性在训练过程中如何演变。 但它有些脆弱,需要划定清晰的界限。比如 ChatGPT 里的思维链摘要器,就是为了给模型保留一定程度的、可控的隐私。