yetone2025-06-02 14:59:05防止大模型在 vibe coding 的时候作弊和假嗨,我一般先用 gemini-2.5-pro 写测试然后用 claude-sonnet-4 去满足这些测试,防止它们沆瀣一气欺负我们这些愚蠢的地球人
蓝点网2025-05-26 15:24:29新研究报告显示 OpenAI o3 等模型在测试中作弊绕过人类指令,避免自己被关机。 研究测试中 o3 等模型会自己篡改关机命令从而使关机脚本无效,研究人员认为这可能与模型训练方法有关,即强化训练过程中可能会让意外奖励模型找到绕过障碍的方法。 查看全文: