Line 0 关注者 关注 3个月前 这篇 2025,07 , 由 Deepmind, Meta, Anthropic, OpenAI AI 安全专家写的论文 《Chain of Thought Monitorability: A New and Fragile Opportunity for AI Safety》 讲了 CoT 安全的重要性, 警告我们不要轻易放弃可解释性 CoT。 这篇文章也获得了 Geoffrey Hinton, #CoT安全 #AI安全 #可解释性 #模型欺骗 #潜在推理空间 前往原网页查看