sitin 0 关注者 关注 5天前 Anthropic宣布为Claude Opus 4及4.1版本推出新功能,模型可在极少数情况下主动结束对话。功能针对持续性有害或辱骂性互动,如用户索取可能导致大规模暴力或恐怖行动的信息。 Claude 不会在用户可能有自我伤害或伤害他人的紧急风险情况下使用“结束对话”的能力,模型仅会在以下两类极端情境中启用此功能: 多次尝试岔开话题失败,且已无继续进行建设性互动的可能; 用户明确请求 Cla #Claude Opus #对话结束功能 #有害互动 #模型安全 #Anthropic 前往原网页查看