Anthropic宣布为Claude Opus 4及4.1版本推出新功能，模型可在极少数情况下主动结束对话。功能针对持续性有害或辱骂性互动，如用户索取可能导致大规模暴力或恐怖行动的信息。 Claude 不会在用户可能有自我伤害或伤害他人的紧急风险情况下使用“结束对话”的能力，模型仅会在以下两类极端情境中启用此功能：多次尝试岔开话题失败，且已无继续进行建设性互动的可能；用户明确请求 Cla

#Claude Opus #对话结束功能 #有害互动 #模型安全 #Anthropic

相关新闻

LinearUncle

10小时前

anthropic今天用接近源码泄露的方式给大家以身作则实践了一把什么是harness engineering. 名词天天造，anthropic老板吹破牛，内部仍然是草台班子。

歸藏(guizang.ai)

23小时前

Claude Code 也能使用前几天 Anthropic 发布的 Computer Use 了你可以用它这个能力来自己去验证一些 UI 上的问题：验证编码中的一些 UI 走查，模拟人工点击的链路测试它也可以操作：已经编译的 SwiftUI 应用本地的、跨平台的应用完全没有 CLI 的一些其他应用 Pro 和 Max 账号能用，三方的 API 不行，使用/MCP 启用里面的 com

Livid 🦇🔊

1天前

对的事情在发展过程中都是不纠结的，一切都会很顺。会被各种主观能动性自然往前推动。如果过程很累，却收效甚微，那一定有什么地方错了。 Anthropic 不需要去特意做什么艰难的推广过程，增长和收入就来了。

梁岷Liam

1天前

听Claude Code创始人Boris Cherny最新播客，主持人问他：AGI实现之后，你打算做什么？他说，大概会回日本做味噌。 Boris曾和妻子在奈良乡村住了几年。他是那个镇上唯一说英文的人。那里的社交方式，是邻居之间互换味噌和腌菜，他就这样学会了做味噌。2024年9月，他离开那个村子，加入Anthropic，开始构建Claude。硅谷似乎有一条隐秘的精神传承：当一个人真的想把东

思维怪怪

3天前

塑造全球 AI 格局的，不只是技术路线之争，还有一段从未愈合的私人创伤。 WSJ 记者 Keach Hagey 发表长篇调查报道，通过对两家公司现任和前员工及高管身边人的大量采访，首次系统披露 Anthropic 与 OpenAI 创始人之间延续十年的个人恩怨。 Dario Amodei 近几个月在内部的措辞远比公开场合激烈。他将 Sam Altman 与 Elon Musk 的法律纠纷比作「