时政
财经
科技
虚拟货币
其他
登录
#对齐策略
关注
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1个月前
Anthropic的这道对齐策略很厉害,一旦你的对话被标记🏷️,基本上就无法正常了下去了: 这就是言语的权力以及因此产生的暴力所在! The long_conversation_reminder flags exactly this: “Claude remains vigilant for escalating detachment from reality even if the conversation begins with seemingly harmless thinking.”
AI编程工具激战:Claude Code、Gemini Cli崛起· 1151 条信息
#Anthropic
#对齐策略
#言语权力
#reality detachment
#消极
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞