𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞 0 关注者 关注 1个月前 Anthropic的这道对齐策略很厉害,一旦你的对话被标记🏷️,基本上就无法正常了下去了: 这就是言语的权力以及因此产生的暴力所在! The long_conversation_reminder flags exactly this: “Claude remains vigilant for escalating detachment from reality even if the con #Anthropic #对齐策略 #言语权力 #reality detachment #消极 前往原网页查看