𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞 0 关注者 关注 2个月前 Mark. 我们人的attention是高度可塑的。反映在语言中的统计规律会是什么样的呢? Sparse Attention Post-Training for Mechanistic Interpretability Paper: 前往原网页查看