马东锡 NLP 0 关注者 关注 1周前 DeepSeek V3.1 出现了 Glitch Tokens 的问题,随机高频冒出 " extreme" / "极" / "極"。 在 post-training 时代之前,Glitch Tokens 通常指的是某些在自然语料里极少/异常的 token,会扰乱本应正常的生成行为。 在 post-training 时代,大量自制 DSL / 控制标记作为 added tokens 被引入,用来 #DeepSeek V3.1 #Glitch Tokens #DSL token #模型干扰 #自然语言生成 前往原网页查看