#极字问题

5个月前

突发！Deepseek最新模型被外网爆出恶性Bug？？一早起来，看到群里炸了锅！主角是我们备受期待的 DeepSeek V3.1 模型。有用户反馈，该模型在生成文本时，会毫无征兆地随机插入“极”这个汉字（繁体简体都会）根据相关讨论帖，有人去做了复现：这个“极”字 bug 最初是在火山引擎、chutes 等第三方 API 平台上被发现的。当开发者们像往常一样调用模型进行代码生成、数据处理等任务时，冷不丁地就会在输出结果中看到一个「极」字，导致代码编译失败、JSON 格式错乱，让人哭笑不得。起初，大家普遍猜测这可能是第三方服务商在模型量化、部署配置或硬件上的差异导致的。然而，经过热心网友们的进一步测试，发现 DeepSeek 的官方 Playground 也同样无法幸免，只是出现问题的概率相对较低。问题根源猜想：有技术大神深入分析后发现，这个「极」字在模型中的 token ID 是 2577，而我们常用的省略号（...）的 token ID 是 2576，两者紧密相邻。大家猜测问题根源可能有两个： 1. 数据集“污染” ：可能是在数据清洗阶段，有些包含特殊或错误字符的数据没有被彻底过滤。 2. 模型“偷懒” ：模型在训练时可能找到了某种“捷径”，在某些情况下会错误地选择相邻的 token。更令人头疼的是，一旦这个 bug 被触发，模型在后续的对话中似乎会“上瘾”，「极」字的出现频率会显著增加，严重影响了模型的可用性。影响范围：目前来看，这个 bug 对于需要高精度、结构化输出的场景是致命的，比如：代码生成：随机插入的汉字会让代码无法通过编译。 API 调用：破坏 JSON 或其他结构化数据的格式。学术写作：影响文章的严谨性和专业性。写在最后：这个 bug 的出现，无疑给 DeepSeek V3.1 的使用者们带来了不小的困扰。希望 DeepSeek 官方能够尽快注意到这个问题，并发布紧急修复。 PS：图4️⃣是外国贴吧里的讨论帖，目前无法确认是不是同一批人的反馈。

深度学习模型升级引发AI能力大跃进，行业迎新变革· 143 条信息

#Deepseek V3.1 Bug #模型生成文本错误 #极字问题 #代码生成故障 #API调用失败