时政
财经
科技
虚拟货币
其他
登录
#极字问题
关注
Max For AI
1个月前
突发!Deepseek最新模型被外网爆出恶性Bug?? 一早起来,看到群里炸了锅! 主角是我们备受期待的 DeepSeek V3.1 模型。 有用户反馈,该模型在生成文本时,会毫无征兆地随机插入“极”这个汉字(繁体简体都会) 根据相关讨论帖,有人去做了复现: 这个“极”字 bug 最初是在火山引擎、chutes 等第三方 API 平台上被发现的。 当开发者们像往常一样调用模型进行代码生成、数据处理等任务时,冷不丁地就会在输出结果中看到一个「极」字,导致代码编译失败、JSON 格式错乱,让人哭笑不得。 起初,大家普遍猜测这可能是第三方服务商在模型量化、部署配置或硬件上的差异导致的。 然而,经过热心网友们的进一步测试,发现 DeepSeek 的官方 Playground 也同样无法幸免,只是出现问题的概率相对较低。 问题根源猜想: 有技术大神深入分析后发现,这个「极」字在模型中的 token ID 是 2577,而我们常用的省略号(...)的 token ID 是 2576,两者紧密相邻。 大家猜测问题根源可能有两个: 1. 数据集“污染” : 可能是在数据清洗阶段,有些包含特殊或错误字符的数据没有被彻底过滤。 2. 模型“偷懒” : 模型在训练时可能找到了某种“捷径”,在某些情况下会错误地选择相邻的 token。 更令人头疼的是,一旦这个 bug 被触发,模型在后续的对话中似乎会“上瘾”,「极」字的出现频率会显著增加,严重影响了模型的可用性。 影响范围: 目前来看,这个 bug 对于需要高精度、结构化输出的场景是致命的,比如: 代码生成 :随机插入的汉字会让代码无法通过编译。 API 调用 :破坏 JSON 或其他结构化数据的格式。 学术写作 :影响文章的严谨性和专业性。 写在最后: 这个 bug 的出现,无疑给 DeepSeek V3.1 的使用者们带来了不小的困扰。 希望 DeepSeek 官方能够尽快注意到这个问题,并发布紧急修复。 PS:图4️⃣是外国贴吧里的讨论帖,目前无法确认是不是同一批人的反馈。
深度学习模型升级引发AI能力大跃进,行业迎新变革· 96 条信息
#Deepseek V3.1 Bug
#模型生成文本错误
#极字问题
#代码生成故障
#API调用失败
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞