我想知道对于 LLM 输出 JSON 超出max_tokens 被截断了，大家都是怎么处理的？注意有些模型 continue 并不会从当前截断的 JSON 处恢复。

#LLM #JSON截断 #max_tokens #模型恢复 #问题处理

相关新闻

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

19小时前

Ilya重新定义了AGI，Pre-Training gives AGI！我的理解是LLM操纵语言的能力给了人AGI的幻觉，这是hype，带来了泡沫！当前GenAI，在符号空间无人能敌，然后却在人的现实世界里符号落地困难重重！

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

20小时前

pre-training的原罪在于，太浪费能源了，为了回答一句“你好”，一个LLM要背着一整个互联网的文本来数量统计一番后才能吐出： hello！

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

1天前

基于attention的scaling到头了，基于emotion的evolutionary 即将到来！ LLM唯一值得scaling的只剩下attention窗口大小了！

howie.serious

3天前

gemini 3.0 pro 的 IQ 分数出来了：历史上所有 LLM 的最高分！（IQ 测试分为两档：门萨版测试和线下/离线版测试。离线版的题目是全新设计且保密的，所有 LLM 都没看过，所以不存在背答案、或模型训练时见过等问题。通常情况下，离线版的 IQ 也会低 10～20 分。）离线版测试，gemini 3.0 pro 的 IQ 是历史最高分，130 分；门萨测试，gemini

howie.serious

4天前

现在长 podcast 内容很流行，分享一下我目前的处理方法。你只需要这三个要素：podcast 文稿，顶级模型，好的 prompt。 1 文稿：几乎所有值得听的 podcast，都有文稿。或者是公众号直接发布的校对版，或者是 youtube 的字幕文件，或者是其他途径。 2 顶级 llm：必须用顶级 llm。也就是 gpt-5.1、gemini 3pro 和 sonnet 4.5。最好