这篇文章确实是指出了当前 LLM 存在的问题，但解决方案并不见得可行，另外这文章实在太长了点。如果几句话总结一下，这篇文章主要就是想讲清楚：强化学习（RL）的教父、图灵奖得主 Richard Sutton 到底在担心什么？为什么我们现在的 Agent 这么“笨”？以及，我们该如何跨过这道鸿沟？ Sutton 就是“AI 圣经”《苦涩的教训》(The Bitter Lesson) 的作者，他的

#LLM死路 #持续学习 #世界模型 #强化学习局限 #ReAct循环

相关新闻

Frank Wang 玉伯

6天前

AI 时代，人一定要持续学习。只有持续学习，才有机会掌握更多“咒语”，去解锁一个个新世界。比如最简单的，学会“香蕉生图”咒语，就有机会生成更好的中文信息图。比如学到“杰文斯悖论”，就能领悟到生产力提升为什么能促进消费，能理解为什么英伟达的股价长期还会疯涨。比如接触到“愚昧之巅”，才会突然意识到，自己可能就站在绝望之谷。 AI 让我们进入了一个大知识时代。进入大知识网络，需要去持续学习

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

1周前

我还以为是持续学习呢原来此continuous 不是continual learning 这和之前meta fair提出的next conception prediction有点类似，总之学习目标和推断目标隔得远。

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

1周前

LeCun 说 LLM 没有物理接地，因此缺少真正的世界模型。我回应说语言面向 ToM，物理世界的语言也是基于人类对时空的认知（感知和推断）。把这两点放在一起，得到的是：没有任何语言系统能直接触达物理世界的生成结构——语言总是已经通过了具身认知的棱镜。 LLM 的局限不是它比人类更远离物理世界，而是它缺少了那个棱镜本身——没有感知运动系统，没有那个将物理世界转化为具身经验的接口。但 T

indigo

2周前

Claude 最近上新频繁！今天 Max、Team & Enterprise 的 Claude Code 默认支持了 1M 的上下文。如图 Opus 4.6 和 Sonnet 4.6 在整个 1M 窗口内的准确率明显高于 GPT 5.4 和 Gemini 3.1 Pro。一个模型上下文的准确性和检索力，决定了其完成复杂任务的质量，Context 就是模型在应用层面的“持续学习”✨

indigo

4个月前

就像 Demis 所说的，我们距离人类级别的通用智能还需要至少两个范式突破！最近 X 上备受关注的来自 Google Research 的论文「Nested Learning」也许能带来一些突破的希望，团队用 HOPE 作为验证架构的名字，足以显示其信心，它会不会是下一个 Transformer 呢？竟然又出自于 Google … 现在 LLM 最大问题，就是“灾难性遗忘”。虽然它们功能强⼤，但