看KIMIzhilin访谈给我的启发： LLM agentic 生成行为的训练，是在next token predition基础上构建新的生成路径模式（原来我认为只是MLP层主导，现在看来是attention和MLP共同作用于残差流) 思维模式的抽象大于行为模式的抽象，越抽象越能泛化，但构建能力越弱。 COT是顶级的，还有reflect/plan search模式思考和行为兼顾 code

#LLM agentic #next token prediction #思维模式抽象 #CoT #search模式

相关新闻

LinearUncle

1个月前

最近在抖音上看《大秦帝国》消磨时间，对商鞅个人非常感兴趣，于是用gemini可视化了其覆灭的主要原因。明白一个道理，要让AI信息图可视化丰富，需要一个类似CoT的中间过程，中间过程的文字需要十分丰富，从而最后信息图的内容才会丰富。

Tom Huang

5个月前

这个也太酷了！支持本地部署，字节跳动刚刚宣布发布了一款 7B 的多模态模型⚡️ 支持思维链思考和生成图片，并且支持支持自然语言编辑能力，在开启 CoT 的基础上，性能超越 Gemini-2-exp 的生图能力开源地址 👉

𝗖𝘆𝗱𝗶𝗮𝗿

8个月前

Manus 爆火之后，我们做了一套框架来验证这件事儿的可行性，就像我们 CTO 说的，技术是没有护城河的。我一直觉得，只要在 AI 这个赛道，应用层不是难事儿。这套框架基本原理就是：CoT + DoT + Model + Agnets + Artifacts 完成，其实我一直在思考，Sonnet3.7 ReFlect 这么强，到底要不要做用户侧 CoT！ ○ 用户提问（通过 Query扩写拓

nazha

9个月前

#分享从 DeepSeek R1 了解推理模型的训练的四种方法 1. Inference-time scaling 在推理过程中增加计算资源以提高输出质量。一个经典的例子，就是 CoT，在 Prompt 中包含类似 `Think step by step` 的短语，它通过输出更多的 token 增加了计算资源。 2. 纯 RL DeepSeek-R1-Zero 仅通过强化学习而没有初始

Simon

9个月前

R1 比 O1 真正优秀的地方在输出了CoT，让人感觉很厉害很值得信任。如果把CoT禁掉，只看结果的话。可能和o1一样，用得人也不是那么多了