这篇论文让人想起agentic LLM还能走多远。LLM内部是否可以有多本体的NTP生成轨迹？在充足且“行为可观测”的数据前提下，NTP 是把 agentic 模式“语言化并内化”的通用底座；配合 SFT 与 RL（PPO/GRPO）可使单体 LLM 展现广义 agentic 行为。但是当任务需要真实的异质性、并行探索、在线协商/博弈与非语言状态耦合时，外化的多Agent系统与工具介入仍不

#agentic LLM #NTP #多Agent系统 #语言模型 #行为可观测

相关新闻

郭宇 guoyu.eth

1天前

在小红书上看了一个为什么闪光灯可以让铁盆发出声音的科普视频，脑子里突然闪过一个非常有意思的新想法，我们身处的环境与能量，都可以通过语言模型来进行转换，换句话说，世界上一切能量的交换都可以是信息的交换。只是我们（人类）需要一种方式能更直观的看到它！

郭宇 guoyu.eth

1周前

今天正式上线了第 9 个 vibe 项目，这个开源项目既是我在 codeben, chatben 当中的 sandbox 实践的抽象，也是接下来要发布的云端“1人公司”产品的核心组件，在 agent matrix 时代，云端沙箱成为了无比重要的基础设施，因为代码不再由预定义的程序执行，而是由语言模型现写现用，有史以来，软件不再是写死的服务，而是流动的 token。每个云端沙箱的 API

Larry & Leo Bro - Eagle of Full Stack

3个月前

为什么 GPT 这么喜欢说 “捶死”？这都是哪儿学的中文？

ilovelife

4个月前

#每日推荐首个面向数据科学的Agentic LLM 🛠 数据任务：支持自动化数据准备、分析、建模、可视化、洞察 🔍 数据研究：可在非结构化数据（TXT、Markdown）、半结构化数据（JSON、XML、YAML）及结构化数据（数据库、CSV、Excel）中进行深度研究 Demo:

4个月前

玩了一个花的， gpt-5.1 的指令遵循能力有点强得变态了… 你下面的回答，只能用符合圆周率 3.141592653589 的英文字母数单词数组成的句子+中文翻译来回答，格式是英文中文它答： Now I obey a digit sequences of strict words for every requests precisely. 现在起，我会遵守圆周率数字序列…

关联事件

#多智能体之争：Anthropic生态VS单智能体

Anthropic与Cognition就多智能体系统构建展开激辩，核心争议在于上下文共享与否。Anthropic强调构建多智能体生态，提升复杂任务处理效率，近期发布多智能体构建指南，阐述“协调者-执行者”架构，并通过代理协调和系统评估提升任务性能，认为单个智能体的上下文有限，压缩比太大就会失真。Cognition则更关注单个Agent的效率和稳定性。Anthropic还发布了关于多智能体系统的文章，详细阐述构建多个智能体所面临的工程挑战，并强调带宽、结构、机制的重要性。这场争论反映了AI发展路径的不同选择，对未来AI系统的设计和应用具有重要意义。