Susan STEM

Susan STEM

0 关注者

19小时前

从分布式认知到智能体沙盒:上下文工程的前世今生 我们一直在追问一个问题:“上下文”到底是什么? 在大语言模型时代,“上下文”似乎成了万物解释器。它是 prompt,是历史,是 token,是 memory,是一切的因。但真正追溯起来,这个词不过是现代工程视角下的临时叫法。在历史长河中,人类从未依赖固定术语来传达概念。意义的表达,一直是动态的、时代性的、多义的。 我知道有人会在推特上不断争论名词定义,纠结术语本体,害怕说错话。其实你会这么焦虑,是因为你还太年轻。你还没来得及在图书馆把所有能读的书都翻过一遍,没啃完泛读课几千张的试卷,也没刷过晋江论坛上一万篇看起来无聊却构成语感基础的网络小说,更没读够《哈利波特》的一百种同人演绎版本,不管恶心还是不恶心的,我都看完了。你还没有亲身验证过:人类的认知,不靠术语确证,而靠结构对齐。 工科生也要多读点文学。读书破万卷,下笔如有神。 不同的时代用不同的话说同样的事。今天你说“上下文”,十年前的人也许说“语境”,更早的人说“记忆”,结构主义者说“框架”,认知心理学者说“图式(schema)”,而《Cognition in the Wild》会说“文化任务系统”。语言在变,但核心的问题没有变:我们如何在系统中保持连续性、追踪状态、组织行为? 上下文不是术语,而是时代对“认知调度结构”的一种指认方式。而我相信,大语言模型的下一个关键跃迁,不会来自模型本身的微调、参数堆叠或幻觉率的下降,而是来自“上下文工程”作为系统性结构工程的确立。这不是拼 prompt 的技巧,而是构建结构、规划路径、调度智能体、维持状态协同的全过程。 从 Hutchins 的分布式认知,到 Minsky 的心智社会模型,再到今天的多智能体沙盒(如 Smallville),其实探索的是一个问题。我们说说 Hutchins 的分布式认知。 在 1995 年出版的《Cognition in the Wild》中,认知人类学家 Edwin Hutchins 提出了一个至今仍具有颠覆性的观点——认知不是发生在某个人的头脑中,而是分布在整个社会性系统中的。这本书的“野”,并非意指原始或混乱,而是指他所观察的认知行为并非在实验室中进行,而是在自然环境、真实世界任务流程中的发生,比如他田野调查的对象:美国海军舰艇上的导航团队。 Hutchins 研究发现,一个看似简单的任务——导航,并不是某位军官独立思考的结果,而是由多人协作完成的结构性过程。有人读取雷达数据,有人记录数值,有人在图纸上进行计算,信息在他们之间流动,决策才得以形成。除此之外,还有纸笔、坐标系统、专用术语、表格、雷达等外部工具的参与,它们不仅是辅助,而是认知过程本身的一部分。语言、制度、流程、工具、环境,以及人的角色分工共同构成一个动态的认知网络,信息在其中穿梭、被加工、被传递。这意味着,大脑并不是认知的全部,它只是这个更大系统中的一个节点。 Hutchins 完全打破了“认知=大脑”的传统观念。他明确指出,认知是在多个层次上被分布的。首先,它在个体之间分布:认知任务通常不是一个人完成的,而是团队共同完成,每个人只掌握任务的一部分。其次,它在内部与外部结构之间分布:认知不仅存在于人脑中,还依赖于图纸、表格、工具,这些物理媒介实际构成了“外部记忆”。最后,它也在时间上分布:一个人的认知行为依赖于之前团队留下的结构和制度遗产,比如流程图、记录规范、指令格式等,它们都是认知的延续性基础。 这一理论,与 Marvin Minsky 在《Society of Mind》中提出的观点形成惊人共鸣。如果我们把 Hutchins 所说的“人在协作中的功能单位”理解为 Agent,那这就是一个运行在真实世界中的 Agent 系统。而他所说的“外部工具系统”则对应当代 AI 系统中由 RAG、数据库、图谱所组成的记忆补全机制。甚至时间上的认知延续,也可以理解为多智能体系统中长期计划与路径依赖的体现。 说到底,Hutchins 向我们揭示了一个根本性的真相:认知不是个体思考的能力总和,而是结构化信息流的组织能力。真正决定智能的,不是单个 Agent 有多聪明,而是这些 Agent 是否处于一个能支持信息流动、反馈、协调、演化的系统中。认知是一种“被调度”的结构过程,是一种嵌入式、路径化、可追踪的信息动态,而非脑内静态存储的内容。 他实际上为我们提供了一种语言模型时代“上下文工程”的最早形态:不是堆叠上下文,而是组织路径;不是增大参数,而是优化流动;不是强调理解,而是调度结构。 如果我们把 Edwin Hutchins 的《Cognition in the Wild》重新理解为一场沙盒模拟实验,就会发现,那艘军舰,其实就是三十年前的 Smallville——只不过它没有像素地图,没有代码,没有 LLM,却已具备全部结构要素。Smallville 是斯坦福团队 2023 年推出的多智能体模拟项目(Generative Agents – Smallville),在其中,每个角色都是由大语言模型驱动的认知个体,具备记忆流、计划能力与反思机制。 当他们在咖啡馆偶遇时,并不会访问全局知识,而是检索各自的片段记忆,基于当前场景与意图做出行为决策,并将对话与动作反馈回自己的记忆系统。事件通过语言传播,行动彼此影响,个体间的协作并非中心化控制,而是由意图触发,逐步组织,最终形成如 Valentine’s Day Party 那样自发出现的社会性行为。 回过头看,Hutchins 所描述的军舰系统就是一个没有计算平台的 Smallville 原型。人类成员承担 Agent 的角色,雷达是传感器,纸笔是外部记忆体,术语是通信协议,时间流程是结构化路径,整套认知行为并不是由某一个人单独完成的,而是分布在整个系统中的任务分工与信息流转之间。它的“上下文”从来不是某一段文字、某个人的记忆或某个模型的输入窗口,而是由角色、工具、任务、流程、制度、状态等维度共同构成的动态认知结构。它是一张可以流动、传递、反馈、演化的认知路径网,是结构意义上的上下文,而非语料意义上的上下文。 从这个角度看,Hutchins 实际上提供了一种极具前瞻性的认知沙盒设计思想:上下文不应该是被记住的内容,而是被调度的结构单元;结构不应该压缩进个体,而应该流经路径、联动角色、触发工具、反馈结果;智能不应该被定义为某个 Agent 的思维能力,而应该被定义为信息能否在一个系统中完整走完一条闭环路径。 这种理解直接反转了当代大模型系统中常见的误区——我们试图让一个超级 Agent 理解全部上下文,就像让一个人同时记住整个小镇的一切,而真正需要的不是更强的单点记忆力,而是更清晰的结构协作图谱。Hutchins 和 Smallville 一起告诉我们:我们不需要一个全知大脑,我们需要一座结构良好的小镇。