试想一下，相关的技术如果更加的成熟和scalable，我们可以：不再靠 context engineering 堆满上下文，而是用注入向量（类似 LoRA、steering vector）作为轻量化的偏好控制层。在海量上下文中也能让模型保持聚焦。每个向量就像一个“人格插件”或“应用态度模块”，可以在推理时组合、切换。在 multi-agent 系统里，不同 agent 可以挂载不同 st

#向量注入 #轻量化偏好控制 #人格插件 #Multi-agent系统 #steering profiles

关联事件

#多智能体之争：Anthropic生态VS单智能体

Anthropic与Cognition就多智能体系统构建展开激辩，核心争议在于上下文共享与否。Anthropic强调构建多智能体生态，提升复杂任务处理效率，近期发布多智能体构建指南，阐述“协调者-执行者”架构，并通过代理协调和系统评估提升任务性能，认为单个智能体的上下文有限，压缩比太大就会失真。Cognition则更关注单个Agent的效率和稳定性。Anthropic还发布了关于多智能体系统的文章，详细阐述构建多个智能体所面临的工程挑战，并强调带宽、结构、机制的重要性。这场争论反映了AI发展路径的不同选择，对未来AI系统的设计和应用具有重要意义。