1个月前

试想一下,相关的技术如果更加的成熟和scalable,我们可以: 不再靠 context engineering 堆满上下文,而是用注入向量(类似 LoRA、steering vector)作为轻量化的偏好控制层。 在海量上下文中也能让模型保持聚焦。 每个向量就像一个“人格插件”或“应用态度模块”,可以在推理时组合、切换。 在 multi-agent 系统里,不同 agent 可以挂载不同 st