宝玉

宝玉

0 关注者

1周前

这里面很有意思的点是 Agent 1.0 到 Agent 2.0 的升级,其中最大的变化: Agent 1.0 的时候会压缩历史会话,Agent 2.0 就不压缩了,只处理用户输入的大内容。 这其实现在也是 Agent 请求的标配,不再花精力去压缩上下文,无脑把历史会话都发过去,一方面这样不担心上下文损耗,一方面 Prompt Caching 可以降低成本。 但是对工具的调用仍然会对结果进行总结和记忆,因为工具是相对独立的上下文,只要把关键信息加入主上下文即可。同时工具还可以是子智能体,也可以帮助分担上下文,避免很快上下文就爆掉。

相关新闻