Duskzhen | 夕阳针 0 关注者 关注 2个月前 其实这个压缩方式还挺好用的,DeepChat 里面上下文压缩也是这样的思路去做的,当上下文过长命中阈值的时候,就回去从远端开始 offload 掉 tool call相关的内容,不过如何以后模型都能内置这种能力,那倒是省事了。代码在这里 前往原网页查看