yan5xu

yan5xu

0 关注者

1个月前

刚深扒了一下 MiroThinker 1.5,他们这套 Agent 压缩方式有点邪门,但看懂了觉得确实有用。 核心解决的是「怎么在 256K 上下文里塞进去 400 次 Tool Use」的问题。 他们做了一个极其大胆的操作:对ReAct历史上 think-action-observation 中的的 Observation(工具返回结果)进行物理掩码。 除了最近 K 轮保留原文,之前的几百轮 T

热门新闻