#模型上下文跟踪

sitin
5小时前
Claude Code 我用了半年,才发现一个很离谱的点:上下文什么时候烧满,我是完全没感觉的。 最开始我还以为是模型抽风——写着写着突然变笨,前面说好的逻辑不认了,甚至开始自相矛盾。后来才反应过来:不是它变傻了,是上下文早就爆了。 最近发现一个叫 Claude HUD 的插件,干的事特别简单——在终端底部加一行状态栏,实时显示上下文占用百分比、当前用的什么模型、工具在调什么、子 Agent 跑到哪了。就一行信息,但装上之后真的回不去了。 安装就三步,在 Claude Code 里敲: <TEXT>/plugin marketplace add jarrodwatts/claude-hud/plugin install claude-hud/claude-hud:setup 重启就能用。 我觉得这个插件最值钱的就是那个上下文进度条。它读的是 Claude Code 原生的 token 数据,不是估算的,颜色会从绿变黄变红。 绿色就放心用,黄色该注意了,红色就得考虑压缩或者开新会话。到了 85% 以上还会自动展开明细,告诉你输入输出各用了多少 token,钱到底花在哪了。 说实话,这个东西解决的不是什么高深的技术问题,它解决的是信息差。AI 工具现在能力都很强,真正卡效率的反而是你跟工具之间的信息不对称——它知道自己在干什么,你不知道。 上下文悄悄满了你没察觉,子 Agent 跑偏了你没看见,token 烧了多少心里没数。这些事单个都不大,但积少成多,整个开发体验就变得不可控了。 Claude HUD 就是把这层窗户纸捅破了,该看到的信息都摆在眼前,你随时能判断是继续推进、压缩上下文、还是干脆开个新会话。 好的工具不只是帮你干活,还得让你清楚它在干什么,这才是用起来真正踏实的状态。