给本地 Claude Code / Codex / Copilot 装上 Chrome MCP,可以很大程度释放双手,它会直连到你当前打开的浏览器,网页各种登录态和浏览器插件依旧都在,也省却了很多环境配置复杂度。 无论是文档写作、表格处理、资料搜索还是网页开发,甚至是游戏开发、后台运营,它都可以长时间跑下去,20~60min,直到将任务完成。 这些任务,凭借着自己的“眼疾手快”和“经验丰富”,需要的时间其实也差不多,但现在可以交给 AI 了,何乐而不为呢?😄,推荐大家都试一试,把自己的工作流跑通。 我验证下来,让 AI 操作浏览器去解决问题,对 Token 的消耗没有想象中那么大。很多人会直觉认为浏览器自动化一定很重,但只要把链路设计清楚,它就是一种可控的观测系统,关键在于如何做任务拆解。举几个例子: 如果你的 AI 不够聪明或者表现不好,就把下面这段话发给它,让它先学习学习。 第一个是样式验证。 很多人第一反应是截图对比,但 Chrome MCP 更稳定的方式是先做结构确认。先拿页面快照,关注 DOM 结构和可访问性树,确认关键节点是否存在、层级是否正确,再用脚本读取计算样式,例如 getComputedStyle 或直接读 class、style 字段。只有在结构和样式都符合预期的情况下,才做一次截图作为最终确认。这样做的好处是把“视觉问题”拆成“结构问题 + 样式问题”,前两步都是低成本、低 token 的判断,截图只是兜底,用的不多。 第二个是模拟用户操作。 这里的核心不是“点按钮”,而是让每一步都有状态反馈。AI 会先确认当前页面和上下文,再去执行 click、fill、键盘输入等操作,但关键在于它不会连续盲点。每一次交互之后,都会用脚本去读状态,比如页面是否跳转、某个节点是否出现、文本是否变化、某个状态位是否被更新。如果没有变化,它会判定这一步“无效”,进而调整策略,比如重新定位元素、等待异步完成,或者回溯上一步。这其实是在浏览器里构建了一个非常轻量的状态机。 第三个是执行流校验。 人做这件事,往往靠感觉,觉得“好像不对劲”。AI 的方式更偏显式约束。你在一开始就定义好几个关键断点,例如页面标题、URL、关键 DOM、某个接口返回值、甚至是某段文本的存在与否。每走一步,它都会去对齐这些断点。如果某一步之后,断点没有满足预期,它就会认为执行流发生偏移,然后触发排查路径,一般是查看控制台日志、网络请求和当前状态快照。通过这三块信息,它可以定位是前端状态没更新、接口失败,还是页面结构发生了变化。 第四个是接口与数据链路验证。 Chrome MCP 并不直接替你发请求,它更像一个旁观者,去观察真实页面发生的请求。AI 会在关键操作之后抓取网络请求列表,定位到目标请求,再分析请求参数和响应结果。如果发现接口返回异常,它可以把这一步和前面的用户操作串起来看,从而判断问题是在输入阶段、交互阶段,还是后端返回阶段。相比直接写接口测试,这种方式更接近真实用户路径。 从上面四个例子就可以看出来,它为啥不怎么耗 Token:先定位上下文,再读取结构和状态,然后执行最小必要操作,最后用多维信号去验证结果。一旦验证失败,就回到观测层重新判断,而不是继续往下硬跑。 大家可以尝试将自己的工作做经验拆解,定义好清晰节点,配置好显式化的验证规则。剩下的,就交给 AI 吧~😄
【AI,舆论场上的“众生平等器”。】 最近中推上一些自诩“文化人”的装B犯,开始集体嫌弃“AI味儿”。 说不用AI才真实,用AI就是投机取巧、偷懒、诡辩。 但说白了,这不是审美问题,是他们的内心深处开始有点不安了。 因为AI正在干一件事: 把原本属于少数人的能力,还给普通人。 你可以把它想象成一个很直观的类比: 在现实生活里,美国人民把手枪当成一种力量拉平器。 它的意义不在于进攻,而在于: 让普通人不再完全被动,让强弱之间的差距被缩小。 同样的事情,现在正在舆论场发生。 AI,就是舆论场的“众生平等器”。 过去是谁在掌控表达? 是那一小撮人: 他们会写 、会绕 、会包装 、会扣帽子泼脏水。 他们最厉害的,不是更接近真相,而是更擅长:偷换概念 、模糊表达 、情绪操控 、春秋笔法 、颠倒是非。 你明明觉得不对,却说不过他们。 因为他们手里有“工具”,你没有。 现在呢? AI把这些能力拆开,分发给普通人: 它帮你整理逻辑 、帮你识别漏洞 、帮你拆掉话术 、帮你把“感觉不对”变成“明确错误” 。 以前是他们在解释世界,现在你可以反过来拆他们的解释。 这就是令他们真正不舒服的地方。 因为他们最依赖的,是模糊空间灰色地带。 只要话不说清,就能左右解释; 只要结构不清,就能来回切换立场; 只要包装够好,就能显得自己更高级。 而AI最擅长干的一件事,就是: 把模糊,变清楚。 一旦清楚,很多看似“高级的表达”就会变成: 精致的偏见 、包装的操控 、选择性的叙事 所以他们开始骂AI,说AI诡辩、机械、没有灵魂。 说用ai写推文的你上不得台面。 但你仔细看: 越擅长诡辩的人,越怕别人学会拆诡辩。 越依赖包装的人,越害怕包装被拆掉。 这不是对工具的批评,这是对权力流失的焦虑。 过去: 只有他们手里才有麦克风 ,只有他们有话语权 、只有他们能定义你该怎么理解这世界 。 现在,普通人手上也有了“解剖刀” ,可以拆他们的话 ,可以反向审问他们 。 就像现实世界里,一把小手枪能让人不再被抢劫强奸的时候,只能被动挨打。 在舆论场里,AI让人不再只能被动接受解释。 所以问题从来不是“用不用AI”“上不上台面” 而是,那些曾经手握舆论权的人,能不能接受: 解释权,不再只属于你。 AI的真正意义,从来不是写得更好看。 而是让更多人拥有一件能力: 看穿。 这才是他们过敏难受的根源。 不是因为AI不好,是因为: 它正在让很多原本不平等的东西,变得越来越平等。 所以,我鼓励所有人都好好使用AI工具。 当有人别有用心,恶的起心动念还没开始,就已经结束。