宝玉
2周前
宝玉
3周前
李想刚发了条朋友圈,盘点 2025 到 2026 年初最具突破性的 AI 产品:Claude Code、豆包手机、Manus、OpenClaw、MoltBook、Chrome Gemini。 六个产品看着不相干,但背后都是一个问题:怎么让 AI 真正帮你干活? 订机票、发微信、填表格,你都想交给 AI。问题是每个 App 都是独立王国,不会把数据和操作权限开放给外人。你想要一个贾维斯,但贾维斯走到哪都吃闭门羹。 豆包手机、OpenClaw、Chrome Gemini 这三个产品选了同一条路绕过去:GUI Agent。 后门不开就走前门,让 AI 直接帮你看屏幕、模拟点击来操作你的设备。 【1】前门怎么走? 传统思路是走后门:让 App 开放接口,AI 直接调用。但现实是大多数 App 根本不开放。 GUI Agent 反过来:AI 在用户授权下帮你看屏幕,识别按钮和输入框在哪,模拟人的手指去点击、滑动、输入。就像你开视频让朋友远程帮你操作手机,只不过这个“朋友”是 AI,而且直接上手帮你干。如果是你自己授权,加上一些关键环节的确认,相对还是比较安全的。 【2】三个产品,同一个思路,落点不同 Chrome Gemini:浏览器里的智能体 Gemini in Chrome 不只帮你总结网页,它还有个功能叫“自动浏览”(auto browse):你说需求,它直接在网页里帮你跑流程,比如预约、填表、规划行程。 浏览器场景有个天然优势:网页不是一张图片,背后有结构信息,哪里是按钮、哪里是输入框,AI 能“看”得更准。所以这类能力会先在浏览器里成熟,再往系统级扩展。 豆包手机助手:手机里的智能体 字节跳动的豆包手机助手就是 GUI Agent 在手机上的打法:读屏幕内容,模拟点击、滑动,帮你跨 App 完成任务。 OpenClaw:电脑里的智能体 OpenClaw 这波火,很大程度因为“真的能干活”。它强调本地运行,能连接你常用的即时通信工具,像个住在电脑里的助手,在浏览器环境里帮你点网页、填表单、跑流程。它把这层能力封装得更好用了。 【3】GUI Agent 其实是个不错的技术路径 国内厂商围绕 GUI Agent 吵得凶:激进、危险、绕不过生态。但 OpenClaw 的火爆说明用户不想再等了,哪怕有风险也要试试。 矛盾很简单:用户想“现在就用、能跨一堆软件”,App 厂商想“别绕过我的地盘”。 GUI Agent 是个现实的折中方案。如果每个 App 都愿意开放接口,当然最好,但这需要时间,很多小 App、小网站根本不会配合。GUI Agent 绕过了这个问题,只要用户授权,能“看屏幕 + 点屏幕”,什么 App 都能操作,覆盖面广,上手快。 所以未来大概率是混合模式:重要的、高频的事走正规接口,长尾的、没人配合的事用 GUI Agent 兜底。
宝玉
4周前
推荐阅读:《万字解析 Manus 的 PMF 和 AI Agent 赛道竞争的稳态约束》 作者: “约尔 Yor” 作者问了一个问题:AI应用的数据都在暴涨,但怎么判断用户是真在用,还是只是在尝鲜围观? 作者给出的答案是:别看融资额和PR稿,去看Reddit和Discord上的真实吐槽。这些地方的用户样本偏早期adopter,语气不友好甚至充满抱怨,但恰恰因为他们真的拿AI去干活、为结果承担过现实成本,所以信息密度极高。 先说结论:Manus找到了自己的位置,而且很清晰。 【1】核心发现 Manus 到底解决了什么问题? 一句话:那些不做不行、自己做太累、雇人又不划算的商业杂活。 报税、填表、爬数据、做PPT、跑固定流程,这些任务的特征是输入输出明确、逻辑不复杂、但执行过程冗长琐碎。 Manus覆盖的正是这片结构性真空。 用户付费的四种动机: 1. 花钱换精力(认知代工) 2. 第一次做出原本不会的东西(能力解锁) 3. 比雇人便宜(成本替代) 4. 不想参与繁琐执行(托管) Manus 和 ChatGPT 不是替代关系,而是分工。 ChatGPT 是认知层产品,擅长想清楚;Manus 是执行层产品,负责跑出来。 很多用户先在 ChatGPT 打磨 prompt,再交给 Manus 执行,省积分。 【2】Manus 比 ChatGPT 强在哪 ChatGPT 是认知层产品,擅长对话、思考、解释。 Manus 是执行层产品,能在真实工作流里干活。 具体差异: - Manus 能交付完整调研报告而非只给建议; - 能直接处理 PDF、图片生成表格而非需要大量人工修正; - 能离线持续执行而非需要你盯着; - 能拿到系统权限直接操作服务器和代码仓库。 【3】谁在付费? 核心用户是 Freelancer、一人公司、小型工作室。他们对外售卖判断力,但缺少助理和运营。Manus 提供的是一种"低配组织形态",让个体拥有接近小团队的执行能力。 Manus提供的是一种低配组织形态,让个体拥有接近小团队的执行能力。 付费逻辑很直接:只要比雇人便宜、比自己做省时间,ROI 算得过账就行。 【4】Manus 的软肋? 积分焦虑。Agent 的价值来自交付结果,但计费发生在执行过程,成本和结果脱钩。 用户愿意为结果付钱,但不敢为过程放手。只要执行路径不确定、按 token 计费,就必然制造成本焦虑,抑制用户把更大任务交出去。 用户的积分焦虑本质是“执行不确定性”的定价问题。 【5】更大的问题:这一代AI争夺的稀缺资源是什么? 移动互联网争的是用户时间,AI争的是人类可被外包的经济效用总量:有多少真实工作、决策和表达,人类愿意授权给AI执行。 Token消耗量就像当年移动互联网时代的人均网络流量消耗,只说明为系统消耗了多少资源,不代表为现实世界创造了多少价值。 AI 产品在争夺三种份额: 1. 任务份额 2. 决策份额 3. 产出份额。 【6】终局形态? Manus 之外的机会在三个方向: 1. 深耕垂直领域的专业 Agent 2. AI 加人类服务的混合交付 3. 嵌入工作过程的 Copilot 终局可能不是一个超级智能体,决定天花板的,是谁能进入更高价值、更高责任、更高决策密度的任务结构。 链接:
宝玉
4周前
微博刚发布的《2025 热点趋势报告》 ,有些有意思的点。 以后内容会有两套评价体系:人类流量 vs AI 权重。 一、AI 从“科幻感”变成了“生活感” 报告用了一个很精准的描述:2025 年,AI 真正卸下未来世界的光环,迈向深入社会肌理的实干元年。 看看 2023-2025 三年 AI 热搜的变化: 1) 2023 年——尝鲜试探期 “AI 写高考作文”“高考前被 AI 的回答鼓励到了”“用 AI 的方式打开诗词里的中秋”“ChatGPT 解读董宇辉回应长文”…… 那时候大家主要是尝鲜,像拿到新玩具一样试探 AI 的边界。能写诗?能写作文?能解读长文?哇,好厉害。但也仅此而已,AI 还带着浓浓的科幻滤镜。 2) 2024 年——伦理焦虑期 “AI 换脸 7000 张裸照”“泰勒斯威夫特 AI 不雅照疯传”“乔任梁父亲喊话撕下 AI 复活明星伪善面具”“查重率没超 3% 却被检测出 AI 代写”“雷军澄清近期雷军 AI 配音”…… 24 年最流行的词之一是 FOMO(错失恐惧症),但 AI 热搜里弥漫的更多是焦虑:换脸诈骗、隐私侵犯、学术造假、AI 复活争议……大家开始意识到这技术可能被滥用,社会还没准备好。 3) 2025 年——落地深耕期 “DeepSeek 一两分钟干了我一两天的活”“00 后用 DeepSeek 一天卖出 3.3 亿”“用 DeepSeek 买彩票真中奖了”“DeepSeek 评以为很卫生实际巨脏的行为”“DeepSeek 评中国最宜居城市”…… 注意这些热搜的共同点:全是实用场景。赚钱、工作、生活决策。用户不再问“AI 能干嘛”,而是问“AI 能帮我干什么”。 报告说得好:用户已经不满足用 AI 写一首蹩脚的诗,而是实现了从玩具到“刚需工具”的使用跨越。 两年时间,用户心态完成质变。而 DeepSeek 的出现,某种程度上加速了这个进程,它让更多普通人第一次真正“用上”了 AI,而不只是“玩过”AI。 二、用户看新闻追热点的方式变了 微博作为互联网热点的发源地,2025 年自己也经历了一场 AI 驱动的进化:微博智搜。 以前查热点的体验: 搜关键词,出来一堆碎片。博主 A 爆料一句,媒体 B 报道一段,官方 C 发个通报,评论区还有 D、E、F 各种补充和反转。你得自己当侦探,把这些碎片拼装成完整事实。或者等某个大神出来帮你“总结吃瓜”。 现在用智搜的体验: 问一句话,拿到的是 AI 整理好的“事实/观点包”。它自动把博主发帖、媒体报道、官方通报串联起来,给你一个全景式的热点视图。 报告里的数据: - 52% 的智搜使用场景是“热点解读”,用户要深度分析、要背景信息 - 48% 是“实时解答”,用户要即时查询、要快速确认 核心诉求只有一个:用户要的不再是线索,而是答案。 再看内容消费的领域分布: - 文娱领域 52%(明星动态、娱乐事件) - 垂直领域 28%(专业知识、兴趣爱好) - 社会领域 20%(社会新闻、公共事件) 文娱主导、热点驱动、实时追踪,这就是 AI 时代用户消费信息的核心特征。 这不只是效率提升,是信息获取方式的根本改变。当用户习惯了“被喂答案”,对整个信息生态意味着什么?这个问题值得所有内容创作者思考。 三、内容的价值标准变了 报告里有句话让我印象很深: > “内容的生命力不再仅仅取决于点赞数,更取决于它在 AI 知识图谱中的权重。” 这句话的含义是:以后写东西,不只要想“读者爱不爱看”,还要想“AI 会不会引用”。 为什么?因为当越来越多用户通过 AI 智搜获取信息时,你的内容能不能被 AI 纳入那个“事实/观点包”,直接决定了它的传播半径。 标题党、情绪化内容可能依然能收割流量,但不一定被 AI 采纳进答案。AI 整合信息时,更倾向选择原创的、结构清晰的、有实质内容的素材。 报告的行业建议也印证了这点:原创的、具有独特视角的深度内容,在 AI 时代反而更具溢价能力。 举个亲身例子。昨天有位网友跟我说: > 说到 skill 还得是宝玉老师,对 skill 的推动普及功不可没,列两个日常的感知:当我用 AI 做关于 skill 的 deep research,AI 引用了宝玉老师的观点;在内网看相关技术博客,文章最后也是引用了宝玉老师的观点。 像我这样的“干货”博主,在流量时代不一定吃香,毕竟干货阅读门槛高,没有情绪价值,不容易爆。但在 AI 时代可能会不一样:当 AI 需要整合某个领域的权威观点时,那些长期输出专业内容、建立起知识权重的创作者,反而会被更多地引用和传播。 以后内容会有两套评价体系:人类流量 vs AI 权重。 两者不一定冲突,但也不完全重合。一篇 10w+ 的情绪爆文,可能在 AI 知识图谱里权重为零;一篇阅读量平平的专业分析,可能被 AI 反复引用、触达百万用户。 这是挑战,也是机会。如果你本来就擅长深度内容,AI 时代终于有了新的分发渠道,不用再单纯拼情绪和标题。
宝玉
1个月前
如果你最近看到很多人在聊 Clawdbot,建议你不需要跟风去安装测试,也不必焦虑没有用上它会错过什么。 Clawdbot 是什么? Clawdbot 是一个开源的本地优先个人 AI 智能体项目,由开发者 Peter Steinberger 和社区共同维护,吉祥物是只龙虾🦞。它可以运行在 macOS、Linux 和 Windows(通过 WSL2)上,核心理念是让你在自己的硬件上运行一个完全本地化的 AI 助手。 它能做什么? Clawdbot 内置了浏览器控制、Canvas 画布、定时任务等工具,可以帮你浏览网页、填写表单、读写文件、执行 Shell 命令。更关键的是它支持多渠道接入:WhatsApp、Telegram、Slack、Discord、Signal、iMessage、Microsoft Teams 等等都能连,这意味着你可以通过这些聊天应用远程操控你的电脑。 为什么大家都在买 Mac Mini? 很多用户把 Clawdbot 部署在一台专用的 Mac Mini 上作为"永不休息的AI助手"。有用户分享说他通过 Telegram 监控 Claude 编码会话,让 Clawdbot 自动拉取代码仓库、打开 VS Code、运行测试、生成修复、自动提交。还有人说"躺在床上看 Netflix 的时候,通过 Telegram 重建了整个网站"。 它能自动化几乎所有你在电脑上能做的事情。所以最佳实践是专门用一台电脑跑 Clawdbot,让它可以随意操作,一时间让这些天 Mac Mini 销量大增。 需要注意什么? 官方强烈推荐使用 Anthropic Pro/Max 订阅配合 Claude Opus 4.5 模型,以获得更好的长上下文能力和提示词注入防护。另外,Anthropic 最近修改了 Claude Code OAuth tokens 的权限,限制只能在 Claude Code 内部使用,不能用于外部 API 调用 ,所以现在需要单独配置 Anthropic API key 才能正常使用。