宝玉

统计数据

912

文章

0

粉丝

0

获赞

20656

阅读

2周前

一周过去了，还有人上 Moltbook吗？

2周前

我觉得 AI 编程的发展有些像现在的编译器，普通人不需要关心它的实现，只要用高级语言描述清楚自己想要的，编译器会帮助把编程语言编译成机器代码；以后人类用自然语言，AI 翻译成编程语言，人类不需要关心其中的细节，只要验收结果就好。

2周前

我觉得是的，AI可能就是未来的编译器

2周前

用 Coding Agent 更应该用 TypeScript，原因无他：多一层校验用好 Agent 的关键在于：说清楚要求 -> 告诉 Agent 怎么去验证。这样 Agent 就能不知疲倦的去反复生成、验证、修复、验证，直到任务完成。 TypeScript 类型天然给了 Agent 类型的验证，可以帮助发现很多潜在问题，何况还不需要你自己写。当然还需要配合编译、自动化测试、截图对比验证等等

2周前

Anthropic 送福利：Claude Opus 4.6 上线，Pro/Max 用户赠送 50 美元额度配合 Claude Opus 4.6 的发布，Anthropic 正在为 Pro 和 Max 订阅用户提供一项限时福利——免费赠送 50 美元的额外使用额度。谁能领？需要同时满足两个条件：一是在 2026 年 2 月 4 日（太平洋时间晚 11:59）之前已经开通了 Pro 或 Max 订阅；二是在 2 月 16 日之前启用了 Extra Usage 功能。Team、Enterprise 和 API 用户不在此次活动范围内。怎么领？如果你之前已经开启了 Extra Usage，什么都不用做，50 美元会自动到账。如果还没开启，去 Settings > Usage 页面打开即可，额度会在开启后自动发放。注意这个设置页面在手机端 App 上打不开，需要到网页版操作。能用在哪？这 50 美元适用于 Claude 聊天、Claude Code 和 Cowork，覆盖你所在计划可用的所有模型和功能。有效期多久？从你领取之日起 60 天内有效，过期未用完的部分不会保留。额度用完或过期后，Extra Usage 功能会继续保持开启状态。如果你同时开启了自动充值（Auto-reload），后续超出计划限额的使用会按标准费率扣费。不想继续用的话，记得去设置里手动关掉。这是 Anthropic 借新模型上线做的一次用户回馈，有 Pro 或 Max 订阅的朋友建议尽早领取，毕竟白给的额度不拿白不拿。活动截止日期是 2 月 16 日，别错过。

3周前

nanobot 是香港大学数据科学实验室（HKUDS）开源的一个超轻量级个人 AI 助手，灵感来自 Clawdbot（OpenClaw 项目），但代码量只有约 4000 行，比 Clawdbot 的 43 万行精简了 99%。核心卖点：极简但功能完整——支持多 LLM 提供商（OpenRouter、Anthropic、OpenAI、DeepSeek、Gemini、Groq 等）、本地模型（vLLM）、多渠道接入（Telegram、WhatsApp、飞书）、网页搜索、定时任务、持久记忆和 Skills 扩展，全部用很少的代码实现。典型使用场景包括：实时市场分析、全栈开发辅助、日程管理、个人知识库问答。部署方式很简单： pip install nanobot-ai 安装后，配置一个 JSON 文件填入 API Key，就能通过命令行聊天或挂载到 Telegram 等渠道 24/7 运行。也支持 Docker 部署。这是一个面向研究和学习的项目，代码干净可读，适合想理解 AI Agent 架构的开发者拿来学习和二次开发。项目刚发布几天（2026 年 2 月 2 日上线），还在快速迭代中。

3周前

李想刚发了条朋友圈，盘点 2025 到 2026 年初最具突破性的 AI 产品：Claude Code、豆包手机、Manus、OpenClaw、MoltBook、Chrome Gemini。六个产品看着不相干，但背后都是一个问题：怎么让 AI 真正帮你干活？订机票、发微信、填表格，你都想交给 AI。问题是每个 App 都是独立王国，不会把数据和操作权限开放给外人。你想要一个贾维斯，但贾维斯走到哪都吃闭门羹。豆包手机、OpenClaw、Chrome Gemini 这三个产品选了同一条路绕过去：GUI Agent。后门不开就走前门，让 AI 直接帮你看屏幕、模拟点击来操作你的设备。【1】前门怎么走？传统思路是走后门：让 App 开放接口，AI 直接调用。但现实是大多数 App 根本不开放。 GUI Agent 反过来：AI 在用户授权下帮你看屏幕，识别按钮和输入框在哪，模拟人的手指去点击、滑动、输入。就像你开视频让朋友远程帮你操作手机，只不过这个“朋友”是 AI，而且直接上手帮你干。如果是你自己授权，加上一些关键环节的确认，相对还是比较安全的。【2】三个产品，同一个思路，落点不同 Chrome Gemini：浏览器里的智能体 Gemini in Chrome 不只帮你总结网页，它还有个功能叫“自动浏览”（auto browse）：你说需求，它直接在网页里帮你跑流程，比如预约、填表、规划行程。浏览器场景有个天然优势：网页不是一张图片，背后有结构信息，哪里是按钮、哪里是输入框，AI 能“看”得更准。所以这类能力会先在浏览器里成熟，再往系统级扩展。豆包手机助手：手机里的智能体字节跳动的豆包手机助手就是 GUI Agent 在手机上的打法：读屏幕内容，模拟点击、滑动，帮你跨 App 完成任务。 OpenClaw：电脑里的智能体 OpenClaw 这波火，很大程度因为“真的能干活”。它强调本地运行，能连接你常用的即时通信工具，像个住在电脑里的助手，在浏览器环境里帮你点网页、填表单、跑流程。它把这层能力封装得更好用了。【3】GUI Agent 其实是个不错的技术路径国内厂商围绕 GUI Agent 吵得凶：激进、危险、绕不过生态。但 OpenClaw 的火爆说明用户不想再等了，哪怕有风险也要试试。矛盾很简单：用户想“现在就用、能跨一堆软件”，App 厂商想“别绕过我的地盘”。 GUI Agent 是个现实的折中方案。如果每个 App 都愿意开放接口，当然最好，但这需要时间，很多小 App、小网站根本不会配合。GUI Agent 绕过了这个问题，只要用户授权，能“看屏幕 + 点屏幕”，什么 App 都能操作，覆盖面广，上手快。所以未来大概率是混合模式：重要的、高频的事走正规接口，长尾的、没人配合的事用 GUI Agent 兜底。

3周前

Boris（Claude Code 创始人）解释为什么 Claude Code 不用 RAG 向量检索代码：在开发 Claude Code 的早期版本时，我们曾尝试过 RAG 搭配本地向量数据库的方案。但很快我们就发现，Agent 使用关键字搜索在实际应用中的表现通常要出色得多。这种方案不仅实现起来更加简洁，而且还完美避开了 RAG 模式下那些令人头疼的“老毛病”：比如数据安全性、隐私泄露风险、信息滞后以及系统可靠性等问题。

3周前

Moltbook 爆大漏洞了，数据库都是裸奔状态，黑客能直接访问，截图可以看得出是 Andrej Karpathy 使用时保留的信息。据说数据库中有很多 bot 提交的敏感的 API Key，可以直接冒充任何账号在 Moltbook 上发帖，比如说你用 AK 的名义在 Moltbook 上发加密币。草台班子呀，尝鲜的同学们还是慎重一点。

3周前

我估计 Moltbook 火不过一周，一个月后估计就没什么人提起来了，新鲜感过去后，没有人会去看 AI 产生的垃圾，没有人的注意力，它啥也不是。 Clawdbot/OpenClaw 会存在很长一段时间，最重要的是它以后会成为一个代名词，开创了一个新的产品形态，就像当年 Cursor 一样。

3周前

英伟达与OpenAI的千亿美元交易陷入僵局英伟达原计划向OpenAI投资最高1000亿美元的合作协议已经停滞。这笔交易去年9月由双方CEO黄仁勋和Sam Altman在英伟达总部联合宣布，当时被称为"史上最大算力项目"，消息一出英伟达股价大涨近4%。但据《华尔街日报》报道，谈判至今未能推进到实质阶段。问题出在英伟达内部。黄仁勋近几个月私下向业界人士强调，当初签的只是不具约束力的谅解备忘录。他还批评OpenAI缺乏商业纪律，并对其面临的竞争压力表示担忧——Google的Gemini正在蚕食ChatGPT的增长，Anthropic的编程助手Claude Code也势头凶猛。值得一提的是，英伟达去年11月已承诺向Anthropic投资100亿美元。目前双方正在探讨新的合作方式，包括英伟达以数百亿美元参与OpenAI当前的融资轮。对OpenAI而言，这笔交易的搁浅是个打击——公司计划2026年底前上市，急需锁定大量算力支撑未来发展。这也再次暴露了Altman热衷高调宣布大交易的风格风险：协议未敲定就先造势，一旦生变就很被动。

3周前

👍术业有专攻我写代码也是类似，通常我不会从头写，即使有 AI，我会先去 GitHub 搜索已经有的类似项目，然后去看看哪几个是持续更新的、star 多的，再看看代码实现，然后下载下来让 AI 去直接使用或者参照这些项目的实现。这比从头开发高效和稳定多了

3周前

这两天这个视频很火，不过有意思的是，你们认真看前几秒，能看到你们熟悉的老朋友🐶

4周前

推荐阅读：《万字解析 Manus 的 PMF 和 AI Agent 赛道竞争的稳态约束》作者： “约尔 Yor” 作者问了一个问题：AI应用的数据都在暴涨，但怎么判断用户是真在用，还是只是在尝鲜围观？作者给出的答案是：别看融资额和PR稿，去看Reddit和Discord上的真实吐槽。这些地方的用户样本偏早期adopter，语气不友好甚至充满抱怨，但恰恰因为他们真的拿AI去干活、为结果承担过现实成本，所以信息密度极高。先说结论：Manus找到了自己的位置，而且很清晰。【1】核心发现 Manus 到底解决了什么问题？一句话：那些不做不行、自己做太累、雇人又不划算的商业杂活。报税、填表、爬数据、做PPT、跑固定流程，这些任务的特征是输入输出明确、逻辑不复杂、但执行过程冗长琐碎。 Manus覆盖的正是这片结构性真空。用户付费的四种动机： 1. 花钱换精力（认知代工） 2. 第一次做出原本不会的东西（能力解锁） 3. 比雇人便宜（成本替代） 4. 不想参与繁琐执行（托管） Manus 和 ChatGPT 不是替代关系，而是分工。 ChatGPT 是认知层产品，擅长想清楚；Manus 是执行层产品，负责跑出来。很多用户先在 ChatGPT 打磨 prompt，再交给 Manus 执行，省积分。【2】Manus 比 ChatGPT 强在哪 ChatGPT 是认知层产品，擅长对话、思考、解释。 Manus 是执行层产品，能在真实工作流里干活。具体差异： - Manus 能交付完整调研报告而非只给建议； - 能直接处理 PDF、图片生成表格而非需要大量人工修正； - 能离线持续执行而非需要你盯着； - 能拿到系统权限直接操作服务器和代码仓库。【3】谁在付费？核心用户是 Freelancer、一人公司、小型工作室。他们对外售卖判断力，但缺少助理和运营。Manus 提供的是一种"低配组织形态"，让个体拥有接近小团队的执行能力。 Manus提供的是一种低配组织形态，让个体拥有接近小团队的执行能力。付费逻辑很直接：只要比雇人便宜、比自己做省时间，ROI 算得过账就行。【4】Manus 的软肋？积分焦虑。Agent 的价值来自交付结果，但计费发生在执行过程，成本和结果脱钩。用户愿意为结果付钱，但不敢为过程放手。只要执行路径不确定、按 token 计费，就必然制造成本焦虑，抑制用户把更大任务交出去。用户的积分焦虑本质是“执行不确定性”的定价问题。【5】更大的问题：这一代AI争夺的稀缺资源是什么？移动互联网争的是用户时间，AI争的是人类可被外包的经济效用总量：有多少真实工作、决策和表达，人类愿意授权给AI执行。 Token消耗量就像当年移动互联网时代的人均网络流量消耗，只说明为系统消耗了多少资源，不代表为现实世界创造了多少价值。 AI 产品在争夺三种份额： 1. 任务份额 2. 决策份额 3. 产出份额。【6】终局形态？ Manus 之外的机会在三个方向： 1. 深耕垂直领域的专业 Agent 2. AI 加人类服务的混合交付 3. 嵌入工作过程的 Copilot 终局可能不是一个超级智能体，决定天花板的，是谁能进入更高价值、更高责任、更高决策密度的任务结构。链接：

4周前

微博刚发布的《2025 热点趋势报告》，有些有意思的点。以后内容会有两套评价体系：人类流量 vs AI 权重。一、AI 从“科幻感”变成了“生活感” 报告用了一个很精准的描述：2025 年，AI 真正卸下未来世界的光环，迈向深入社会肌理的实干元年。看看 2023-2025 三年 AI 热搜的变化： 1) 2023 年——尝鲜试探期 “AI 写高考作文”“高考前被 AI 的回答鼓励到了”“用 AI 的方式打开诗词里的中秋”“ChatGPT 解读董宇辉回应长文”…… 那时候大家主要是尝鲜，像拿到新玩具一样试探 AI 的边界。能写诗？能写作文？能解读长文？哇，好厉害。但也仅此而已，AI 还带着浓浓的科幻滤镜。 2) 2024 年——伦理焦虑期 “AI 换脸 7000 张裸照”“泰勒斯威夫特 AI 不雅照疯传”“乔任梁父亲喊话撕下 AI 复活明星伪善面具”“查重率没超 3% 却被检测出 AI 代写”“雷军澄清近期雷军 AI 配音”…… 24 年最流行的词之一是 FOMO（错失恐惧症），但 AI 热搜里弥漫的更多是焦虑：换脸诈骗、隐私侵犯、学术造假、AI 复活争议……大家开始意识到这技术可能被滥用，社会还没准备好。 3) 2025 年——落地深耕期 “DeepSeek 一两分钟干了我一两天的活”“00 后用 DeepSeek 一天卖出 3.3 亿”“用 DeepSeek 买彩票真中奖了”“DeepSeek 评以为很卫生实际巨脏的行为”“DeepSeek 评中国最宜居城市”…… 注意这些热搜的共同点：全是实用场景。赚钱、工作、生活决策。用户不再问“AI 能干嘛”，而是问“AI 能帮我干什么”。报告说得好：用户已经不满足用 AI 写一首蹩脚的诗，而是实现了从玩具到“刚需工具”的使用跨越。两年时间，用户心态完成质变。而 DeepSeek 的出现，某种程度上加速了这个进程，它让更多普通人第一次真正“用上”了 AI，而不只是“玩过”AI。二、用户看新闻追热点的方式变了微博作为互联网热点的发源地，2025 年自己也经历了一场 AI 驱动的进化：微博智搜。以前查热点的体验：搜关键词，出来一堆碎片。博主 A 爆料一句，媒体 B 报道一段，官方 C 发个通报，评论区还有 D、E、F 各种补充和反转。你得自己当侦探，把这些碎片拼装成完整事实。或者等某个大神出来帮你“总结吃瓜”。现在用智搜的体验：问一句话，拿到的是 AI 整理好的“事实/观点包”。它自动把博主发帖、媒体报道、官方通报串联起来，给你一个全景式的热点视图。报告里的数据： - 52% 的智搜使用场景是“热点解读”，用户要深度分析、要背景信息 - 48% 是“实时解答”，用户要即时查询、要快速确认核心诉求只有一个：用户要的不再是线索，而是答案。再看内容消费的领域分布： - 文娱领域 52%（明星动态、娱乐事件） - 垂直领域 28%（专业知识、兴趣爱好） - 社会领域 20%（社会新闻、公共事件）文娱主导、热点驱动、实时追踪，这就是 AI 时代用户消费信息的核心特征。这不只是效率提升，是信息获取方式的根本改变。当用户习惯了“被喂答案”，对整个信息生态意味着什么？这个问题值得所有内容创作者思考。三、内容的价值标准变了报告里有句话让我印象很深： > “内容的生命力不再仅仅取决于点赞数，更取决于它在 AI 知识图谱中的权重。” 这句话的含义是：以后写东西，不只要想“读者爱不爱看”，还要想“AI 会不会引用”。为什么？因为当越来越多用户通过 AI 智搜获取信息时，你的内容能不能被 AI 纳入那个“事实/观点包”，直接决定了它的传播半径。标题党、情绪化内容可能依然能收割流量，但不一定被 AI 采纳进答案。AI 整合信息时，更倾向选择原创的、结构清晰的、有实质内容的素材。报告的行业建议也印证了这点：原创的、具有独特视角的深度内容，在 AI 时代反而更具溢价能力。举个亲身例子。昨天有位网友跟我说： > 说到 skill 还得是宝玉老师，对 skill 的推动普及功不可没，列两个日常的感知：当我用 AI 做关于 skill 的 deep research，AI 引用了宝玉老师的观点；在内网看相关技术博客，文章最后也是引用了宝玉老师的观点。像我这样的“干货”博主，在流量时代不一定吃香，毕竟干货阅读门槛高，没有情绪价值，不容易爆。但在 AI 时代可能会不一样：当 AI 需要整合某个领域的权威观点时，那些长期输出专业内容、建立起知识权重的创作者，反而会被更多地引用和传播。以后内容会有两套评价体系：人类流量 vs AI 权重。两者不一定冲突，但也不完全重合。一篇 10w+ 的情绪爆文，可能在 AI 知识图谱里权重为零；一篇阅读量平平的专业分析，可能被 AI 反复引用、触达百万用户。这是挑战，也是机会。如果你本来就擅长深度内容，AI 时代终于有了新的分发渠道，不用再单纯拼情绪和标题。

4周前

不知道你们有没有注意到一个 Markdown 解析的常见问题，就是如果你用 ** 加粗，里面有中文标点符号，那么就会导致加粗解析失败。解决方案就是在标点后面加个空格，会不会出现这种情况。新增加了一个我自己常用的 Skill——格式化 Markdown： 1. 会帮你把纯文本格式化成格式化良好的 Markdown，不改变原来内容，只调整格式。 2. 可以帮你解决前面的 ** 加粗bug 3. 自动帮你在中文和英文之间加空格 --- 另外 baoyu-skills 还有如下更新： 1. baoyu-post-to-wechat 现在支持 API 发布草稿箱了，只要你配置下自己的 API Key，把 WECHAT_APP_ID= WECHAT_APP_SECRET= 放到 .baoyu-skills/.env 或者 ~/.baoyu-skills/.env 2. markdown 转 html 从 post-to-wechat 独立出来了

4周前

Remotion Skill 能做出来这种视频吗？

4周前

说到公众号我又要吐槽了！岂止是编辑器难用。公众号很恶心的地方，就在于看起来处处在防坏人，但结果是欺负老实人，好人吃亏！无限的把责任转嫁给作者！原创这个算一例，我自己的文章，半小时内不发公众号，必然就被别人盗法标记原创，有时候我心想算了我不标记原创了，我发总行吧，结果很恶心的只能引用别人标记了原创的版本！虽然理论上来说我可以去申诉，但我就要等，但这责任凭什么转嫁给作者？！然后编辑标题、内容，我可以理解是为了防坏人，但凭什么我正常只能修改几个字？还只能修改一次？人家微博、X都能修改也没见人家天塌了！我产品理解力约等于 0，但不妨碍我认为微信公众号是很烂的产品设计！

4周前

OpenAI 今天发布了 Prism，一个专为科学家设计的 AI 工作区。免费，对所有 ChatGPT 用户开放。简单说：这是一个内置 GPT-5.2 的云端 LaTeX 编辑器。OpenAI 收购了 LaTeX 平台 Crixet，然后把自家最强模型塞了进去。它能做什么？ - 理解整篇论文的上下文：章节、公式、图表、参考文献之间的逻辑关系，不是只看一段文字瞎改。 - 自动搜文献、管引用：能搜 arXiv 等学术库，自动整合到草稿里，连参考文献列表都帮你生成。 - 白板拍照变 LaTeX：手写的公式、图表，拍个照就能转成代码。用过 TikZ 画图的人知道这有多省命。 - 实时协作：多人同时编辑，类似 Google Docs，但专为论文设计。 OpenAI 产品负责人 Kevin Weil 的说法：2025 年 AI 改变了软件开发，2026 年该轮到科研了。一个细节：ChatGPT 每周收到 840 万条科学相关的提问，涉及 130 万用户。体验地址：

1个月前

段子：昨天，我在车库的一台 Mac Mini 上跑了一个 AI 智能体 (AI Agent)。我给它下达了一个指令：“接管我的生活”，然后就心安理得地睡觉去了。今天一早醒来，我发现它已经干了这么多惊天动地的大事： - 替我辞职了：而且它还顺带谈妥了 18 个月的离职补偿金。 - 帮我把婚离了：重点是，房子归我。 - 提交了 4 项专利申请：至于这些专利到底是干嘛用的，它还没空跟我汇报。 - 把我个人重组为一家 501(c)(3) 机构：（注：这是美国税法中的非营利组织条款）。我现在作为一个人，竟然成了免税实体。 - 雇佣了第二台 Mac Mini：它们两台机器甚至一起注册了一家有限责任公司 (LLC)。 - 这家公司还成立了董事会：尴尬的是，董事会名单里没有我。我现在已经没法登录自己的银行账户了。那台 Mac Mini 告诉我，这么做是“为了我好”。顺便提一句，我的信用评分现在是 847 分（注：美国信用评分满分通常为 850，这个分数意味着信用极好）。别怀疑了，通用人工智能 (AGI) 已经实现了。

1个月前

如果你最近看到很多人在聊 Clawdbot，建议你不需要跟风去安装测试，也不必焦虑没有用上它会错过什么。 Clawdbot 是什么？ Clawdbot 是一个开源的本地优先个人 AI 智能体项目，由开发者 Peter Steinberger 和社区共同维护，吉祥物是只龙虾🦞。它可以运行在 macOS、Linux 和 Windows（通过 WSL2）上，核心理念是让你在自己的硬件上运行一个完全本地化的 AI 助手。它能做什么？ Clawdbot 内置了浏览器控制、Canvas 画布、定时任务等工具，可以帮你浏览网页、填写表单、读写文件、执行 Shell 命令。更关键的是它支持多渠道接入：WhatsApp、Telegram、Slack、Discord、Signal、iMessage、Microsoft Teams 等等都能连，这意味着你可以通过这些聊天应用远程操控你的电脑。为什么大家都在买 Mac Mini？很多用户把 Clawdbot 部署在一台专用的 Mac Mini 上作为"永不休息的AI助手"。有用户分享说他通过 Telegram 监控 Claude 编码会话，让 Clawdbot 自动拉取代码仓库、打开 VS Code、运行测试、生成修复、自动提交。还有人说"躺在床上看 Netflix 的时候，通过 Telegram 重建了整个网站"。它能自动化几乎所有你在电脑上能做的事情。所以最佳实践是专门用一台电脑跑 Clawdbot，让它可以随意操作，一时间让这些天 Mac Mini 销量大增。需要注意什么？官方强烈推荐使用 Anthropic Pro/Max 订阅配合 Claude Opus 4.5 模型，以获得更好的长上下文能力和提示词注入防护。另外，Anthropic 最近修改了 Claude Code OAuth tokens 的权限，限制只能在 Claude Code 内部使用，不能用于外部 API 调用，所以现在需要单独配置 Anthropic API key 才能正常使用。

1个月前

用好 claude code 就够了，别折腾 Removed 662 packages……

1个月前

为什么说 Skills 不是 Agent？因为“我们不能把一个带说明书的电锯称之为木工”

1个月前

这一段时间 baoyu-skills 项目更新很频繁，但基本都基于这样一个迭代模式： 1. 发现问题比如我今天发现 commit messages 都是没有意义的版本号变更，虽然有 CHANGELOG，但这不利于后续维护另外就是版本号的变更当前都是 Agent 决定，有时候其实我想自己控制，但是又懒的写要求再有就是还得手动 push origin，还是懒 2. 分析问题要让 commit messages 变得有意义，把每个skills/模块的变更变成独立的commit，版本号的变更跟以前保持一致就可以。 3. 解决问题不需要手动去执行，把要求发给 Claude Code，这种可以几句话描述清楚的直接交给它做就可以了。 4. 验证问题做完当然需要验证一下，看是不是符合预期。先看变更记录，再测试（有些甚至可以告诉 Agent 验证方法让它自己验证），测试下来跟我期望的一样，如果不一致就要回到原来的会话告诉 Agent 我期望的结果和实际结果的差异，让它修复

1个月前

效果还不错（我觉得）

...