Shen Huang

统计数据

6

文章

0

粉丝

0

获赞

95

阅读

5个月前

为什么 AI 帮你写 1 小时代码还行，写 10 小时就变成一坨屎？为什么 Chatbots 聊上很多轮之后，就开始一本正经地胡说八道？核心原因就藏在Yann LeCun 23年演讲的这张图里：错误会指数级累积。想象一下，AI 生成每个 token（词）时，都有一个很小的概率偏离“正确”答案。假如每一步走对的概率是 99%，那连续走 100 步都对的概率就只剩 36.6% 了。如果任务更长，比如 1000 步，那正确的概率就无限接近于 0！（ 0.002%）这就是为什么长任务、长对话，最后总会“散架”。因为这条路太长，走错一步，就再也回不来了。LeCun 认为这是 AR 架构的“原罪”，靠打补丁没用。

#AI #Yann LeCun #错误累积 #长任务 #AR架构

5个月前

最近在网上看到一位大神 Chris Dzombak，用 Claude Code 在短时间内写了整整12个项目，效率高到吓人。我深挖了一下他的方法，发现终极秘诀不是什么花哨的Prompt，而是给 Claude 植入一个“资深工程师”的灵魂。他创建了一个全局配置文件 CLAUDE .md，也就是AI的个人操作系统。这个文件里定义了： > 开发哲学：比如“增量优于全部重构”、“代码要清晰而非聪明”。 > 标准工作流：规划 -> 写测试 -> 实现 -> 重构 -> 提交。 > “卡住怎么办”预案：尝试3次失败后，必须停下来，记录失败、研究替代方案、反思根本问题。 > 决策框架：当有多种方案时，按可测试性 > 可读性 > 一致性 > 简单性的顺序选择。最关键的是，他强调“AI写的代码，最终责任在人”，所有代码都必须手动审查和测试。这个 CLAUDE .md 文件简直是把高级工程师的思维模式和职业素养灌输给了AI，让它从一个“工具”变成了一个有章法、懂取舍的“准同事”。我已经把他的这份“AI调教圣经”fork了，强烈建议大家也去学习一下。

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#Claude Code #Chris Dzombak #AI调教 #资深工程师 #代码审查

6个月前

如何构建一个强大的AI Agent？别从零开始。参考这篇论文的 4KAgent 的架构，就是一份给开发者的完美蓝图。我把它拆解成了四大设计原则，可以直接借鉴：原则一：建立“感知-规划”大脑 Agent必须先理解问题。4KAgent的核心是 Perception Agent（感知智能体）。它的工作流是： 1. 多模态分析：用一个VLM（视觉语言模型）来“看”懂图像内容。 2. 量化诊断：结合多个专业的IQA（图像质量评估）工具，输出客观的质量分数。 3. 制定计划：综合主观的“内容理解”和客观的“质量分数”，生成一个有序的、分步骤的Restoration Plan（修复计划）。原则二：打造“模块化工具箱” 不要试图用一个万能模型解决所有问题。为Agent配备一个 Toolbox（工具箱），里面装满各种“专家模型”。 4KAgent的工具箱Model Zoo里，就集成了去噪、去模糊、超分、面部修复等9大类、数十个SOTA模型。 Agent根据规划，按需调用。原则三：设计“品控-反思”闭环这是4KAgent效果封神的关键，也是最值得学习的地方： Execution-Reflection-Rollback（执行-反思-回滚）机制。 a) 混合专家择优 (Q-MoE)：执行每一步计划时，它不是只用1个工具，而是让工具箱里所有相关的“专家”都出个结果，然后通过一个质量评分函数，选出效果最好的那个，再进入下一步。 b) 失败回滚 (Rollback)：如果某一步操作后，质量评分反而下降了，系统会立即“回滚”并撤销这一步，尝试计划中的其他任务，避免“一条路走到黑”。原则四：提供“用户意图”接口最后，通过一个极简的Profile Module（配置文件模块），允许用户下达高级指令，比如“我更在乎观感，可以牺牲一点保真度 (Perception)”或“必须保真，不能有任何魔改 (Fidelity)”。这让Agent无需重新训练，就能灵活适应不同用户的核心需求。总结如何设计一个强大的AI Agent： [感知规划 -> 工具执行 -> 质量反思] 的闭环设计，再配上灵活的用户Profile，就是这套Agent系统的精髓。这个思路，对我们开发任何领域的Agent都极具启发。

7个月前

每天花大量时间刷 X，我们到底在期待刷到什么？是最新的 AI 资讯？是某个工具的奇技淫巧？还是大牛们激辩的观点？表面上，我们在消费信息。但往深一层想，尤其是在信息过载的今天，我们其实是在下意识地寻找一个值得信赖的「认知代理」。用户关注你，不是为了看你转发了什么新闻，而是为了购买一种极其稀缺的服务：“认知代理服务”。什么意思？就是你，作为一个可信赖的节点，代替他们： 1. 过滤信号：在漫天噪音中，筛选出真正重要、有价值的信息。 2. 塑造意义：将零散的信息串联起来，提供一个深刻、独到、成体系的视角。本质上，你的价值 = 帮粉丝节省的时间 + 你提供的高质量视角。所以，别再问“我该发什么内容”，先问自己三个问题： - 我的“认知代理”服务，客户是谁？（定位 Niche：是AI产品经理，还是AI创业者？） - 我如何帮他们过滤信号？（你的信息源和判断标准是什么？） - 我提供的“意义”是什么？（你的核心观点和方法论是什么？）

7个月前

今天这2小时咨询，给我直接干沉默了。客户是个特牛的独立开发者，结果呢？产品在起点就卡死了。为啥？因为他在为一个根本不存在的美国市场做产品。感觉必须把话说明白：你觉得的“用户需求”，大概率可能只是“国人的需求”。你连美国人厨房里会有什么没有什么都不知道，就敢说你懂他们的痛点？别再用“战术上的勤奋”去掩盖“战略上的懒惰”了。基于错误假设的努力，纯属浪费生命。所以，我的【Validated SaaS Ideas | 硅谷圈内验证的SaaS金矿】💡，不搞虚的。它的唯一目的：帮你省下那6个月的冤枉路，让你直接看牌桌底牌。我的点子从哪来？ - YC创始人饭局上吐的槽：他们想做但没空做的项目，每一个都可能是一个小金矿。 - 美国小老板亲口说的付费需求：我们收购小公司和公司决策层聊的时候，他们愿意每月花钱解决的真实麻烦，这比任何调研报告都真。 - Reddit的阴暗角落：那些让你觉得“卧槽，这都有人要？”的高价悬赏帖，背后就是最纯粹的商业需求现在，你有两个选择摆在面前： A. 继续独自摸索：用宝贵的时间和资金，去验证一个充满不确定性的方向。这很勇敢，但风险和机会成本都极高。 B. 让我为你引路：用极小的成本，获得一份经过验证的「高胜率决策参考」，让你站在过来人的肩膀上起步。你的每一个决策，都在定义你的创业效率。这个价格结构，是想把最大的诚意，留给最早信任我的朋友。 - 前10位早期支持者（预售）：$30。这不仅是一个价格，更是一份邀请，让你用最低成本获得宝贵的认知优势。 - 之后，价格将到$199，然后$399。我们相信，机会总是偏爱那些能快速识别价值、并果断行动的人。预售链接将在我的下一条推文中发布。

7个月前

我们上线了旅行规划。现在你可以在Google的AI Mode搞定行程和灵感了。

#旅行规划 #Google #AI Mode #行程 #灵感