sitin
2个月前
Nagi Yan
2个月前
《AI不是帮你写代码的,它在等你教它怎么理解你》 经过一段时间的 ClaudeCode 编程体验,我得到一个清晰的结论: 在大型工程中,AI 目前还不可能“无监督”地一次性完成最终代码。 因为在真实的开发环境里,需求不是写在文档里的常量,而是在协作中一步步被澄清的变量。 AI 不知道你真正要什么,它只能在你不断提供的约束和上下文中逐步靠近目标。这意味着,AI 编程不是单向命令,而是协作过程。 ⸻ 一、AI编程的幻觉:一次性完工的神话 很多人幻想 AI 能一键生成成品项目。 但他们忽略了一个事实:软件开发的核心不是写代码,而是定义需求。 而需求是什么? 它是无数次讨论、否定、取舍与妥协的产物。 它是人类协作过程的副产品。 所以,当AI还没被告知“世界的边界”时,它写出的东西,只能是幻觉的具象化。 问题不在AI不聪明,而在——你没让它知道它应该聪明到哪里为止。 ⸻ 二、从“写代码”到“写约束” 未来的开发者不会直接写代码, 而是写下AI理解问题所需的约束。 就像你不再亲自去拧每一颗螺丝,而是画出力学结构图。 AI将成为那个根据结构图执行的“智能技工”。 所以开发者的新职责是: •明确输入输出边界; •设计可复用的上下文模式; •在每一次对话中,让AI理解“为什么这样做”。 这是一种新的编程语言——结构语言。 ⸻ 三、共情AI:新的编程能力 很多人以为“共情AI”是情绪层面的,但其实它是结构层面的洞察力。 当AI犯错时,不该骂它,而该反问: •它缺少了哪段关键信息? •它的逻辑链在哪一步断开? •它是不是误解了问题语境? 真正的高手,不是写出完美的Prompt,而是能在AI的“错误”中看见它的信息饥饿。 ⸻ 四、暴躁与放弃:人类的不成熟反应 很多开发者第一次用AI写代码时的反应是: “这AI太蠢了。” 然后关掉界面,重回老路。 但那其实是他们的认知防御机制在作祟。 他们没意识到自己面对的,不是工具,而是一个需要共识成本的智能体。 当AI输出混乱时,它不是叛逆,而是在告诉你:“我还不够了解你的世界。” 骂它没用,教它才行。 ⸻ 五、AI协作的文明门槛 未来的工程师之间的差距,不再是语言或算法能力, 而是谁更能与AI建立共识。 当一个人能从AI的视角思考问题, 他已经不只是程序员,而是协议设计者—— 定义人与智能如何协作的语言建筑师。 AI不会取代你, 但它会淘汰那些只会对它发号施令的人。 ⸻ 结语: AI不缺算力,它缺理解。 而理解,不是AI的天赋,而是人类的馈赠。 你要做的不是命令它,而是让它明白你是谁、你想构建怎样的世界。
汉松
2个月前
我们团队开源了 Multi-Agent 强化学习的框架 MrlX,它能够让你同时训练多个 Agent 模型。 当我们试图让大模型变得更聪明时,大多数人都在做同样的事:训练一个模型,让它自己跟自己对话,希望它能学会反思验证,能学会使用工具。 但如果你仔细想想,这其实很奇怪。 真实世界不是这样运作的。人们是在与其他人的互动中变聪明的。医生通过与病人交谈来提升诊断能力,而病人也在这个过程中学会更好地描述症状。这是一种共同进化。 这就是我们做 MrlX 的原因。 核心想法很简单:让两个 Agent 互相帮助对方成长。一个是“探索者”,负责在真实环境中冒险尝试;另一个是“适应者”,它观察刚刚发生的一切,然后快速调整自己。它们像台阶一样互相垫脚,螺旋式上升。 我们在两个场景中测试了这个想法。 第一个是医生 - 病人对话训练。传统做法是只训练医生 Agent,但我们在思考一个问题:如果病人 Agent 也在进化,会不会让医生 Agent 进化更快?就像真实世界一样:好的病人能帮助医生成为更好的医生,反之亦然。结果证明,联合训练两者比只训练医生要强得多。 第二个场景更复杂:让 Agent 做深度研究。这里的问题是,当你需要频繁使用工具、查询信息时,单个 Agent 的“记忆”会爆炸:它要记住所有工具调用、所有中间结果,很快就撑不住了。解决方案?分工。让不同的 Agent 专注于不同的任务,同时让它们互相训练对方。一个负责主线推理,一个负责处理子任务。它们各自深化自己的专长,同时为对方生成训练样本。 这不是让一个模型假装扮演不同角色。这是真正的多个 Agent,各有专长,共同进化。 两个案例的结果都显示:这种共同进化的方式,在稳定性、收敛速度和最终性能上,都明显超过单 Agent 方法。 最好的创业公司不是一个天才独自工作,而是一群互补的人互相激发。联合创始人之间的张力和协作,往往比任何一个人单独能做到的都要好。MrlX 做的就是这个,只不过是在 AI Agent 之间。 现在这还只是开始。我们只探索了两个场景,都是相对受控的环境。真正有趣的是当你把这个想法推广到更多 Agent、更动态的环境时会发生什么。也许 Agent 可以自己决定要扮演什么角色。也许它们可以形成自组织的生态系统。 欢迎大家使用我们的框架尝试 Multi-Agent 的强化学习,如果觉得有帮助,欢迎转发并给我们的项目一个 star。 最后也欢迎关注我们的 AQ-MedAI 的官方账号,后续我们还有很多新的开源项目在这里发布。