#agent-first

meng shao
6小时前
重读 OpenAI「Harness engineering」工程博客,重新理解这个「agent-first」时代的工程支架,如何真正用好 Codex? 在 agent-first 的软件开发中,工程师的核心任务正从“直接写代码”转向“设计让智能体稳定产出代码的系统”。 未来真正决定效率的,不再是模型有多强,而是团队是否具备以下能力: · 把需求转成清晰的任务和验收标准 · 把知识沉淀进仓库,而不是留在聊天和人脑里 · 把架构约束、代码规范、测试和反馈机制做成可执行规则 · 让 agent 能直接观察、验证、修复问题 OpenAI 用 Codex 做了一个极端实验: 从空仓库开始,不手写代码,由 agent 生成产品代码、测试、CI、文档和工具,并在真实使用中持续迭代。 OpenAI 并不认为“AI 已经能完全代替工程师”,反而是: 如果软件团队把 agent 当作主要执行者,那么工程体系本身必须重构。 重构的重点不是 prompt 技巧,而是四件事: · 环境:让 agent 能运行、调试、测试、观察系统 · 知识:让关键文档、规则、设计决策都在仓库内可检索、可维护 · 约束:用 lint、结构测试、依赖规则约束架构演化 · 回路:让日志、指标、评审、失败信息都能直接反馈给 agent 最值得重视的启发 第一,知识是否“在仓库里”变得非常关键。 对 agent 来说,运行时读不到的知识基本等于不存在。因此,文档不再只是辅助材料,而是生产系统的一部分。 第二,严格边界比过去更重要。 agent 的产出速度很快,如果没有清晰的架构层次、依赖方向和机械化规则,系统会更快失控,而不是更快进步。 第三,测试、可观测性和评审正在变成 agent 的工作输入。 它们不只是给人看的质量工具,也是在训练 agent 自我修正的反馈机制。