#agent-first

6小时前

重读 OpenAI「Harness engineering」工程博客，重新理解这个「agent-first」时代的工程支架，如何真正用好 Codex？在 agent-first 的软件开发中，工程师的核心任务正从“直接写代码”转向“设计让智能体稳定产出代码的系统”。未来真正决定效率的，不再是模型有多强，而是团队是否具备以下能力： · 把需求转成清晰的任务和验收标准 · 把知识沉淀进仓库，而不是留在聊天和人脑里 · 把架构约束、代码规范、测试和反馈机制做成可执行规则 · 让 agent 能直接观察、验证、修复问题 OpenAI 用 Codex 做了一个极端实验：从空仓库开始，不手写代码，由 agent 生成产品代码、测试、CI、文档和工具，并在真实使用中持续迭代。 OpenAI 并不认为“AI 已经能完全代替工程师”，反而是：如果软件团队把 agent 当作主要执行者，那么工程体系本身必须重构。重构的重点不是 prompt 技巧，而是四件事： · 环境：让 agent 能运行、调试、测试、观察系统 · 知识：让关键文档、规则、设计决策都在仓库内可检索、可维护 · 约束：用 lint、结构测试、依赖规则约束架构演化 · 回路：让日志、指标、评审、失败信息都能直接反馈给 agent 最值得重视的启发第一，知识是否“在仓库里”变得非常关键。对 agent 来说，运行时读不到的知识基本等于不存在。因此，文档不再只是辅助材料，而是生产系统的一部分。第二，严格边界比过去更重要。 agent 的产出速度很快，如果没有清晰的架构层次、依赖方向和机械化规则，系统会更快失控，而不是更快进步。第三，测试、可观测性和评审正在变成 agent 的工作输入。它们不只是给人看的质量工具，也是在训练 agent 自我修正的反馈机制。

#OpenAI #agent-first #Codex #软件开发 #智能体 #工程支架