#SWE-agent

5个月前

大量使用 Claude Code 后，重新读了 SWE-Agent，开始理解使用中的一些问题。 cd/ls/cat/grep/find, Vim-style next/prev 本质上是Human-oriented CLI。所谓 Human-oriented, 意为着这些CLI设计初衷迎合人类的眼球转动速度，使用CLI过程中的short term 记忆。 Human-oriented CLI与LLM的特性矛盾，导致CLI Agent使用这些CLI的时候，给Agent的单次action的信号太低，导致CLI Agent 在实质上倾向于消耗大量token，并且更容易犯错。所以，虽然相比于GUI，CLI更加适合 Agent，但CLI终究是为human设计的，并不是ACI (Agent Computer Interface) 的最终形态。如果你做的仅仅是another CLI Agent，几乎没有价值。附上论文中关于 ACI 设计的原文，大家也思考一下，到底什么样的交互，是真正的 Agent Computer interface。

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#Claude Code #SWE-agent #Human-oriented CLI #LLM #ACI

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

7个月前

有了swe-agent的强化学习data scaling law，接下来swe-code-cli更是要突飞猛进了，传统的code，发抖吧：从强大的思考者LRM到自主的行动者Agent，其演化路径清晰地呈现为一个【四部曲】： 1内在思考： LRM利用思维链等能力，在内部形成解决问题的抽象因果蓝图。 2交互具象化：通过ACI这座桥梁和ReAct范式，将抽象蓝图转化为与真实世界交互的、具体的{Thought, Action}循环，弥合了知与行的鸿GMO。 3【性能催化：通过数据缩放和对长上下文、多轮交互的利用，Agent突破了浅层推理的瓶颈，具备了解决复杂问题的基础能力。】 4策略精炼：借助模仿学习和强化学习的奖惩机制，对Agent的行为策略进行端到端的优化，使其在无数次试错中学会最高效、最安全的行动方式。

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#SWE-agent #强化学习 #数据缩放 #自主行动者Agent #模仿学习

马东锡 NLP 🇸🇪

9个月前

「codex, ACI, Agent」论文 SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering 从 Human‑Computer Interaction (HCI) 到 Agent‑Computer Interaction (ACI) —— AI IDE 的基石与框架今天 OpenAI 开源了 Codex CLI。这正是 NeurIPS 2024 论文 SWE‑agent 中提出的精彩概念 Agent‑Computer Interface（ACI）的一次产品级实践。 SWE‑agent = ReAct + CLI 原生 = ACI 1. ReAct：Thought → Action → Observation 在运行 Codex CLI 时，你会清晰看到经典的 ReAct 循环：这一流程与 SWE‑agent 在论文中描述完全一致： “At each step, SWE‑agent generates a thought and a command, then incorporates the feedback from the command’s execution in the environment (ReAct).” 2. CLI 原生：让 Linux CLI 成为Agent的工具 Codex CLI 构建在 Linux shell 之上，必要时会直接调CLI（如 sed, grep, pytest）完成代码检查与测试，对应论文中的另一句： “Built atop the Linux shell, SWE‑agent also allows access to common Linux commands and utilities when needed.” 3. 从思想上，SWE-agent提出了精彩的新概念，ACI。 LLM在编程场景中就像“新型用户”，需要专门为其量身定制的人机交互层——ACI。与HCI的不同之处在于： HCI 面向人类直觉，ACI 面向Agent推理； HCI用GUI追求“让人觉得好用”，ACI追求“让Agent更容易reasoning、有更简洁精确的context, 指令和工具”。 ACI的特点是：精简指令集合把嘈杂的Linux CLI抽象成少量高杠杆动作，降低回合数与成本。反馈充分且简洁固定格式 + 必要元数据，避免上下文膨胀。内置护栏语法 lint、无效编辑回滚，阻断错误连锁。值得一提的是，codex是纯CLI系统，是ACI的纯粹实践。其他如cursor，Windsurf或者是devin，是HCI和ACI的结合。但只从agent的角度来说，理解ACI才能更加当我们vibe coding的时候，到底是怎么回事。

#Codex #ACI #agent #SWE-agent #Human-Computer Interaction #Agent-Computer Interaction #AI IDE #OpenAI #开源