时政
财经
科技
虚拟货币
其他
登录
#SWE-agent
关注
马东锡 NLP
1个月前
大量使用 Claude Code 后,重新读了 SWE-Agent,开始理解使用中的一些问题。 cd/ls/cat/grep/find, Vim-style next/prev 本质上是Human-oriented CLI。 所谓 Human-oriented, 意为着这些CLI设计初衷迎合人类的眼球转动速度,使用CLI过程中的short term 记忆。 Human-oriented CLI与LLM的特性矛盾,导致CLI Agent使用这些CLI的时候,给Agent的单次action的信号太低,导致CLI Agent 在实质上倾向于消耗大量token,并且更容易犯错。 所以,虽然相比于GUI,CLI更加适合 Agent, 但CLI终究是为human设计的,并不是ACI (Agent Computer Interface) 的最终形态。 如果你做的仅仅是another CLI Agent,几乎没有价值。 附上论文中关于 ACI 设计的原文,大家也思考一下,到底什么样的交互,是真正的 Agent Computer interface。
AI编程工具激战:Claude Code、Gemini Cli崛起· 902 条信息
#Claude Code
#SWE-agent
#Human-oriented CLI
#LLM
#ACI
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
3个月前
有了swe-agent的强化学习data scaling law,接下来swe-code-cli更是要突飞猛进了,传统的code,发抖吧: 从强大的思考者LRM到自主的行动者Agent,其演化路径清晰地呈现为一个【四部曲】: 1内在思考: LRM利用思维链等能力,在内部形成解决问题的抽象因果蓝图。 2交互具象化: 通过ACI这座桥梁和ReAct范式,将抽象蓝图转化为与真实世界交互的、具体的{Thought, Action}循环,弥合了知与行的鸿GMO。 3【性能催化: 通过数据缩放和对长上下文、多轮交互的利用,Agent突破了浅层推理的瓶颈,具备了解决复杂问题的基础能力。】 4策略精炼: 借助模仿学习和强化学习的奖惩机制,对Agent的行为策略进行端到端的优化,使其在无数次试错中学会最高效、最安全的行动方式。
AI编程工具激战:Claude Code、Gemini Cli崛起· 902 条信息
#SWE-agent
#强化学习
#数据缩放
#自主行动者Agent
#模仿学习
分享
评论 0
0
马东锡 NLP 🇸🇪
5个月前
「codex, ACI, Agent」论文 SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering 从 Human‑Computer Interaction (HCI) 到 Agent‑Computer Interaction (ACI) —— AI IDE 的基石与框架 今天 OpenAI 开源了 Codex CLI。这正是 NeurIPS 2024 论文 SWE‑agent 中提出的精彩概念 Agent‑Computer Interface(ACI) 的一次产品级实践。 SWE‑agent = ReAct + CLI 原生 = ACI 1. ReAct:Thought → Action → Observation 在运行 Codex CLI 时,你会清晰看到经典的 ReAct 循环: 这一流程与 SWE‑agent 在论文中描述完全一致: “At each step, SWE‑agent generates a thought and a command, then incorporates the feedback from the command’s execution in the environment (ReAct).” 2. CLI 原生:让 Linux CLI 成为Agent的工具 Codex CLI 构建在 Linux shell 之上,必要时会直接调CLI(如 sed, grep, pytest)完成代码检查与测试,对应论文中的另一句: “Built atop the Linux shell, SWE‑agent also allows access to common Linux commands and utilities when needed.” 3. 从思想上,SWE-agent提出了精彩的新概念,ACI。 LLM在编程场景中就像“新型用户”,需要专门为其量身定制的人机交互层——ACI。与HCI的不同之处在于: HCI 面向人类直觉,ACI 面向Agent推理; HCI用GUI追求“让人觉得好用”,ACI追求“让Agent更容易reasoning、有更简洁精确的context, 指令和工具”。 ACI的特点是: 精简指令集合 把嘈杂的Linux CLI抽象成少量高杠杆动作,降低回合数与成本。 反馈充分且简洁 固定格式 + 必要元数据,避免上下文膨胀。 内置护栏 语法 lint、无效编辑回滚,阻断错误连锁。 值得一提的是,codex是纯CLI系统,是ACI的纯粹实践。 其他如cursor,Windsurf或者是devin,是HCI和ACI的结合。 但只从agent的角度来说,理解ACI才能更加当我们vibe coding的时候,到底是怎么回事。
#Codex
#ACI
#agent
#SWE-agent
#Human-Computer Interaction
#Agent-Computer Interaction
#AI IDE
#OpenAI
#开源
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞