𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞 0 关注者 关注 3个月前 有了swe-agent的强化学习data scaling law,接下来swe-code-cli更是要突飞猛进了,传统的code,发抖吧: 从强大的思考者LRM到自主的行动者Agent,其演化路径清晰地呈现为一个【四部曲】: 1内在思考: LRM利用思维链等能力,在内部形成解决问题的抽象因果蓝图。 2交互具象化: 通过ACI这座桥梁和ReAct范式,将抽象蓝图转化为与真实世界交互的、具体的{Th #SWE-agent #强化学习 #数据缩放 #自主行动者Agent #模仿学习 前往原网页查看