「 SWE Agent, Data Scaling Law 」 Skywork-SWE: Unveiling Data Scaling Laws for Software Engineering in LLMs Data scaling law,只要数据继续增长,SWE Agent 的性能几乎呈 log-linear上升,且尚未见饱和。 作者构建全自动、执行可验证的data pipeline,构建了Skywork-SWE 数据集,并验证了data scaling law 在 SWE 任务上的适用性。 值得注意的是,作者发现“长上下文与多轮交互” 对 Agent 表现起到关键作用。 将 rollout ( try-observe-edit-test) 轮数从 10 增至 100,可带来近 10 pp 的解决率增益。