宝玉 0 关注者 关注 4天前 完全赞同,模块级别的 Coding 能力已经不足以检测顶级模型的真实能力,还是要看模型 Agent 方面的能力——根据用户输入和代码库调用工具补足上下文完成任务 从 Coding 能力来讲 Gemini 2.5 Pro、o3、Claude 4 差距不明显,但是 Coding Agent 能力明显 Claude 是最强的,Gemini 2.5 最弱 前往原网页查看