宝玉

宝玉

0 关注者

4天前

完全赞同,模块级别的 Coding 能力已经不足以检测顶级模型的真实能力,还是要看模型 Agent 方面的能力——根据用户输入和代码库调用工具补足上下文完成任务 从 Coding 能力来讲 Gemini 2.5 Pro、o3、Claude 4 差距不明显,但是 Coding Agent 能力明显 Claude 是最强的,Gemini 2.5 最弱