完全赞同，模块级别的 Coding 能力已经不足以检测顶级模型的真实能力，还是要看模型 Agent 方面的能力——根据用户输入和代码库调用工具补足上下文完成任务从 Coding 能力来讲 Gemini 2.5 Pro、o3、Claude 4 差距不明显，但是 Coding Agent 能力明显 Claude 是最强的，Gemini 2.5 最弱

#顶级模型 #Agent能力 #Claude #Gemini 2.5 #Coding能力

相关新闻

geniusvczh

20小时前

今天老婆开通了claude，结果没几条request就用了$20，但是$20在copilot可以用opus 4.6 250次。所以claude的1万美元，copilot只要几百美元就搞定了我🤪

阿科

1天前

你连Claude max 订阅都用不完，你跟我说努力？

初码

1天前

没有Claude的日子里，似乎GPT Think 5.4也不是不能用，原来感情这东西，走的痛也来得快！哈哈哈哈哈哈

Mr Panda

1天前

我刚才试了一下 claude 最近推出的dispatcher 功能，真的很好用，比龙虾好用啊。

Bryan

1天前

Codex 能力一流，但是看它说的话太难受了 🙏来个插件，内部保持它那套不动，但最终结果给我看的时候用 Claude 润色下吧

关联事件

AI编程工具激战：Claude Code、Gemini Cli崛起

1256

Claude Code持续快速发展，功能不断增加，竞争日益激烈。开发者社区积极探索其功能、应用并分享经验，第三方工具和应用生态系统不断涌现。Prompt工程的重要性日益凸显，Warp等终端Agent崭露头角。Cursor的Diff AI Edit能力被Cline开源。Claude正添加记忆功能以优化用户体验，与ChatGPT竞争。Gemini发布了类似的AI编程产品Gemini Cli。同时，开发者们也在积极探索如grep/ast-grep等工具在LLM时代Code Agent中的应用，以及如何利用AI优化产品经理的工作流程。此外，市场上还出现了“改版Claude-Code+订阅账户”的方案。