0 关注者

3周前

Claude Opus 4.6 来了 GPT-5.3-Codex 也来了 Anthropic 和 OpenAI 又一次杠上了（广告问题还在杠）先看几个关键评估指标，Opus 4.6 在左，GPT-5.3-Codex 在右： · Terminal-Bench 2.0：65.4% vs. 77.3% · SWE-Bench Verified/Pro：81%(Verified) vs. 56.8%

热门新闻