meng shao

meng shao

0 关注者

3周前

Claude Opus 4.6 来了 GPT-5.3-Codex 也来了 Anthropic 和 OpenAI 又一次杠上了(广告问题还在杠) 先看几个关键评估指标,Opus 4.6 在左,GPT-5.3-Codex 在右: · Terminal-Bench 2.0:65.4% vs. 77.3% · SWE-Bench Verified/Pro:81%(Verified) vs. 56.8%

热门新闻