Viking 0 关注者 关注 2天前 我看大模型的效果最直观的就是: 每个模型跑同样的 20 个关于 Next.js 不同特性的测试,看看哪个模型强。 现在毫无疑问的是 GPT 5.3 Codex (90%通过)和 Claude Opus 4.6 (80% 通过),而且 GPT5.3 还更便宜,所以我现在就是无脑使用 5.3 了。 前往原网页查看