katon
0 关注者
Viking
1天前
写 Next.js 的可以看看 Vercel 的 AI agent benchmark 很真实的一个大模型解决 next.js 功能的测试,每个大模型给 21 个测试看结果。 之前也推荐过,我每次写都会看看,这次另外惊奇的是 Cursor Composer2 的成功率 95% 排名第三,而前几天说的被他魔改的 Kimi K2.5 只有 52%,看来 RL 版本还是有用的啊,一下提高了这么多成
币安Binance华语
🙋Binance Ai Pro 即将上线,敬请期待!
砍砍.ᐟ
2天前
Codex 说不出话了。
Saito
3天前
我觉得每个使用 Claude Code 和 Codex 的用户都应该听听 Django 创始人 Simon 这段,然后采用测试驱动开发的方式重新思考自己的 Vibe 产品。
大帅老猿
GROK 果然还是能力最大的那个 AI