11小时前

Kimi-K2-0905 实测! 一口气输出1100行代码~ Kimi-K2-0905 测试来啦! 直接说结论, 前端水平提升明显! 而且感觉召回变好了! 直接一次完成了 1100 行的测试! 两个前端项目测试中表现优于 DeepSeek-V3.1 不过 Python 水平没感觉到明显的变化, 这个测试运行了6次, 基本都是这个效果. 也可能是我单一测试集场景过窄了, 所以用来写 pyth

相关新闻