砍砍@标准件厂长
0 关注者
Larry & Leo Bro - Eagle of Full Stack
17小时前
今天表现,快要回我的本了。 继续测试系统的数据正确性 + 提 bug、修 bug! 哪些朋友有影响收益的大 bug 可以提出来,我来看
luolei
1天前
我的抖音法治内容推送算法也是精确起来了 😂
10xMyLife
是什么原因 让你对这么好的天气视而不见 锁在房间里面和bug缠斗呢? 这么好的时光 应该浪费在值得的事情上 我的朋友
0xTodd
3天前
😂 按照这个算法 爆仓两次带来的痛苦堪比入狱
Lex Tang
5天前
我是不是对 AI 太客气了,prompt 里还用 please, would you mind, is there any chance… 但是又怕太粗鲁的话被它报复,给我在代码里偷偷塞不容易被发现的 bug
AI高考数学测试:O3意外落后,Gemini夺冠引发热议
54
在近期的AI高考数学测试中,O3虽然未降智,但却屈居第四,未能进入前三名,引发了广泛的质疑与讨论。此次测试不仅使用了O3,还引入了其他模型的API进行统一评估,并加入了人气模型Gemini 2.5 Pro。结果显示,国内多款模型在推理能力上有显著提升,基本都能考上130分以上,其中Gemini在客观题测试中表现最佳。随着AI数学能力的提升,未来的测试结果可能会趋于满分,导致各模型之间的区分度降低。这一现象引发了对AI发展趋势的深入探讨,尤其是在教育领域的应用前景。