Justin
0 关注者
在悉尼和稀泥
6小时前
下周开始 vibe coding 走起
大帅老猿
10小时前
像 潜水员戴夫 和 小丑牌这种联动太屌了,潜水员戴夫里机会完整的实现了小丑牌的机制,这种合作怎么谈的
61
1天前
今天开始让 Codex 直接做网页了,把 APP 各种数据都丢给他,很爽
Andy Stewart
我不懂GTA,但我懂桌搭啊😍
Vonng
2天前
Codex 这个新的自动化功能不错。
AI高考数学测试:O3意外落后,Gemini夺冠引发热议
67
在近期的AI高考数学测试中,O3虽然未降智,但却屈居第四,未能进入前三名,引发了广泛的质疑与讨论。此次测试不仅使用了O3,还引入了其他模型的API进行统一评估,并加入了人气模型Gemini 2.5 Pro。结果显示,国内多款模型在推理能力上有显著提升,基本都能考上130分以上,其中Gemini在客观题测试中表现最佳。随着AI数学能力的提升,未来的测试结果可能会趋于满分,导致各模型之间的区分度降低。这一现象引发了对AI发展趋势的深入探讨,尤其是在教育领域的应用前景。