Jesse Lau 遁一子

Jesse Lau 遁一子

0 关注者

1个月前

虽然感觉中长篇claude opus应该不敌gemini,还是整一个测试一下

#Claude #Gemini #AI模型对比 #性能测试 #中性

相关新闻

placeholder

iPaul

45分钟前

决定原谅这个世界一分钟

placeholder

henu王凯

4小时前

昨晚很有意思:先是AI策略给了VZ的交易信号,Claude跑完了风险等级、确定了买点挂单(目前还没完全接自动化交易),但是由于我分神干别的事,

placeholder

狂奔滴小马

4小时前

使用 Claude code canvas-design + GLM 4.5 设计的海报

placeholder

Gorden Sun

6小时前

几乎完美了,就是中文发音的儿化音出现的莫名其妙。另外AI也不会读Gemini。。。

placeholder

程益中

7小时前

“平等”与“均贫富”虽然在字面上似有亲缘关系,实则理念迥异、路线相悖、大相径庭,“平等”不等于“平均”、也不等于“均贫富”……

关联事件

AI高考数学测试:O3意外落后,Gemini夺冠引发热议

45

在近期的AI高考数学测试中,O3虽然未降智,但却屈居第四,未能进入前三名,引发了广泛的质疑与讨论。此次测试不仅使用了O3,还引入了其他模型的API进行统一评估,并加入了人气模型Gemini 2.5 Pro。结果显示,国内多款模型在推理能力上有显著提升,基本都能考上130分以上,其中Gemini在客观题测试中表现最佳。随着AI数学能力的提升,未来的测试结果可能会趋于满分,导致各模型之间的区分度降低。这一现象引发了对AI发展趋势的深入探讨,尤其是在教育领域的应用前景。

© 2025 news.news. All rights reserved. 0.12797 秒. v1.0.46
我的评论