wwwgoubuli

wwwgoubuli

0 关注者

13小时前

都 2025 年中了,大家还在用这种方式测 AI? 挺哭笑不得的。

#AI测评 #2025年 #技术落后 #哭笑不得 #反思

相关新闻

placeholder

𝘁𝗮𝗿𝗲𝘀𝗸𝘆

1天前

《2025 年的 AI 协助编程观察》 阅读拾遗。

placeholder

德潤傳媒

2天前

人光是勤奋是没有用的

placeholder

海外爆料

3天前

🔥 2025年8月9日下午6时4分,全国百城“撑江油,打酱油”! 👉 “我们要透气,我们要说话,我们都要打酱油”‼️

placeholder

每日反共🇺🇦

3天前

今日金句:不要等到被抓进猪笼,才发现自己一直活在猪圈。

placeholder

Geek

3天前

Qwen 3 Coder vs Kimi K2 vs Claude 4 Sonnet 编程比较

关联事件

AI高考数学测试:O3意外落后,Gemini夺冠引发热议

12

在近期的AI高考数学测试中,O3虽然未降智,但却屈居第四,未能进入前三名,引发了广泛的质疑与讨论。此次测试不仅使用了O3,还引入了其他模型的API进行统一评估,并加入了人气模型Gemini 2.5 Pro。结果显示,国内多款模型在推理能力上有显著提升,基本都能考上130分以上,其中Gemini在客观题测试中表现最佳。随着AI数学能力的提升,未来的测试结果可能会趋于满分,导致各模型之间的区分度降低。这一现象引发了对AI发展趋势的深入探讨,尤其是在教育领域的应用前景。

© 2025 news.news. All rights reserved. 0.11585 秒. v1.0.42
我的评论