素人极客-Amateur Geek

素人极客-Amateur Geek

0 关注者

6天前

Gemini3.0测试-选题创作 准确度、严谨度、发散能力足够

#Gemini3.0 #测试 #选题创作 #准确 #严谨

相关新闻

placeholder

向阳乔木

9小时前

这个原则非常好! 用这个思路写了一个短视频脚本创作提示词。 待会测试下效果

placeholder

Larry & Leo Bro - Eagle of Full Stack

1天前

105 star 多谢关注。纯社区驱动的 nofxai 欢迎关注使用!特点: 安全,准确,易用,有态度!

placeholder

比特进

4天前

刚说的BTC目标价马上就到了😂, Valuescan的提醒太及时准确。

placeholder

sitin

6天前

Gemini3.0 开干!明天再看!

placeholder

iPaul

1周前

最后一句,准确!

关联事件

AI高考数学测试:O3意外落后,Gemini夺冠引发热议

62

在近期的AI高考数学测试中,O3虽然未降智,但却屈居第四,未能进入前三名,引发了广泛的质疑与讨论。此次测试不仅使用了O3,还引入了其他模型的API进行统一评估,并加入了人气模型Gemini 2.5 Pro。结果显示,国内多款模型在推理能力上有显著提升,基本都能考上130分以上,其中Gemini在客观题测试中表现最佳。随着AI数学能力的提升,未来的测试结果可能会趋于满分,导致各模型之间的区分度降低。这一现象引发了对AI发展趋势的深入探讨,尤其是在教育领域的应用前景。

© 2025 news.news. All rights reserved. 0.043 秒. v1.0.46
我的评论