都 2025 年中了，大家还在用这种方式测 AI？挺哭笑不得的。

#AI测评 #2025年 #技术落后 #哭笑不得 #反思

相关新闻

縱橫日本

4天前

日本法務省統計，2025年成功入籍日本的中國人數超過3500人。2024年，選擇入籍日本的外國人群體中，中國人達3122人，首次超過朝/韓，成爲日本第一大外籍歸化群體。

朱韵和

5天前

偷听敌台的赫鲁晓夫 1968年，勃列日涅夫出兵捷克，镇压“布拉格之春”，这使他大为愤怒。回想自己1956年也曾下令出兵匈牙利镇压群众示威游行，他意识到，这是体制的问题，如果体制如故，任谁当政都会在这条轨道上狂奔。他怒吼：“这个国家的大门被关闭了，被锁链绑住了。当你不得不将人民用锁链捆绑起来，那是一种什么样的社会？什么样的社会秩序？如果上帝让我有继续执政的机会，我会将大门和窗户都大大地打开！”

向阳乔木

6天前

做AI生成内容测试。成大事的人，为什么从不反思自己？ Marc Andreessen 最近说了一句让很多人不舒服的话：「我的内省为零，越少越好。」说这话的人，是硅谷最有影响力的投资人之一，a16z 的创始人，他见过这个时代几乎所有伟大的创始人。他不是在炫耀，他是在描述一个他观察了很久的现象。 David Senra 读了 400 本传记，发现了同一件事 Founders Po

勃勃OC

1周前

OK，我经常反思自己，反省自己，我怎么还没有成功，我怎么就这么失败？

Sixia "Leask" Huang

1周前

不知道當年撐警的港人，現在有沒有回過頭想想自己失去了什麼。

关联事件

AI高考数学测试：O3意外落后，Gemini夺冠引发热议

在近期的AI高考数学测试中，O3虽然未降智，但却屈居第四，未能进入前三名，引发了广泛的质疑与讨论。此次测试不仅使用了O3，还引入了其他模型的API进行统一评估，并加入了人气模型Gemini 2.5 Pro。结果显示，国内多款模型在推理能力上有显著提升，基本都能考上130分以上，其中Gemini在客观题测试中表现最佳。随着AI数学能力的提升，未来的测试结果可能会趋于满分，导致各模型之间的区分度降低。这一现象引发了对AI发展趋势的深入探讨，尤其是在教育领域的应用前景。

都 2025 年中了，大家还在用这种方式测 AI？ 挺哭笑不得的。

相关新闻

关联事件

都 2025 年中了，大家还在用这种方式测 AI？挺哭笑不得的。