时政

财经

科技

#AI智商测试

2025-05-26 14:00:08

你怎么看待这个针对语言模型的智商测试？ > claude 4 opus目前以120分的离线成绩和117分的Mensa挪威测试成绩领先 > o3模型在Mensa测试中得分更高，达到了135分这些结果令人印象深刻。不能确定这个测试有多准确，或者它是如何衡量AI的智商的？这或许并不是评判AI智能的最佳方式来自：Haider.

#语言模型 #AI智商测试 #Mensa测试

2025-04-18 08:46:43

o3的IQ分数出来了：线下测试 116分；线上测试 136分；第二名是gemini 2.5 pro：线下115分；线上 128分； trackingai网站每周会测试一次llm的智商，然后取平均值；测试方法还分为线上和线下两种，一般线上测试比线下要高20分。人类测智商一般也是线上的，当然，线下测试（例如去某医院心理科挂号排队测智商，然后提交给学校筛选🤣）更“权威”。 o3的IQ比我之前

#AI智商测试 #o3 #线上线下测试

没有更多了 🤐