AI Will2025-05-26 14:00:08你怎么看待这个针对语言模型的智商测试? > claude 4 opus目前以120分的离线成绩和117分的Mensa挪威测试成绩领先 > o3模型在Mensa测试中得分更高,达到了135分 这些结果令人印象深刻。 不能确定这个测试有多准确,或者它是如何衡量AI的智商的? 这或许并不是评判AI智能的最佳方式 来自:Haider. #语言模型#AI智商测试#Mensa测试
howie.serious2025-04-18 08:46:43o3的IQ分数出来了:线下测试 116分;线上测试 136分; 第二名是gemini 2.5 pro:线下115分;线上 128分; trackingai网站每周会测试一次llm的智商,然后取平均值;测试方法还分为线上和线下两种,一般线上测试比线下要高20分。 人类测智商一般也是线上的,当然,线下测试(例如去某医院心理科挂号排队测智商,然后提交给学校筛选🤣)更“权威”。 o3的IQ比我之前#AI智商测试#o3#线上线下测试