2025-05-30 09:22:10
你怎么看待这个针对语言模型的智商测试? > claude 4 opus目前以120分的离线成绩和117分的Mensa挪威测试成绩领先 > o3模型在Mensa测试中得分更高,达到了135分 这些结果令人印象深刻。 不能确定这个测试有多准确,或者它是如何衡量AI的智商的? 这或许并不是评判AI智能的最佳方式 来自:Haider.
2025-05-29 11:45:51
2025-05-18 23:02:19
2025-04-23 11:33:48