时政
财经
科技
登录
#线上线下测试
关注
howie.serious
2个月前
o3的IQ分数出来了:线下测试 116分;线上测试 136分; 第二名是gemini 2.5 pro:线下115分;线上 128分; trackingai网站每周会测试一次llm的智商,然后取平均值;测试方法还分为线上和线下两种,一般线上测试比线下要高20分。 人类测智商一般也是线上的,当然,线下测试(例如去某医院心理科挂号排队测智商,然后提交给学校筛选🤣)更“权威”。 o3的IQ比我之前估计的要低10分,看来之前是过于乐观了。 我昨天还发现o3学坏了,学上了“甩大词”的毛病。这一点需要更多时间更多案例来测试。我是期待o3在写作上大有所为的,如果学了甩大词的毛病,就得想办法治好它。🤣
#AI智商测试
#o3
#Gemini 2.5 Pro
#线上线下测试
#trackingai网站
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞