时政
财经
科技

#英国客机事故

orange.ai
orange.ai
2025-06-11 18:51:00

之前大家都特别关注的大模型高考测试放出来之后,收到了很多的质疑: 有人说o3降智了 有人说用的客户端都是联网的,用 api 才是真实水平 有人说没加入近期变强的的 Gemini 于是机器之心又搞了一次测试 - 用不降智的 o3 测试 - o3之外,用各家模型的 API 统一测试 - 加入人气很高的了 Gemini 2.5 Pro 结果…又是很意外 o3 虽然没降智,但前三都没进,只屈居第四

#大模型测试#高考#Gemini
没有更多了 🤐