0 关注者

8个月前

继上次不少媒体拿大模型做了高考数学题以后，今年的高考全科真题测评结果也出来了，不过这次进行测评的是字节Seed团队，很明显能看出，他们对上次豆包的高考数学成绩是充满意外和惊喜的，也在摩拳擦掌想试试看它在全科试题里会表现如何。老规矩，这次参战的5个大模型，仍然是市面上各种跑分都名列前茅的选手：Gemini 2.5Pro、DeepSeek R1、Claude 4、OpenAI o3，以及Seed1

热门新闻