Jesse Lau2025-03-31 06:37:52gemini 2.5 pro在数学竞赛测试中综合第一 大概o1-pro API定价离谱,该网站没有测试o1-pro -------- 背景: 美国数学邀请赛(AIME) AIME(American Invitational Mathematics Examination)是美国数学竞赛体系中的重要组成部分,主要面向在AMC10或AMC12竞赛中表现优异的学生。 哈佛-麻省理工数学竞赛(HM#数学竞赛#AIME#美国数学邀请赛
勃勃OC2025-02-18 14:08:15xAI 的新大型语言模型 Grok 3 发布 Grok 3具备推理能力,以及一个Grok-mini的小模型 在 LMArena 上的 ELO 评分达到 1400,排名第一 AIME 24 —— 52% [推理后 96%] GPQA —— 75% [推理后 85%] 编程(LiveCodeBench)—— 57% [推理后 80%] 此外,在最新的数学竞赛 AIME 2025 中取得了 93#XAI#大型语言模型#Grok-mini
罗翔2025-01-14 23:48:272025年1月14日,佩带乌克兰标志的斯洛伐克学生赢得数学竞赛奖,领奖时拒绝与他们的亲俄总统握手! 好小伙,给你点个赞👍! 这要在中国,不得马上拉去关精神病院! #斯洛伐克#乌克兰#数学竞赛