歸藏(guizang.ai)2025-05-28 11:21:42LLM 竞技场 LMArena 对整个站点都进行了翻新,融资了之后终于可以搞搞体验了 新 Logo、更好、更快的聊天和排行榜 UI/UX、移动设备优化、聊天记录、视频、图像的评估和排行也即将推出 #LLM竞技场#LMArena#网站翻新
勃勃OC2025-02-18 14:08:15xAI 的新大型语言模型 Grok 3 发布 Grok 3具备推理能力,以及一个Grok-mini的小模型 在 LMArena 上的 ELO 评分达到 1400,排名第一 AIME 24 —— 52% [推理后 96%] GPQA —— 75% [推理后 85%] 编程(LiveCodeBench)—— 57% [推理后 80%] 此外,在最新的数学竞赛 AIME 2025 中取得了 93#XAI#大型语言模型#Grok-mini