向阳乔木 0 关注者 关注 3个月前 LMarena排版榜,可以很好的了解模型能力和适用场景。 目前看,谷歌的 Gemini-2.5-Pro-Preview-06-05 模型一骑绝尘,遥遥领先。 不过比较惊喜的是,WebDev场景,中国模型 Deepseek R1 0528,甚至超过了Opus4,相当能打。 搜索场景最厉害的是gemini-2.5-pro-grounding,第二名是Perplexity的 ppl-sonar-r #LMArena #模型能力 #适用场景 #Gemini-2.5-Pro-Preview-06-05 #DeepSeek R1 0528 #Opus4 #WebDev #搜索场景 #gemini-2.5-pro-grounding #perplexity #ppl-sonar-r 前往原网页查看