2025-06-13 11:44:49
LMarena排版榜,可以很好的了解模型能力和适用场景。 目前看,谷歌的 Gemini-2.5-Pro-Preview-06-05 模型一骑绝尘,遥遥领先。 不过比较惊喜的是,WebDev场景,中国模型 Deepseek R1 0528,甚至超过了Opus4,相当能打。 搜索场景最厉害的是gemini-2.5-pro-grounding,第二名是Perplexity的 ppl-sonar-reasoning-pro-high 整体结论 ① Gemini-2.5-Pro-Preview-06-05:目前综合能力最强,适合文本、视觉、代码等多场景,推荐作为主力通用大模型。 ② GPT-4o/4.5:多模态能力突出,适合需要图文混合、复杂推理的场景。 ③ DeepSeek 系列:在代码、开发协作方面表现优异,适合程序员和开发团队。 ④ Claude Opus/Sonnet:在代码解释、文档生成、推理等任务中表现稳定,适合需要高可靠性的企业级应用。 ⑤ GPT-Image-1/Imagen:文生图能力强,适合设计、创意、广告等视觉内容生成。
2025-06-13 11:44:49
2025-06-12 14:29:10
2025-06-12 09:44:50
2025-06-10 21:31:31