#Opus4

9个月前

LMarena排版榜，可以很好的了解模型能力和适用场景。目前看，谷歌的 Gemini-2.5-Pro-Preview-06-05 模型一骑绝尘，遥遥领先。不过比较惊喜的是，WebDev场景，中国模型 Deepseek R1 0528，甚至超过了Opus4，相当能打。搜索场景最厉害的是gemini-2.5-pro-grounding，第二名是Perplexity的 ppl-sonar-reasoning-pro-high 整体结论 ① Gemini-2.5-Pro-Preview-06-05：目前综合能力最强，适合文本、视觉、代码等多场景，推荐作为主力通用大模型。 ② GPT-4o/4.5：多模态能力突出，适合需要图文混合、复杂推理的场景。 ③ DeepSeek 系列：在代码、开发协作方面表现优异，适合程序员和开发团队。 ④ Claude Opus/Sonnet：在代码解释、文档生成、推理等任务中表现稳定，适合需要高可靠性的企业级应用。 ⑤ GPT-Image-1/Imagen：文生图能力强，适合设计、创意、广告等视觉内容生成。

#LMArena #模型能力 #适用场景 #Gemini-2.5-Pro-Preview-06-05 #DeepSeek R1 0528 #Opus4 #WebDev #搜索场景 #gemini-2.5-pro-grounding #perplexity #ppl-sonar-r

10个月前

Opus4的审美太好了：测试用Claude4直接生成广告创意网页，用AI TALk历史名人介绍Claude4。它输出的不仅是视觉，也在一体化的解决创意和文案问题。所以AI对广告行业的影响不仅是视觉，更关乎创意，这比视觉的价值可能更大。详细评测会在AI TALK的公众号里更新。

#Opus4 #AI #Claude4 #广告创意 #AI对行业影响 #视觉设计 #历史名人