向阳乔木2025-06-17 09:17:52LMarena排版榜,可以很好的了解模型能力和适用场景。 目前看,谷歌的 Gemini-2.5-Pro-Preview-06-05 模型一骑绝尘,遥遥领先。 不过比较惊喜的是,WebDev场景,中国模型 Deepseek R1 0528,甚至超过了Opus4,相当能打。 搜索场景最厉害的是gemini-2.5-pro-grounding,第二名是Perplexity的 ppl-sonar-r#LMArena#模型能力#适用场景
汗青 HQ2025-05-23 20:17:05Opus4的审美太好了:测试用Claude4直接生成广告创意网页,用AI TALk历史名人介绍Claude4。 它输出的不仅是视觉,也在一体化的解决创意和文案问题。所以AI对广告行业的影响不仅是视觉,更关乎创意,这比视觉的价值可能更大。 详细评测会在AI TALK的公众号里更新。 #Opus4#AI#Claude4