时政

财经

科技

#KCORES

karminski-牙医

2025-04-15 08:26:14

来啦！GPT-4.1 测评！ KCORES 大模型竞技场为大家带来 GPT-4.1 测评！直接说结论： Gemini-2.5-Pro 仍然领先榜首 GPT-4.1 大概与 Qwen-2.5-Max 相当, 甚至在我的测试集里面是不如 OpenAI-O3-mini-high 和 OpenAI-o1 的 GPT-4.1-mini 则与老的 DeepSeek-V3 差不多, 或者说, 是一个价格便宜

#GPT-4.1 #Gemini-2.5-Pro #KCORES

karminski-牙医

2025-03-25 00:41:54

给大家带来全网最速 DeepSeek-V3-0324 写代码实测！直接说结论—— 超越 DeepSeek-R1！甚至超越 Claude-3.7! 难以想象这还不是一个 Thinking 模型！ DeepSeek-V3-0324 目前以 328.3 分在 KCORES 大模型竞技场排名第三 (图1)，仅次于 claude-3.7-sonnet-thinking 和 claude-3.5 (没错

#DeepSeek-V3-0324 #DeepSeek-R1 #Claude-3.7

没有更多了 🤐