DeepSeek V3 感觉还是差 Sonet 一筹,Benchmark 是一回事,实际表现是一回事,感觉是混入的数学语料太多。
我的感受(不考虑推理模型)
第一档:Claude Sonet 、Gemini Flash 2.0、 GPT-4o
第二档:DeepSeek V3、Qwen2.5-72B、国内的一票Top 模型
DeepSeek优点是速度变快+便宜~
DeepSeek V3 感觉还是差 Sonet 一筹,Benchmark 是一回事,实际表现是一回事,感觉是混入的数学语料太多。
我的感受(不考虑推理模型)
第一档:Claude Sonet 、Gemini Flash 2.0、 GPT-4o
第二档:DeepSeek V3、Qwen2.5-72B、国内的一票Top 模型
DeepSeek优点是速度变快+便宜~