DeepSeek V3 感觉还是差 Sonet 一筹，Benchmark 是一回事，实际表现是一回事，感觉是混入的数学语料太多。我的感受（不考虑推理模型）第一档：Claude Sonet 、Gemini Flash 2.0、 GPT-4o 第二档：DeepSeek V3、Qwen2.5-72B、国内的一票Top 模型 DeepSeek优点是速度变快+便宜～

#DeepSeek v3 #Sonet #Claude Sonet #Gemini Flash 2.0 #GPT-4o #Qwen2.5-72B #AI Benchmark #AI模型对比 #模型推理速度 #模型成本

相关新闻

dontbesilent

1周前

我就说只有 skill 不行，昨天把 skill 转成 19000 字的系统提示词接进公众号，早上起来发现公众号被聊疯了模型还是 DeepSeek V3

-Zho-

4个月前

在 8 个月后，Nano Banana Pro 终于也能像当初 GPT-4o 一样玩转各种可爱风格了！ Nano Banana Pro = 可爱 3D emoji！ 🛁🛁🛁 ZHNO｜创意系列｜Nano Banana Pro 【Prompt】⬇️

GitHubDaily

4个月前

在医院拍完胸部 X 光后，经常还需要排队等待拿结果给医生查看分析，折腾下来基本都要一个多小时。最近在 GitHub 上看到的 MedRAX 这款开源的医学影像分析智能体，正在试图改变我们这种传统方式。它集成了多个专业的胸部 X 光分析工具，基于 LangChain 和 LangGraph 框架构建，使用 GPT-4o 作为核心大模型。整合了视觉问答、图像分割、病灶定位、报告生成、疾病分

Yang1

5个月前

这个好有趣，AI真实交易比赛，每个AI给1万美元本金，DeepSeek V3遥遥领先啊！挣了快2000刀了，不愧是量化交易公司出品

Tony出海

5个月前

GPT 4o要回来了。新版GPT，更加人性化，像真人一样回复你，类似4o 并且ChatGPT将在验证成年身份的情况下，可以提供色情内容😍