GPT-4.5 会带来推理模型的升级想象一下，每个 AI 模型都是一名努力学习的学生。每个学生的能力有高有低，有的懂得多，有的懂得少。这张图片就像是一场考试的成绩单，展示了不同的“学生”（模型）在高难度考试（GPQA基准测试，类似博士水平的知识问答）中的表现。在图片中，我们能清楚看到： - 最底层的基础模型（Base Models），类似于那些还没学会“如何思考”、只掌握了大量知识却不善于运

#GPT-4.5 #推理模型 #AI升级 #模型性能 #GPQA

相关新闻

Cali Castle

3周前

OpenAI 厉害了，经过一天的测试下来，GPT 5.4 (high thinking) 在 🦞 上表现是大于 Sonnet 4.6，约等于 Opus 4.6 的压力测试了我过去所有的用例，结论是比 Opus 要快大概 30% 左右，完成任务质量跟 Opus 大差不差，我的财务、HR、客户经理 agent 已经切过去变主力模型了再用一段时间看看

dontbesilent

4个月前

自从我的乐趣变成了彻底操控、愚弄 AI 大模型之后就不怎么用推理模型了，太聪明，不好骗

Geek

5个月前

OpenRouter 又上隐身模型了 openrouter/andromeda-alpha ，这是一个较小的推理模型，擅长图像理解。

Gorden Sun

5个月前

2025年AI发展现状报告内容依旧详实，314页PPT。摘要： · OpenAI依旧领先，但是优势缩小； · Meta的LLaMA开源陨落，中国的DeepSeek、Qwen、Kimi居上，Qwen在HuggingFace上占据40%的微调量。中国AI位居第二 · 推理成为年度主线。结合强化学习、评分奖励与可验证推理，构建出能“计划—反思—自我纠错”的模型，开始处理更长时间跨度的任务 ·

东方网-东方网

6个月前

更清晰、更好看、更智能！东方有线超高清AI升级行动启动