GPT-4.5 重磅发布：天价算力背后的- news.news·换个方式看新闻|AI看新闻、实时追踪事件后续

GPT-4.5 重磅发布：天价算力背后的性能迷局，AI Scaling Law 到尽头了吗？ 2025 年 2 月 27 日，OpenAI 正式发布了其迄今为止规模最大的 AI 模型——GPT-4.5（代号 Orion）。尽管 OpenAI 表示 GPT-4.5 是该公司有史以来算力和数据规模最大的模型，但这次的性能提升并未像此前 GPT 系列一样带来革命性的飞跃。不仅如此，GPT-4.5 高昂的运行成本和在一些关键基准测试上的表现差强人意，甚至让外界开始怀疑——AI 长期依赖的Scaling Law（规模定律），正在走向终点了吗？巨型模型、巨额成本，但性能未如预期此次 GPT-4.5 发布最引人注目的，莫过于其惊人的成本——每 100 万输入 token 收费 75 美元，输出 token 更高达 150 美元。这意味着 GPT-4.5 的成本是 OpenAI 自己广泛使用的主力模型 GPT-4o 的30 倍，更是竞争对手 Claude 3.7 Sonnet 的25 倍。 OpenAI 发言人承认，GPT-4.5 的运行成本之高，使得公司必须重新评估它未来是否适合长期开放 API。如此巨额成本背后，GPT-4.5 的性能究竟如何呢？性能迷雾：优势与劣势并存尽管 OpenAI 将 GPT-4.5 定位为非推理模型（Non-Reasoning Model），但它的表现却出现了明显的两极分化。 ✅ 明确的性能提升领域： - 事实性问答 (SimpleQA) 基准测试中，GPT-4.5 优于 GPT-4o 和 OpenAI 的推理模型 o1 和 o3-mini，幻觉（hallucination）的频率也明显降低。 - 软件开发（SWE-Lancer）测试中，GPT-4.5 表现优于 GPT-4o 和 o3-mini，在开发完整软件功能时具有更高的可靠性。 ❌ 性能不及预期的领域： - 在高难度的学术推理类测试（如 AIME 和 GPQA）中，GPT-4.5 表现低于竞争对手 Claude 3.7 Sonnet、DeepSeek R1 和 OpenAI 自家的推理模型 o3-mini。性能对比之谜：成本 vs 性能提升 GPT-4.5 虽然在一些特定任务上确实表现出色，但考虑到成本的激增，性能并未出现对应比例的显著提升。特别是在需要深度推理的任务上，GPT-4.5 远不如更便宜的推理型模型 Claude 3.7 Sonnet 和 OpenAI 的深度推理模型 Deep Research。 Devin 公司 CEO Scott Wu 在推特上也指出，GPT-4.5 在涉及架构设计和跨系统交互的任务上表现突出，但在纯粹的代码编写和编辑任务上却逊色于 Claude 3.7 Sonnet。这种性能的细微差别进一步证明，单纯的扩大模型规模，可能已不能带来跨领域全面的性能跃升。从性能到情感智能：“微妙的提升” OpenAI CEO Sam Altman 提到了 GPT-4.5 独特的魅力——它带来了以往模型所缺乏的“人性化”的感觉，虽然在数学、代码等硬核推理领域并不出彩，但在理解人类意图和情感回应方面达到了新的高度。 OpenAI 展示了一个情感交流的案例，当用户表示考试失败而难过时，GPT-4.5 给出的安慰更为贴心且符合社交情境：(图 4）正如 Andrej Karpathy 所言：“每代 GPT 都是微妙的提升，一切都变得更好一点，但无法具体指出哪一项是绝对的突破。” Scaling Law 失效了吗？此次 GPT-4.5 发布最令人关注的一点，在于它似乎验证了 AI 界早有预言的“规模定律的终结”。OpenAI 联合创始人 Ilya Sutskever 曾直言：“我们已经达到了数据的巅峰，传统的预训练方式即将终结。” GPT-4.5 的性能曲线证实了他的预测——随着模型规模继续扩大，其性能的提升不再显著，甚至出现了严重的成本与收益不成比例的现象。市场也开始感受到这一趋势： > “DeepSeek R1：我们不再需要大量 GPU 进行预训练； OpenAI GPT-4.5：我们已到 GPU 预训练的尽头。” GPU 算力瓶颈已成新常态，甚至引发了 GPU 供不应求的现象，这背后反映的是产业链面对 AI 规模困境的真实反应。 GPT-4.5：AI 发展的分水岭？ OpenAI 已明确表示 GPT-4.5 不会成为 GPT-4o 的替代品。相反，它更可能是 OpenAI 向 GPT-5 和未来结合推理模型路线的转折点，象征着公司逐渐告别单纯依赖大规模预训练的时代。总结而言： GPT-4.5 展示了 AI 在预训练模式下的规模极限。性价比问题凸显，纯规模化扩张已无法带来突破性进步。情感智能提升明显，可能开启 AI 交互方式新趋势。此次 GPT-4.5 的发布，或许正是 AI 发展道路上的重要里程碑——它提醒着我们，未来的 AI 模型，也许需要的不再只是更多的 GPU 和数据，而是对智能本质的更深入理解。 GPT-4.5 的登场，最终是否宣告 AI Scaling Law 的终结，仍有待时间检验。但毋庸置疑的是，AI 产业已站在变革的路口，传统的规模化预训练模式即将迎来一次深刻的反思与变革。

热门新闻