#速度翻倍

sitin
8小时前
Claude Haiku 4.5 刚发(小模型),但实力一点不“迷你”。 性能≈五个月前的旗舰 Sonnet 4 速度翻倍(体感就是同样任务等一半时间) 价格更便宜(输入 $1/百万 tokens,输出 $5/百万 tokens) 有些场景甚至反超 Sonnet 4 特点: 1)性能不“迷你” 编程:Agentic coding(SWE-bench)73.3%、Terminal coding 41.0%,几乎和 Sonnet 4(72.7%、36.4%)打平。 数学:Python 工具开着 96.3%,关工具 80.7%,小模型里很能打。 Computer Use(电脑操作):OSWorld 50.7%,直接超 Sonnet 4 的 42.2%。这块确实有点惊喜。 2)速度真的快 官方说 more than twice the speed。实际感觉:Claude Code 写代码、跑任务,等待时间直接砍半。 如果你做 API 应用,延迟下降的价值,很多时候比省钱更关键。 3)更省钱、更好上手 价位:对比 Sonnet 4,整体便宜三分之一。 输入:$1 / 1M tokens 输出:$5 / 1M tokens 接入渠道:Claude API、Amazon Bedrock、Google Cloud Vertex AI、Claude Code、网页端 / App……基本能用 Claude 的地方都能切换 Haiku 4.5。 模型名:claude-haiku-4-5 4)安全性更稳 Haiku 4.5 被官方评为目前最安全的 Claude 系列模型之一: 自动对齐评估里,误对齐行为比例更低(比 Sonnet 4.5、Opus 4.1 还低)。 ASL-2 分级(CBRN 风险评估表现好);而 Sonnet 4.5 / Opus 4.1 是更严格的 ASL-3。 适合谁? 高频调用 / 算力敏感:比如代码助手、数据处理、对话式业务逻辑,想要更低成本 + 更低延迟。 需要“电脑操作”能力的自动化工作流:浏览器/系统级任务编排更稳了。 团队大规模接入:同预算撑起更多调用量。 一句话总结 五个月前,Claude Sonnet 4 是最先进的型号。如今,Claude Haiku 4.5 提供类似的编码性能,但价格仅为其三分之一,速度却提升了一倍多。