Tom Huang

Tom Huang

0 关注者

16小时前

写在 GPT-5 发布之后,关于 Sam Altman 的「阳谋」和如何定义下一代的 AI 搜索,或者 AI Native 的搜索引擎 (以及,Perplexity 这种并不是真正的 AI 搜索的最终形态) 昨天同事在 Refly 群里丢了一张如下的 ChatGPT 改版图,乍一看几乎所有人的反应是「GPT 没活了」连界面都改没了(笑 其实猛的一看,这不就是 Google 最初的样子的? 其实 OpenAI 不是一直没活,而是一直朝着 AI 时代的 Google 前进! GPT-5 的发布,核心的几个指标大家看清楚了吗 自动路由、极大上下文、便宜 10x 的输入 token、极速的输出、极强的边思考边进行工具调用的能力、极强的逻辑/全栈编码能力 有了这些,用户基本上可以无脑的输入「搜索内容」,然后 GPT-5 自动路由,自动快速检索,边思考边快速输出富交互的内容,这是一个范式的巨变 (在 ChatGPT 这样一个量级的产品里,这里每去掉一个按钮,在保障效果的前提下,都是对流量提升的倍数提升) 这才是 AI Native 搜索该有的样子,而这 ChatGPT 向下一个 10 亿甚至数十亿流量入口迈进的坚实的一步 而 AI Native 搜索达成流量入口之后,各种 *-Canvas 承接搜索之后内容的编辑 - 协作 - 再输出,也就是 AI Native Office ,一整个闭环了 OpenAI 靠 GPT-5 直接拿下了 PC 互联网两大超级应用 90% 的使用场景(搜索+Office),接下来就是等 GPT-5 后续的迭代,更快的速度,更低的成本,然后解锁全新除开积分订阅的商业模式 --- 一些其他的我一直很疑惑的思考,就是,为啥 OpenAI 一直做不好 AI Coding? GPT-5 之后就有了答案,其实并不是不想做,而是实际上 OpenAI 一直在等一个机会,就是模型真正发生像人一样的 「智变」的机会,就是从 O3,或者 Deep Research 开始,一边思考,一边使用工具,在思考中使用工具,在输出中使用工具 有了这样的「智变」之后,再加上「逻辑编码」能力,就迎来了 GPT-5 的时刻,现在可以一口气直接输出整个 Repo 级别的完整代码和全栈逻辑,还原度,实现逻辑,细节都非常到位 举一个非常形象的例子,你就知道 Claude Opus 4.1 vs GPT-5 的变化,比如你让 Claude 初始化一个 TS 全栈的 React + Express 项目,Claude 会逐行写代码创建文件而非使用脚手架,比如 Vite/Express-generator,即使你明确告诉他,而 GPT-5 切切实实直接调用了这两个工具完成了初始化,并在这个基础上细粒度的完成了整个全栈逻辑 这就是「智变」时刻,GPT-5 靠模型路由,速度/成本,thinking + tools 组合调用,极致的编码能力,完成了一口气的反超,再次拿回整个 OpenAI 的大幅度基础模型领先的身位 只能说在这个时刻开始,我又回到了 2 年前拿到 GPT-4 时候的忐忑的心情,当时我觉得人类好像正在迎来一个全新的智能时刻,而经历了两年搁浅之后,在今天的 GPT-5 身上,我又一次感受到了这个巨变时刻和忐忑 也许今年不只是 Agent 的元年,LLM Scaling Law 也并没有放缓,而只是在「突变」前一个短暂的缓冲,就像你用迅雷下载软件到最后 99% 的时候要等很久一样 而在今天,这个突变「蹦」的一下,发生了,很难想象接下来的 2025 年和未来的很多年,人类与 AI 的共生关系的变化 激动、焦虑、兴奋夹杂在一起,此刻,作为一名 AI 时代的创业者,我竟然一时之间感觉脑子轰鸣,也许此时此刻每一位创业者都应该停下来,短暂的思考一下,这一次 GPT-5 的发布,对我们来说意味着什么,哪些可以做加法,哪些可以做减法,怎么样才能不被智能提升的车轮给碾压掉 共勉 第一次写这么长的推特内容,文笔有限,欢迎大佬们轻点喷(