宝玉
1个月前
TheVerge:我和山姆·奥特曼聊了聊 GPT-5 发布引发的风波 在晚宴上,OpenAI 的 CEO 回应了关于 GPT-5 发布、AI 泡沫、脑机接口、收购谷歌浏览器等诸多问题的批评。 周四,在旧金山,我与 山姆·奥特曼 (Sam Altman)、几位 OpenAI 的高管以及一小群记者共进晚餐。奥特曼花了几个小时回答我们的问题。所有话题都可以谈,而且除了甜点时间聊的内容,其余的全部可以公开报道。 与一位科技巨头的 CEO 在餐桌上进行如此长时间、范围如此广泛的访谈,实属罕见。但奥特曼所处的境况本就非同寻常。ChatGPT 迅速成为全球使用最广泛、最具影响力的产品之一。现在,奥特曼正策划一次雄心勃勃的扩张,目标直指消费级硬件、脑机接口和社交媒体。他还对收购 Chrome 浏览器感兴趣——如果美国政府迫使谷歌出售它的话。哦,对了,他还想筹集数万亿美元来建造数据中心。 但眼下,他首先要处理的是上周 GPT-5 发布后引发的种种反应。就在晚宴开始前大约一个小时,OpenAI 推送了一次更新,让用户可以选择切回之前 ChatGPT 的默认模型 4o,以重拾其“温情”。在一些用户在 Reddit 和 X 平台上抗议 4o 的消失后,正是奥特曼拍板决定,迅速为付费订阅者恢复了 4o 选项。 “我认为我们在发布过程中确实搞砸了一些事,”他说道。“但从另一方面看,我们的 API 流量在 48 小时内翻了一番,并且还在增长。我们的 GPU 已经用完了。ChatGPT 的日活用户数每天都在创下新高。很多用户也确实很喜欢这个模型切换器。我想,我们学到了一课,那就是一天之内为数亿用户升级一款产品到底意味着什么。” 他估计,与 ChatGPT 建立起不健康关系的用户比例“远低于 1%”,但也承认 OpenAI 的员工正在就这个话题进行“大量”的会议讨论。“有一类人真的感觉自己和 ChatGPT 建立了某种关系,我们一直关注并思考着这类用户。还有数亿其他用户,他们虽然没有和 ChatGPT 产生拟社会关系,但也已经非常习惯于它以某种特定的方式回应他们,会认同某些事情,并在某些方面给予支持。” “你肯定会看到一些公司去制造日本动漫风格的性爱机器人,因为他们认为自己在这里发现了一些行之有效的模式,”他这番话不那么含蓄地指向了 Grok。“但你不会看到我们这样做。我们会继续努力打造一款有用的应用,并努力让用户以他们想要的方式使用它,但不会过分到让那些精神状态非常脆弱的人在无意中被利用。” 奥特曼希望 ChatGPT 尽可能地个性化,但未必迎合某种特定的意识形态或政治观点。“我认为我们的产品不应该‘政治正确’(woke)。我也不认为它们应该是‘政治正确’的反面。我认为我们的产品应该持有一种相当中立、中间的立场,然后你应该能够把它推向任何一个方向。如果你说,‘我希望你非常政治正确’,那它就应该变得非常政治正确。而如果你说,‘我希望你保守一点’,它就应该反映你的想法。” ChatGPT 的用户基数在一年内大约增长了四倍,现在每周触达超过 7 亿人。“很快,每天将有数十亿人与 ChatGPT 对话,”奥特曼说。“我们现在是世界第五大网站。我认为我们正走在通往第三的明确道路上。”(这意味着要超越 Instagram 和 Facebook。)“再往后就更难了。ChatGPT 要想超越谷歌,那真的非常困难。” 为了让运营规模持续扩大,OpenAI 需要更多的 GPU。这是奥特曼的首要任务之一。“你应该会看到,在不远的将来,OpenAI 将在数据中心建设上花费数万亿美元,”他自信地告诉在场的所有人。 “我们现在必须做出这些痛苦的权衡,”他说。“我们有更好的模型,但就是无法提供它们,因为我们没有足够的算力。我们还有其他各种各样的新产品和新服务很想推出。” 他也认为我们正处在一个 AI 泡沫之中。“当泡沫发生时,聪明人会因为一丝真相的火花而变得过度兴奋,”他解释道。“如果你回顾历史上大多数的泡沫,比如科技泡沫,你会发现背后确有其事。科技确实很重要。互联网确实是件大事。只是人们变得过度兴奋了。我们现在是否处于一个投资者整体上对 AI 过于兴奋的阶段?我的看法是,是的。AI 是否是长久以来发生的最重要的事情?我的看法同样是,是的。” “你应该会看到,在不远的将来,OpenAI 将在数据中心建设上花费数万亿美元” 他证实了最近的报道,即 OpenAI 计划资助一家脑机接口初创公司,以与埃隆·马斯克 (Elon Musk) 的 Neuralink 竞争。“我认为神经接口是值得探索的很酷的想法。我希望能做到脑子里想点什么,ChatGPT 就能对此做出回应。” Fidji Simo 加入 OpenAI 负责“应用”部门,这是否意味着除了 ChatGPT 之外还会有其他独立的应用程序?“是的,你可以对我们抱有这样的期待。”他暗示了自己在社交媒体领域的雄心:“我感兴趣的是,是否有可能用 AI 构建一种更酷的社交体验。”他还说:“如果 Chrome 真的要被出售,我们应该考虑一下。” 尽管奥特曼兴趣广泛,但他是否会长期执掌 OpenAI 实际上并不明朗。“我天生就不是一个适合当上市公司 CEO 的人,”他一度这样说道。“你能想象我参加财报电话会议的样子吗?” 我接着问他,几年后他是否还会是 CEO。“我的意思是,也许三年后 CEO 就是一个 AI 了。那可是很长一段时间。” 以下是奥特曼说的一些其他观点: • 关于打造 GPT-5: “我们当时遇到了严重的 GPU 短缺。我们可以去再造一个巨大的模型。我们可以去做那个,很多人也会想用它,但我们最终会让他们失望。所以我们说,让我们做一个非常智能、非常有用的模型,但同时也要努力优化推理成本。我认为我们在这方面做得非常出色。” • 关于 OpenAI 与 Jony Ive 合作的 AI 设备: “这会花我们一些时间,但我认为你会觉得它非常值得等待。我觉得它令人难以置信。你不会经常遇到一种新的计算范式。过去 50 年里大概只有两次。所以,就让自己满怀欣喜和期待吧。它真的值得等待。” • 关于网络和内容出版商的未来: “我确实认为人们访问的网站会变少。我认为人们会比以往任何时候都更在乎人类创作的内容。我的方向性判断是,人类创作、人类认可、人类策划的内容的价值都将大幅上升。” • 关于通用人工智能 (AGI) 的意义: “也许对我们来说最相关的里程碑是,当我们将大部分的研究集群算力都分配给了 AI 研究员,而不是人类研究员的时候。但我认为这不会是一个非黑即白的过程,因为我觉得这会是一个渐进的过程,人们得到的帮助会一点点、一点点地增多。” • “如果我们不用为模型训练买单,我们本会是一家利润非常丰厚的公司。” • “我再也不用谷歌了。说真的,我完全想不起来上一次用谷歌搜索是什么时候了。”
fin
1个月前
一个感觉,从商业逻辑来看,未来GPT6/7/8,可能和手机常规升级换代一样,不会再有从GPT1到GPT4的数据量+训练量巨大飞跃了(GPT4.5已经试过了) 让GPT5做了一幅这几年的旗舰模型token定价曲线,发现有很多地方和PC/手机芯片的商业逻辑是非常相像的,这集我看了太多遍,其实能看出很多很有意思的结论 GPT4.5刚推出的时候$150/M,价格非常昂贵,官方称为“非常大而且计算成本高”(very large and compute-intensive model),是一次“超大且昂贵”的实验性base model 从token价格来推测,GPT4.5是GPT4的10倍规模,这可能是大力出奇迹路线和商业可行性冲突的一次探索,于是四月的时候openai就计划未来将GPT4.5下线了。从token价格推测GPT5可能只有5T参数,GPT4的3倍规模 所以chatGPT以后的升级,大概会是沿着大家能支付意愿的sweet spot(比如$80/M旗舰 + $15/M普通),分成几档价位,做出这个成本下最好用的模型,每隔一段时间比如12~24个月更新一代新产品(GPT5.5/GPT6) 在下一代新算力/数据/架构范式变革之前,Benchmark爆炸式上台阶的时代大概已经过去了 GPT5就是典型,营销层面上也在淡化数字游戏,每年的提升不再单纯的聚焦benchmark,而是更加全方位的提升:成本降低,幻觉减少,对用户刻意讨好改善,长上下文,一致性,多步思考推理机制等等,从单纯的base model升级变成了系统级升级,同时要考虑长线商业盈利 --------------- 类似的剧本在芯片界就见的太多了 PC/手机每年的旗舰机芯片阉割之后变成次旗舰和中低端芯片,比如intel i7芯片和i5/i3都是同样的设计同一批芯片,测试出来,性能最好的标为i7,性能差一些的就降频,关闭核心,变成i5和i3 每一次换代之后,旗舰芯片的价格保持基本不变,性价比最高的就是i5/i3,单核性能比上一代旗舰i7持平甚至更好,但是价格一半都不到 每一代旗舰i7的单核通过超频和堆料达到略高一点的分数,但是因为架构同属于同一代,单核跑分和次旗舰比提升非常小 ----- 至于大模型,旗舰模型(比如GPT-5 pro)的定价基本上就在$80/百万token附近,这代表了当前模型的最高水平 每一次换代之后,性价比最高的就是次旗舰模型,性能会和上一代旗舰类似甚至更好,但是价格会便宜,甚至到只有不到20%,就比如GPT5的价格($10/M),但是性能比上一代(按一年来算)旗舰o1要好一些,盈利靠海量用户 以后每一代推出例行升级情况下,之前的o3/4.1/4.5/o1 pro/o4 mini high之类的命名就太复杂了,干脆把这些全部隐藏起来,由内部router去根据用户画像以及意图,去给出用最低成本让用户满意的模型 从此以后就和PC/手机一样,每一代跑分改善一些,全方位提升一些(幻觉减少,对用户逢迎改善,长上下文,一致性,多步思考推理),然后分几档价位去满足各类用户的需求,GPT6 pro, GPT6, GPT mini,每一代的次旗舰相当于前一代旗舰水平 以前讲究的是手机贬值的速度,以后就是模型的贬值速度 从商业逻辑来看,模型公司和fabless芯片公司的成本花销的模式也非常相像: 每一代大模型一次性的训练费用就像是芯片的开发(数亿美元)和tapeout费用成本(上亿$),而推理token费用是边际分发成本,就像是每一个芯片的成本 从2015年的六七十美元一片手机旗舰芯片(连定价都如此相似$70/M),随着台积电涨价和通胀,到了2025年的200~250刀一枚旗舰芯片 AI的技术浪潮不像是互联网,靠生态本身的繁荣和更多链接就能创造更多价值,AI的破坏性革命几乎是完全建立在模型的能力大小之上的,由此带来的范式转移影响也是建立在模型能力上的 从这一点来看,我们可能更像是在2010~2012年的移动互联网时代:手机经历了前面三四年的飞跃性成长,来到了一个稳定发展期,每一代的硬件进步仍然非常可观:十四年前的手机芯片开始趋于稳定迭代,那时还不到1B晶体管数量(28nm节点),十四年之后的今天,手机芯片已经接近了30B晶体管数量(3nm节点) 这十四年还包括了摩尔定律放缓的2012年到2019年整整七年,在功耗墙被手机卡死的情况下,仍然规模增长了30倍 大模型的进步也一样,每一代的进步可能会让人失望(比如GPT5的平淡相比GPT4问世时候的炸裂程度),但是到十年后回看,仍然是非常不可思议的进步 即便是每一代提升让人失望,这也仍然是指数发展的奇迹