#模型即产品

3个月前
最近,AI 圈子里有两个事值得关注:一个是 GPT-4o 推出了新的画图模型,另一个是豆包升级了“边搜边想”功能。这两个例子都指向了一个正在越来越被人接受和认同的 AI 新范式——“模型即产品”。它听起来有点抽象,但其实可能会影响未来 AI 产品的发展形态。那么“模型即产品”到底是什么意思,它跟传统的AI方式有什么不同,为什么它这么厉害但为什么又不够普及? 什么是“模型即产品”? 简单来说,“模型即产品”就是把AI模型本身当作产品,它的核心价值来自于模型的智能和能力,而不是靠一大堆复杂的软件或界面来包装。 比如说,GPT-4o的新画图模型,你只需要上缠图片写六个字:“吉卜力风格化”,它就能直接生成一张高度还原又可爱的吉卜力动画风格图片;或者你可以基于刚生成的吉卜力漫画形象再去生成个表情包,甚至还能生成一幅四格漫画。不需要你会用Photoshop,也不用切换好几个App,一个模型就搞定了一切。 想想以前画图的流程:你得先找素材、调颜色、画线条,还得用别的工具加文字,步骤多得让人头晕。而现在,GPT-4o的画图模型把这些都“学会”了,直接给你成品。 这就是“模型即产品”的魅力——模型可以直接满足各种场景下的不同情况,而不需要你去设计复杂的工作流或者在不同的 App 之间切换。 它和传统的工作流智能体有什么区别?各自有什么优缺点? 传统的AI应用大多是“工作流智能体”模式。啥意思呢?就是通过预先设计好固定的流程,把AI模型和其他工具串起来,按部就班地完成任务。比如前一段时间很火的 Manus,如果你让它“帮我规划一下北京到山西自驾游的详细行程”,那么它会设计一个类似于 TODO List 的工作流: - 搜索北京到山西之间的景点信息 - 搜索北京到山西自驾游的攻略 - 生成详细行程 这样的工作流优点就是容易执行,按部就班就能出来结果,缺点就是不够灵活,因为 TODO List / 工作流一旦定了,就不好根据返回的结果做调整。如果搜索结果中出现了最近北京到山西之间某一段高速施工的新闻资讯,或者未来会出现极端天气的新闻资讯,那么就需要增加对绕开高速路段的搜索和天气预报的搜索,最终综合调整行程。 豆包最近测试上线的「边搜边想」功能是另一个很好的例子。不同于传统AI的“先搜后想”——模型根据你的问题,一股脑搜索一遍网络资料,然后拿着这一份固定的信息来作答,豆包会在思考过程中进行多轮搜索。也就是说,模型边回答边判断:“我是不是还缺某方面的信息?” 如果是,它会主动再搜索。如此循环,直到把问题各个方面都弄清楚为止。 就像前面行程规划的例子,“边搜边想”先搜出基本景点和交通方案,再根据这些结果想到“还需要看看最新的天气预报和当地交通情况”,于是进行第二轮搜索获取这些动态信息,最后综合各方面数据,甚至连景点之间的小交通都考虑进去,给出一个周全的行程表。 这就像一个聪明的助手,会根据手头的信息动态调整策略,而不是死板地走完预定路线。 为什么“模型即产品”很难? 既然“模型即产品”的模式这么强大,为什么不都采用这种模式呢?因为将模型训练成一个适应不同场景的通用产品,简单易用太难了: - 研发门槛高:需要有很强大的基座模型;需要有优质数据;需要专门的强化训练。 - 资源烧钱:训练模型得用超级多的计算资源,像GPU集群,小公司根本玩不起。 - 市场风险大:投入大、周期长,投资者往往更爱快见效的应用,而不是这种“慢工出细活”的项目。 - 用户体验挑战:模型再牛,也得有个好用的界面。像 GPT-4o 在聊天框就可以画图,像豆包只要选中“深度思考”就可以自动“边搜边想”。 简单科普:强化学习 说到这,有必要提一提“模型即产品”背后的核心技术——强化学习(Reinforcement Learning, RL)。简单说,就是让AI自己试错,像训练马戏团的动物一样,给它奖励和反馈,让它慢慢学会做事。 举个经典例子:AlphaGo,那个打败人类围棋冠军的AI。它没靠人类教招式,而是通过强化学习,自己跟自己下棋。赢了有奖励,输了调整策略,玩了几百万局后,它不仅学会了围棋,还发现了人类几千年没想到的招数。这就是强化学习的厉害之处——让AI自己摸索出最佳方案。 比如豆包的“边搜边想”也是通过强化训练,通过模拟的搜索数据库,以及搜索训练集,让模型一遍遍的去对给定的问题去尝试不同的关键词和思考后再搜索,一次又一次地尝试后终于偶然找到了答案,得到奖励。然后,模型再尝试理解并总结出那些能提高下次找到相似答案可能性的规律。 这种自主学习能力,是“模型即产品”能取代复杂工作流的关键。 未来展望 尽管挑战不小,但可以看到“模型即产品”已经成为AI发展的重大趋势。展望未来,我们可以期待“模型即产品”带来更多惊喜。也许再过不久,你与AI的互动将不仅局限于问答,而更像是与一个能够替你执行复杂操作的数字伙伴合作。届时,我们的许多应用场景可能被重新定义:很多以前要在人和工具之间反复切换的事情,现在一个AI模型就能包办。从创作灵感的火花,到繁琐资料的整理,再到决策方案的拿出,AI模型将直接为你提供端到端的支持。 真正聪明的AI,不是你告诉它怎么做,而是它自己知道该怎么做。
3个月前
模型即产品(The Model is the Product) 作者:Alexander Doria 过去几年,人们一直在讨论下一个AI发展周期可能是什么:智能体(Agents)?推理系统(Reasoners)?还是彻底的多模态? 现在是时候下结论了:下一个周期,就是“模型本身即产品”。 目前,无论是科研界还是产业界的变化,都在推动这种转型: • 通用模型扩展遇到了瓶颈。OpenAI发布GPT-4.5时透露了一个重要信息:模型能力呈现线性增长,但算力成本却指数级飙升。尽管过去两年训练效率不断提高,但成本太高,以至于OpenAI无法以合理的价格广泛部署最新的大模型。 • 特定任务的强化训练效果远超预期。结合强化学习与推理能力训练,模型开始真正地“学习任务”,出现了一种新东西:既非传统机器学习,也不是基础模型,而是一种神秘的第三种类型。小模型突然展现出极强的数学能力;代码模型不仅会写代码,甚至能自己管理整个代码库;Claude甚至能在信息极少的情况下玩宝可梦游戏,并且做得很好。 • 推理成本大幅下降。以DeepSeek为例,新的优化技术已经让全球所有现有GPU的总算力,足以每天给地球上的每个人提供1万个顶级模型生成的token。这意味着,单纯卖token(模型调用次数)的经济模式已经难以持续,模型提供商不得不去做更高附加值的事情。 这种趋势让许多人感到不舒服。投资者们原本押注在应用层,但下一个阶段,最可能被AI取代的恰恰就是应用层。 下一代模型的形态 过去几周,我们看到了新一代“模型即产品”的典型案例,比如OpenAI的DeepResearch和Anthropic的Claude Sonnet 3.7。 许多人误解了DeepResearch,尤其市面上出现了大量山寨版本,让情况更加混乱。事实上,OpenAI并不是简单地在GPT基础上增加了外部搜索功能。他们训练了一个全新的模型,能够完全在内部完成搜索任务: 模型学习了基础的浏览能力(搜索、点击、滚动、文件解析),以及如何通过强化学习来整合大量网页信息,生成结构清晰、来源可靠的研究报告。 因此,DeepResearch并不是普通的聊天模型,而是一种专门设计用于搜索和研究的新型语言模型。相比之下,谷歌的Gemini和Perplexity的类似功能,只是在普通模型基础上的表面优化: Gemini和Perplexity也提供了所谓“深度研究”功能,但他们并未公开任何优化模型方法或实质性评估,这表明他们并未进行深入训练。 Anthropic也在明确他们的发展方向。他们在去年底给出了智能体(Agent)明确的定义:真正的智能体必须能够自主决定任务的具体实现过程和工具使用,而非被人为设计好的工作流程所限制。 目前市面上许多号称“智能体”的公司,实际上只是在设计自动化工作流程(workflows),即人为定义好的代码路径串联模型和工具。虽然这种工作流程也有一定价值,但未来真正有效的智能体一定会通过重新训练模型本身来实现。 举个具体例子:最近发布的Claude 3.7模型,专门针对复杂的代码开发任务进行强化训练,这让所有与代码相关的应用都出现了性能显著提升。 我所在的Pleias团队也做了类似尝试:我们设计了两个专门的模型,一个用于数据准备,一个专门用于搜索和报告生成,通过设计全新的合成数据和奖励机制进行训练,让部署阶段更简单,最终使得复杂性在训练阶段就被解决。 具体表现为将这种复杂结构:图1 转变为如下更简洁的模式:图2 要么自己训练,要么被别人训练。 可以明确的是,各大实验室都在向这个方向前进:他们会逐步停止开放API,转向自己训练并直接提供完整模型服务。著名AI公司Databricks的投资人Naveen Rao很清晰地指出: 在未来2-3年内,所有闭源AI提供商将停止提供API服务,只有开源模型才会继续提供API。闭源公司会建立更加独特、非商品化的能力。 近期的迹象也佐证了这个趋势: • OpenAI发布的DeepSearch只用于高级订阅用户,根本没有提供API服务。 • Claude Code的模型训练针对代码应用场景优化后,反而导致Cursor这样的第三方工具使用效果不佳。 • 一些曾经的“套壳公司”(wrapper公司,比如Cursor、WindSurf、Perplexity)也开始秘密训练自己的小型模型,以增强自己的竞争力。 小公司可能不会马上感受到这种冲击,但他们会越来越依赖独立的推理服务提供商。现在的竞争格局就像免费为大公司做市场调研和数据生成,最终结果可能是被训练公司吞并。 强化学习的价值被严重低估。 目前所有AI投资都存在同质化现象,投资机构普遍认为: • 真正的价值只存在于与模型无关的应用层; • 所有形式的训练,包括强化学习,都没有投资价值。 但现实情况是,强化学习(RL)的进步已经彻底改变了这种情况。现在的市场情况更像是风险投资出现了集体错误定价,忽视了强化学习最新的技术突破带来的巨大价值。 实际上,真正的新机会反而是那些专注于模型训练的公司,但他们却很难拿到融资。Prime Intellect公司虽然训练出了第一个去中心化的大模型,但融资规模甚至不如一般的应用层公司。 OpenAI最近也开始表达对这一现象的不满,希望硅谷创业公司多关注“垂直领域强化学习”,未来YC孵化器可能会做出调整:模型实验室不再只是向客户开放API,而是会和参与模型早期训练阶段的公司形成深度合作。 技术的爆炸,而非应用的爆炸。 相较之下,中国 DeepSeek 创始人梁文峰则更加直接地指出了这一点: 当前的AI发展,是一场技术创新的爆炸,而非应用创新的爆炸……如果上下游生态体系还不完整,直接去押注应用并没有意义。 很多西方公司甚至还没有意识到这场技术战争已经结束了,他们还在用上一次战争的思维去打下一次战争,已经远远落后。 以上,就是目前AI发展的大势所趋: 模型本身已经成为产品本身,谁掌握模型训练,谁就掌握未来。