阑夕
7个月前
昨天参加新浪科技组织的连麦聊了两个小时的Manus,我表达的核心观点基本都在这张图上了。 一定要再补充几点的话,那就是: - 不要低估降低使用门槛这件事情的价值,万丈高楼才刚盖第一层呢,就开始搞鄙视链了; - 书上有条评论说Manus不就是套壳吗,得到的回答也很简洁——恭喜你,发现了Agent的原理; - 也别看不起套壳,Perplexity的估值/年化倍数现在是OpenAI的4倍,对产品体验缺少敬畏的终点,只会是愤世嫉俗; - Manus的风评起落,和发码太少关系很大,但这不好解决,除了资源不够之外,还在于遏制失败率; - Sora跳票大半年也是同样的原因,最后合作导演都受不了OpenAI的控制欲,你不能只允许抽卡成功的作品才有资格被发出来; - jinyu的就很有代表性,在具体的失败案例上,他能准确作出归因,判断到底是自己的问题还是Agent的问题,但普通用户的挫败感会更强,直接给出不行的判决; - 在小范围内先做冷启动的策略没问题,但情绪管理是个麻烦,很难在过誉和损毁之间找到中位值; - 非刚性需求会因供给不足而快速消退,这会让Manus很快回归到预期范围内,同时坐实预言的自我实现——我就说它炒作失败凉透了吧; - 哪怕觉得Manus没什么了不起,也是有意义的正向激励,既然连这样的产品都能火,其他从业者应该更有信心了,人人都行人人上; - 任何时候都厌恶独尊儒术的主张,好产品从来不嫌多,能交货,就能有话筒,这挺好的。
阑夕
7个月前
Googl开始试探AI Mode——搜索结果完全没有10个蓝色超链接了,取而代之的是在对话里聚合答案——不算意外,意外的是目前Google是在把AI Mode当作增值功能专供给One AI Premium用户使用,这是一个20美金/月的订阅包。 我会条件反射的想到Neeva,2019年上线,2023年关闭,产品卖点是赌用户会为没有广告的搜索服务掏钱,预期值是6美金/月。 Neeva的创始人2003年入职Google,负责开发了核心广告产品Adwords,离职前已经升到了SVP,在Google声誉由盛转衰的节点出来做了订阅式搜索Neeva,赌的就是大家对于Google及其商业化的厌恶,会给主打质加比的平替服务提供机会。 Neeva也想剜掉一次输入换取10个蓝色超链接的体验,在前AI时代就尝试了很多信息重组的方法,甚至会堆人力去编辑热门关键词的反馈页面,但流量一直没有迎来波峰,最后是以融资估值的对价卖掉了。 创始人写了文章解释这次创业的种种痛苦,说很多人会以为花钱才能搜索的商业模式是失败原因,其实不然,说服用户为更好的体验付费一点都不难,转化率非常健康,问题主要出在没办法说服用户切换新的搜索引擎。 换句话说,Neeva不担心用户留存,但解决不了用户增长,俞军的著名公式——产品价值=(新体验-旧体验)-迁移成本——含金量还在发光,即便是从大厂出来、且深知大厂缺陷的人,也会低估用户对于熟悉环境的依赖性。 现在Google自己要来摘桃子了,我不怀疑AI Mode的测试数据只要够好,未来一定也能找到和广告融合的方法,并被推向大众市场,但就眼前的情况而言,Google是在亲自做一件所有号称Google杀手都想做的事情: 用户交一点钱,换取一个无广告、更简洁的搜索服务。 就很黑色幽默。
阑夕
8个月前
阑夕
8个月前
阑夕
8个月前
阑夕
8个月前
DeepSeek-R2真的要来了,这次不是KFCVWO50! 来自路透社的独家报道: - DeepSeek原计划在5月初发布新一代R2模型,但已经开始考虑提前发布,这段时间Grok 3、Claude 3.7、Qwen 2.5-Max等竞品接连推出,还是有影响的; - 梁文锋在距离清华、北大两所高校步行可达的地段设立了北京办公室,非常乐于和实习生以及应届生一起工作和讨论问题,而且从不鼓励加班; - 采访中一名已经离职的研究员依然对前老板赞不绝口,「他把我们视为专家,不断提问,一起学习,而且愿意下放管理权,普通员工也能参与核心技术,这很让人兴奋」; - 梁文锋在幻方量化时就以薪酬慷慨著称,他会给数据科学家开出150万的年薪,而同行给的数字一般不会超过80万; - 在创办DeepSeek前,幻方量化就制定了把70%对可支配收入投入到AI研究上的战略,从2020年到2021年,幻方量化花了12亿买卡训练模型; - 这样的异常支出让幻方量化受到了证券监管部门的注意,但最终没有做出干预,这对后来DeepSeek的问世至关重要,因为2022年开始,中国企业就不太能够合规买到A100了; - DeepSeek-R1爆火之后,梁文锋被建议不要和媒体接触,因为担心过度炒作会引起不必要的争议,尤其是在地缘政治的风口浪尖,苟住再说; - 另有前员工表示,DeepSeek不缺算力,能够进行大规模训练,但梁文锋对更具经济成本的模型架构非常关注,这决定了DeepSeek的发展路线以及后来的巨大成功; - 全球的AI大厂至今都还在消化DeepSeek-R1造成的影响,也都盯着R2的时间表,它的发布会是今年AI行业的又一个关键时刻。
阑夕
8个月前
看完阿里这次财报的会议记录,感觉最大的功臣是IR(投资者关系)这条线,把吴妈的意志贯彻得非常成功,肉眼可见的把阿里作为被抖拼追赶威胁的电商公司定位,改换成了中国互联网最信仰AI叙事的一家剧透,我愿称之为胡迪尼式的以旧换新。 最直接的证据就是电话会议上投行提了6个问题,其中5个都是在问AI业务的进展,已经不怎么关心电商了,突出一个对资本市场的预期管理太成功了。 因为财报整体算是超预期,参会管理层的表态都很激进,而且抖了一些目测不会出现在通稿里的具体数字和主观判断,我提部分重点你们看看: - AI是时隔几十年才会出现一次的机会,阿里的战略要为终局服务,也就是80%的人类劳动被替代,同时全球GDP里约有50%是工资,这会是天翻地覆的产业重组,要为这一天的到来做准备; - 认为未来95%的大模型Tokens会在云上传输,本地只会占到5%,所以会更加坚定的在云计算这项基础设施上投钱,接下来3年会花掉过去10年花掉的钱之和; - 阿里云在底层设计上心思缜密,从一开始就考虑到要兼容各种不同的芯片,用以应对不可抗的政策变化(比如禁售),投资者不要担心我们的钱花不出去;[doge] - AI是电力,各家提供的商品差异开始变小,而盈利的位置转移到了电网上,阿里云就相当于电网,负责托管市面上的主流模型并输送到千家万户; - 阿里自己也有强大的产品线去落地Qwen系列,点了三个产品的名字,夸克、钉钉、高德,夸克是中国2C市场用户最多的AI应用,钉钉是2B市场最核心的当家资产; - 从今年春节开始,推理需求开始爆发(没明说但很显然是DeepSeek带动的),新增的调用需求里60%-70%都是推理,但强调了中国市场的竞争烈度,表示不能用国际市场的利润率来要求中国市场; - Qwen开源但不免费,能够产生API收入,但很微薄,也别指望它能大赚特赚,Qwen是一个口碑很好的钩子,在客户使用Qwen期间,会产生很多交叉销售的机会,有助于把其他云产品卖出去; - 基础模型的能力虽然趋同,但后训练市场很大,不同的行业、公司都有需求让选中的模型去适应它们的私有数据集,而这些工程都会跑在云上,所以云,云,云,重要的事值得说三遍。
阑夕
8个月前
抖音还有一个数据化的信号比较重要:店播(商家自播)的GMV贡献已经超过了达播(达人带货),而且这是有意干预分配的主动结果。 只能说头部主播的「塌房」是有影响的,至少平台已经过了依赖标杆灌输直播电商这个心智的阶段,而且达播有一个绕不过去的根本矛盾,那就是只要坑位费和佣金的商业模式存在,这个直播间里的价格就不可能到底,相比之下,拼多多作为竞对就完全可以标榜挖掉了这块中间成本,理解起来也很容易。 所以大概也可以直截了当的说,头部主播已经走过了他们最好的光华岁月,平台力捧,簇拥者众,管制有限,虽然时间也不算长,但说到集中化的造富运动,有过之而无不及。 往后就不一样了,百万粉丝以上的带货主播,给抖音电商的大盘贡献差不多只有9%左右了,未来只会低不能高,最后回归人货场的商业逻辑,推销员当然还可以有,但不再会是成交与否的决定性因素。 店播倒是一直扶不上墙的那一方,商家搞流量的网感和套路显然比不上原本就在网络上摸爬滚打的网红,这些年来有点学费终于交完的意思,做得好的店铺多少都有模仿到了个人主播的精髓,知道卖货的前提是要造人设、想脚本、出爆品,你帮平台解决内容供给的问题了,平台也就愿意帮你解决交易转化的问题。 从抖音电商GMV的构成来看,货架/店播/达播三大场域的占比成了4:3:3,连直播带货这顶帽子,抖音都不想戴得过于牢固了,原因也很简单,直播电商的天花板有点低了,即便拿走牌桌上全部的钱,也追不上货架电商,过去少走了多少弯路,现在都要重新补回来,短期盯阿里、长期打拼多多的局势不会变。
阑夕
8个月前
说个有点吓人的,阿里的股价一个月内已经涨了快50%,曲线相当好看。 考虑到财报还没发,很难说这是来自具体业务的驱动,更像是重新捡回了想象空间——BTW,中概股最近势头都不错——众所周知,美股估值体系的核心指标,实际上是对未来预期的兑现。 芒格离世前半开玩笑的说阿里就是一家零售商,然后这几年来,阿里都在洗刷这句评价,现在来看,好像还真给它做到了。 资本市场看涨阿里的原因不难找到,DeepSeek火了之后,二级市场不太能找到对标,手握另一个t0级开源模型千问 Qwen的阿里成了FOMO的买入目标,加上苹果选择和阿里合作开发大模型以落户中国市场的消息出来,精确适时的补全了前段叙事,一切就都顺理成章了。 但这也不重要,重要的是,「阿里回来了」这个信号从开始构建到成为事实,中间走的每一步都很需要勇气。 如果我没记错,吴泳铭是在2023年的云栖大会上正式提出「云+AI」的长期战略,因为这两项看起来和核心电商业务没有直接关系,所以阿里的承压状态也维持了将近2年时间,现在终于到了释放出利好价值的环节。 或者说,这2年来,阿里证明了自己并没有选择避战,而是恰好相反,它要进入更硬核的行业,拉开战线。 2015年,亚马逊决定把AWS的业绩披露出来汇报——在那之前,AWS的收入被亚马逊藏在财报的「其他」分类里长达8年时间——完全有理由相信,如果不是因为要满足SEC的规定,亚马逊搞不好还会继续遮掩AWS的体量,用以迷惑竞争对手。 Ben Thompson当时写了一篇文章,称这是那一年最大的一次IPO,亚马逊的单日市值涨了256亿美金,这就是资本市场「惊觉」AWS的存在后给亚马逊未来升值空间的24小时估值。 做了再说和说了再做的结果虽然可能趋于一致,但过程差别会有很大,在AWS奠定亚马逊是一家科技公司而非网上书店之前,贝佐斯年年都被质疑不懂赚钱,而阿里在新的领导班子提出「云+AI」的发展方向之后,每一天都活在能不能把吹过的牛逼给实现了的观望中。 我刚看了HuggingFace的年度榜单,2024年,全球排名前10的开源模型,有10个,对,你没看错,10个里面有10个,全部都是阿里Qwen的衍生模型,同时Qwen占到了全球开源模型下载量的1/4,在事实意义上,阿里就是AI开源路线的扛把子。 之前DeepSeek-R1为开源社区贡献了6个蒸馏模型,其中4个模型都来自Qwen,原因也很简单,能打且足够开放的模型没太多可选的,Qwen是最普遍的,LLaMa的协议甚至禁止被这么干。 有了AI的兜底,再去带动云的增长,就是常规操作了,阿里云的市场份额本来就是亚太地区的断档第一,于是这么一看,「云+AI」的华丽转身,竟然真的被阿里给办成了。 之所以这么感叹几句,是因为可以预见得到,接下来会有一大波把结果当原因的声音出来,比如认为马老师的几次现身及其意义是让阿里起飞的推动因素,这么理解起来当然没问题,但基本面永远是最应该关注的地方。 天只救自救者。
阑夕
8个月前
百度,出局! 根据The Information的独家报道,苹果已经提交了与阿里巴巴合作开发大模型的申请,正在等待批准。 前情提要是: - 苹果iPhone 16这一代产品内置的AI能力,是和第三方大模型厂商共同定制的,在海外市场选的是ChatGPT作为合作商; - 中国的监管政策需要对大模型进行备案,符合条件的基本只有国内公司,苹果本来选的是百度的文心一言,但一年时间的磨合下来,发现文心一言实在是扶不上墙; - 苹果需要的AI供应商并不只是提供现有服务就够了,需要能够基于不同用户在iOS内的数据进行个性化回应,百度这边的对接团队一直没有达到要求; 最新的进展是: - 苹果似乎终于耗尽了它的耐心,眼看着iPhone的市场份额持续下滑,开始加速推进替代方案,腾讯、阿里、字节都在意向名单里; - DeepSeek也是苹果的接触对象之一,但是就像上面提到过的,苹果需要一个完整的团队来做定制化开发,但DeepSeek既缺人也缺经验干这件事情; - 最终入围苹果招标的公司是阿里巴巴,大概率会把自家的扛鼎模型Qwen交给苹果适配,阿里巴巴已经提前训练了一个专有数据集,用来实现苹果想要的效果; - 百度有没有完全出局尚不确定,也存在苹果不愿损失沉没成本而将文心一言作为内置模型选项之一的可能性,让用户自主选择; 我的评价是: - 哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈; - 前几天有媒体采访我,问如何评价百度在文心一言App里接入了DeepSeek的模型,我说这意味着这家公司连最基本的尊严都放弃了; - 李厂长李厂长,你能再表演一次那个吗,就是那个,开源模型会越来越落后的经典发言; - Qwen是个很好的模型,在开源社区的刷分成绩也相当优秀,但产品太落后了,我自己其实长期在用好几款通义系产品解决需求,但从来不推荐的原因就是因为产品做得太烂,不想坑人⋯⋯😅
阑夕
8个月前
DeepSeek火出圈的这十几天,其实也是噪音最多的一段时间,说实话大部分的讨论成品都有种加班硬赶KPI的味道,是人是鬼都在掰扯,有留存价值的屈指可数,倒是有两期播客让我听后受益匪浅,非常推荐。 一个是张小珺请来加州伯克利大学AI实验室博士潘家怡对DeepSeek论文的逐句讲解,接近3个小时的高密度输出,非常能杀脑细胞,但杀完之后分泌出来的内啡肽,也含量爆炸。 另一个是Ben Thompson关于DeepSeek的3集播客合集,加起来1个多小时,这哥们是News Letter的开创者,也是全球最懂技术的分析师之一,常年旅居台北,对中国/亚洲的近距离洞察比美国同行要高很多。 先说张小珺的那期,嘉宾潘家怡当时是在读完DeepSeek的论文之后,最快开发出了小规模复现R1-Zero模型的项目,在GitHub上已经接近1万Stars。 这种薪火相传式的知识接力,其实是技术领域理想主义的投射,就像月之暗面的研究员Flood Sung也说,Kimi的推理模型k1.5最初就是基于OpenAI放出来的两个视频得到了启发,更早一点,当Google发布「Attention Is All You Need」之后,OpenAI立刻就意识到了Transformer的未来,智慧的流动性才是一切进步的先决条件。 所以大家才对Anthropic创始人Dario Amodei那番「科学没有国界,但科学家有祖国」的封锁表态大为失望,他在否定竞争的同时,也在挑战基本常识。 继续回到播客内容上,我还是试着划些重点出来给你们看,推荐有时间的还是听完原版:(1/n)
阑夕
8个月前
阑夕
9个月前
一年前,也是在春节期间,OpenAI突然发布了断档领先的视频大模型Sora,给国产AI厂商添了大堵,被调侃为都过不好年了。 一年后的这次临近春节,轮到中国AI厂商给美国竞对们上眼药了,Qwen、DeepSeek、Kimi、Doubao连着发大招,你方唱罢我登场,实在热闹。 因为别人太强而过不好年,和因为自个忙起来根本就没想过好年,是完全不同的两码事。 字节跳动新发布的豆包1.5 Pro,除了在基准测试里表现抢眼之外,还特意强调了两个点: - 基于豆包产品的大规模用户反馈,实现了以用户数据飞轮持续提升模型能力的优化系统; - 模型训练过程中,未使用任何其他模型生成的数据,坚持不走捷径,确保数据来源的独立性和可靠性。 这两个点,很容易联想到最近的两件事:前一个是MiniMax的创始人在接受采访时提出的反共识,认为用户越多并不能推动模型越强;后一个则是中科院、北大等六家机构发了篇学术论文,用两种方法验证了Claude、Gemini和豆包没有蒸馏其他模型,DeepSeeek的蒸馏程度则比较高。 豆包的意思是,用户数据飞轮对大模型仍然有价值,推翻了它,就意味着否认用户市场和技术发展之间的关系,大家也都没必要追求MAU/DAU了,以及用先进模型去教出一个学生模型出来,并不能让学生真正变得比老师更加聪明。 Sam Altman早些时候也发过一条意有所指的隐晦推文:「复制你知道行得通的东西是(相对)容易的。当你不知道它是否行得通时,做一些新的、有风险的、困难的事情是非常困难的。」 严格来说,豆包的表态更像是在输出一种自我要求的标准,而没有太多的diss成分,中国需要DeepSeek这样的公司用最快速和低成本的方法推动AI技术开放,也需要字节这样的大厂用更重的投入、走更难的路去挑战更高目标。 这种并无计划的错位搭配,正是国产科技行业擅长的饱和式路线,资源受限的公司,可以拿出性价比最优的方案,突出一个物超所值,资源充裕的公司,也确实有资格不抄近道,做好和模型预研、实验、训练共同生长的数据基建。 豆包这次的亮点在于,即使没有采用能快速复制海外先进模型能力的蒸馏方法,而是老老实实的自建庞大的人工标注团队和数据生产体系,依然能把模型效果做到GPT-4o的水平,也充分发挥了中国团队的工程优化能力来降低推理成本,而且无论是DeepSeek还是豆包在谈及定价策略时,都曾很是无辜的表示并没有挑起价格战的意图,自己是有利润的,成本结构完全可以实现。 与此同时,Musk和Altman还在为「星际之门」项目到底有没有5000亿美金能够到账而吵个不休⋯⋯ 当然OpenAI依然值得尊重,只是在行业整体都在大幅前进的情况下,有多少是站在巨人的肩膀上,又有多少正在成为新的巨人,这是很有讨论价值的,也是在开启一个波澜壮阔的硅基时代前,不可缺少的仪式性帷幕。 科技公司通常会凸显研发支出占总收入的比重,视其为愿意在多大程度上投入核心竞争力的决心,以后倒可能会有一个类似的新指标出来,那就是对AI的支出占总支出的比重,这代表公司愿意在未来上押注多少现金流。 这是字节跳动最有力量的标志,从收入体量来看,它是全球级的互联网大厂,不但有着管够的弹药,而且可以自给自足,不必过于依赖外部输血,去年在AI设施上花的钱几乎相当于BAT之和,在投入和产出两个方面都成了国内断崖领先的榜一。 另一方面,豆包的发展也带有很强的商业逻辑,无论是它对大模型调用经济性的重视,还是带着火山剪映等兄弟业务协同发展,甚至包括衔接上下游产业链去做更多样化的的产品,都相当务实。 有的时候也会感慨,这种务实在需要喊口号时,也很难一下子变得浪漫化,尤其是在英文圈里言必称AGI、各种科幻梗层出不穷的背景下,再去看字节跳动为AGI团队Seed Edge设立的五大目标,只能说真的很理工化,没有半分虚的: - 探索推理能力的边界,用更先进的推理带动智能的提升; - 探索感知能力的边界,不止是语言模型,还要建立世界模型; - 探索软硬一体的下一代模型设计,用模型的需求反过来为硬件设计指路; - 探索下一代学习范式,既要挑战现在的共识,还得提出新的改进空间; - 探索下一个Scaling方向,推动智能边界的进步。 就,很具体明晰,很就事论事,有没有?根本不存在那种金句或者机锋,每一个字每一句话都是在精确的传达给字节跳动想要招揽的科学家和工程师,唯一画的大饼,就是承诺Seed Edge将会独立制定考核方式,充分提供前沿研究的工作环境。 也只有字节跳动来做这样的事情,是最合适的了。 张一鸣早年发过一条微博,说在遇到技术问题时,公司花了两天时间集中排查,终于得到解决,而这个过程让他感到愉悦: 「想起稻盛和夫说的:用尽全力,异常认真,神明就会来相助。其实神明未必相助,但是你会更接近问题的本质,从而解决问题。」 我想说的是,从今日头条,到抖音,再到豆包,其实都是这个过程的复现。
阑夕
9个月前