RamenPanda
3个月前
大白话讲解谷歌TPU VS GPU #### 1. TPU 诞生的真正原因(2013-2015) - Google 谷歌发现:如果每个安卓用户每天用语音搜索 3 分钟,现有 CPU/GPU 算力要让全球数据中心翻倍。 - 结论:必须自研 ASIC 专门跑矩阵运算(神经网络推理),否则 AI 成功会把自己“撑死”。 - 从立项到量产仅 15 个月,2015 年就已经在 Google 搜索、地图、照片、翻译背后悄悄运行。 #### 2. TPU vs GPU 的本质区别 - GPU:通用并行处理器,背着“图形渲染”历史包袱(缓存、分支预测、复杂调度等)。 - TPU:极简“领域专用架构”(Domain-Specific Architecture) - 核心是 **Systolic Array(脉动阵列)**:权重只加载一次,数据像血液一样单向流动,几乎不回写内存,彻底解决冯诺依曼瓶颈。 - 最新一代 TPU v7(Ironwood,2025 年 4 月发布)单芯片规格: - 4,614 TFLOPS(BF16) - 192GB HBM(与 Blackwell B200 相同) - 内存带宽 7,370 GB/s - 性能/功耗比比上代 v6e(Trillium)提升 100% #### 3. 真实性能对比 - 推理场景下,TPU 性价比普遍比 Nvidia GPU 高 30%-100%(看具体工作负载) - 典型说法: - “同样的钱,8 张 H100 的活,1 个 TPU v5e Pod 就能干” - “TPU v6 比 Hopper GPU 省电 60-65%” - “老一代 TPU 降价极狠,新一代出来后上一代几乎白送” - 即使 Jensen Huang 也承认:ASIC 里只有 Google TPU 是“special case”。 #### 4. TPU 普及的最大障碍 - 生态锁死:程序员大学学的是 CUDA + PyTorch,TPU 用 JAX/TensorFlow(虽已支持 PyTorch,但库仍不完善) - 只能在 Google Cloud 用(AWS/Azure 都没有),数据迁移成本(egress fee)极高,企业不敢 All-in - 目前主要赢在推理,训练虽强但 CUDA 生态仍占优势 #### 5. 对 Google Cloud 的战略意义 - AI 时代云服务毛利率从 50-70% 暴跌到 20-35%,因为大家都在给 Nvidia 打工(Nvidia 毛利 75%)。 - 谁能用自研 ASIC 摆脱 Nvidia,谁就能重回 50%+ 毛利。 - 三大云厂商自研 ASIC 进度:**Google TPU >> AWS Trainium > Azure MAIA** - Google 已把 TPU 设计前段(RTL)全部握在自己手里,Broadcom 只做后端物理实现,Broadcom 毛利率被压到 50% 左右。 - 内部:Google 搜索、Gemini、Veo 等全部用 TPU 推理;对外 GCP 客户要 Nvidia 才给 Nvidia。 - **TPU 是 GCP 在 AI 时代翻盘、抢回云市场份额的最大王牌**。 - Google 正疯狂扩产 TPU v7(Ironwood) - 外部客户 2025 年底才开始大规模拿到 - 业内预计 2026 年 Google TPU 出货量将出现爆发式增长(与你之前那张 UBS 报告提到的“Google TPU v7p 明显放量”完全吻合) **总结:** Google TPU 是目前唯一真正能和 Nvidia 掰手腕的自研 AI 芯片,尤其在推理时代具备压倒性性价比优势,未来 5-10 年将是 Google Cloud 最大护城河,也是台积电 CoWoS 封装需求暴涨的最重要驱动力之一。
RamenPanda
3个月前
美股买AI,我只会买软件和芯片,不碰所谓的机器人相关,是因为搞机器人真的没美国什么事。全球人形机器人的最激烈竞争只发生在中国的几个城市之间。说一些事实 全球参与人形机器人制造的100家上市公司中,中国占比56% 中国有全球45%的机器人集成商,这些企业专注于根据用户需求定制机器人 中国在全球人形机器人产业链中占比63%,产业集群:珠三角、长三角地区集聚超3000家机器人企业 中国人形机器人技术专利全球第一。优必选以763件有效专利数位列全球企业榜首 中国的专利覆盖本体结构、驱动控制、智能感知三个领域,形成全栈式技术垄断布局 人形机器人的核心技术指标,包括负载能力、运动控制和自由度、AI和感知技术,中国都是突破和性能指标领先全球的 优必选单台人形机器人成本比特斯拉Optimus低30%,宇树科技单台人形机器人成本比特斯拉Optimus低32% 2025年宇树G1售价9.9万元的首批订单迅速售罄,优必选Walker S1在比亚迪工厂实现效率翻倍,预计2025年第二季度规模化交付。而特斯拉Optimus量产仍处于初期阶段 机器人总体规模,中国连续12年稳居全球最大工业机器人市场,2024年新增工业机器人安装量占全球54%,保有量达200万台,占全球43% 最后,我引用高盛团队实地调查中国人形机器人后给出的研报: “高盛团队对中国多家领先的人形机器人企业进行了实地调研,发现中国在该领域已形成显著领先优势,尤其在数据积累上,中国企业累计训练数据超过1000万小时,远超硅谷同行的水平,这得益于中国庞大的应用场景和快速迭代能力。高盛调研覆盖了从核心零部件到整机制造的全产业链,观察到中国机器人已在工厂、仓储等领域实现小规模部署,成本控制和供应链优化更具竞争力;相比之下,硅谷企业在实际落地和数据闭环仍滞后。高盛认为,中国人形机器人产业正预计未来3-5年内将主导全球市场,并建议投资者关注相关供应链机会。”