#TPU

indigo
6小时前
Google 要干戴森环?今天 Google Research 团队发表了一篇关于 Project Suncatcher(太阳捕手)项目的研究论文「迈向未来太空高可扩展性 AI 基础设施系统设计」,评估了配备 TPU 的太阳能卫星和自由空间光链路,在太空中进行大规模机器学习计算的可行性☀️ 论文认为“Suncatcher 项目”是可行的,有四个关键条件: 1. 网络带宽可行性:通过“拉近距离”来实现 AI 集群所需的超高带宽(10 Tbps 级别)远超当前太空技术。通过让卫星编队在极近距离(数百公里或更短)飞行 ,使得接收功率大幅增强。这允许在太空中直接使用地球上成熟、高带宽的商用光通信硬件 (COTS DWDM),而无需发明新技术。 2. 轨道动力学可行性:利用“被动安全”编队 为解决近距离飞行的碰撞风险,论文设计了一种“自由落体”星座。在这个编队中,卫星依靠自然的轨道动力学来维持一个“呼吸式”的、可预测的相对位置。这种设计几乎不需要消耗燃料来维持编队(零 delta-v 需求),仅需少量燃料对抗扰动,使其在工程上可行。 3. 芯片生存可行性:商用 TPU 的“超预期”耐受性 项目的一个核心问题是地球数据中心的 AI 芯片(TPU)能否在太空辐射下工作。测试结果出人意料地乐观:Google Trillium TPU 对总电离剂量 (TID) 的耐受性几乎是 5 年任务最低要求的 3倍。对于单粒子效应 (SEEs),其导致的错误率对于 AI 推理任务“很可能是可接受的”,故障概率极低。 4. 经济可行性:发射成本即将与“地球电费”持平 该方案的经济临界点是发射成本降至 $200/KG。这一价格下,将 AI 硬件发射到太空的年均摊销成本(例如 Starlink v2 模型为 $810/kW/y) 将与地球数据中心支付的年均电费($570-$3,000/kW/y)大致相当。 基于 SpaceX 等公司的可复用火箭(如 Starship)发射成本的降幅,改成本预计在 2035 年左右可以实现。 --- Google 的母公司 Alphabet 是 SpaceX 的早期投资人,目前还持有 8% 左右的股份。未来十年,随着发射成本的大幅下降,近地轨道的空间经济也会快速发展,这里会涌现出非常多的创业公司和应用场景,我会持续帮大家关注,投资机会都在论文里😄 下图展示了轨道平面内一个示例性 81 颗卫星星座的完整轨道周期轨迹,其平均集群高度为 650 公里。集群半径 R=1 公里,在地球引力作用下,相邻卫星间的最近距离在约 100-200 米之间振荡🛰️
Huihoo灰狐
10个月前
Nvidia, GPU (Graphics Processing Unit) Google, TPU (Tensor Processing Unit) Groq, LPU (Language Processing Unit) Groq:Nvidia 的最新 AI 竞争对手 Groq 创新的核心是其 LPU,旨在以前所未有的速度加速 AI 模型,包括 ChatGPT 等语言模型 与使用高带宽内存 (high-bandwidth memory, HBM) 的 GPU 不同,Groq 的 LPU 利用 SRAM 进行数据处理,从而显著降低能耗并提高效率 GroqChip 的独特架构与其时间指令集相结合,可实现非常适合自然语言和其他顺序数据的顺序处理 Groq Language Processing Unit (LPU) 与最初为图形处理而设计的 GPU 完全不同,LPU 是为 AI 推理和语言而设计的 Groq 是 LPU 的创造者,它从头开始构建,以满足 AI 的独特特性和需求 LPU 以更快的速度运行大型语言模型 (LLM),在架构层面上,与 GPU 相比,其能源效率提高了 10 倍 Groq 使用 Haskell 的其中一个目的是为新芯片 LPU 提供嵌入式领域特定汇编语言(assembly EDSL,汇编 EDSL) 这也是 Haskell 又一成功案例 Groq 创始人兼 CEO:Jonathan Ross 在创立 Groq 之前,Jonathan 启动了 Google 的张量处理单元 (TPU) 项目,这是一个 20% 的项目,他设计并实现了第一代 TPU 芯片的核心元素 Jonathan 接下来加入了 Google X 的快速评估团队,这是著名的“Moonshots factory”的初始阶段,他为 Google 的母公司 Alphabet 设计并孵化了新的 Bets (Units) Jonathan 师从纽约大学柯朗研究所的 Yann LeCun