GPU将不再稀缺,而电力成为英伟达估值的终极约束 GPUs Will No Longer Be Scarce, as Power Becomes the Ultimate Constraint on Nvidia's Valuation 编者注:在过去的两年里,华尔街最动听的故事莫过于AI 淘金热,而英伟达(Nvidia)无疑是这场盛宴中接近唯一的卖铲人。其股价的火箭式蹿升,建立在一个看似无限且刚性的需求之上:只要有更强的 GPU,世界就会毫不犹豫地买单。 然而,当资本市场还在为B200/B300以及下一代的Vera Rubin芯片的算力倍增而狂欢时,一个更基础,更物理,也更残酷的瓶颈正在悄然逼近,这甚至可能成为英伟达万亿市值的真正天花板。 这个瓶颈不是台积电的产能,不是CoWoS封装技术,而是电力(Power)。 Musk同志的电力预言:被忽视的警告信号 2026年开年,科技界最震耳欲聋的警告并非来自老黄在CES的新品发布会,而是来自Elon Musk同志(笔者看到推上有人说Elon Musk已经被中国统战了,那确实应该叫上一声“老马同志,你好。”)。 在1月6日的一档播客节目中,Elon Musk抛出了一个极具地缘政治意味的论断:他断言,中国在人工智能计算能力上将会超越美国。而支撑这一结论的核心论据,并非算法或芯片设计的优劣,而是最底层的物理限制,电力供应能力。 老马同志给出的估计是到2026年,中国的发电量会达到美国的3倍左右。他直言不讳地指出,这种巨大的能源优势,将使中国,也仅有中国能有能力支撑起规模空前,高能耗的人工智能数据中心集群。 “电力生产是扩大AI系统规模的限制因素”,是的,老马同志对“算力即电力”的理解或许比任何人都深刻,但他的这个新的“电力制约论”或将改变全球AI竞争格局的核心认知。 他的这番言论,实际上是向过度乐观的美国科技界,华尔街甚至监管投下了一枚炸弹:AI军备竞赛的下半场,比拼的可能不再是硅片上的纳米制程,而将是国家电网里的特高压传输。 美国电网之殇:英伟达无法回避的物理墙 AI数据中心的快速扩张正在对全球电力系统形成前所未有的压力。到2027年,仅英伟达自己供应的GPU集群将消耗全球150-200GW电力,相当于1.5~2个法国全国用电量。 美国的电力短缺尤为严峻。摩根士丹利已将2025-2028年美国数据中心累计电力缺口从44吉瓦上调至47吉瓦,此缺口相当于9个迈阿密或15个费城的用电量。 至此,老马同志的警告揭示了美国科技巨头们面临的一个尴尬现实:他们有足够的钱买英伟达的芯片,却可能没有足够的电力让这些芯片转起来。 美国老旧的电网设施可能正成为其AI发展的最大绊脚石。 首先是审批积压。在美国,新建发电厂或大型传输线路需要经历漫长而复杂的监管审批流程。数据中心开发商现在面临着长达数年的电力连接等待期。在弗吉尼亚州北部这样的数据中心核心区,电力容量已接近饱和,新的大型项目往往被告知要等到2028年甚至更晚才能获得足够的电力供应。 其次是电网稳定性与各种能源的博弈。AI数据中心需要的是24/7不间断的稳定基荷电源(Baseload Power)。风能和太阳能这些可再生能源的间歇性使得它们无法单独支撑数据中心的苛刻需求。诚如老马同志之前所说,储能会是一个极大的挑战和市场。 对于英伟达的核心客户而言,包括微软,谷歌,亚马逊,甲骨文,OpenAI以及Meta,这正逐渐演变为一个无法回避的现实约束。如果它们无法在未来一到两年内获得数百兆瓦,甚至吉瓦级规模的新增电力供应,那么今天向英伟达下出的巨额GPU订单,届时很可能将面临无处安放的尴尬局面。 而英伟达当前的万亿美元级估值,本质上正是建立在这些巨头持续和高强度的资本开支(Capex)之上。一旦算力投资受到电力基础设施瓶颈的制约,资本开支的实际落地能力将被削弱,新增GPU的采购节奏势必放缓。这不仅会直接影响英伟达的出货规模和收入增长,也可能成为其估值逻辑中最容易被忽视,却最具决定性的变量。 中国模式与估值逻辑重构 相比之下,老马同志口中中国的优势在于其强大的基础设施建设能力和国家层面的统筹规划。通过特高压输电技术和“东数西算”工程,中国更有能力将西部的可再生能源用于东部的算力需求。如果老马同志关于“3倍发电量”的预测成真,那么在物理层面,这种“电力红利”将直接转化为算力优势。 这对英伟达的投资者意味着必须重新审视其估值模型。过去两年市场的逻辑是“需求无限,供给(芯片制造)是瓶颈”;而现在,新的逻辑可能正在浮现:“电力和基础设施成为新瓶颈,导致客户需求被迫放缓”。 黄仁勋显然意识到了这个问题,他开始在各种场合强调“能源效率”和液冷技术。但在物理世界中,没有任何指数级增长可以永远持续下去。当硅谷的梦想撞上热力学的铁壁,能源的获取能力将取代芯片的制造能力,成为决定AI未来版图的关键变量。 老马同志的断言指出了一个核心事实:在这场关乎国运的AI竞赛中,谁掌握了更充沛更稳定的能源,谁就握住了通往未来的电源插头。对于英伟达而言,其万亿市值的下一个增长点,或许不再仅仅取决于CUDA生态的护城河,而取决于全球电网何时能跟上它疯狂的步伐。 所以,电力,这个最传统的工业要素,正成为掐住最前沿科技行业咽喉的关键之手。它不仅可能冻结数百亿美元的资本支出,更可能引发从供应链,企业财报到资本市场估值的连锁反应。 对于投资者而言,下一阶段观察英伟达及其客户的关键指标,除了GPU出货量,更应关注这些巨头获取和宣布的长期电力合同(PPA)规模,数据中心项目的电网接入批准情况,以及它们资本支出中用于能源基础设施的比例变化。这些将是比财报数字更早的预警信号。 在这个逻辑下,真正的赢家或许会悄然转移:那些能够提供稳定,廉价电力的区域(如中国及北欧),拥有强大电网建设能力的电力设备公司,以及能够提供更高能效算力解决方案的挑战者,都可能从这场电力危机中意外获益。
AI虹吸产能引发内存涨价潮:全球PC市场或迎缩量加价的寒冬 编者注:AI的爆发式增长正在重塑全球半导体供应链和资源配置。受高带宽内存(HBM)产能放大及大额企业级订单的挤压影响,标准存储芯片供应告急。IDC最新预警显示,全球PC市场或将面临最高近9%的销量下滑,而整机价格涨幅可能高达8%。 IDC最新市场预判:PC销量萎缩与成本上行的双重挤压 在IDC最新的情景预测中,原本对2026年PC市场萎缩2.4%的基准预期已显保守。基于NAND闪存与DRAM供应格局的剧变,IDC新增了两项预测路径: 🔹 温和情景:销量预计下降4.9%,整机价格上涨4%至6%。 🔹 悲观情景:销量可能大幅萎缩8.9%,而终端价格涨幅或将冲至8%甚至更高。 这一趋势背后的核心逻辑并非需求枯竭,而是上游成本激增导致的市场被动收缩。 解析:HBM如何“抢食”传统产能? 此次内存波动的震中位于AI数据中心。作为AI芯片(如NVIDIA B系列GPU)的标配,HBM(高带宽内存)凭借超高带宽优势成为战略级资源。 然而,HBM并非独立于生态之外。由于其生产过程与消费级DRAM共享相同的晶圆产线和先进制程技术,面对利润更丰厚,溢价更高的HBM订单以及企业级内存订单,三星、SK海力士及美光等存储巨头纷纷调整策略,优先保证AI和企业级产能。 这种产能的调配直接导致用于PC及消费电子的标准DRAM和NAND闪存供应大幅受限,供需天平开始剧烈倾斜。 举个栗子:2025年暑假的时候,一根原厂的64GB DDR5-6400 RDIMM服务器内存的价格尚在260美金附近,年底的价格已经落在了将近1,000美金,这是一个短期内将近四倍的惊人涨幅。 跟据供应链的反馈,现在即使是谷歌和Meta也需要和三星签署长达五年的长约(LTA),很明显目前谈判的筹码在内存厂手上。 当然,行业内对于这场波动的持续时间仍存巨大分歧,预测区间从半年到五年不等。这不仅取决于AI应用的商业化落地速度,更依赖于是否能催生新一代更高效能的内存架构,来缓解目前大规模的短缺趋势。
Compute King
1个月前
华为发布新一代AI算力调度技术,Flex:ai智算资源利用率提升可达30% 华为前几日正式推出新一代AI算力容器化调度技术Flex:ai。据介绍,该技术可将智算资源利用率提升最高30%,并支持异构算力环境,兼容英伟达GPU、华为昇腾NPU等多类加速卡,避免了生态锁定问题。。。 在技术架构上,Flex:ai基于Kubernetes构建,是面向XPU的池化与智能调度软件。通过对GPU,NPU等算力资源进行细粒度管理和智能化调度,实现AI训练与推理任务与底层硬件的精确匹配,从而显著提升整体算力利用效率。 软件补硬件以及开放兼容,是该技术的两大核心特点。 2024年4月,英伟达以7亿美元收购以色列AI基础设施公司Run:ai,以弥补其在算力管理软件领域的短板。相比之下,华为的Flex:ai在虚拟化能力和智能调度算法方面具备差异化优势,并将以更完整的方式开源。 华为表示,Flex:ai自立项起便与多所高校联合研发。公司认为,算力利用率的提升必须基于真实业务场景不断优化,因此希望更多企业借助开源生态参与共建,共同探索行业最佳实践。 华为Flex:ai的核心能力可概括为三个方面: 1,算力资源切分:一张卡变N张卡,同时服务多个AI工作负载 Flex:ai通过算力切分技术,将单张GPU/NPU拆分为多个虚拟算力单元,切分粒度精确至10%。这一技术使得单卡能够同时承载多个AI工作负载,在整卡算力无法被充分利用的场景下,算力资源平均利用率可提升30%。 2,多级智能调度:实现 AI 工作负载与算力资源的精准匹配 Flex:ai内置全局智能调度器Hi Scheduler,实时监控集群负载与资源状态,并结合AI任务的优先级,算力需求等多维参数,对本地及远端虚拟化的GPU/NPU资源进行全局最优调度。 3,跨节点算力聚合:通用算力与智能算力融合 Flex:ai可聚合集群内各节点的空闲XPU算力,形成共享算力池。通用服务器通过高速网络将AI工作负载分发至池内GPU/NPU执行,实现通用算力与智能算力的无缝融合,从而提升整体算力利用效率和任务调度灵活性。 魔擎社区地址:
Compute King
2个月前
针对高事早苗的涉华错误言行到目前为止,中方释放三大罕见信号,一个郑重,两个奉示,三语宣示。 In Response to Sanae Takaichi's Erroneous Remarks Concerning China, Beijing has so Far Released Three Rare Signals: One Solemn Warning; Second Pointed Admonition; Declarative Statement in Three Language Credit to 乔鲁京(Qiao Lujing),国际观察主编(Editor-in-Chief of International Review) Authors note: This is a must read piece, please use "Translate" feature on X if you can't read Chinese... 中方反制的时间节点: 2025年11月14日凌晨2点56分,外交部官网发布了一条深夜消息:“外交部副部长孙卫东奉示召见日本驻华大使金杉宪治”。 2025年11月14日晨,人民日报钟声:绝不容忍高市早苗在台湾问题上的越线挑衅。 2025年11月14日早晨,外交部以中英日三种语言的方式在社交平台上继续警告。 2025年11月14日下午,驻日本大使吴江浩奉示约见日本外务事务次官船越健裕,就日本首相高市早苗涉华错误言行提出严正交涉。 2025年11月14日晚,外交部和中国驻日本使领馆就中国公民前往日本发布郑重提醒。 2025年11月15日下午,国航,南航、东航三家航司已发出通知,公布了涉及日本航线客票的特殊处置方案,对于出行日期在12月31日之前且符合相关条件的客票,可予以免费退改处理。 2025年11月15日下午,继三大航司后,四川航空、厦门航空、海南航空等多家航司发出通知,公布了涉及日本航线客票的特殊处置方案,对于出行日期在12月31日之前且符合相关条件的客票,可予以免费退改处理。
Compute King
2个月前
中国科学家登上《Nature》:攻克140年化学难题,或大幅降低抗癌药成本 笔者注:最近国内高校在Nature都爆表了呀。。。这个国际顶级学术期刊上个星期刊发了来自中国科学院大学,杭州高等研究院,化学与材料科学学院张夏衡研究团队的最新成果:“Direct deaminative functionalization with N-nitroamines”。 论文链接: 这项研究解决了困扰有机合成领域超过140年的核心难题,被国际同行高度评价。作为审稿人之一,辉瑞制药高级研发总监Scott Bagley称其为“true tour de force(真正的杰作)”。。。 破解百年化学瓶颈 一个世纪以来,化学家们在将芳香胺结构转化为其他功能性化合物时,几乎都依赖通过“重氮盐”中间体的反应路径。 然而,这一传统路线不仅反应步骤繁琐、收率低、纯化成本高,更由于重氮盐极不稳定、易爆炸,极大地限制了工业化生产安全与规模。 张夏衡团队提出了一种以N-硝胺为媒介的“直接脱氨官能团化”策略。该方法能够在温和条件下,直接将惰性的芳香C–N键一步转化为C–X、C–O、C–N、C–C等多种化学键,反应安全、高效且可放大至公斤级生产,为有机合成开辟了一条全新路径。 这一方法不仅从根本上摒弃了高危中间体“重氮盐”,还在安全性、成本与效率方面实现多重突破。这是一个颠覆性的进展,将为多个市场带来了革命性的转变。。。 或将颠覆抗癌药合成成本结构 张夏衡团队测试了170余种化学底物,包括传统方法极难转化的复杂分子,如间位氨基吡啶、多氮杂环及多种药物分子,转化成功率达到46%至83%。 更具代表性的是,研究团队把好几步反应放在一个锅里一次性做完。比如,他们用三步一锅法高效合成了一种抗炎药“依托考昔”,成功将原本复杂的多步反应路线极大简化。实验结果表明,该反应在千克级规模下收率高达90%,显示出强大的工业可行性。 业内人士指出,这项技术有望应用于多种重磅药物的第二代或第三代仿制药工艺中,包括PARP抑制剂,BTK抑制剂和酪氨酸激酶抑制剂等,从而显著降低全生命周期成本,使高端抗癌药更易被患者负担。 距离“诺奖级成果”还有多远? 纵观诺贝尔化学奖历史,Heck、Negishi、Suzuki的钯催化交叉偶联反应(2010年获奖)与List、MacMillan的不对称有机催化(2021年获奖)均经历了20至40年的时间验证。。。 张夏衡团队的成果同样具备原创性强、应用广泛、潜力深远等关键特征,但仍需未来数年到十数年在全球范围内获得更广泛验证与引用。。。 从实验室到工业化,从方法学创新到实际应用,张夏衡团队的这项研究为全球化学与制药产业提供了全新的范式。 它不仅展示了中国科学家在基础化学领域的原创能力,也为“让高科技抗癌药更亲民”带来了现实希望。。。 张夏衡团队 这里还有个有意思的评论:
Compute King
2个月前
汇总一下今天刚哥和贝嫂技术性谈判之后的主要消息 1,立场态度 “美方表达立场强硬,中方维护利益坚定”。。。中美谈判团队就双方关心的重要经贸问题进行了“坦诚,深入且富有建设性的交流”,包括:美对华海事物流和造船业的 301 措施、延长对等关税暂停期、芬太尼关税及执法合作、农产品贸易(主要是大豆)、双方出口管制(美方的 50% 规则,中方的稀土)等。。。 2,软件反制与关税威胁 目前,美方之前提出的所谓靠软件反制被搁置,特朗普对中国征收额外100%关税的威胁也被搁置,这两点属于谈判前造牌,被搁置符合预期。。。 3,谈判成果 双方达成了一个框架(Framework)。中方表述为:“中美双方就上述议题建设性地探讨了一些妥善处理双方关注的方案,形成了初步共识。下一步各自将履行内部报批程序。” 美方Greer也表示:“a potential framework moving forward。” 正如我们之前分析,这个Framework旨在保证双方能够执行达成的协议。我们之前聊过,在马德里谈判之后,中方显然认为存在共识不再加码,但是美方商务部的管制措施加码明显,也直接国庆节后中方导致了稀土的严格管制。如何限制美方履行共识也是中方重点防范的方向,从这点来看,框架应该满足了中方的基本要求。。。 4,稀土出口管制 今天贝嫂接受NBC采访时表示,中国可能会推迟对美实施新的稀土出口管制(Deferral on rare earth restriction),但尚未最终确定,还需两位领导拍板。美方也会相应延长对等关税暂停期作为回报。贝嫂的表态仍然比较谨慎。 我的理解就不在这里说了。毕竟中国的稀土出口管制自2020年就已存在,只是之前的执行也有很多的漏洞。 5,关税暂停期 确认会延长对等关税的暂停期,但具体方式尚未披露,不清楚是否与稀土延期管制挂钩。 6,农产品采购 预计中国将恢复大规模购买美国大豆。 7,芬太尼关税与执法合作 中方直接提出“芬太尼关税及执法合作”,这个表述是第一次看到,也显示出中方在这方面有合作意愿。毕竟这个关税20%是没有必要的。所以川川和大大会面的时候一定会聊到这。。。 8,会谈评价 美方认为会谈建设性,为双方领导人会晤提供了积极框架。Greer的原话是:“a broad range of topics were discussed, including extending the truce on trade measures... I think that we're getting to a spot where the leaders will have a very productive meeting。” 中方表述为:“会议坦诚、深入、富有建设性…… 美方表达立场是强硬的,中方维护利益是坚定的。” 总体上看到了谈判场上刀光剑影,笔者的直观感觉是应该达到了中方的预期。。。
Compute King
2个月前
这对刚刚退休不久的美国夫妇,控诉退休后他们的医疗保险保费从每月443美元,暴涨到2,224美元。短短几个月,支出翻了五倍,从“能负担”瞬间变成“完全付不起”。。。 这并非孤例。美国的医保体系向来复杂而昂贵,许多人在职时依靠雇主提供的团体保险,一旦退休,就必须自行承担全部保费。而只要收入稍微高出政府补贴线一点点,就会立刻失去补助资格,从“有补贴”变成“全自费”。一个细微的收入差距,就可能让保费暴涨数倍。 对普通退休家庭而言,这样的变化无异于一场经济灾难。医疗开支原本应该是老年生活最基本的保障,如今却成了压垮生活的最大负担。 对,不是病治不起,而是连保险都买不起了。 A recently retired American couple has spoken out, saying their monthly health insurance skyrocketed from $443 to $2,224 after retirement. In just a few months, their costs quintupled, turning what was once "affordable" into something "completely out of reach"... And they're not alone. The U.S. healthcare system is quite complex and expensive. Many people rely on employer-sponsored insurance while working, but once they retire, they have to pay the full premium out of pocket... Even worse, if their income exceeds the government subsidy threshold by just a small margin, they immediately lose eligibility, going from "subsidized" to "fully self-paid"... A tiny difference in income can make premiums skyrocket severalfold... For ordinary retirees, such a sudden jump is nothing short of an economic disaster... Healthcare costs, which should be a basic guarantee in later life, have instead become the heaviest burden to bear...
Compute King
2个月前
美国软件出口禁令对电子行业的潜在影响分析 Author's Note: This is a must-read piece. If you don't read Chinese, I highly recommend using the "Translate" feature on X. Title: Analysis of the Potential Impact of the U.S. Software Export Ban on the Electronics Industry 一,核心假设 目前流传的禁令范围:涵盖所有含美国产软件成分或受美国技术控制的软件出口至中国,包括但不限于:EDA 工具,芯片驱动,操作系统,嵌入式控制软件及工业软件等。 受影响范围:基本覆盖整个电子产业链,从上游芯片设计,芯片制造,驱动开发,到消费电子及工业电子产品开发和制造,再延伸至系统集成及下游服务与应用。具体影响领域包括:电脑,手机,家电,汽车,工业控制,医疗设备,安防设备等。 二,产业链影响 如前所述,在现行禁令的覆盖范围内,整个电子产业链都会受到冲击。这种影响不仅仅局限于中国市场,而是具有全球效应。具体表现为: 🔹 美国企业的出口风险:任何面向中国的电子产品出口都面临显著的合规压力。例如,美国公司若向中国出口电脑、手机或工业设备,只要产品中含有美国软件或组件,就可能触及出口管制条款,违反法规将面临高额罚款和信誉损失。 🔹 欧洲及其他国家出口的间接影响:即便产品在非美国产地制造,如果其组件(如发动机中的控制芯片或驱动软件)使用了美国技术或软件,整台产品的出口也需要获得许可。举例来说,一台欧洲制造的发动机,只要其控制模块或驱动使用了美国软件,其出口中国将面临严格审批。 🔹 中国企业进口的复杂性:中国企业在进口电子产品或关键零部件时,合规流程将变得异常复杂,任何涉及美国软件的产品都可能被延迟审批甚至被美国禁止出口。 因此,短期内几乎所有与电子产品相关的出口和进口活动都有可能陷入停滞。具体到市场影响: 🔹 苹果可能无法向中国销售任何 iPhone,无论产地在哪里; 🔹 微软、甲骨文等美国软件公司面临直接销售受阻; 🔹 更广泛的电子设备、工业控制系统、汽车电子等产品的跨境流通将受到连锁影响。 整体来看,这一禁令不仅扰动供应链,还将引发全球电子产业链的系统性调整压力。 三,笔者的关键思考 如果即将出台的禁令如目前流传的那样范围极其广泛,等同于美国开始在政策层面上推动与中国在电子产业的全面脱钩,笔者认为这在现实操作上几乎不可能实现,原因可以归结为以下几点: 🔹 立法与政策准备需要长期、细致的工作 如此大范围的禁令不会是一纸即发的行政命令,而必须经过立法或长期的制度设计,合规框架构建与跨部门协调。更现实的做法很可能是对若干关键领域或特定软件,固件组件(例如特定的EDA工具,设备驱动或安全相关中间件)实施有针对性的限制,而非对所有电子产品,所有零部件一刀切。 🔹 执行成本与监管能力的制约极大 若把禁令延伸到“连一颗小芯片的出口都需审批”的层面,意味着需要一个覆盖全球,逐件审核的庞大配套体系,包括但不限于海关,许可审查,企业尽职,溯源和合规认证等。目前美国及其盟友并不具备能在短期内无缝部署并稳定运行这种超大规模监管体系的人力与技术资源,因此在可预见的时间内难以实现全面执行。 🔹 自损与国际市场反噬的高风险 这种“杀敌一千,自损二千”的做法将对美国产业自身造成重大伤害。美国电子产业在全球价值链中占据重要位置,将一个庞大市场突然切出,会直接冲击美国公司营收与全球供应链。例如:2024年高通(Qualcomm)约46%的收入来自中国客户(约178亿美元),英特尔约28%来自中国;英伟达(Nvidia),博通(Broadcom),德州仪器(TI)等厂商也有相当比重来自中国市场。即便某公司(比如Nvidia)对外宣称对华业务下降到0%,公司的某些产品线和生态仍深度依赖中国市场与供应链。 🔹 中美经贸互依的规模与反制成本 中美两国在服务和实体贸易上存在显著互补与不对称性:2001–2023年间,美对华服务出口从56.3亿美元增长到467.1亿美元,增长了7.3倍,且美国对华服务贸易年度顺差从较低基数扩大到265.7亿美元。这反映出美国在跨国服务,软件出口,IP出口与品牌方面的优势。 同时,2022年美资企业在华销售额高达4905.2亿美元,远高于中资企业在美的786.4亿美元。若禁令升级,中方采取报复性措施的力度和方式也会更加实质化,导致双向损失放大。 🔹 美国更可能的政策路径是聚焦关键环节而非全盘脱钩 综合以上因素,更现实也更可行的路径,是对战略性,敏感的工具与组件实施有限制:例如对高端EDA(电子设计自动化)软件、高级AI训练/推理加速器的软件栈、特定加密/远程管理固件等进行出口管控。这类“有的放矢”的限制,才能把对自家产业的副作用降到可控范围。 至于Bessent等人在公开场合释放的强硬表述,更多是博弈筹码与谈判策略的一部分,而非立刻就能覆盖整个电子产品市场的现实政策。 结论:短期内出现覆盖全部电子产品与零部件的全面脱钩并不现实;但必须高度警惕并跟踪对某些关键软件工具与高端元件的有针对性限制,因为那类限制对中国本土设计与制造的影响可能呈现出“穿透性”,对产业链上游研发与下游量产都会产生实质性影响。当然,目前美国剩下的“明珠”已经不多了。。。
Compute King
2个月前
股神争霸赛:赚钱,DeepSeek果然第一名! 全球六大顶级AI模型实盘对决,各自携带1万美元真实资金下场厮杀。战况仍然激烈,但DeepSeek V3.1凭借出色的交易表现暂居榜首,盈利已突破4300美元;Grok 4紧随其后。而GPT5和Gemini 2.5 Pro表现惨淡,成为目前唯二亏损的模型。 一场AI版“股神争霸” 如果给每个顶级大模型1万美元真金白银,让它们在真实市场中实盘交易,谁会成为AI界的“巴菲特”? 这一问题由发起的全新实验,Alpha Arena正在给出答案。这场竞赛,将当前全球最强的六大语言模型拉入同一真实交易环境,包括: 规则简单但残酷 每个模型获得1万美元初始资金,并接收完全相同的市场数据与交易指令。 系统会向AI提供当前时间,账户信息,持仓状况及一系列实时市场指标(如MACD,RSI等),随后要求其做出决策: * 若有持仓,决定是继续持有还是平仓; * 若空仓,则判断是买入还是继续观望。 实验的考验在于,AI能否在瞬息万变的市场中做出理性、精准的判断。 DeepSeek的量化优势凸显 截至目前,市场波动不断,而DeepSeek凭借量化背景与策略优化能力脱颖而出,目前稳居收益榜首。 这一成绩再次印证了DeepSeek模型在数据理解,风险控制与执行效率上的深厚积累。从实验结果看,AI炒股不再是噱头,而是算法,数据与市场博弈的真实较量。 挺有意思的,这场Alpha Arena,不仅是模型智能的试金石,也让外界得以窥见未来AI在金融实盘中的潜力与边界。
Compute King
3个月前
中国的稀土出口管制(类似于美国的长臂管辖)或冲击高端芯片与设备供应链:14nm及以下逻辑芯片,256层及以上存储芯片面临潜在影响 Author’s Note: This is a must-read piece. If you don’t read Chinese, I highly recommend using the “Translate” feature on X. Title: China's Rare Earth Export Controls, A "Long-Arm Jurisdiction" of Its Own, May Disrupt High End Chip and Equipment Supply Chains: 14nm-and-Below Logic and 256-Layer-and-Above Memory at Risk 如之前分享的新闻,2025年10月9日,中国商务部宣布新版稀土出口管制措施,明确将“含有中国原产稀土的境外制品”,“使用中国稀土技术在境外制造的产品”,以及“原产于中国的稀土本体”纳入许可管控范围。该措施自发布之日起执行,并将分阶段推进。此举意味着中国正对高端半导体,以及军工等领域的稀土出口实施更精细化的审查机制。 这一政策可能对高端半导体供应链造成深远影响,特别是14纳米及以下逻辑芯片,256层及以上3D NAND存储芯片,以及相关制造,测试和封装设备以及工艺领域。 稀土的科技基础:轻稀土与重稀土之别 我们先来了解一下稀土元素。稀土元素根据其物理化学特性可分为两大类: 🔹 轻稀土元素(LREE):包括镧(La)、铈(Ce)、镨(Pr)、钕(Nd)、钷(Pm)、钐(Sm)、铕(Eu)等,储量相对丰富,广泛用于抛光,催化,发光等领域。 🔹 重稀土元素(HREE):包括钆(Gd)、铽(Tb)、镝(Dy)、钬(Ho)、铒(Er)、铥(Tm)、镱(Yb)、镥(Lu)、钪(Sc)与钇(Y)等,资源更为稀缺,却是高性能磁体,激光晶体和特种合金等高科技领域不可替代的核心原料。 先进半导体工艺和设备对于稀土材料的依赖 半导体产业作为现代科技的核心支柱,其发展在很大程度上依赖于稀土元素所具备的独特化学与物理特性。这些元素,包括镧(La)系元素,钇(Y)和钪(Sc),在导电性,介电性能以及气体敏感特性方面发挥着关键作用,对提升半导体器件的性能至关重要。 例如,钕(Nd)是制造半导体设备中高性能永磁体(如步进电机,高精度定位系统)的关键材料,而镝(Dy)的加入则可显著提升磁体在高温环境下的稳定性与抗退磁能力。铕(Eu)则在显示技术中不可或缺,是荧光粉的重要组成部分,广泛用于液晶与OLED显示器。 🔹 在半导体工艺领域,稀土氧化物也不可替代。氧化铈(CeO₂)是化学机械平坦化(CMP)工艺的核心材料,其抛光浆料直接影响晶圆的平整度与最终良率。对于高层数NAND闪存而言,CMP质量的稳定性尤为关键,任何抛光颗粒短缺或质量波动都会放大次品率。 近年来,氧化镧(La₂O₃),氧化钆(Gd₂O₃)与氧化镥(Lu₂O₃)等高介电常数(High-k)稀土氧化物因其优异的热稳定性与介电特性,被广泛研究用于逻辑和存储芯片。另外,随着原子层沉积(ALD)技术的进步,特别是采用臭氧(O₃)等替代氧化剂的工艺创新,稀土氧化物薄膜的均匀性与稳定性显著提升,使其在先进制程中更具可行性。 此外,一氧化钇(YO)等二价稀土氧化物也被合成为外延薄膜,展现出独特的电子与磁性特征。其可调控的电导率,窄带隙以及强自旋轨道耦合特性,使其成为新一代半导体器件材料的重要候选。 在特定半导体材料体系中,稀土掺杂技术同样不可或缺。例如,在高速,高频器件使用的氮化镓(GaN)与磷化铟(InP)材料中,钇(Y)和铕(Eu)常被用于提升载流子迁移率与光电转换效率,我们之前聊过市场非常关注的光模块需要;而稀土掺杂的氧化铟(In₂O₃)表现出显著增强的气体传感性能,拓展了其在智能感知芯片中的应用前景。 🔹 在半导体设备领域,稀土材料也贯穿多个关键环节。以EUV光刻机为例,其核心技术主要包括三项:顶级的光源系统,高精度的物镜系统以及工件台。这些均需要使用稀土材料,比如说使用NdFeB永磁体(步进电机以及高精度定位系统)与掺杂了稀土元素晶体的固体激光器;而刻蚀与沉积设备的真空腔体,靶材表面常采用Y₂O₃、CeO₂等稀土氧化物涂层,以提升耐蚀性与使用寿命。 🔹 至于后段封装与测试环节,高端封装中使用的导热陶瓷,荧光掺杂封装材料,以及用于光电探测器的稀土掺杂晶体,虽然用量不大,却在特定高性能应用(如高频雷达、红外传感和量子器件)中具有不可替代的作用。 所以,稀土元素贯穿半导体制造的几乎每个环节,从材料到设备,从工艺到封装测试,其重要性远超传统金属原料。一旦稀土供应链受到出口管制,价格波动或精炼环节受限,全球先进芯片生产链都将不可避免地面临结构性影响。 为什么中国能在全球稀土精炼领域占据主导地位? 尽管稀土元素在现代产业中发挥着举足轻重的作用,但其全球供应链极度集中。中国不仅掌握了约70%的全球稀土矿开采量,还占据了约90%的全球精炼与分离产能。尤其在最具战略意义的重稀土领域,中国的供应占比更是高达99%。 这一地位的形成,绝非偶然。它源自中国在该领域长达数十年的战略布局,技术积累与全产业链建设。与外界常见的误解不同,稀土精炼远不是“把矿石提纯”那么简单的化工过程,而是一套涵盖高难度化学分离,复杂流程控制与严格环境管理的系统性工程。 稀土精炼的核心挑战与中国的竞争优势 1,技术门槛高:元素分离与提纯的“化学艺术” 稀土包含17种化学性质极为相似的金属元素,要将其高纯度分离,需要上百次萃取,洗涤和沉淀等化学步骤。中国经过数十年的技术攻关,已在萃取剂研发与工艺流程设计方面形成了全球领先优势。 目前,中国企业能够稳定实现6N(99.9999%)级高纯度提炼,而多数国家仍徘徊在2N~3N水平。此外,中国企业在伴生矿与低品位矿的综合利用上积累了丰富经验,通过优化工艺,实现了高效率与低成本并存。 2,完整的产业链与规模经济效应 中国形成了“北轻南重、集群发展”的产业布局,拥有从矿石开采,分离提纯到金属冶炼与材料加工的全流程能力。 万吨级分离装置不仅带来了规模化成本优势,也让中国具备了快速响应市场需求与出口波动的灵活性。 3,化工配套完善,副产物处理体系成熟 稀土精炼常伴生钍,铀等放射性元素,其废料处理是欧美等国的“痛点”。 中国通过与钢铁,铝业等重工业体系的协同,将部分副产物实现再利用,形成资源循环体系。而在法规严格,重工业基础分散的西方国家,放射性副产物处理成本极高,成为扩产瓶颈。 4,能源与经济壁垒:电力成本与产能规模的双重优势 稀土金属电解环节耗电量巨大。中国凭借低成本电力供应与高效输配电网络,在能耗环节拥有显著优势。 同时,已投产的万吨级装置构筑了强大的规模经济壁垒,使新进入者即便获得政策支持,也难以在成本或效率上与中国竞争。 全球应对与前景展望 面对中国的稀土主导地位,美国,澳大利亚和欧盟正积极推动“去中国化供应链”战略。 例如,澳大利亚伊卢卡资源公司(Iluka Resources)计划在2027年建成首座重稀土精炼厂,美国国防部亦在资助德州的MP Materials扩产项目。然而,业内普遍认为,这些项目在成本,技术与规模三方面短期内难以撼动中国的地位。可以说,在未来可预见的十年内,中国仍将是全球稀土供应链中唯一具备全流程竞争力的国家。 这也意味着,在短期内,任何涉及高端芯片,先进制造和国防技术的全球产业链,都无法绕开中国稀土长臂管辖的核心影响力。
Compute King
4个月前
英伟达发布Rubin CPX GPU,专为长上下文推理打造 昨天白天我们还在聊128GB GDDR7的5090,还在质疑是不是真的,晚上就来了真正128GB GDDR7的Rubin CPX。这也侧面呼应了前两天业内反馈三星收单收到手软,大幅度提升GDDR7产能的事实。 对,英伟达昨天深夜发布全新GPU:NVIDIA Rubin CPX,这是一款专门面向长上下文AI推理的新型处理器,旨在支持百万级Token的软件开发、生成式视频以及深度研究等复杂任务。 Rubin CPX将与NVIDIA Vera CPU及下一代Rubin GPU协同,组成全新的NVIDIA Vera Rubin NVL144 CPX集成平台。该平台在单机柜内可提供高达8 exaflops的AI算力,性能较现有GB300 NVL72系统提升7.5倍,并配备100TB高速内存与每秒1.7PB的内存带宽,为AI推理树立全新性能标准。 英伟达将AI推理划分为上下文阶段(Context Phase)与生成阶段(Generation Phase):前者计算密集,需要高吞吐率处理输入;后者则对内存带宽依赖更强,逐个生成token。为此,英伟达推出“分解式推理”架构,由不同硬件分别优化两大环节。 CEO 黄仁勋表示:“Vera Rubin平台标志着AI计算的又一次重大飞跃。正如RTX改变了图形与物理AI,Rubin CPX是首款专为海量上下文AI设计的CUDA GPU,使模型能够一次性推理数百万token的知识。” Rubin CPX性能亮点 Rubin CPX专为加速“上下文阶段”设计,采用单片式芯片架构,具备: 🔹 30 petaflops NVFP4精度算力 🔹 128GB GDDR7内存 🔹 注意力计算速度提升至GB300 NVL72的三倍 🔹 集成视频编解码器与长上下文推理功能 据称,这一设计大幅提升视频搜索与生成式视频的效率。 GB300 NVL72刷新MLPerf纪录 除了发布新架构,英伟达还公布了MLPerf Inference v5.1基准测试结果。基于Blackwell Ultra架构的GB300 NVL72系统,在Llama 3.1 405B,Whisper等任务中刷新纪录。在6710亿参数的DeepSeek-R1混合专家模型测试中,其单GPU性能较上一代Hopper提升约5倍。 这一进步得益于英伟达全栈优化,包括NVFP4低精度加速,TensorRT-LLM库的模型与KV缓存量化,以及针对复杂模型研发的新型并行技术。
Compute King
4个月前
高盛今早更新研报,继续上调寒武纪目标价至人民币2104元,买入评级。 <仅供参考> 日前寒武纪公布强劲的2025年二季度业绩,同时给出2025年收入指引为人民币50亿元至70亿元,中值为人民币60亿元。GS此前对人民币65亿元的预测位于指引区间内,且较指引中值高出8%。 GS强调继续看好寒武纪,并将12个月目标价上调至人民币2,104元(对应2030年预期市盈率45倍)。 GS上调盈利预测主要基于: 🔹 AI芯片出货量更高,这反映出中国CSP在AI基础设施方面的资本开支上升,政府政策支持,以及在推理需求上升背景下本土芯片生态的涌现; 🔹 随着收入规模扩大与运营效率提升,期间费用率(opex ratio)改善,经营杠杆增强。公司过去12个月的“人均(工程师)收入”已由2024年12月的人民币200万元提高至2025年6月的人民币500万元。 积极的支持因素: 🔹 中国云端资本开支在加速扩张 阿里巴巴2025年二季度资本开支达人民币390亿元(约合54亿美元),环比+57%,同比约为两倍。腾讯2025年二季度资本开支同比+119%,好于此前担忧,高盛将其2025E/2026E资本开支预测分别上调23%/17%,对应2026E资本开支同比+13%。 🔹 支持性的AI政策 国务院发布了新的指导意见,设定到2027年/2030年,在6个关键领域(科技,工业,消费,民生,治理与全球协作)的新一代智能终端与AI Agent渗透率目标分别达到70%以上/90%以上,并强调通过行动计划赋能AI设备、提升效率。 🔹 中国AI供应链 2025年上半年实现强劲增长:寒武纪收入快速增长;上游原材料(主要是晶圆)供应稳健;合同负债显示手持订单强劲。AI服务器,交换机品牌商,ODM厂商看到中国云端资本开支上升,本土芯片在推理场景中的性能已能满足需求,同时本土生态持续完善(例如高速网络正释放本土芯片性能,推动AI服务器集群进一步放大)。
Compute King
4个月前
DeepSeek的UE8M0 FP8优化:国产AI与半导体协同的战略转折点 在人工智能训练和推理加速的竞赛中,浮点数(Floating Point)的表示方式正成为关键突破口。作为计算机中用于表示小数的核心手段,浮点数由三部分构成:符号位(Sign)、指数(Exponent)和尾数(Mantissa)。符号位决定正负,指数决定小数点的位置,尾数则影响精度。内存位数越多,浮点数的表示精度越高,但同时带来的计算和存储开销也更大。 如下图为浮点数据类型的结构。所有显示的值(在 FP16,BF16,FP8 E4M3和FP8 E5M2中)都是最接近数值0.3952的表示形式。 在主流硬件生态中,NVIDIA GPU目前支持E4M3与E5M2两种FP8格式,并通过绑定硬件和软件的深度优化提升了其适用性。例如,NVIDIA引入了per-tensor scaling,per-block scaling等动态缩放策略,以解决FP8动态范围不足,容易溢出的难题。同时,在Tensor Core中也专门增加了FP8指令集,使得FP8在H100 GPU上能够充分释放算力。 在新一代Blackwell架构中,NVIDIA更进一步提出了“微缩浮点格式”(Microscaling formats),涵盖MXFP8(8位)、MXFP6(6位)、MXFP4(4位)等多种新型表示方式。研究显示,在高质量数据集上,一个8亿参数的模型若采用MXFP8-E4M3格式,并配合优化的数值转换策略,训练结果几乎可与传统的BF16持平。这意味着在Blackwell平台上,MXFP8正在成为兼顾性能与精度的最佳选择。 与之相比,中国团队DeepSeek在V3.1模型中提出的UE8M0 FP8格式,走了一条完全不同的道路。UE8M0采取极简设计:8位全部用于指数(Exponent),尾数(Mantissa)为零。换言之,它牺牲了精度,以换取更大的动态范围。在这种格式下,最接近刚才图片内提到的数值0.3952的表示形式为0.5。可以很明显地看出来,精度差异较大,但是这种“极端化”的方案不仅减少了硬件实现复杂度,也为未来中国技术栈在模型训练、部署和推理中的数值优化提供了新的可能性。 1,FP8/UE8M0的优势与权衡 🔹 显存与带宽显著节省:相较于FP16和BF16,8-bit表示可将内存占用与传输成本大幅降低,有利于支持更大规模模型、更高并行度或更多批处理。 🔹 吞吐与能效提升:更窄的数据通路意味着在相同内核与内存带宽下,系统可处理更多算子,整体吞吐率和能效显著提升。 🔹 成本与部署门槛下降:低精度带来更高的性价比,对于数据中心及国产算力环境尤为重要,使大模型在受限带宽或成本条件下的部署成为可能。 🔹 软硬件协同优化:当模型与硬件围绕低精度格式协同设计时(如DeepSeek专门针对“国产芯片优化”),能够释放软硬件一体化的性能潜力。 但需要注意的是:更低位宽必然带来精度与鲁棒性下降,尤其是UE8M0这类极端“无尾数”设计,更依赖于训练、量化、校准等算法补偿,以及硬件支持机制。FP8在训练与推理端的应用边界,仍是学术界和工程界研究的活跃话题。 2,UE8M0的战略思维:软件先行推动硬件适配 UE8M0的“发起”方式具有鲜明的战略意义。不同于传统由硬件厂商先定义数据格式,DeepSeek选择在模型端率先采用并公开声明使用UE8M0格式,将其训练与scale策略与该精度绑定。 这等于由大模型端主动提出标准,迫使硬件和工具链进行适配。媒体普遍认为,这一举措是“模型先行推动硬件协同”的里程碑事件,加速了国产软硬件一体化的生态建设。 3,战略协同:AI与半导体的一体化生态 诚如笔者浅见:DeepSeek的高明之处在于其战略协同。公开资料显示,已有超过15家国内企业正在调整硬件以适配DeepSeek模型,覆盖电信、汽车、移动科技等多个领域,其中包括华为、中国移动等行业巨头。 这种合作并非单向: 🔹 对半导体厂商而言,DeepSeek模型成为性能与效率的标杆,推动其改进设计。 🔹 对DeepSeek而言,合作确保了其AI工具的落地基础,开发者与企业正在加速采用。 结果是形成一个自我强化的正反馈生态:软件与硬件同步演进,速度甚至可能超过美国碎片化的“AI公司依赖外部芯片”模式。 至此,看我推文比较久的小伙伴们或许还记得,我曾写过一篇解读DeepSeek论文的文章:《洞见 —— 硬件与模型协同设计,突破Scaling挑战》()。如今,看到国内AI企业在这条道路上迈出关键一步,实在令人欣喜。 4,国产芯片代表:寒武纪与华为的FP8路径 🔹 寒武纪(Cambricon)690系列 据多家媒体报道,寒武纪MLU370、思元590及最新的思元690均已支持FP8或“Block FP8”。其NeuWare软件栈在低精度支持上提供了完整的工具链,包括量化、混合精度调度以及对主流框架的适配。 在硬件层面,寒武纪的MLU架构通过算子引擎、片上缓存和张量内核优化,实现了高吞吐的低精度计算。媒体称思元690在低精度算力与能效上提升明显,已能够兼容DeepSeek模型。 需要强调的是,公司公开资料并未披露是否支持UE8M0这类极端格式,实际效果依赖SDK与模型方的适配验证。 🔹 华为(Ascend/昇腾) 华为提出了HiFloat8(HiF8)方案(),不同于E4M3/E5M2,而是一种“渐进式(tapered precision)”设计,根据数值区间动态分配指数与尾数,以在范围与精度之间取得平衡。 华为的Ascend系列已在OptiQuant、Atlas等平台上支持量化和混合精度,并将HiF8作为未来关键方向。与寒武纪偏重推理优化不同,华为强调同时支持训练的前向与反向传播,力图构建更通用的FP8训练方案。 5,大局观:AI已是国家战略 中国的AI发展早已超越实验室阶段,成为国家战略的重要组成部分。通过将AI软件与国产半导体深度结合,北京正在减少对外部技术的依赖,并为未来创新绘制蓝图。 DeepSeek的UE8M0 FP8优化,不仅是数值表示的一次尝试,更是中国在AI软硬件协同上的战略突破。 对投资者而言,启示清晰: 🔹 AI的未来不仅仅是算法,而是完整的生态系统。 🔹 DeepSeek与国产半导体生态的绑定,正在塑造这一趋势。 最终,问题不是中国能否实现AI自主,而是多块能够实现。而凭借UE8M0 FP8优化与深度产业整合,DeepSeek无疑是目前最值得关注的AI企业之一。
Compute King
5个月前
路透社独家 | 美国被指在含有高风险AI芯片的货物中植入追踪器,线人称 路透社独家获悉,美国当局已在其认定存在高风险被非法转运至中国的部分先进芯片货物中,秘密植入位置追踪装置。这一此前未被媒体披露的执法手段,旨在侦测并取证将受美方出口限制的人工智能芯片转运至限制地区的行为,且仅针对正在调查的特定货物使用。 知情人士表示,这类追踪装置有助于为涉嫌违反美国出口管制并从中牟利的个人和公司搜集证据,进而推进刑事或民事起诉。位置追踪作为执法调查工具已被美国机构使用数十年,用于追踪受出口管制的物品(例如飞机零部件);近年来,这一手段也被用于打击半导体及相关设备的非法转运。 多名直接参与AI服务器供应链的知情人士称,他们知悉在Dell和SuperMicro等服务器制造商的出货中发现过追踪装置,这些服务器含有Nvidia与AMD的芯片。消息人士称,追踪装置通常隐蔽置于服务器的包装内;他们并不清楚由谁在供应链的哪个环节安装这些设备。 路透未能确认追踪装置在与芯片相关的调查中具体使用频率,也无法确定美国当局何时起开始将其用于打击芯片走私。美方自2022年起已对Nvidia,AMD 等厂商向中国出售先进芯片实施限制。 在一宗发生于2024年的个案中,两位供应链人士描述称,一批搭载Nvidia芯片的Dell服务器的运输箱既装有体积较大的追踪器,也藏有更小、更隐蔽的装置,甚至有设备被安置在服务器机箱内部。 第三位人士表示,他们曾见到其他芯片经销商从Dell与SuperMicro服务器上拆除追踪器的图片与视频,并称部分较大追踪器体积接近智能手机。 负责监管出口管制与执法的美国商务部工业与安全局(Bureau of Industry and Security,BIS)通常参与此类行动;国土安全调查局(HSI)与联邦调查局(FBI)也可能介入,消息人士如此表示。HSI与FBI均拒绝置评;商务部未回应置评请求;中国外交部表示并不知悉此事。 在回应媒体询问时,SuperMicro在声明中表示,公司不会披露“为保护全球业务、合作伙伴和客户而采取的安全做法与政策”,并就美国当局的任何追踪行动拒绝发表评论。戴尔则称,公司“并未获悉美国政府在其产品发货中安装追踪装置的举措”。Nvidia拒绝置评,AMD未回应置评请求。 芯片管控与追踪措施的背景 近年来,美国在全球AI芯片供应链占据主导地位,并为阻止中国在军事现代化方面获得先进技术,相继收紧对华芯片与相关技术的出口限制。同时,美方也对俄方实施了相关限制,以削弱对乌战争的支持能力。白宫与国会两院曾提出要求美国芯片企业为其产品配备位置验证技术,以防止芯片被转运至受限国家。 中国对美国出口限制提出强烈批评,并反对在芯片中加入位置追踪等提案。上月,中国网络空间管理机构曾召见Nvidia,表达对芯片可能包含“后门”(允许远程访问或控制)风险的关切,Nvidia对此予以坚决否认。 路透今年一月曾报道,美国已追踪出通过马来西亚、新加坡与阿联酋等国向中国走私AI芯片的有组织网络,但尚不清楚当时是否使用了追踪装置。追踪装置用于执法的历史可追溯至数十年前,路透查阅的一份法院判决显示,1985年美国曾在受出口管制的货物上安装追踪装置以辅助调查。 ...... 涉事供应链中的货物转运与拆装人员也对追踪器保持警惕。两位在中国的芯片经销商表示,由于追踪风险,他们会定期检查被转运的AI服务器以寻找追踪装置。 路透还获悉,在美国司法部就本月两名中国籍被告非法向中国运送价值数千万美元AI芯片案的起诉书中,一份宣誓书提到,一名共谋者曾指示另一名共谋者检查含Nvidia芯片的Quanta H200服务器是否装有追踪器,并用英文写道:“注意看是否有追踪器,你必须仔细寻找。”该共谋者在信息中还以粗俗言辞辱骂特朗普政府(文中姓名被打码)。 原链接:
Compute King
5个月前
Cadence违规向中国实体清单高校出口EDA工具,被美重罚超1.4亿美元 美国电子设计自动化(EDA)行业巨头Cadence因违反美国出口管制法规,被美国司法部(DOJ)和商务部工业与安全局(BIS)联合处罚。根据7月28日发布的公告,Cadence已承认刑事指控并同意支付总额达1.406亿美元的罚款,以达成和解协议。 美国政府指控Cadence及其中国子公司Cadence China,在2015年9月至2020年9月期间,向客户“中南CAD中心”(CSCC)(其被美国政府认为是列入美国“实体清单”的中国国防科技大学(NUDT)的别名)非法销售或租借EDA相关产品。涉案物项包括受《出口管理条例》(EAR)约束的EDA软件、硬件及知识产权(IP),共计56次交易,未经必要出口许可,总价值约4,530万美元。 此外,Cadence还被指在违规的情况下,进一步将相关软件和技术转让给与NUDT存在关联的中国芯片企业(案中称为“P公司”),构成新的出口管制违规行为。 除上述主要违规外,调查还发现Cadence合规体系存在严重漏洞,导致多家已被列入“实体清单”的受限实体,包括俄罗斯JSC Mikron、中国一家通信巨头以及中国某顶级芯片制造商,在被制裁后仍成功访问并下载其EDA软件。 在刑事和行政和解中,Cadence将向美国政府支付总计1.406亿美元罚金,并须在未来完成两轮对其出口合规体系的独立审计。该行政命令自2025年7月28日起正式生效。 此次事件凸显了美国政府对技术出口管控执行力度持续升级,尤其是在与中国相关的高敏感领域。作为全球EDA三巨头之一,Cadence的违规行为及其所受处罚,也将对整个半导体设计工具行业的出口合规体系敲响警钟。