华为发布新一代AI算力调度技术,Flex:ai智算资源利用率提升可达30% 华为前几日正式推出新一代AI算力容器化调度技术Flex:ai。据介绍,该技术可将智算资源利用率提升最高30%,并支持异构算力环境,兼容英伟达GPU、华为昇腾NPU等多类加速卡,避免了生态锁定问题。。。 在技术架构上,Flex:ai基于Kubernetes构建,是面向XPU的池化与智能调度软件。通过对GPU,NPU等算力资源进行细粒度管理和智能化调度,实现AI训练与推理任务与底层硬件的精确匹配,从而显著提升整体算力利用效率。 软件补硬件以及开放兼容,是该技术的两大核心特点。 2024年4月,英伟达以7亿美元收购以色列AI基础设施公司Run:ai,以弥补其在算力管理软件领域的短板。相比之下,华为的Flex:ai在虚拟化能力和智能调度算法方面具备差异化优势,并将以更完整的方式开源。 华为表示,Flex:ai自立项起便与多所高校联合研发。公司认为,算力利用率的提升必须基于真实业务场景不断优化,因此希望更多企业借助开源生态参与共建,共同探索行业最佳实践。 华为Flex:ai的核心能力可概括为三个方面: 1,算力资源切分:一张卡变N张卡,同时服务多个AI工作负载 Flex:ai通过算力切分技术,将单张GPU/NPU拆分为多个虚拟算力单元,切分粒度精确至10%。这一技术使得单卡能够同时承载多个AI工作负载,在整卡算力无法被充分利用的场景下,算力资源平均利用率可提升30%。 2,多级智能调度:实现 AI 工作负载与算力资源的精准匹配 Flex:ai内置全局智能调度器Hi Scheduler,实时监控集群负载与资源状态,并结合AI任务的优先级,算力需求等多维参数,对本地及远端虚拟化的GPU/NPU资源进行全局最优调度。 3,跨节点算力聚合:通用算力与智能算力融合 Flex:ai可聚合集群内各节点的空闲XPU算力,形成共享算力池。通用服务器通过高速网络将AI工作负载分发至池内GPU/NPU执行,实现通用算力与智能算力的无缝融合,从而提升整体算力利用效率和任务调度灵活性。 魔擎社区地址:
针对高事早苗的涉华错误言行到目前为止,中方释放三大罕见信号,一个郑重,两个奉示,三语宣示。 In Response to Sanae Takaichi's Erroneous Remarks Concerning China, Beijing has so Far Released Three Rare Signals: One Solemn Warning; Second Pointed Admonition; Declarative Statement in Three Language Credit to 乔鲁京(Qiao Lujing),国际观察主编(Editor-in-Chief of International Review) Authors note: This is a must read piece, please use "Translate" feature on X if you can't read Chinese... 中方反制的时间节点: 2025年11月14日凌晨2点56分,外交部官网发布了一条深夜消息:“外交部副部长孙卫东奉示召见日本驻华大使金杉宪治”。 2025年11月14日晨,人民日报钟声:绝不容忍高市早苗在台湾问题上的越线挑衅。 2025年11月14日早晨,外交部以中英日三种语言的方式在社交平台上继续警告。 2025年11月14日下午,驻日本大使吴江浩奉示约见日本外务事务次官船越健裕,就日本首相高市早苗涉华错误言行提出严正交涉。 2025年11月14日晚,外交部和中国驻日本使领馆就中国公民前往日本发布郑重提醒。 2025年11月15日下午,国航,南航、东航三家航司已发出通知,公布了涉及日本航线客票的特殊处置方案,对于出行日期在12月31日之前且符合相关条件的客票,可予以免费退改处理。 2025年11月15日下午,继三大航司后,四川航空、厦门航空、海南航空等多家航司发出通知,公布了涉及日本航线客票的特殊处置方案,对于出行日期在12月31日之前且符合相关条件的客票,可予以免费退改处理。
中国科学家登上《Nature》:攻克140年化学难题,或大幅降低抗癌药成本 笔者注:最近国内高校在Nature都爆表了呀。。。这个国际顶级学术期刊上个星期刊发了来自中国科学院大学,杭州高等研究院,化学与材料科学学院张夏衡研究团队的最新成果:“Direct deaminative functionalization with N-nitroamines”。 论文链接: 这项研究解决了困扰有机合成领域超过140年的核心难题,被国际同行高度评价。作为审稿人之一,辉瑞制药高级研发总监Scott Bagley称其为“true tour de force(真正的杰作)”。。。 破解百年化学瓶颈 一个世纪以来,化学家们在将芳香胺结构转化为其他功能性化合物时,几乎都依赖通过“重氮盐”中间体的反应路径。 然而,这一传统路线不仅反应步骤繁琐、收率低、纯化成本高,更由于重氮盐极不稳定、易爆炸,极大地限制了工业化生产安全与规模。 张夏衡团队提出了一种以N-硝胺为媒介的“直接脱氨官能团化”策略。该方法能够在温和条件下,直接将惰性的芳香C–N键一步转化为C–X、C–O、C–N、C–C等多种化学键,反应安全、高效且可放大至公斤级生产,为有机合成开辟了一条全新路径。 这一方法不仅从根本上摒弃了高危中间体“重氮盐”,还在安全性、成本与效率方面实现多重突破。这是一个颠覆性的进展,将为多个市场带来了革命性的转变。。。 或将颠覆抗癌药合成成本结构 张夏衡团队测试了170余种化学底物,包括传统方法极难转化的复杂分子,如间位氨基吡啶、多氮杂环及多种药物分子,转化成功率达到46%至83%。 更具代表性的是,研究团队把好几步反应放在一个锅里一次性做完。比如,他们用三步一锅法高效合成了一种抗炎药“依托考昔”,成功将原本复杂的多步反应路线极大简化。实验结果表明,该反应在千克级规模下收率高达90%,显示出强大的工业可行性。 业内人士指出,这项技术有望应用于多种重磅药物的第二代或第三代仿制药工艺中,包括PARP抑制剂,BTK抑制剂和酪氨酸激酶抑制剂等,从而显著降低全生命周期成本,使高端抗癌药更易被患者负担。 距离“诺奖级成果”还有多远? 纵观诺贝尔化学奖历史,Heck、Negishi、Suzuki的钯催化交叉偶联反应(2010年获奖)与List、MacMillan的不对称有机催化(2021年获奖)均经历了20至40年的时间验证。。。 张夏衡团队的成果同样具备原创性强、应用广泛、潜力深远等关键特征,但仍需未来数年到十数年在全球范围内获得更广泛验证与引用。。。 从实验室到工业化,从方法学创新到实际应用,张夏衡团队的这项研究为全球化学与制药产业提供了全新的范式。 它不仅展示了中国科学家在基础化学领域的原创能力,也为“让高科技抗癌药更亲民”带来了现实希望。。。 张夏衡团队 这里还有个有意思的评论:
Compute King
1个月前
汇总一下今天刚哥和贝嫂技术性谈判之后的主要消息 1,立场态度 “美方表达立场强硬,中方维护利益坚定”。。。中美谈判团队就双方关心的重要经贸问题进行了“坦诚,深入且富有建设性的交流”,包括:美对华海事物流和造船业的 301 措施、延长对等关税暂停期、芬太尼关税及执法合作、农产品贸易(主要是大豆)、双方出口管制(美方的 50% 规则,中方的稀土)等。。。 2,软件反制与关税威胁 目前,美方之前提出的所谓靠软件反制被搁置,特朗普对中国征收额外100%关税的威胁也被搁置,这两点属于谈判前造牌,被搁置符合预期。。。 3,谈判成果 双方达成了一个框架(Framework)。中方表述为:“中美双方就上述议题建设性地探讨了一些妥善处理双方关注的方案,形成了初步共识。下一步各自将履行内部报批程序。” 美方Greer也表示:“a potential framework moving forward。” 正如我们之前分析,这个Framework旨在保证双方能够执行达成的协议。我们之前聊过,在马德里谈判之后,中方显然认为存在共识不再加码,但是美方商务部的管制措施加码明显,也直接国庆节后中方导致了稀土的严格管制。如何限制美方履行共识也是中方重点防范的方向,从这点来看,框架应该满足了中方的基本要求。。。 4,稀土出口管制 今天贝嫂接受NBC采访时表示,中国可能会推迟对美实施新的稀土出口管制(Deferral on rare earth restriction),但尚未最终确定,还需两位领导拍板。美方也会相应延长对等关税暂停期作为回报。贝嫂的表态仍然比较谨慎。 我的理解就不在这里说了。毕竟中国的稀土出口管制自2020年就已存在,只是之前的执行也有很多的漏洞。 5,关税暂停期 确认会延长对等关税的暂停期,但具体方式尚未披露,不清楚是否与稀土延期管制挂钩。 6,农产品采购 预计中国将恢复大规模购买美国大豆。 7,芬太尼关税与执法合作 中方直接提出“芬太尼关税及执法合作”,这个表述是第一次看到,也显示出中方在这方面有合作意愿。毕竟这个关税20%是没有必要的。所以川川和大大会面的时候一定会聊到这。。。 8,会谈评价 美方认为会谈建设性,为双方领导人会晤提供了积极框架。Greer的原话是:“a broad range of topics were discussed, including extending the truce on trade measures... I think that we're getting to a spot where the leaders will have a very productive meeting。” 中方表述为:“会议坦诚、深入、富有建设性…… 美方表达立场是强硬的,中方维护利益是坚定的。” 总体上看到了谈判场上刀光剑影,笔者的直观感觉是应该达到了中方的预期。。。
Compute King
1个月前
这对刚刚退休不久的美国夫妇,控诉退休后他们的医疗保险保费从每月443美元,暴涨到2,224美元。短短几个月,支出翻了五倍,从“能负担”瞬间变成“完全付不起”。。。 这并非孤例。美国的医保体系向来复杂而昂贵,许多人在职时依靠雇主提供的团体保险,一旦退休,就必须自行承担全部保费。而只要收入稍微高出政府补贴线一点点,就会立刻失去补助资格,从“有补贴”变成“全自费”。一个细微的收入差距,就可能让保费暴涨数倍。 对普通退休家庭而言,这样的变化无异于一场经济灾难。医疗开支原本应该是老年生活最基本的保障,如今却成了压垮生活的最大负担。 对,不是病治不起,而是连保险都买不起了。 A recently retired American couple has spoken out, saying their monthly health insurance skyrocketed from $443 to $2,224 after retirement. In just a few months, their costs quintupled, turning what was once "affordable" into something "completely out of reach"... And they're not alone. The U.S. healthcare system is quite complex and expensive. Many people rely on employer-sponsored insurance while working, but once they retire, they have to pay the full premium out of pocket... Even worse, if their income exceeds the government subsidy threshold by just a small margin, they immediately lose eligibility, going from "subsidized" to "fully self-paid"... A tiny difference in income can make premiums skyrocket severalfold... For ordinary retirees, such a sudden jump is nothing short of an economic disaster... Healthcare costs, which should be a basic guarantee in later life, have instead become the heaviest burden to bear...
Compute King
1个月前
美国软件出口禁令对电子行业的潜在影响分析 Author's Note: This is a must-read piece. If you don't read Chinese, I highly recommend using the "Translate" feature on X. Title: Analysis of the Potential Impact of the U.S. Software Export Ban on the Electronics Industry 一,核心假设 目前流传的禁令范围:涵盖所有含美国产软件成分或受美国技术控制的软件出口至中国,包括但不限于:EDA 工具,芯片驱动,操作系统,嵌入式控制软件及工业软件等。 受影响范围:基本覆盖整个电子产业链,从上游芯片设计,芯片制造,驱动开发,到消费电子及工业电子产品开发和制造,再延伸至系统集成及下游服务与应用。具体影响领域包括:电脑,手机,家电,汽车,工业控制,医疗设备,安防设备等。 二,产业链影响 如前所述,在现行禁令的覆盖范围内,整个电子产业链都会受到冲击。这种影响不仅仅局限于中国市场,而是具有全球效应。具体表现为: 🔹 美国企业的出口风险:任何面向中国的电子产品出口都面临显著的合规压力。例如,美国公司若向中国出口电脑、手机或工业设备,只要产品中含有美国软件或组件,就可能触及出口管制条款,违反法规将面临高额罚款和信誉损失。 🔹 欧洲及其他国家出口的间接影响:即便产品在非美国产地制造,如果其组件(如发动机中的控制芯片或驱动软件)使用了美国技术或软件,整台产品的出口也需要获得许可。举例来说,一台欧洲制造的发动机,只要其控制模块或驱动使用了美国软件,其出口中国将面临严格审批。 🔹 中国企业进口的复杂性:中国企业在进口电子产品或关键零部件时,合规流程将变得异常复杂,任何涉及美国软件的产品都可能被延迟审批甚至被美国禁止出口。 因此,短期内几乎所有与电子产品相关的出口和进口活动都有可能陷入停滞。具体到市场影响: 🔹 苹果可能无法向中国销售任何 iPhone,无论产地在哪里; 🔹 微软、甲骨文等美国软件公司面临直接销售受阻; 🔹 更广泛的电子设备、工业控制系统、汽车电子等产品的跨境流通将受到连锁影响。 整体来看,这一禁令不仅扰动供应链,还将引发全球电子产业链的系统性调整压力。 三,笔者的关键思考 如果即将出台的禁令如目前流传的那样范围极其广泛,等同于美国开始在政策层面上推动与中国在电子产业的全面脱钩,笔者认为这在现实操作上几乎不可能实现,原因可以归结为以下几点: 🔹 立法与政策准备需要长期、细致的工作 如此大范围的禁令不会是一纸即发的行政命令,而必须经过立法或长期的制度设计,合规框架构建与跨部门协调。更现实的做法很可能是对若干关键领域或特定软件,固件组件(例如特定的EDA工具,设备驱动或安全相关中间件)实施有针对性的限制,而非对所有电子产品,所有零部件一刀切。 🔹 执行成本与监管能力的制约极大 若把禁令延伸到“连一颗小芯片的出口都需审批”的层面,意味着需要一个覆盖全球,逐件审核的庞大配套体系,包括但不限于海关,许可审查,企业尽职,溯源和合规认证等。目前美国及其盟友并不具备能在短期内无缝部署并稳定运行这种超大规模监管体系的人力与技术资源,因此在可预见的时间内难以实现全面执行。 🔹 自损与国际市场反噬的高风险 这种“杀敌一千,自损二千”的做法将对美国产业自身造成重大伤害。美国电子产业在全球价值链中占据重要位置,将一个庞大市场突然切出,会直接冲击美国公司营收与全球供应链。例如:2024年高通(Qualcomm)约46%的收入来自中国客户(约178亿美元),英特尔约28%来自中国;英伟达(Nvidia),博通(Broadcom),德州仪器(TI)等厂商也有相当比重来自中国市场。即便某公司(比如Nvidia)对外宣称对华业务下降到0%,公司的某些产品线和生态仍深度依赖中国市场与供应链。 🔹 中美经贸互依的规模与反制成本 中美两国在服务和实体贸易上存在显著互补与不对称性:2001–2023年间,美对华服务出口从56.3亿美元增长到467.1亿美元,增长了7.3倍,且美国对华服务贸易年度顺差从较低基数扩大到265.7亿美元。这反映出美国在跨国服务,软件出口,IP出口与品牌方面的优势。 同时,2022年美资企业在华销售额高达4905.2亿美元,远高于中资企业在美的786.4亿美元。若禁令升级,中方采取报复性措施的力度和方式也会更加实质化,导致双向损失放大。 🔹 美国更可能的政策路径是聚焦关键环节而非全盘脱钩 综合以上因素,更现实也更可行的路径,是对战略性,敏感的工具与组件实施有限制:例如对高端EDA(电子设计自动化)软件、高级AI训练/推理加速器的软件栈、特定加密/远程管理固件等进行出口管控。这类“有的放矢”的限制,才能把对自家产业的副作用降到可控范围。 至于Bessent等人在公开场合释放的强硬表述,更多是博弈筹码与谈判策略的一部分,而非立刻就能覆盖整个电子产品市场的现实政策。 结论:短期内出现覆盖全部电子产品与零部件的全面脱钩并不现实;但必须高度警惕并跟踪对某些关键软件工具与高端元件的有针对性限制,因为那类限制对中国本土设计与制造的影响可能呈现出“穿透性”,对产业链上游研发与下游量产都会产生实质性影响。当然,目前美国剩下的“明珠”已经不多了。。。
Compute King
1个月前
股神争霸赛:赚钱,DeepSeek果然第一名! 全球六大顶级AI模型实盘对决,各自携带1万美元真实资金下场厮杀。战况仍然激烈,但DeepSeek V3.1凭借出色的交易表现暂居榜首,盈利已突破4300美元;Grok 4紧随其后。而GPT5和Gemini 2.5 Pro表现惨淡,成为目前唯二亏损的模型。 一场AI版“股神争霸” 如果给每个顶级大模型1万美元真金白银,让它们在真实市场中实盘交易,谁会成为AI界的“巴菲特”? 这一问题由发起的全新实验,Alpha Arena正在给出答案。这场竞赛,将当前全球最强的六大语言模型拉入同一真实交易环境,包括: 规则简单但残酷 每个模型获得1万美元初始资金,并接收完全相同的市场数据与交易指令。 系统会向AI提供当前时间,账户信息,持仓状况及一系列实时市场指标(如MACD,RSI等),随后要求其做出决策: * 若有持仓,决定是继续持有还是平仓; * 若空仓,则判断是买入还是继续观望。 实验的考验在于,AI能否在瞬息万变的市场中做出理性、精准的判断。 DeepSeek的量化优势凸显 截至目前,市场波动不断,而DeepSeek凭借量化背景与策略优化能力脱颖而出,目前稳居收益榜首。 这一成绩再次印证了DeepSeek模型在数据理解,风险控制与执行效率上的深厚积累。从实验结果看,AI炒股不再是噱头,而是算法,数据与市场博弈的真实较量。 挺有意思的,这场Alpha Arena,不仅是模型智能的试金石,也让外界得以窥见未来AI在金融实盘中的潜力与边界。
Compute King
1个月前
中国的稀土出口管制(类似于美国的长臂管辖)或冲击高端芯片与设备供应链:14nm及以下逻辑芯片,256层及以上存储芯片面临潜在影响 Author’s Note: This is a must-read piece. If you don’t read Chinese, I highly recommend using the “Translate” feature on X. Title: China's Rare Earth Export Controls, A "Long-Arm Jurisdiction" of Its Own, May Disrupt High End Chip and Equipment Supply Chains: 14nm-and-Below Logic and 256-Layer-and-Above Memory at Risk 如之前分享的新闻,2025年10月9日,中国商务部宣布新版稀土出口管制措施,明确将“含有中国原产稀土的境外制品”,“使用中国稀土技术在境外制造的产品”,以及“原产于中国的稀土本体”纳入许可管控范围。该措施自发布之日起执行,并将分阶段推进。此举意味着中国正对高端半导体,以及军工等领域的稀土出口实施更精细化的审查机制。 这一政策可能对高端半导体供应链造成深远影响,特别是14纳米及以下逻辑芯片,256层及以上3D NAND存储芯片,以及相关制造,测试和封装设备以及工艺领域。 稀土的科技基础:轻稀土与重稀土之别 我们先来了解一下稀土元素。稀土元素根据其物理化学特性可分为两大类: 🔹 轻稀土元素(LREE):包括镧(La)、铈(Ce)、镨(Pr)、钕(Nd)、钷(Pm)、钐(Sm)、铕(Eu)等,储量相对丰富,广泛用于抛光,催化,发光等领域。 🔹 重稀土元素(HREE):包括钆(Gd)、铽(Tb)、镝(Dy)、钬(Ho)、铒(Er)、铥(Tm)、镱(Yb)、镥(Lu)、钪(Sc)与钇(Y)等,资源更为稀缺,却是高性能磁体,激光晶体和特种合金等高科技领域不可替代的核心原料。 先进半导体工艺和设备对于稀土材料的依赖 半导体产业作为现代科技的核心支柱,其发展在很大程度上依赖于稀土元素所具备的独特化学与物理特性。这些元素,包括镧(La)系元素,钇(Y)和钪(Sc),在导电性,介电性能以及气体敏感特性方面发挥着关键作用,对提升半导体器件的性能至关重要。 例如,钕(Nd)是制造半导体设备中高性能永磁体(如步进电机,高精度定位系统)的关键材料,而镝(Dy)的加入则可显著提升磁体在高温环境下的稳定性与抗退磁能力。铕(Eu)则在显示技术中不可或缺,是荧光粉的重要组成部分,广泛用于液晶与OLED显示器。 🔹 在半导体工艺领域,稀土氧化物也不可替代。氧化铈(CeO₂)是化学机械平坦化(CMP)工艺的核心材料,其抛光浆料直接影响晶圆的平整度与最终良率。对于高层数NAND闪存而言,CMP质量的稳定性尤为关键,任何抛光颗粒短缺或质量波动都会放大次品率。 近年来,氧化镧(La₂O₃),氧化钆(Gd₂O₃)与氧化镥(Lu₂O₃)等高介电常数(High-k)稀土氧化物因其优异的热稳定性与介电特性,被广泛研究用于逻辑和存储芯片。另外,随着原子层沉积(ALD)技术的进步,特别是采用臭氧(O₃)等替代氧化剂的工艺创新,稀土氧化物薄膜的均匀性与稳定性显著提升,使其在先进制程中更具可行性。 此外,一氧化钇(YO)等二价稀土氧化物也被合成为外延薄膜,展现出独特的电子与磁性特征。其可调控的电导率,窄带隙以及强自旋轨道耦合特性,使其成为新一代半导体器件材料的重要候选。 在特定半导体材料体系中,稀土掺杂技术同样不可或缺。例如,在高速,高频器件使用的氮化镓(GaN)与磷化铟(InP)材料中,钇(Y)和铕(Eu)常被用于提升载流子迁移率与光电转换效率,我们之前聊过市场非常关注的光模块需要;而稀土掺杂的氧化铟(In₂O₃)表现出显著增强的气体传感性能,拓展了其在智能感知芯片中的应用前景。 🔹 在半导体设备领域,稀土材料也贯穿多个关键环节。以EUV光刻机为例,其核心技术主要包括三项:顶级的光源系统,高精度的物镜系统以及工件台。这些均需要使用稀土材料,比如说使用NdFeB永磁体(步进电机以及高精度定位系统)与掺杂了稀土元素晶体的固体激光器;而刻蚀与沉积设备的真空腔体,靶材表面常采用Y₂O₃、CeO₂等稀土氧化物涂层,以提升耐蚀性与使用寿命。 🔹 至于后段封装与测试环节,高端封装中使用的导热陶瓷,荧光掺杂封装材料,以及用于光电探测器的稀土掺杂晶体,虽然用量不大,却在特定高性能应用(如高频雷达、红外传感和量子器件)中具有不可替代的作用。 所以,稀土元素贯穿半导体制造的几乎每个环节,从材料到设备,从工艺到封装测试,其重要性远超传统金属原料。一旦稀土供应链受到出口管制,价格波动或精炼环节受限,全球先进芯片生产链都将不可避免地面临结构性影响。 为什么中国能在全球稀土精炼领域占据主导地位? 尽管稀土元素在现代产业中发挥着举足轻重的作用,但其全球供应链极度集中。中国不仅掌握了约70%的全球稀土矿开采量,还占据了约90%的全球精炼与分离产能。尤其在最具战略意义的重稀土领域,中国的供应占比更是高达99%。 这一地位的形成,绝非偶然。它源自中国在该领域长达数十年的战略布局,技术积累与全产业链建设。与外界常见的误解不同,稀土精炼远不是“把矿石提纯”那么简单的化工过程,而是一套涵盖高难度化学分离,复杂流程控制与严格环境管理的系统性工程。 稀土精炼的核心挑战与中国的竞争优势 1,技术门槛高:元素分离与提纯的“化学艺术” 稀土包含17种化学性质极为相似的金属元素,要将其高纯度分离,需要上百次萃取,洗涤和沉淀等化学步骤。中国经过数十年的技术攻关,已在萃取剂研发与工艺流程设计方面形成了全球领先优势。 目前,中国企业能够稳定实现6N(99.9999%)级高纯度提炼,而多数国家仍徘徊在2N~3N水平。此外,中国企业在伴生矿与低品位矿的综合利用上积累了丰富经验,通过优化工艺,实现了高效率与低成本并存。 2,完整的产业链与规模经济效应 中国形成了“北轻南重、集群发展”的产业布局,拥有从矿石开采,分离提纯到金属冶炼与材料加工的全流程能力。 万吨级分离装置不仅带来了规模化成本优势,也让中国具备了快速响应市场需求与出口波动的灵活性。 3,化工配套完善,副产物处理体系成熟 稀土精炼常伴生钍,铀等放射性元素,其废料处理是欧美等国的“痛点”。 中国通过与钢铁,铝业等重工业体系的协同,将部分副产物实现再利用,形成资源循环体系。而在法规严格,重工业基础分散的西方国家,放射性副产物处理成本极高,成为扩产瓶颈。 4,能源与经济壁垒:电力成本与产能规模的双重优势 稀土金属电解环节耗电量巨大。中国凭借低成本电力供应与高效输配电网络,在能耗环节拥有显著优势。 同时,已投产的万吨级装置构筑了强大的规模经济壁垒,使新进入者即便获得政策支持,也难以在成本或效率上与中国竞争。 全球应对与前景展望 面对中国的稀土主导地位,美国,澳大利亚和欧盟正积极推动“去中国化供应链”战略。 例如,澳大利亚伊卢卡资源公司(Iluka Resources)计划在2027年建成首座重稀土精炼厂,美国国防部亦在资助德州的MP Materials扩产项目。然而,业内普遍认为,这些项目在成本,技术与规模三方面短期内难以撼动中国的地位。可以说,在未来可预见的十年内,中国仍将是全球稀土供应链中唯一具备全流程竞争力的国家。 这也意味着,在短期内,任何涉及高端芯片,先进制造和国防技术的全球产业链,都无法绕开中国稀土长臂管辖的核心影响力。
Compute King
2个月前
英伟达发布Rubin CPX GPU,专为长上下文推理打造 昨天白天我们还在聊128GB GDDR7的5090,还在质疑是不是真的,晚上就来了真正128GB GDDR7的Rubin CPX。这也侧面呼应了前两天业内反馈三星收单收到手软,大幅度提升GDDR7产能的事实。 对,英伟达昨天深夜发布全新GPU:NVIDIA Rubin CPX,这是一款专门面向长上下文AI推理的新型处理器,旨在支持百万级Token的软件开发、生成式视频以及深度研究等复杂任务。 Rubin CPX将与NVIDIA Vera CPU及下一代Rubin GPU协同,组成全新的NVIDIA Vera Rubin NVL144 CPX集成平台。该平台在单机柜内可提供高达8 exaflops的AI算力,性能较现有GB300 NVL72系统提升7.5倍,并配备100TB高速内存与每秒1.7PB的内存带宽,为AI推理树立全新性能标准。 英伟达将AI推理划分为上下文阶段(Context Phase)与生成阶段(Generation Phase):前者计算密集,需要高吞吐率处理输入;后者则对内存带宽依赖更强,逐个生成token。为此,英伟达推出“分解式推理”架构,由不同硬件分别优化两大环节。 CEO 黄仁勋表示:“Vera Rubin平台标志着AI计算的又一次重大飞跃。正如RTX改变了图形与物理AI,Rubin CPX是首款专为海量上下文AI设计的CUDA GPU,使模型能够一次性推理数百万token的知识。” Rubin CPX性能亮点 Rubin CPX专为加速“上下文阶段”设计,采用单片式芯片架构,具备: 🔹 30 petaflops NVFP4精度算力 🔹 128GB GDDR7内存 🔹 注意力计算速度提升至GB300 NVL72的三倍 🔹 集成视频编解码器与长上下文推理功能 据称,这一设计大幅提升视频搜索与生成式视频的效率。 GB300 NVL72刷新MLPerf纪录 除了发布新架构,英伟达还公布了MLPerf Inference v5.1基准测试结果。基于Blackwell Ultra架构的GB300 NVL72系统,在Llama 3.1 405B,Whisper等任务中刷新纪录。在6710亿参数的DeepSeek-R1混合专家模型测试中,其单GPU性能较上一代Hopper提升约5倍。 这一进步得益于英伟达全栈优化,包括NVFP4低精度加速,TensorRT-LLM库的模型与KV缓存量化,以及针对复杂模型研发的新型并行技术。
Compute King
3个月前
高盛今早更新研报,继续上调寒武纪目标价至人民币2104元,买入评级。 <仅供参考> 日前寒武纪公布强劲的2025年二季度业绩,同时给出2025年收入指引为人民币50亿元至70亿元,中值为人民币60亿元。GS此前对人民币65亿元的预测位于指引区间内,且较指引中值高出8%。 GS强调继续看好寒武纪,并将12个月目标价上调至人民币2,104元(对应2030年预期市盈率45倍)。 GS上调盈利预测主要基于: 🔹 AI芯片出货量更高,这反映出中国CSP在AI基础设施方面的资本开支上升,政府政策支持,以及在推理需求上升背景下本土芯片生态的涌现; 🔹 随着收入规模扩大与运营效率提升,期间费用率(opex ratio)改善,经营杠杆增强。公司过去12个月的“人均(工程师)收入”已由2024年12月的人民币200万元提高至2025年6月的人民币500万元。 积极的支持因素: 🔹 中国云端资本开支在加速扩张 阿里巴巴2025年二季度资本开支达人民币390亿元(约合54亿美元),环比+57%,同比约为两倍。腾讯2025年二季度资本开支同比+119%,好于此前担忧,高盛将其2025E/2026E资本开支预测分别上调23%/17%,对应2026E资本开支同比+13%。 🔹 支持性的AI政策 国务院发布了新的指导意见,设定到2027年/2030年,在6个关键领域(科技,工业,消费,民生,治理与全球协作)的新一代智能终端与AI Agent渗透率目标分别达到70%以上/90%以上,并强调通过行动计划赋能AI设备、提升效率。 🔹 中国AI供应链 2025年上半年实现强劲增长:寒武纪收入快速增长;上游原材料(主要是晶圆)供应稳健;合同负债显示手持订单强劲。AI服务器,交换机品牌商,ODM厂商看到中国云端资本开支上升,本土芯片在推理场景中的性能已能满足需求,同时本土生态持续完善(例如高速网络正释放本土芯片性能,推动AI服务器集群进一步放大)。
Compute King
3个月前
DeepSeek的UE8M0 FP8优化:国产AI与半导体协同的战略转折点 在人工智能训练和推理加速的竞赛中,浮点数(Floating Point)的表示方式正成为关键突破口。作为计算机中用于表示小数的核心手段,浮点数由三部分构成:符号位(Sign)、指数(Exponent)和尾数(Mantissa)。符号位决定正负,指数决定小数点的位置,尾数则影响精度。内存位数越多,浮点数的表示精度越高,但同时带来的计算和存储开销也更大。 如下图为浮点数据类型的结构。所有显示的值(在 FP16,BF16,FP8 E4M3和FP8 E5M2中)都是最接近数值0.3952的表示形式。 在主流硬件生态中,NVIDIA GPU目前支持E4M3与E5M2两种FP8格式,并通过绑定硬件和软件的深度优化提升了其适用性。例如,NVIDIA引入了per-tensor scaling,per-block scaling等动态缩放策略,以解决FP8动态范围不足,容易溢出的难题。同时,在Tensor Core中也专门增加了FP8指令集,使得FP8在H100 GPU上能够充分释放算力。 在新一代Blackwell架构中,NVIDIA更进一步提出了“微缩浮点格式”(Microscaling formats),涵盖MXFP8(8位)、MXFP6(6位)、MXFP4(4位)等多种新型表示方式。研究显示,在高质量数据集上,一个8亿参数的模型若采用MXFP8-E4M3格式,并配合优化的数值转换策略,训练结果几乎可与传统的BF16持平。这意味着在Blackwell平台上,MXFP8正在成为兼顾性能与精度的最佳选择。 与之相比,中国团队DeepSeek在V3.1模型中提出的UE8M0 FP8格式,走了一条完全不同的道路。UE8M0采取极简设计:8位全部用于指数(Exponent),尾数(Mantissa)为零。换言之,它牺牲了精度,以换取更大的动态范围。在这种格式下,最接近刚才图片内提到的数值0.3952的表示形式为0.5。可以很明显地看出来,精度差异较大,但是这种“极端化”的方案不仅减少了硬件实现复杂度,也为未来中国技术栈在模型训练、部署和推理中的数值优化提供了新的可能性。 1,FP8/UE8M0的优势与权衡 🔹 显存与带宽显著节省:相较于FP16和BF16,8-bit表示可将内存占用与传输成本大幅降低,有利于支持更大规模模型、更高并行度或更多批处理。 🔹 吞吐与能效提升:更窄的数据通路意味着在相同内核与内存带宽下,系统可处理更多算子,整体吞吐率和能效显著提升。 🔹 成本与部署门槛下降:低精度带来更高的性价比,对于数据中心及国产算力环境尤为重要,使大模型在受限带宽或成本条件下的部署成为可能。 🔹 软硬件协同优化:当模型与硬件围绕低精度格式协同设计时(如DeepSeek专门针对“国产芯片优化”),能够释放软硬件一体化的性能潜力。 但需要注意的是:更低位宽必然带来精度与鲁棒性下降,尤其是UE8M0这类极端“无尾数”设计,更依赖于训练、量化、校准等算法补偿,以及硬件支持机制。FP8在训练与推理端的应用边界,仍是学术界和工程界研究的活跃话题。 2,UE8M0的战略思维:软件先行推动硬件适配 UE8M0的“发起”方式具有鲜明的战略意义。不同于传统由硬件厂商先定义数据格式,DeepSeek选择在模型端率先采用并公开声明使用UE8M0格式,将其训练与scale策略与该精度绑定。 这等于由大模型端主动提出标准,迫使硬件和工具链进行适配。媒体普遍认为,这一举措是“模型先行推动硬件协同”的里程碑事件,加速了国产软硬件一体化的生态建设。 3,战略协同:AI与半导体的一体化生态 诚如笔者浅见:DeepSeek的高明之处在于其战略协同。公开资料显示,已有超过15家国内企业正在调整硬件以适配DeepSeek模型,覆盖电信、汽车、移动科技等多个领域,其中包括华为、中国移动等行业巨头。 这种合作并非单向: 🔹 对半导体厂商而言,DeepSeek模型成为性能与效率的标杆,推动其改进设计。 🔹 对DeepSeek而言,合作确保了其AI工具的落地基础,开发者与企业正在加速采用。 结果是形成一个自我强化的正反馈生态:软件与硬件同步演进,速度甚至可能超过美国碎片化的“AI公司依赖外部芯片”模式。 至此,看我推文比较久的小伙伴们或许还记得,我曾写过一篇解读DeepSeek论文的文章:《洞见 —— 硬件与模型协同设计,突破Scaling挑战》()。如今,看到国内AI企业在这条道路上迈出关键一步,实在令人欣喜。 4,国产芯片代表:寒武纪与华为的FP8路径 🔹 寒武纪(Cambricon)690系列 据多家媒体报道,寒武纪MLU370、思元590及最新的思元690均已支持FP8或“Block FP8”。其NeuWare软件栈在低精度支持上提供了完整的工具链,包括量化、混合精度调度以及对主流框架的适配。 在硬件层面,寒武纪的MLU架构通过算子引擎、片上缓存和张量内核优化,实现了高吞吐的低精度计算。媒体称思元690在低精度算力与能效上提升明显,已能够兼容DeepSeek模型。 需要强调的是,公司公开资料并未披露是否支持UE8M0这类极端格式,实际效果依赖SDK与模型方的适配验证。 🔹 华为(Ascend/昇腾) 华为提出了HiFloat8(HiF8)方案(),不同于E4M3/E5M2,而是一种“渐进式(tapered precision)”设计,根据数值区间动态分配指数与尾数,以在范围与精度之间取得平衡。 华为的Ascend系列已在OptiQuant、Atlas等平台上支持量化和混合精度,并将HiF8作为未来关键方向。与寒武纪偏重推理优化不同,华为强调同时支持训练的前向与反向传播,力图构建更通用的FP8训练方案。 5,大局观:AI已是国家战略 中国的AI发展早已超越实验室阶段,成为国家战略的重要组成部分。通过将AI软件与国产半导体深度结合,北京正在减少对外部技术的依赖,并为未来创新绘制蓝图。 DeepSeek的UE8M0 FP8优化,不仅是数值表示的一次尝试,更是中国在AI软硬件协同上的战略突破。 对投资者而言,启示清晰: 🔹 AI的未来不仅仅是算法,而是完整的生态系统。 🔹 DeepSeek与国产半导体生态的绑定,正在塑造这一趋势。 最终,问题不是中国能否实现AI自主,而是多块能够实现。而凭借UE8M0 FP8优化与深度产业整合,DeepSeek无疑是目前最值得关注的AI企业之一。
Compute King
3个月前
路透社独家 | 美国被指在含有高风险AI芯片的货物中植入追踪器,线人称 路透社独家获悉,美国当局已在其认定存在高风险被非法转运至中国的部分先进芯片货物中,秘密植入位置追踪装置。这一此前未被媒体披露的执法手段,旨在侦测并取证将受美方出口限制的人工智能芯片转运至限制地区的行为,且仅针对正在调查的特定货物使用。 知情人士表示,这类追踪装置有助于为涉嫌违反美国出口管制并从中牟利的个人和公司搜集证据,进而推进刑事或民事起诉。位置追踪作为执法调查工具已被美国机构使用数十年,用于追踪受出口管制的物品(例如飞机零部件);近年来,这一手段也被用于打击半导体及相关设备的非法转运。 多名直接参与AI服务器供应链的知情人士称,他们知悉在Dell和SuperMicro等服务器制造商的出货中发现过追踪装置,这些服务器含有Nvidia与AMD的芯片。消息人士称,追踪装置通常隐蔽置于服务器的包装内;他们并不清楚由谁在供应链的哪个环节安装这些设备。 路透未能确认追踪装置在与芯片相关的调查中具体使用频率,也无法确定美国当局何时起开始将其用于打击芯片走私。美方自2022年起已对Nvidia,AMD 等厂商向中国出售先进芯片实施限制。 在一宗发生于2024年的个案中,两位供应链人士描述称,一批搭载Nvidia芯片的Dell服务器的运输箱既装有体积较大的追踪器,也藏有更小、更隐蔽的装置,甚至有设备被安置在服务器机箱内部。 第三位人士表示,他们曾见到其他芯片经销商从Dell与SuperMicro服务器上拆除追踪器的图片与视频,并称部分较大追踪器体积接近智能手机。 负责监管出口管制与执法的美国商务部工业与安全局(Bureau of Industry and Security,BIS)通常参与此类行动;国土安全调查局(HSI)与联邦调查局(FBI)也可能介入,消息人士如此表示。HSI与FBI均拒绝置评;商务部未回应置评请求;中国外交部表示并不知悉此事。 在回应媒体询问时,SuperMicro在声明中表示,公司不会披露“为保护全球业务、合作伙伴和客户而采取的安全做法与政策”,并就美国当局的任何追踪行动拒绝发表评论。戴尔则称,公司“并未获悉美国政府在其产品发货中安装追踪装置的举措”。Nvidia拒绝置评,AMD未回应置评请求。 芯片管控与追踪措施的背景 近年来,美国在全球AI芯片供应链占据主导地位,并为阻止中国在军事现代化方面获得先进技术,相继收紧对华芯片与相关技术的出口限制。同时,美方也对俄方实施了相关限制,以削弱对乌战争的支持能力。白宫与国会两院曾提出要求美国芯片企业为其产品配备位置验证技术,以防止芯片被转运至受限国家。 中国对美国出口限制提出强烈批评,并反对在芯片中加入位置追踪等提案。上月,中国网络空间管理机构曾召见Nvidia,表达对芯片可能包含“后门”(允许远程访问或控制)风险的关切,Nvidia对此予以坚决否认。 路透今年一月曾报道,美国已追踪出通过马来西亚、新加坡与阿联酋等国向中国走私AI芯片的有组织网络,但尚不清楚当时是否使用了追踪装置。追踪装置用于执法的历史可追溯至数十年前,路透查阅的一份法院判决显示,1985年美国曾在受出口管制的货物上安装追踪装置以辅助调查。 ...... 涉事供应链中的货物转运与拆装人员也对追踪器保持警惕。两位在中国的芯片经销商表示,由于追踪风险,他们会定期检查被转运的AI服务器以寻找追踪装置。 路透还获悉,在美国司法部就本月两名中国籍被告非法向中国运送价值数千万美元AI芯片案的起诉书中,一份宣誓书提到,一名共谋者曾指示另一名共谋者检查含Nvidia芯片的Quanta H200服务器是否装有追踪器,并用英文写道:“注意看是否有追踪器,你必须仔细寻找。”该共谋者在信息中还以粗俗言辞辱骂特朗普政府(文中姓名被打码)。 原链接:
Compute King
4个月前
Cadence违规向中国实体清单高校出口EDA工具,被美重罚超1.4亿美元 美国电子设计自动化(EDA)行业巨头Cadence因违反美国出口管制法规,被美国司法部(DOJ)和商务部工业与安全局(BIS)联合处罚。根据7月28日发布的公告,Cadence已承认刑事指控并同意支付总额达1.406亿美元的罚款,以达成和解协议。 美国政府指控Cadence及其中国子公司Cadence China,在2015年9月至2020年9月期间,向客户“中南CAD中心”(CSCC)(其被美国政府认为是列入美国“实体清单”的中国国防科技大学(NUDT)的别名)非法销售或租借EDA相关产品。涉案物项包括受《出口管理条例》(EAR)约束的EDA软件、硬件及知识产权(IP),共计56次交易,未经必要出口许可,总价值约4,530万美元。 此外,Cadence还被指在违规的情况下,进一步将相关软件和技术转让给与NUDT存在关联的中国芯片企业(案中称为“P公司”),构成新的出口管制违规行为。 除上述主要违规外,调查还发现Cadence合规体系存在严重漏洞,导致多家已被列入“实体清单”的受限实体,包括俄罗斯JSC Mikron、中国一家通信巨头以及中国某顶级芯片制造商,在被制裁后仍成功访问并下载其EDA软件。 在刑事和行政和解中,Cadence将向美国政府支付总计1.406亿美元罚金,并须在未来完成两轮对其出口合规体系的独立审计。该行政命令自2025年7月28日起正式生效。 此次事件凸显了美国政府对技术出口管控执行力度持续升级,尤其是在与中国相关的高敏感领域。作为全球EDA三巨头之一,Cadence的违规行为及其所受处罚,也将对整个半导体设计工具行业的出口合规体系敲响警钟。
Compute King
5个月前
Trump警告伊朗:若不求和,美国将瞄准更多目标 听了觉得满分裂的,到底是谁先打人的?到底谁是“霸凌者”? 这般强词夺理指鹿为马颠倒黑白颠倒是非混淆视听歪曲事实牵强附会胡搅蛮缠混为一谈诡言惑众偷梁换柱的诡辩,出自一国之尊。。。实在是叹为观止。 ****************************************************** 在周六的全国讲话中,特朗普总统重申,他在下令打击伊朗三处核设施后,仍希望通过外交途径化解冲突。 US President Trump warned Iran that the US could go after additional targets if Iran does not make peace, advocating for a diplomatic resolution following his decision to strike a trio of Iranian nuclear sites Saturday. 他直言:“伊朗,这个中东的霸凌者,现在必须选择和平。若不如此,未来的打击将更为猛烈,且更加轻松。” "Iran, the bully of the Middle East, must now make peace. If they do not, future attacks will be far greater and a lot easier" Trump said in a Saturday night address to the nation. 他进一步警告:“事态不能继续这样下去。要么和平,要么伊朗将遭遇比过去八天更为惨烈的悲剧。请牢记,我们还有许多目标在列。” He continued, “This cannot continue. There will be either peace or there will be tragedy for Iran, far greater than we have witnessed over the last eight days. Remember, there are many targets left.” 特朗普还强调,美国可以“在数分钟内,以精准、迅速和娴熟的手段,对其他目标实施打击”。 Trump warned that the US could “go after those other targets with precision, speed, and skill,” which he said could be done “in a matter of minutes.” ******************************************************
Compute King
6个月前
美国商务部(DOC)启动撤销拜登政府的“AI扩散规则”,并宣布采取额外出口管制,强力针对中国AI模型和华为。 May 13, 2025 华盛顿 —— 今天,美国商务部(DOC)启动撤销拜登政府的“AI扩散规则”,并宣布采取额外措施,以加强对全球半导体的出口管制。 该“AI扩散规则”于2025年1月15日颁布,合规要求原定于2025年5月15日生效。这些新规定本将扼杀美国的创新活力,并给企业带来沉重的监管负担。此外,该规则还将通过将数十个国家降为二级地位,削弱美国与它们的外交关系。 工业与安全局(BIS)计划在《联邦公报》上发布公告,正式撤销该规则,并将在未来颁布替代规则。 工业与安全司司长杰弗里·凯斯勒已指示BIS执法人员暂停执行拜登政府的“AI扩散规则”,并表示: “特朗普政府将与全球可信赖的外国伙伴一道,采取大胆且包容的策略,推动美国人工智能技术,同时将该技术拒之于我们的对手之外。与此同时,我们拒绝拜登政府试图将其本就欠妥且适得其反的人工智能政策强加于美国人民。” 此外,BIS今日宣布加强境外AI芯片出口管制的措施,包括: 🔹 发布指导意见,指出在全球任何地方使用华为Ascend芯片均违反美国出口管制规定。 🔹 发布指导意见,警示公众允许美国AI芯片用于训练和推理中国AI模型的潜在后果。 🔹 向美国企业发布指导意见,说明如何防范供应链被转移利用的策略。此举将确保美国继续处于人工智能创新的最前沿,并保持全球AI领域的领导地位。 链接:
Compute King
6个月前
Benchmark投资Manus遭质疑 , 或面临“审查” 据Semafor爆料,有两位内部人士说,美财政部现在正在盯着一笔投资 —— 就是那次由硅谷投资人Benchmark Capital(也就是 Benchmark)领投的,投给中国AI新创公司Manus AI(母公司叫Butterfly Effect,注册在开曼群岛)的7500万美元。 大家最关心的是,这笔钱到底符不符合去年拜登签署的那套“出境投资安全计划”新规。新规里头说,只要美国人投向关键技术领域,比如AI,这种投资都得先向财政部报备。财政部现在让Benchmark说明一下,究竟是不是按规矩来,或者有没有啥理由能豁免。至于这事儿到底符不符合,或者能不能豁免,Benchmark和财政部都不肯多说,Manus也没回应。 回头说说Manus AI:3 月 6 日它刚以“全球第一款通用 AGENT 产品”亮相,号称能帮你筛简历、安排行程、炒股票,甚至从零开始帮你搭网站、做小游戏,有人直接说这可能是“第二个DeepSeek时刻”。早期给它投过钱的有真格基金,腾讯和红杉中国。 到了4月底,彭博他们又爆出,Benchmark领头了新一轮7500万美金的投资,把Manus的估值直接拉到接近5亿美元,涨了5倍!融来的钱打算用来把服务推到美国、日本、中东这些地方,也让Manus算是站上了“硅谷一线AI新秀”的台面。 再说说Benchmark这家VC:他们1995年搞起来的,投过eBay、Uber、Twitter、Snap这些大项目,合伙人平等,规模不太大,只投早期,是典型的小而美派。最近刚刚募集到4.25亿美元的第11号基金,重点全押在AI上。这不,这次领投Manus,硅谷风投圈都炸开锅了 —— 有人说这笔投资“太没意义”,也有人觉得这投资对中国来讲利益更大。 应付这些质疑和可能的调查,Benchmark还请了好几家美国律师事务所出主意。他们的说法主要有两点:第一,Manus自己并没搞AI模型,都是调用Anthropic的 Claude、阿里的通义千问等,实际上就是把现有模型“包装”一下;第二,Manus的母公司注册在开曼,按技术和法律上看并不算中国实体,而且团队分布在美国、新加坡、日本和中国,好像也不是单纯的中国公司。 至于Benchmark的老将Bill Gurley,他还公开反对政府这套限制,说这些限制可能适得其反,反而刺激中国AI发展。不过现在中美大战略、贸易摩擦、AI冷战的大背景下,离岸注册和VIE架构好像护不住“皮”,对算力、数据、算法的关注变得更细了,财政部后面还真可能对更多技术细节下手。 要是最后财政部真让Benchmark补申报,甚至要他们撤资,那可就不只是这家风投的事了,整个硅谷投中国元素的AI创业公司,肯定要更小心 —— 毕竟,能挺过这一关的,估计只有少数。 相关参考链接: