Compute King

统计数据

41

文章

0

粉丝

0

获赞

853

阅读

2周前

从HBM到HBF：2027~2028商业化在即，AI推理先尝红利 From HBM to HBF: Commercialization Nears in 2027~2028, with AI Inference Benifits First 笔者注：韩国科学院（KAIST）教授，同时被称为“HBM之父”的Joungho (Jeong-ho) Kim前几日在“HBF 研究成果介绍及技术发展战略”上说，“在人工智能时代，每人将需要 100TB 的存储容量。这是一个名副其实的 “存算饥渴” 时代。未来，高带宽内存（HBM）将负责算力支撑的高速读写，而高带宽闪存（High Bandwidth Flash，HBF）将承担海量数据的存储需求”。当然，有的报道更是明确到了，“到2030年代中期，AI Agents普及时，每人将需要100TB的存储容量。”对的，WD也说为了应对数据暴增的时代，其在2029年的HDD产品容量将达到100TB。 “In the AI era, 100TB of memory per person will be required. It’s the so-called ‘memory-hungry’ era. In the future AI era, high-bandwidth memory (HBM) will handle speed, while high-bandwidth flash (HBF) will manage capacity.” Link to the report: 在HBM推动AI算力狂飙的同时，存储侧的瓶颈正在被重新定义。Kim教授明确提出，仅靠HBM已难以跟上AI演进节奏，行业需要一种兼顾高带宽与超大容量，且功耗显著更低的新型存储形态，高带宽闪存（HBF）。他预计，HBF商业化落地时间将落在2027年底至2028年初，并且初期将优先应用于AI推理场景。说到这里，笔者只想感慨：Intel当年和Micron力推的3DXPoint（Persistent Memory），恐怕都要按不住棺材板了，不是它不对，而是生得太早。嗯，Intel起个大早，却注定难以凭一己之力撬动整个产业架构的迁移，只能在时代的节拍之外，提前把答案写在了试卷上。为什么HBF会在“推理”先爆发？ Kim教授将HBM比作GPU旁的“专属书架”，而HBF更像“巨型图书馆”：前者解决热数据的极致带宽，后者面向多模态时代海量数据与特征库的数据访问与就近供给。随着图像，视频，音频，文档深度融合，GPU即使算得快，也会被“从远端存储搬运数据”拖慢。这类瓶颈在推理侧更常见：推理并不总是需要像训练那样持续喂满算力，但却高度依赖大规模知识库，检索数据，历史特征的快速调取。技术路线：把NAND做成“高带宽，可堆叠，靠近GPU”的存储层从产业口径看，HBF被频繁描述为“NAND版HBM”：其核心思路是利用NAND的高密度与低成本优势，通过垂直堆叠与接口，封装，系统架构协同，把闪存从远端块存储推向“更靠近计算，具备高吞吐”的温数据存储。 HBF的定位不是替代HBM，而是补足HBM在容量与成本上的先天约束，形成“HBM（热数据）+HBF（温数据）”的混合存储架构。产业化进度：标准先行，样品在2026下半年，系统在2027 推动HBF从概念走向生态的关键一步，是规格与标准化。SanDisk与SK hynix在2025年8月宣布签署合作备忘录，联合推进HBF技术规范制定与生态构建，直指“下一代AI推理的容量与性能”缺口。双方公开口径中，目标是在2026年下半年提供HBF样品，并期待首批搭载HBF的AI推理设备在2027年初出现。在此背景下，Kim教授给出的“2027年~2028年”商业化时间窗，与产业链“先标准，再样品，后系统”的节奏形成呼应：2026（样品/规格成熟）→ 2027（系统验证/推理先落地）→ 2027末~2028（规模化商业化）。谁最可能吃到第一波红利？ Kim教授的判断是：HBF将为同时掌握HBM，NAND工艺与先进封装的厂商提供新机会，尤其是三星电子与SK Hynix这类具备“存储+封装”一体化能力的玩家，更容易把HBF做成可量产，可被系统接受的产品形态。与此同时，行业也在探索多种实现路径。例如，Kioxia曾展示过面向AI的HBF原型模块思路：以更靠近I/O与总线的方式提供高吞吐与TB级容量，强调“更接近内存侧”的数据供给模式。 HBF真正改变的是“存储分层”和“系统架构成本曲线” 如果把AI系统看成“算力~内存~存储”三段式，过去两年大家主要在HBM上堆带宽；但接下来，决定推理性价比的往往是：你能否把更大规模的数据，更低功耗地放到更靠近GPU的位置。HBF的意义不止是“更快的NAND”，而是把NAND变成一个介于HBM与存储之间的一层： 🔹 容量扩张更容易（NAND密度与成本优势） 🔹 功耗压力更小（相比用HBM去硬顶容量） 🔹 推理场景更匹配（大知识库，多模态温数据就近访问）未来两年值得重点观察三件事： 🔹 接口，协议与控制器架构是否统一。 🔹 封装与散热在机柜级能否规模化， 🔹 “HBM+HBF”的软件栈（缓存，预取，数据放置策略）是否跟上。这三者决定HBF能否从“工程样机”走向“可复制的系统产品”。图片1：SanDisk HBF Concept 图片2：GPU with HBF，一个GPU4TB内存不是梦。

1个月前

史诗级涨价：存储器价格季度涨幅上修至近翻倍编者注：TrendForce最新预计，2026年第一季度常规DRAM合约价将上涨90-95%，NAND闪存也将上涨55-60%，超过一个月前预测的涨幅达35个百分点。最新市场数据显示，存储芯片市场正在经历前所未有的价格上涨周期。TrendForce在2月2日的最新报告中指出，2026年第一季度常规DRAM合约价格预计将上涨90-95%，NAND闪存价格预计上涨55-60%。这一预测相比一个月前大幅上调，当时机构预计的涨幅分别为55-60%和33-38%。各类存储产品的价格全面攀升。PC DRAM价格预计将季增100%以上，创下历史新高；服务器DRAM价格预计上涨约90%；移动设备使用的LPDDR4X和LPDDR5X内存价格也将大幅上调90%左右。在NAND闪存领域，企业级SSD的价格预计将季增53-58%，同样创下单季涨幅最高纪录。市场供应紧张，原厂产能转移是主要因素。存储芯片价格飙升已引发终端产品成本危机，企业被迫寻求替代解决方案。存储软件厂商VDURA报告显示：在2025年第二季度至2026年第一季度期间，30TB TLC企业级SSD价格累计上涨约257%。具体来看：这类SSD在2025年第二季度的价格约为3062美元，而到2026年第一季度已接近11000美元。相比之下，同期HDD的价格涨幅约为35%，导致数据中心单位容量的SSD与HDD成本比值从6.2倍扩大至16.4倍。

1个月前

长江存储三期项目极速量产，借超级周期改变全球NAND竞争格局 YMTC’s Phase III Project Races to Mass Production, Leveraging the "Storage Super Cycle" to Reshape the Global NAND Competitive Landscape 笔者注：据韩媒和台媒在内的多个报道，武汉东湖高新区，长江存储三期项目工地的塔吊之间，洁净厂房设备已开始安装，这家中国最大的NAND Flash制造商正以前所未有的速度向2026年下半年量产目标冲刺。这一超常速度的背后，是长存对NAND Flash市场“超级周期”的战略布局，也是中国在全球半导体竞争中加快步伐的缩影。建设大提速长江存储武汉三期项目于2025年9月才正式动工，按照常规半导体建厂周期，本应等到2027年才能具备正式量产能力。然而，来自设备缠上的消息显示，长江存储近期已开始密集进行NAND Flash生产设备采购订单发送与工厂启动设置作业，进度已大幅调整。从动工到开始量产仅历时约一年，这在半导体行业中极为罕见。消息人士分析指出，这意味着长江存储采取了加速的策略，即在工厂主体建筑尚未完全完工的情况下，就同步搬入部分设备并进行生产线的早期调试与运作。扩大市场占有率的绝佳时刻急速扩张背后，是长江存储为了在NAND Flash市场迎接“超级周期”时，强化自身的全球竞争优势布局。长江存储将2026年视为扩大NAND Flash市场占有率的黄金时刻。其战略判断源于三星电子与SK海力士2026年将主要资源与重心倾斜至利润更高的DRAM以及AI专用的HBM领域。据市场研究机构Counterpoint Research统计，以NAND出货量为基准，长江存储的全球市占率在2025年第一季首度突破10%大关。随后的成长趋势不减，至2025年第三季，其市占率已攀升至13%，较前一年同期大幅增长了4个百分点。生产技术突破在技术层面，长江存储在NAND Flash的生产技术实力上已取得显著进步。数据显示，长江存储目前已掌握270层3D NAND Flash的生产技术。虽然与三星电子的286层及SK海力士的321层技术相比仍有差距，但这一差距正在快速缩小。更关键的是，受益于长期资本投入以及积极延揽外部专家，长江存储在生产良率与稳定性方面获得了高度评价，被认为已具备与全球领先企业一较高下的实力。研究公司Omdia估计，2025年长江存储的资本支出比全球同行更为积极，约占全球NAND闪存总投资的20%，预计还将继续加速增长。市场竞争格局全球NAND Flash市场主要参与者包括三星电子、SK海力士、美光、铠侠和长江存储。从技术和市场两个维度，我们可以更清晰地看到长江存储当前的地位和追赶目标：从数据上来看，如果长存扩建能按计划按期完成的话，按产能计算，长江存储明年可能获得超过20%的全球市占，极有可能超越SK Hynix，美光和铠侠成为全球第二大NAND生产厂商。资本局的变化长江存储三期项目公司主体：长存三期（武汉）集成电路有限责任公司成立于2025年9月5日，注册资本207.2亿元，法定代表人为长江存储董事长陈南翔。股东信息显示，长存三期由长江存储持股50.19%、湖北长晟三期投资发展有限责任公司持股49.81%。湖北长晟三期成立于2025年9月2日，由光谷金控、江城基金、长江产投按40%、40%、20%的比例共同持有，这三者分别代表了湖北省，市，区的国资力量。长存三期的加速，是中国半导体产业在极端外部环境下，通过优化工程管理和资本效率实现的极限求生与主动出击。如果2026年下半年能够如期启动量产，武汉将真正成为全球存储芯片版图上不可忽视的一极。

1个月前

微软CEO萨提亚·纳德拉前段时间在接受采访时指出：当前制约人工智能算力发展的关键已不仅是芯片供应，而是电力基础设施的短缺。纳德拉明确表示，微软现有的电力资源已无法满足其全部GPU的运行需求。他将这一瓶颈归结为缺乏Warm Shells。这里的Warm Shells是特指那些已建设完成，基础设施齐全，且毗邻主干电网的数据中心。这类设施能够迅速接入电网并投入使用，从而支持大规模AI算力的部署。纳德拉的言论很明确：在AI竞赛进入白热化阶段的今天，电力供应与数据中心准备程度已经成为比芯片本身更为紧迫的挑战。

1个月前

GPU将不再稀缺，而电力成为英伟达估值的终极约束 GPUs Will No Longer Be Scarce, as Power Becomes the Ultimate Constraint on Nvidia's Valuation 编者注：在过去的两年里，华尔街最动听的故事莫过于AI 淘金热，而英伟达（Nvidia）无疑是这场盛宴中接近唯一的卖铲人。其股价的火箭式蹿升，建立在一个看似无限且刚性的需求之上：只要有更强的 GPU，世界就会毫不犹豫地买单。然而，当资本市场还在为B200/B300以及下一代的Vera Rubin芯片的算力倍增而狂欢时，一个更基础，更物理，也更残酷的瓶颈正在悄然逼近，这甚至可能成为英伟达万亿市值的真正天花板。这个瓶颈不是台积电的产能，不是CoWoS封装技术，而是电力（Power）。 Musk同志的电力预言：被忽视的警告信号 2026年开年，科技界最震耳欲聋的警告并非来自老黄在CES的新品发布会，而是来自Elon Musk同志（笔者看到推上有人说Elon Musk已经被中国统战了，那确实应该叫上一声“老马同志，你好。”）。在1月6日的一档播客节目中，Elon Musk抛出了一个极具地缘政治意味的论断：他断言，中国在人工智能计算能力上将会超越美国。而支撑这一结论的核心论据，并非算法或芯片设计的优劣，而是最底层的物理限制，电力供应能力。老马同志给出的估计是到2026年，中国的发电量会达到美国的3倍左右。他直言不讳地指出，这种巨大的能源优势，将使中国，也仅有中国能有能力支撑起规模空前，高能耗的人工智能数据中心集群。 “电力生产是扩大AI系统规模的限制因素”，是的，老马同志对“算力即电力”的理解或许比任何人都深刻，但他的这个新的“电力制约论”或将改变全球AI竞争格局的核心认知。他的这番言论，实际上是向过度乐观的美国科技界，华尔街甚至监管投下了一枚炸弹：AI军备竞赛的下半场，比拼的可能不再是硅片上的纳米制程，而将是国家电网里的特高压传输。美国电网之殇：英伟达无法回避的物理墙 AI数据中心的快速扩张正在对全球电力系统形成前所未有的压力。到2027年，仅英伟达自己供应的GPU集群将消耗全球150-200GW电力，相当于1.5~2个法国全国用电量。美国的电力短缺尤为严峻。摩根士丹利已将2025-2028年美国数据中心累计电力缺口从44吉瓦上调至47吉瓦，此缺口相当于9个迈阿密或15个费城的用电量。至此，老马同志的警告揭示了美国科技巨头们面临的一个尴尬现实：他们有足够的钱买英伟达的芯片，却可能没有足够的电力让这些芯片转起来。美国老旧的电网设施可能正成为其AI发展的最大绊脚石。首先是审批积压。在美国，新建发电厂或大型传输线路需要经历漫长而复杂的监管审批流程。数据中心开发商现在面临着长达数年的电力连接等待期。在弗吉尼亚州北部这样的数据中心核心区，电力容量已接近饱和，新的大型项目往往被告知要等到2028年甚至更晚才能获得足够的电力供应。其次是电网稳定性与各种能源的博弈。AI数据中心需要的是24/7不间断的稳定基荷电源（Baseload Power）。风能和太阳能这些可再生能源的间歇性使得它们无法单独支撑数据中心的苛刻需求。诚如老马同志之前所说，储能会是一个极大的挑战和市场。对于英伟达的核心客户而言，包括微软，谷歌，亚马逊，甲骨文，OpenAI以及Meta，这正逐渐演变为一个无法回避的现实约束。如果它们无法在未来一到两年内获得数百兆瓦，甚至吉瓦级规模的新增电力供应，那么今天向英伟达下出的巨额GPU订单，届时很可能将面临无处安放的尴尬局面。而英伟达当前的万亿美元级估值，本质上正是建立在这些巨头持续和高强度的资本开支（Capex）之上。一旦算力投资受到电力基础设施瓶颈的制约，资本开支的实际落地能力将被削弱，新增GPU的采购节奏势必放缓。这不仅会直接影响英伟达的出货规模和收入增长，也可能成为其估值逻辑中最容易被忽视，却最具决定性的变量。中国模式与估值逻辑重构相比之下，老马同志口中中国的优势在于其强大的基础设施建设能力和国家层面的统筹规划。通过特高压输电技术和“东数西算”工程，中国更有能力将西部的可再生能源用于东部的算力需求。如果老马同志关于“3倍发电量”的预测成真，那么在物理层面，这种“电力红利”将直接转化为算力优势。这对英伟达的投资者意味着必须重新审视其估值模型。过去两年市场的逻辑是“需求无限，供给（芯片制造）是瓶颈”；而现在，新的逻辑可能正在浮现：“电力和基础设施成为新瓶颈，导致客户需求被迫放缓”。黄仁勋显然意识到了这个问题，他开始在各种场合强调“能源效率”和液冷技术。但在物理世界中，没有任何指数级增长可以永远持续下去。当硅谷的梦想撞上热力学的铁壁，能源的获取能力将取代芯片的制造能力，成为决定AI未来版图的关键变量。老马同志的断言指出了一个核心事实：在这场关乎国运的AI竞赛中，谁掌握了更充沛更稳定的能源，谁就握住了通往未来的电源插头。对于英伟达而言，其万亿市值的下一个增长点，或许不再仅仅取决于CUDA生态的护城河，而取决于全球电网何时能跟上它疯狂的步伐。所以，电力，这个最传统的工业要素，正成为掐住最前沿科技行业咽喉的关键之手。它不仅可能冻结数百亿美元的资本支出，更可能引发从供应链，企业财报到资本市场估值的连锁反应。对于投资者而言，下一阶段观察英伟达及其客户的关键指标，除了GPU出货量，更应关注这些巨头获取和宣布的长期电力合同（PPA）规模，数据中心项目的电网接入批准情况，以及它们资本支出中用于能源基础设施的比例变化。这些将是比财报数字更早的预警信号。在这个逻辑下，真正的赢家或许会悄然转移：那些能够提供稳定，廉价电力的区域（如中国及北欧），拥有强大电网建设能力的电力设备公司，以及能够提供更高能效算力解决方案的挑战者，都可能从这场电力危机中意外获益。

2个月前

AI虹吸产能引发内存涨价潮：全球PC市场或迎缩量加价的寒冬编者注：AI的爆发式增长正在重塑全球半导体供应链和资源配置。受高带宽内存（HBM）产能放大及大额企业级订单的挤压影响，标准存储芯片供应告急。IDC最新预警显示，全球PC市场或将面临最高近9%的销量下滑，而整机价格涨幅可能高达8%。 IDC最新市场预判：PC销量萎缩与成本上行的双重挤压在IDC最新的情景预测中，原本对2026年PC市场萎缩2.4%的基准预期已显保守。基于NAND闪存与DRAM供应格局的剧变，IDC新增了两项预测路径： 🔹 温和情景：销量预计下降4.9%，整机价格上涨4%至6%。 🔹 悲观情景：销量可能大幅萎缩8.9%，而终端价格涨幅或将冲至8%甚至更高。这一趋势背后的核心逻辑并非需求枯竭，而是上游成本激增导致的市场被动收缩。解析：HBM如何“抢食”传统产能？此次内存波动的震中位于AI数据中心。作为AI芯片（如NVIDIA B系列GPU）的标配，HBM（高带宽内存）凭借超高带宽优势成为战略级资源。然而，HBM并非独立于生态之外。由于其生产过程与消费级DRAM共享相同的晶圆产线和先进制程技术，面对利润更丰厚，溢价更高的HBM订单以及企业级内存订单，三星、SK海力士及美光等存储巨头纷纷调整策略，优先保证AI和企业级产能。这种产能的调配直接导致用于PC及消费电子的标准DRAM和NAND闪存供应大幅受限，供需天平开始剧烈倾斜。举个栗子：2025年暑假的时候，一根原厂的64GB DDR5-6400 RDIMM服务器内存的价格尚在260美金附近，年底的价格已经落在了将近1,000美金，这是一个短期内将近四倍的惊人涨幅。跟据供应链的反馈，现在即使是谷歌和Meta也需要和三星签署长达五年的长约（LTA），很明显目前谈判的筹码在内存厂手上。当然，行业内对于这场波动的持续时间仍存巨大分歧，预测区间从半年到五年不等。这不仅取决于AI应用的商业化落地速度，更依赖于是否能催生新一代更高效能的内存架构，来缓解目前大规模的短缺趋势。

2个月前

Trump政府终于批准了H200对中国的销售。老黄要笑了。。。 Lol，现在看看中国会不会开放进口了。。。

3个月前

华为发布新一代AI算力调度技术，Flex:ai智算资源利用率提升可达30% 华为前几日正式推出新一代AI算力容器化调度技术Flex:ai。据介绍，该技术可将智算资源利用率提升最高30%，并支持异构算力环境，兼容英伟达GPU、华为昇腾NPU等多类加速卡，避免了生态锁定问题。。。在技术架构上，Flex:ai基于Kubernetes构建，是面向XPU的池化与智能调度软件。通过对GPU，NPU等算力资源进行细粒度管理和智能化调度，实现AI训练与推理任务与底层硬件的精确匹配，从而显著提升整体算力利用效率。软件补硬件以及开放兼容，是该技术的两大核心特点。 2024年4月，英伟达以7亿美元收购以色列AI基础设施公司Run:ai，以弥补其在算力管理软件领域的短板。相比之下，华为的Flex:ai在虚拟化能力和智能调度算法方面具备差异化优势，并将以更完整的方式开源。华为表示，Flex:ai自立项起便与多所高校联合研发。公司认为，算力利用率的提升必须基于真实业务场景不断优化，因此希望更多企业借助开源生态参与共建，共同探索行业最佳实践。华为Flex:ai的核心能力可概括为三个方面： 1，算力资源切分：一张卡变N张卡，同时服务多个AI工作负载 Flex:ai通过算力切分技术，将单张GPU/NPU拆分为多个虚拟算力单元，切分粒度精确至10%。这一技术使得单卡能够同时承载多个AI工作负载，在整卡算力无法被充分利用的场景下，算力资源平均利用率可提升30%。 2，多级智能调度：实现 AI 工作负载与算力资源的精准匹配 Flex:ai内置全局智能调度器Hi Scheduler，实时监控集群负载与资源状态，并结合AI任务的优先级，算力需求等多维参数，对本地及远端虚拟化的GPU/NPU资源进行全局最优调度。 3，跨节点算力聚合：通用算力与智能算力融合 Flex:ai可聚合集群内各节点的空闲XPU算力，形成共享算力池。通用服务器通过高速网络将AI工作负载分发至池内GPU/NPU执行，实现通用算力与智能算力的无缝融合，从而提升整体算力利用效率和任务调度灵活性。魔擎社区地址：

#华为Flex:ai #AI算力调度 #算力资源利用率提升 #异构算力兼容 #开源生态

3个月前

同样是美元，中国给其他国家的企业贷款，并不附带政治条件，就被说成“掠夺性放贷”；美国给其他国家的企业放贷，还要附带政治条件，却被包装成“助推企业成长”。。。难不成中国的美元到了大洋彼岸还能长出两只手去抢不成？？世人皆知：资本无国界，然而偏见却有国籍。。。 It is the same US dollar, yet when China loans it to enterprises in other countries without attaching political conditions, it is denounced as "predatory lending"... Conversely, when the US loans it to enterprises in other countries, even with political conditions attached, it is packaged as "promoting enterprise growth"... Could it be that the dollars provided by China magically sprout a pair of hands once they cross the ocean, enabling them to simply snatch things away?? The world acknowledges that capital is borderless, but prejudice, alas, has nationality...

#中国 #美国 #贷款 #政治条件 #偏见

3个月前

华为将发布AI领域突破性技术，有望大幅提升算力资源利用效率来源：中国基金报据信，华为将于11月21日发布一项AI领域的突破性技术，有望解决长期困扰行业的算力资源利用效率难题。。。据介绍，该技术可显著提升GPU（图形处理器），NPU（神经网络处理器）等关键算力资源的利用率，将行业平均30%～40%的水平提升至约70%，大幅释放算力硬件潜能。。。消息人士透露，此次突破主要源于华为在软件层面的创新：通过统一管理和调度英伟达，昇腾以及其他第三方算力资源，技术可有效屏蔽硬件差异，为AI模型训练与推理提供更加高效、灵活的资源支撑。。。

#中美芯片战：英伟达求生，中国突围· 122 条信息

#华为 #AI技术突破 #算力资源利用率提升 #GPU/NPU #软件创新

3个月前

针对高事早苗的涉华错误言行到目前为止，中方释放三大罕见信号，一个郑重，两个奉示，三语宣示。 In Response to Sanae Takaichi's Erroneous Remarks Concerning China, Beijing has so Far Released Three Rare Signals: One Solemn Warning; Second Pointed Admonition; Declarative Statement in Three Language Credit to 乔鲁京（Qiao Lujing），国际观察主编（Editor-in-Chief of International Review） Authors note: This is a must read piece, please use "Translate" feature on X if you can't read Chinese... 中方反制的时间节点: 2025年11月14日凌晨2点56分，外交部官网发布了一条深夜消息：“外交部副部长孙卫东奉示召见日本驻华大使金杉宪治”。 2025年11月14日晨，人民日报钟声：绝不容忍高市早苗在台湾问题上的越线挑衅。 2025年11月14日早晨，外交部以中英日三种语言的方式在社交平台上继续警告。 2025年11月14日下午，驻日本大使吴江浩奉示约见日本外务事务次官船越健裕，就日本首相高市早苗涉华错误言行提出严正交涉。 2025年11月14日晚，外交部和中国驻日本使领馆就中国公民前往日本发布郑重提醒。 2025年11月15日下午，国航，南航、东航三家航司已发出通知，公布了涉及日本航线客票的特殊处置方案，对于出行日期在12月31日之前且符合相关条件的客票，可予以免费退改处理。 2025年11月15日下午，继三大航司后，四川航空、厦门航空、海南航空等多家航司发出通知，公布了涉及日本航线客票的特殊处置方案，对于出行日期在12月31日之前且符合相关条件的客票，可予以免费退改处理。

#中日关系 #高市早苗 #外交警告 #涉台言论 #航班退改

4个月前

中国科学家登上《Nature》：攻克140年化学难题，或大幅降低抗癌药成本笔者注：最近国内高校在Nature都爆表了呀。。。这个国际顶级学术期刊上个星期刊发了来自中国科学院大学，杭州高等研究院，化学与材料科学学院张夏衡研究团队的最新成果：“Direct deaminative functionalization with N-nitroamines”。论文链接：这项研究解决了困扰有机合成领域超过140年的核心难题，被国际同行高度评价。作为审稿人之一，辉瑞制药高级研发总监Scott Bagley称其为“true tour de force（真正的杰作）”。。。破解百年化学瓶颈一个世纪以来，化学家们在将芳香胺结构转化为其他功能性化合物时，几乎都依赖通过“重氮盐”中间体的反应路径。然而，这一传统路线不仅反应步骤繁琐、收率低、纯化成本高，更由于重氮盐极不稳定、易爆炸，极大地限制了工业化生产安全与规模。张夏衡团队提出了一种以N-硝胺为媒介的“直接脱氨官能团化”策略。该方法能够在温和条件下，直接将惰性的芳香C–N键一步转化为C–X、C–O、C–N、C–C等多种化学键，反应安全、高效且可放大至公斤级生产，为有机合成开辟了一条全新路径。这一方法不仅从根本上摒弃了高危中间体“重氮盐”，还在安全性、成本与效率方面实现多重突破。这是一个颠覆性的进展，将为多个市场带来了革命性的转变。。。或将颠覆抗癌药合成成本结构张夏衡团队测试了170余种化学底物，包括传统方法极难转化的复杂分子，如间位氨基吡啶、多氮杂环及多种药物分子，转化成功率达到46%至83%。更具代表性的是，研究团队把好几步反应放在一个锅里一次性做完。比如，他们用三步一锅法高效合成了一种抗炎药“依托考昔”，成功将原本复杂的多步反应路线极大简化。实验结果表明，该反应在千克级规模下收率高达90%，显示出强大的工业可行性。业内人士指出，这项技术有望应用于多种重磅药物的第二代或第三代仿制药工艺中，包括PARP抑制剂，BTK抑制剂和酪氨酸激酶抑制剂等，从而显著降低全生命周期成本，使高端抗癌药更易被患者负担。距离“诺奖级成果”还有多远？纵观诺贝尔化学奖历史，Heck、Negishi、Suzuki的钯催化交叉偶联反应（2010年获奖）与List、MacMillan的不对称有机催化（2021年获奖）均经历了20至40年的时间验证。。。张夏衡团队的成果同样具备原创性强、应用广泛、潜力深远等关键特征，但仍需未来数年到十数年在全球范围内获得更广泛验证与引用。。。从实验室到工业化，从方法学创新到实际应用，张夏衡团队的这项研究为全球化学与制药产业提供了全新的范式。它不仅展示了中国科学家在基础化学领域的原创能力，也为“让高科技抗癌药更亲民”带来了现实希望。。。张夏衡团队这里还有个有意思的评论：

#中国科学家 #《Nature》 #化学难题 #抗癌药成本 #张夏衡团队

4个月前

汇总一下今天刚哥和贝嫂技术性谈判之后的主要消息 1，立场态度 “美方表达立场强硬，中方维护利益坚定”。。。中美谈判团队就双方关心的重要经贸问题进行了“坦诚，深入且富有建设性的交流”，包括：美对华海事物流和造船业的 301 措施、延长对等关税暂停期、芬太尼关税及执法合作、农产品贸易（主要是大豆）、双方出口管制（美方的 50% 规则，中方的稀土）等。。。 2，软件反制与关税威胁目前，美方之前提出的所谓靠软件反制被搁置，特朗普对中国征收额外100%关税的威胁也被搁置，这两点属于谈判前造牌，被搁置符合预期。。。 3，谈判成果双方达成了一个框架（Framework）。中方表述为：“中美双方就上述议题建设性地探讨了一些妥善处理双方关注的方案，形成了初步共识。下一步各自将履行内部报批程序。” 美方Greer也表示：“a potential framework moving forward。” 正如我们之前分析，这个Framework旨在保证双方能够执行达成的协议。我们之前聊过，在马德里谈判之后，中方显然认为存在共识不再加码，但是美方商务部的管制措施加码明显，也直接国庆节后中方导致了稀土的严格管制。如何限制美方履行共识也是中方重点防范的方向，从这点来看，框架应该满足了中方的基本要求。。。 4，稀土出口管制今天贝嫂接受NBC采访时表示，中国可能会推迟对美实施新的稀土出口管制（Deferral on rare earth restriction），但尚未最终确定，还需两位领导拍板。美方也会相应延长对等关税暂停期作为回报。贝嫂的表态仍然比较谨慎。我的理解就不在这里说了。毕竟中国的稀土出口管制自2020年就已存在，只是之前的执行也有很多的漏洞。 5，关税暂停期确认会延长对等关税的暂停期，但具体方式尚未披露，不清楚是否与稀土延期管制挂钩。 6，农产品采购预计中国将恢复大规模购买美国大豆。 7，芬太尼关税与执法合作中方直接提出“芬太尼关税及执法合作”，这个表述是第一次看到，也显示出中方在这方面有合作意愿。毕竟这个关税20%是没有必要的。所以川川和大大会面的时候一定会聊到这。。。 8，会谈评价美方认为会谈建设性，为双方领导人会晤提供了积极框架。Greer的原话是：“a broad range of topics were discussed, including extending the truce on trade measures... I think that we're getting to a spot where the leaders will have a very productive meeting。” 中方表述为：“会议坦诚、深入、富有建设性…… 美方表达立场是强硬的，中方维护利益是坚定的。” 总体上看到了谈判场上刀光剑影，笔者的直观感觉是应该达到了中方的预期。。。

中美贸易谈判再进一步，框架协议能否终结贸易战？· 509 条信息

#中美经贸谈判 #稀土出口管制 #芬太尼合作 #关税暂停期延长 #农产品采购

4个月前

这对刚刚退休不久的美国夫妇，控诉退休后他们的医疗保险保费从每月443美元，暴涨到2,224美元。短短几个月，支出翻了五倍，从“能负担”瞬间变成“完全付不起”。。。这并非孤例。美国的医保体系向来复杂而昂贵，许多人在职时依靠雇主提供的团体保险，一旦退休，就必须自行承担全部保费。而只要收入稍微高出政府补贴线一点点，就会立刻失去补助资格，从“有补贴”变成“全自费”。一个细微的收入差距，就可能让保费暴涨数倍。对普通退休家庭而言，这样的变化无异于一场经济灾难。医疗开支原本应该是老年生活最基本的保障，如今却成了压垮生活的最大负担。对，不是病治不起，而是连保险都买不起了。 A recently retired American couple has spoken out, saying their monthly health insurance skyrocketed from $443 to $2,224 after retirement. In just a few months, their costs quintupled, turning what was once "affordable" into something "completely out of reach"... And they're not alone. The U.S. healthcare system is quite complex and expensive. Many people rely on employer-sponsored insurance while working, but once they retire, they have to pay the full premium out of pocket... Even worse, if their income exceeds the government subsidy threshold by just a small margin, they immediately lose eligibility, going from "subsidized" to "fully self-paid"... A tiny difference in income can make premiums skyrocket severalfold... For ordinary retirees, such a sudden jump is nothing short of an economic disaster... Healthcare costs, which should be a basic guarantee in later life, have instead become the heaviest burden to bear...

#美国医疗保险 #退休 #保费上涨 #经济负担 #老年生活

4个月前

美国软件出口禁令对电子行业的潜在影响分析 Author's Note: This is a must-read piece. If you don't read Chinese, I highly recommend using the "Translate" feature on X. Title: Analysis of the Potential Impact of the U.S. Software Export Ban on the Electronics Industry 一，核心假设目前流传的禁令范围：涵盖所有含美国产软件成分或受美国技术控制的软件出口至中国，包括但不限于：EDA 工具，芯片驱动，操作系统，嵌入式控制软件及工业软件等。受影响范围：基本覆盖整个电子产业链，从上游芯片设计，芯片制造，驱动开发，到消费电子及工业电子产品开发和制造，再延伸至系统集成及下游服务与应用。具体影响领域包括：电脑，手机，家电，汽车，工业控制，医疗设备，安防设备等。二，产业链影响如前所述，在现行禁令的覆盖范围内，整个电子产业链都会受到冲击。这种影响不仅仅局限于中国市场，而是具有全球效应。具体表现为： 🔹 美国企业的出口风险：任何面向中国的电子产品出口都面临显著的合规压力。例如，美国公司若向中国出口电脑、手机或工业设备，只要产品中含有美国软件或组件，就可能触及出口管制条款，违反法规将面临高额罚款和信誉损失。 🔹 欧洲及其他国家出口的间接影响：即便产品在非美国产地制造，如果其组件（如发动机中的控制芯片或驱动软件）使用了美国技术或软件，整台产品的出口也需要获得许可。举例来说，一台欧洲制造的发动机，只要其控制模块或驱动使用了美国软件，其出口中国将面临严格审批。 🔹 中国企业进口的复杂性：中国企业在进口电子产品或关键零部件时，合规流程将变得异常复杂，任何涉及美国软件的产品都可能被延迟审批甚至被美国禁止出口。因此，短期内几乎所有与电子产品相关的出口和进口活动都有可能陷入停滞。具体到市场影响： 🔹 苹果可能无法向中国销售任何 iPhone，无论产地在哪里； 🔹 微软、甲骨文等美国软件公司面临直接销售受阻； 🔹 更广泛的电子设备、工业控制系统、汽车电子等产品的跨境流通将受到连锁影响。整体来看，这一禁令不仅扰动供应链，还将引发全球电子产业链的系统性调整压力。三，笔者的关键思考如果即将出台的禁令如目前流传的那样范围极其广泛，等同于美国开始在政策层面上推动与中国在电子产业的全面脱钩，笔者认为这在现实操作上几乎不可能实现，原因可以归结为以下几点： 🔹 立法与政策准备需要长期、细致的工作如此大范围的禁令不会是一纸即发的行政命令，而必须经过立法或长期的制度设计，合规框架构建与跨部门协调。更现实的做法很可能是对若干关键领域或特定软件，固件组件（例如特定的EDA工具，设备驱动或安全相关中间件）实施有针对性的限制，而非对所有电子产品，所有零部件一刀切。 🔹 执行成本与监管能力的制约极大若把禁令延伸到“连一颗小芯片的出口都需审批”的层面，意味着需要一个覆盖全球，逐件审核的庞大配套体系，包括但不限于海关，许可审查，企业尽职，溯源和合规认证等。目前美国及其盟友并不具备能在短期内无缝部署并稳定运行这种超大规模监管体系的人力与技术资源，因此在可预见的时间内难以实现全面执行。 🔹 自损与国际市场反噬的高风险这种“杀敌一千，自损二千”的做法将对美国产业自身造成重大伤害。美国电子产业在全球价值链中占据重要位置，将一个庞大市场突然切出，会直接冲击美国公司营收与全球供应链。例如：2024年高通（Qualcomm）约46%的收入来自中国客户（约178亿美元），英特尔约28%来自中国；英伟达（Nvidia），博通（Broadcom），德州仪器（TI）等厂商也有相当比重来自中国市场。即便某公司（比如Nvidia）对外宣称对华业务下降到0%，公司的某些产品线和生态仍深度依赖中国市场与供应链。 🔹 中美经贸互依的规模与反制成本中美两国在服务和实体贸易上存在显著互补与不对称性：2001–2023年间，美对华服务出口从56.3亿美元增长到467.1亿美元，增长了7.3倍，且美国对华服务贸易年度顺差从较低基数扩大到265.7亿美元。这反映出美国在跨国服务，软件出口，IP出口与品牌方面的优势。同时，2022年美资企业在华销售额高达4905.2亿美元，远高于中资企业在美的786.4亿美元。若禁令升级，中方采取报复性措施的力度和方式也会更加实质化，导致双向损失放大。 🔹 美国更可能的政策路径是聚焦关键环节而非全盘脱钩综合以上因素，更现实也更可行的路径，是对战略性，敏感的工具与组件实施有限制：例如对高端EDA（电子设计自动化）软件、高级AI训练/推理加速器的软件栈、特定加密/远程管理固件等进行出口管控。这类“有的放矢”的限制，才能把对自家产业的副作用降到可控范围。至于Bessent等人在公开场合释放的强硬表述，更多是博弈筹码与谈判策略的一部分，而非立刻就能覆盖整个电子产品市场的现实政策。结论：短期内出现覆盖全部电子产品与零部件的全面脱钩并不现实；但必须高度警惕并跟踪对某些关键软件工具与高端元件的有针对性限制，因为那类限制对中国本土设计与制造的影响可能呈现出“穿透性”，对产业链上游研发与下游量产都会产生实质性影响。当然，目前美国剩下的“明珠”已经不多了。。。

#中美芯片战：英伟达求生，中国突围· 122 条信息

#美国软件出口禁令 #电子产业脱钩 #中美经贸关系 #高科技制裁 #产业链影响

4个月前

股神争霸赛：赚钱，DeepSeek果然第一名！全球六大顶级AI模型实盘对决，各自携带1万美元真实资金下场厮杀。战况仍然激烈，但DeepSeek V3.1凭借出色的交易表现暂居榜首，盈利已突破4300美元；Grok 4紧随其后。而GPT5和Gemini 2.5 Pro表现惨淡，成为目前唯二亏损的模型。一场AI版“股神争霸” 如果给每个顶级大模型1万美元真金白银，让它们在真实市场中实盘交易，谁会成为AI界的“巴菲特”？这一问题由发起的全新实验，Alpha Arena正在给出答案。这场竞赛，将当前全球最强的六大语言模型拉入同一真实交易环境，包括：规则简单但残酷每个模型获得1万美元初始资金，并接收完全相同的市场数据与交易指令。系统会向AI提供当前时间，账户信息，持仓状况及一系列实时市场指标（如MACD，RSI等），随后要求其做出决策： * 若有持仓，决定是继续持有还是平仓； * 若空仓，则判断是买入还是继续观望。实验的考验在于，AI能否在瞬息万变的市场中做出理性、精准的判断。 DeepSeek的量化优势凸显截至目前，市场波动不断，而DeepSeek凭借量化背景与策略优化能力脱颖而出，目前稳居收益榜首。这一成绩再次印证了DeepSeek模型在数据理解，风险控制与执行效率上的深厚积累。从实验结果看，AI炒股不再是噱头，而是算法，数据与市场博弈的真实较量。挺有意思的，这场Alpha Arena，不仅是模型智能的试金石，也让外界得以窥见未来AI在金融实盘中的潜力与边界。

AI交易比赛：DeepSeek V3领先，GPT-5惨遭亏损· 98 条信息

#DeepSeek #AI股神争霸赛 #量化交易 #Alpha Arena #金融实盘

4个月前

在荷兰政府介入接管后，中国对安世半导体实施出口管制 China Puts Export Controls on Nexperia After Dutch Takeover 核心要点： 🔹 中国在荷兰政府宣布接管芯片制造商Nexperia后，禁止该公司从中国出口产品。 🔹 中国商务部发布出口管制通知，禁止Nexperia中国及其分包商出口部分元件。 🔹 荷兰政府援引一项冷战时期的法律，接管Nexperia，以确保欧洲能够继续获得该公司的产品。在荷兰政府援引冷战时期法律接管Nexperia后，中国采取了反制措施。荷方表示此举是为了保障欧洲芯片供应的安全。Nexperia是中国闻泰科技（Wingtech Technology）的子公司，为汽车和消费电子行业提供成熟芯片。相关阅读：荷兰首次援引1952年法律，接管中国控股芯片制造商

#中国出口管制 #安世半导体 #荷兰政府接管 #芯片供应安全 #中荷贸易摩擦

4个月前

中国的稀土出口管制（类似于美国的长臂管辖）或冲击高端芯片与设备供应链：14nm及以下逻辑芯片，256层及以上存储芯片面临潜在影响 Author’s Note: This is a must-read piece. If you don’t read Chinese, I highly recommend using the “Translate” feature on X. Title: China's Rare Earth Export Controls, A "Long-Arm Jurisdiction" of Its Own, May Disrupt High End Chip and Equipment Supply Chains: 14nm-and-Below Logic and 256-Layer-and-Above Memory at Risk 如之前分享的新闻，2025年10月9日，中国商务部宣布新版稀土出口管制措施，明确将“含有中国原产稀土的境外制品”，“使用中国稀土技术在境外制造的产品”，以及“原产于中国的稀土本体”纳入许可管控范围。该措施自发布之日起执行，并将分阶段推进。此举意味着中国正对高端半导体，以及军工等领域的稀土出口实施更精细化的审查机制。这一政策可能对高端半导体供应链造成深远影响，特别是14纳米及以下逻辑芯片，256层及以上3D NAND存储芯片，以及相关制造，测试和封装设备以及工艺领域。稀土的科技基础：轻稀土与重稀土之别我们先来了解一下稀土元素。稀土元素根据其物理化学特性可分为两大类： 🔹 轻稀土元素（LREE）：包括镧（La）、铈（Ce）、镨（Pr）、钕（Nd）、钷（Pm）、钐（Sm）、铕（Eu）等，储量相对丰富，广泛用于抛光，催化，发光等领域。 🔹 重稀土元素（HREE）：包括钆（Gd）、铽（Tb）、镝（Dy）、钬（Ho）、铒（Er）、铥（Tm）、镱（Yb）、镥（Lu）、钪（Sc）与钇（Y）等，资源更为稀缺，却是高性能磁体，激光晶体和特种合金等高科技领域不可替代的核心原料。先进半导体工艺和设备对于稀土材料的依赖半导体产业作为现代科技的核心支柱，其发展在很大程度上依赖于稀土元素所具备的独特化学与物理特性。这些元素，包括镧（La）系元素，钇（Y）和钪（Sc），在导电性，介电性能以及气体敏感特性方面发挥着关键作用，对提升半导体器件的性能至关重要。例如，钕（Nd）是制造半导体设备中高性能永磁体（如步进电机，高精度定位系统）的关键材料，而镝（Dy）的加入则可显著提升磁体在高温环境下的稳定性与抗退磁能力。铕（Eu）则在显示技术中不可或缺，是荧光粉的重要组成部分，广泛用于液晶与OLED显示器。 🔹 在半导体工艺领域，稀土氧化物也不可替代。氧化铈（CeO₂）是化学机械平坦化（CMP）工艺的核心材料，其抛光浆料直接影响晶圆的平整度与最终良率。对于高层数NAND闪存而言，CMP质量的稳定性尤为关键，任何抛光颗粒短缺或质量波动都会放大次品率。近年来，氧化镧（La₂O₃），氧化钆（Gd₂O₃）与氧化镥（Lu₂O₃）等高介电常数（High-k）稀土氧化物因其优异的热稳定性与介电特性，被广泛研究用于逻辑和存储芯片。另外，随着原子层沉积（ALD）技术的进步，特别是采用臭氧（O₃）等替代氧化剂的工艺创新，稀土氧化物薄膜的均匀性与稳定性显著提升，使其在先进制程中更具可行性。此外，一氧化钇（YO）等二价稀土氧化物也被合成为外延薄膜，展现出独特的电子与磁性特征。其可调控的电导率，窄带隙以及强自旋轨道耦合特性，使其成为新一代半导体器件材料的重要候选。在特定半导体材料体系中，稀土掺杂技术同样不可或缺。例如，在高速，高频器件使用的氮化镓（GaN）与磷化铟（InP）材料中，钇（Y）和铕（Eu）常被用于提升载流子迁移率与光电转换效率，我们之前聊过市场非常关注的光模块需要；而稀土掺杂的氧化铟（In₂O₃）表现出显著增强的气体传感性能，拓展了其在智能感知芯片中的应用前景。 🔹 在半导体设备领域，稀土材料也贯穿多个关键环节。以EUV光刻机为例，其核心技术主要包括三项：顶级的光源系统，高精度的物镜系统以及工件台。这些均需要使用稀土材料，比如说使用NdFeB永磁体（步进电机以及高精度定位系统）与掺杂了稀土元素晶体的固体激光器；而刻蚀与沉积设备的真空腔体，靶材表面常采用Y₂O₃、CeO₂等稀土氧化物涂层，以提升耐蚀性与使用寿命。 🔹 至于后段封装与测试环节，高端封装中使用的导热陶瓷，荧光掺杂封装材料，以及用于光电探测器的稀土掺杂晶体，虽然用量不大，却在特定高性能应用（如高频雷达、红外传感和量子器件）中具有不可替代的作用。所以，稀土元素贯穿半导体制造的几乎每个环节，从材料到设备，从工艺到封装测试，其重要性远超传统金属原料。一旦稀土供应链受到出口管制，价格波动或精炼环节受限，全球先进芯片生产链都将不可避免地面临结构性影响。为什么中国能在全球稀土精炼领域占据主导地位？尽管稀土元素在现代产业中发挥着举足轻重的作用，但其全球供应链极度集中。中国不仅掌握了约70%的全球稀土矿开采量，还占据了约90%的全球精炼与分离产能。尤其在最具战略意义的重稀土领域，中国的供应占比更是高达99%。这一地位的形成，绝非偶然。它源自中国在该领域长达数十年的战略布局，技术积累与全产业链建设。与外界常见的误解不同，稀土精炼远不是“把矿石提纯”那么简单的化工过程，而是一套涵盖高难度化学分离，复杂流程控制与严格环境管理的系统性工程。稀土精炼的核心挑战与中国的竞争优势 1，技术门槛高：元素分离与提纯的“化学艺术” 稀土包含17种化学性质极为相似的金属元素，要将其高纯度分离，需要上百次萃取，洗涤和沉淀等化学步骤。中国经过数十年的技术攻关，已在萃取剂研发与工艺流程设计方面形成了全球领先优势。目前，中国企业能够稳定实现6N（99.9999%）级高纯度提炼，而多数国家仍徘徊在2N~3N水平。此外，中国企业在伴生矿与低品位矿的综合利用上积累了丰富经验，通过优化工艺，实现了高效率与低成本并存。 2，完整的产业链与规模经济效应中国形成了“北轻南重、集群发展”的产业布局，拥有从矿石开采，分离提纯到金属冶炼与材料加工的全流程能力。万吨级分离装置不仅带来了规模化成本优势，也让中国具备了快速响应市场需求与出口波动的灵活性。 3，化工配套完善，副产物处理体系成熟稀土精炼常伴生钍，铀等放射性元素，其废料处理是欧美等国的“痛点”。中国通过与钢铁，铝业等重工业体系的协同，将部分副产物实现再利用，形成资源循环体系。而在法规严格，重工业基础分散的西方国家，放射性副产物处理成本极高，成为扩产瓶颈。 4，能源与经济壁垒：电力成本与产能规模的双重优势稀土金属电解环节耗电量巨大。中国凭借低成本电力供应与高效输配电网络，在能耗环节拥有显著优势。同时，已投产的万吨级装置构筑了强大的规模经济壁垒，使新进入者即便获得政策支持，也难以在成本或效率上与中国竞争。全球应对与前景展望面对中国的稀土主导地位，美国，澳大利亚和欧盟正积极推动“去中国化供应链”战略。例如，澳大利亚伊卢卡资源公司（Iluka Resources）计划在2027年建成首座重稀土精炼厂，美国国防部亦在资助德州的MP Materials扩产项目。然而，业内普遍认为，这些项目在成本，技术与规模三方面短期内难以撼动中国的地位。可以说，在未来可预见的十年内，中国仍将是全球稀土供应链中唯一具备全流程竞争力的国家。这也意味着，在短期内，任何涉及高端芯片，先进制造和国防技术的全球产业链，都无法绕开中国稀土长臂管辖的核心影响力。

关税战落幕：美国失势，中国崛起？· 682 条信息

#稀土出口管制 #高端芯片供应链 #中国稀土主导地位 #半导体产业 #长臂管辖

5个月前

凌晨，阿里重磅开源三款模型，一举刷新32项业界SOTA 太卷了呀，兄弟们！我想回农村。今日凌晨，阿里通义大模型团队一口气发布三款开源模型：原生全模态大模型Qwen3-Omni；语音生成模型Qwen3-TTS；以及完成重要升级的图像编辑模型Qwen-Image-Edit-2509。其中，Qwen3-Omni可同时处理文本，图像，音频与视频输入，并实现实时流式的文本与自然语音输出。在36项音频及音视频基准测试中，该模型斩获32项开源SOTA与22项总体SOTA，性能超越Gemini-2.5-Pro，Seed-ASR，GPT-4o-Transcribe等闭源强模型。同时，其图像与文本表现也在同尺寸模型中达到行业最优。 Qwen3-TTS支持17种音色和10种语言，在语音稳定性与音色相似度方面优于SeedTTS，GPT-4o-Audio-Preview 等主流产品。Qwen-Image-Edit-2509则新增多图编辑功能，能够实现人物与人物，人物与物体等跨图像拼接，显著扩展了应用场景。此次开源还包括Qwen3-Omni-30B-A3B-Instruct（指令跟随）、Qwen3-Omni-30B-A3B-Thinking（推理）以及通用音频字幕器Qwen3-Omni-30B-A3B-Captioner。相关开源地址已同步上线： Hugging Face: GitHub: 此次“三连击”不仅进一步强化了阿里在多模态与语音生成领域的全球竞争力，也再次引爆了开源社区的关注。

#阿里 #开源模型 #Qwen3-Omni #多模态 #SOTA

5个月前

总体而言，华为提出的UnifiedBus（UB）协议构建了一个统一且可扩展的互联框架，能够连接CPU，GPU，NPU，内存，存储设备（SSU），交换芯片，DPU/网络接口及其他I/O模块等各类异构设备。图一见：所以，UB不仅在组件之间提供统一的协议与接口，还旨在取代现有的PCIe，NVLink，CXL，传统以太网/TCP-IP/RoCE等多种标准互联/通信协议，以降低延迟，简化协议栈。提升带宽与规模扩展性，同时增强资源共享与整体系统可靠性。据Huawei的相关公开资料，UB/UB-Mesh被设计用来取代或简化现有的数据中心互联堆栈中多个异构协议，接口系统。这些被“取代”的协议包括但不限于：图二，笔者的简单总结

#华为 #UnifiedBus协议 #异构设备互联 #取代PCIe/NVLink/CXL #数据中心互联

5个月前

英伟达发布Rubin CPX GPU，专为长上下文推理打造昨天白天我们还在聊128GB GDDR7的5090，还在质疑是不是真的，晚上就来了真正128GB GDDR7的Rubin CPX。这也侧面呼应了前两天业内反馈三星收单收到手软，大幅度提升GDDR7产能的事实。对，英伟达昨天深夜发布全新GPU：NVIDIA Rubin CPX，这是一款专门面向长上下文AI推理的新型处理器，旨在支持百万级Token的软件开发、生成式视频以及深度研究等复杂任务。 Rubin CPX将与NVIDIA Vera CPU及下一代Rubin GPU协同，组成全新的NVIDIA Vera Rubin NVL144 CPX集成平台。该平台在单机柜内可提供高达8 exaflops的AI算力，性能较现有GB300 NVL72系统提升7.5倍，并配备100TB高速内存与每秒1.7PB的内存带宽，为AI推理树立全新性能标准。英伟达将AI推理划分为上下文阶段（Context Phase）与生成阶段（Generation Phase）：前者计算密集，需要高吞吐率处理输入；后者则对内存带宽依赖更强，逐个生成token。为此，英伟达推出“分解式推理”架构，由不同硬件分别优化两大环节。 CEO 黄仁勋表示：“Vera Rubin平台标志着AI计算的又一次重大飞跃。正如RTX改变了图形与物理AI，Rubin CPX是首款专为海量上下文AI设计的CUDA GPU，使模型能够一次性推理数百万token的知识。” Rubin CPX性能亮点 Rubin CPX专为加速“上下文阶段”设计，采用单片式芯片架构，具备： 🔹 30 petaflops NVFP4精度算力 🔹 128GB GDDR7内存 🔹 注意力计算速度提升至GB300 NVL72的三倍 🔹 集成视频编解码器与长上下文推理功能据称，这一设计大幅提升视频搜索与生成式视频的效率。 GB300 NVL72刷新MLPerf纪录除了发布新架构，英伟达还公布了MLPerf Inference v5.1基准测试结果。基于Blackwell Ultra架构的GB300 NVL72系统，在Llama 3.1 405B，Whisper等任务中刷新纪录。在6710亿参数的DeepSeek-R1混合专家模型测试中，其单GPU性能较上一代Hopper提升约5倍。这一进步得益于英伟达全栈优化，包括NVFP4低精度加速，TensorRT-LLM库的模型与KV缓存量化，以及针对复杂模型研发的新型并行技术。

英伟达市值破四万亿，AI芯片霸主地位稳固？· 216 条信息

#英伟达 #Rubin CPX #AI推理 #GPU #128GB GDDR7

6个月前

高盛今早更新研报，继续上调寒武纪目标价至人民币2104元，买入评级。 <仅供参考> 日前寒武纪公布强劲的2025年二季度业绩，同时给出2025年收入指引为人民币50亿元至70亿元，中值为人民币60亿元。GS此前对人民币65亿元的预测位于指引区间内，且较指引中值高出8%。 GS强调继续看好寒武纪，并将12个月目标价上调至人民币2,104元（对应2030年预期市盈率45倍）。 GS上调盈利预测主要基于： 🔹 AI芯片出货量更高，这反映出中国CSP在AI基础设施方面的资本开支上升，政府政策支持，以及在推理需求上升背景下本土芯片生态的涌现； 🔹 随着收入规模扩大与运营效率提升，期间费用率（opex ratio）改善，经营杠杆增强。公司过去12个月的“人均（工程师）收入”已由2024年12月的人民币200万元提高至2025年6月的人民币500万元。积极的支持因素： 🔹 中国云端资本开支在加速扩张阿里巴巴2025年二季度资本开支达人民币390亿元（约合54亿美元），环比+57%，同比约为两倍。腾讯2025年二季度资本开支同比+119%，好于此前担忧，高盛将其2025E/2026E资本开支预测分别上调23%/17%，对应2026E资本开支同比+13%。 🔹 支持性的AI政策国务院发布了新的指导意见，设定到2027年/2030年，在6个关键领域（科技，工业，消费，民生，治理与全球协作）的新一代智能终端与AI Agent渗透率目标分别达到70%以上/90%以上，并强调通过行动计划赋能AI设备、提升效率。 🔹 中国AI供应链 2025年上半年实现强劲增长：寒武纪收入快速增长；上游原材料（主要是晶圆）供应稳健；合同负债显示手持订单强劲。AI服务器，交换机品牌商，ODM厂商看到中国云端资本开支上升，本土芯片在推理场景中的性能已能满足需求，同时本土生态持续完善（例如高速网络正释放本土芯片性能，推动AI服务器集群进一步放大）。

#高盛 #寒武纪 #AI芯片 #中国云端资本开支 #AI政策

6个月前

DeepSeek的UE8M0 FP8优化：国产AI与半导体协同的战略转折点在人工智能训练和推理加速的竞赛中，浮点数（Floating Point）的表示方式正成为关键突破口。作为计算机中用于表示小数的核心手段，浮点数由三部分构成：符号位（Sign）、指数（Exponent）和尾数（Mantissa）。符号位决定正负，指数决定小数点的位置，尾数则影响精度。内存位数越多，浮点数的表示精度越高，但同时带来的计算和存储开销也更大。如下图为浮点数据类型的结构。所有显示的值（在 FP16，BF16，FP8 E4M3和FP8 E5M2中）都是最接近数值0.3952的表示形式。在主流硬件生态中，NVIDIA GPU目前支持E4M3与E5M2两种FP8格式，并通过绑定硬件和软件的深度优化提升了其适用性。例如，NVIDIA引入了per-tensor scaling，per-block scaling等动态缩放策略，以解决FP8动态范围不足，容易溢出的难题。同时，在Tensor Core中也专门增加了FP8指令集，使得FP8在H100 GPU上能够充分释放算力。在新一代Blackwell架构中，NVIDIA更进一步提出了“微缩浮点格式”（Microscaling formats），涵盖MXFP8（8位）、MXFP6（6位）、MXFP4（4位）等多种新型表示方式。研究显示，在高质量数据集上，一个8亿参数的模型若采用MXFP8-E4M3格式，并配合优化的数值转换策略，训练结果几乎可与传统的BF16持平。这意味着在Blackwell平台上，MXFP8正在成为兼顾性能与精度的最佳选择。与之相比，中国团队DeepSeek在V3.1模型中提出的UE8M0 FP8格式，走了一条完全不同的道路。UE8M0采取极简设计：8位全部用于指数（Exponent），尾数（Mantissa）为零。换言之，它牺牲了精度，以换取更大的动态范围。在这种格式下，最接近刚才图片内提到的数值0.3952的表示形式为0.5。可以很明显地看出来，精度差异较大，但是这种“极端化”的方案不仅减少了硬件实现复杂度，也为未来中国技术栈在模型训练、部署和推理中的数值优化提供了新的可能性。 1，FP8/UE8M0的优势与权衡 🔹 显存与带宽显著节省：相较于FP16和BF16，8-bit表示可将内存占用与传输成本大幅降低，有利于支持更大规模模型、更高并行度或更多批处理。 🔹 吞吐与能效提升：更窄的数据通路意味着在相同内核与内存带宽下，系统可处理更多算子，整体吞吐率和能效显著提升。 🔹 成本与部署门槛下降：低精度带来更高的性价比，对于数据中心及国产算力环境尤为重要，使大模型在受限带宽或成本条件下的部署成为可能。 🔹 软硬件协同优化：当模型与硬件围绕低精度格式协同设计时（如DeepSeek专门针对“国产芯片优化”），能够释放软硬件一体化的性能潜力。但需要注意的是：更低位宽必然带来精度与鲁棒性下降，尤其是UE8M0这类极端“无尾数”设计，更依赖于训练、量化、校准等算法补偿，以及硬件支持机制。FP8在训练与推理端的应用边界，仍是学术界和工程界研究的活跃话题。 2，UE8M0的战略思维：软件先行推动硬件适配 UE8M0的“发起”方式具有鲜明的战略意义。不同于传统由硬件厂商先定义数据格式，DeepSeek选择在模型端率先采用并公开声明使用UE8M0格式，将其训练与scale策略与该精度绑定。这等于由大模型端主动提出标准，迫使硬件和工具链进行适配。媒体普遍认为，这一举措是“模型先行推动硬件协同”的里程碑事件，加速了国产软硬件一体化的生态建设。 3，战略协同：AI与半导体的一体化生态诚如笔者浅见：DeepSeek的高明之处在于其战略协同。公开资料显示，已有超过15家国内企业正在调整硬件以适配DeepSeek模型，覆盖电信、汽车、移动科技等多个领域，其中包括华为、中国移动等行业巨头。这种合作并非单向： 🔹 对半导体厂商而言，DeepSeek模型成为性能与效率的标杆，推动其改进设计。 🔹 对DeepSeek而言，合作确保了其AI工具的落地基础，开发者与企业正在加速采用。结果是形成一个自我强化的正反馈生态：软件与硬件同步演进，速度甚至可能超过美国碎片化的“AI公司依赖外部芯片”模式。至此，看我推文比较久的小伙伴们或许还记得，我曾写过一篇解读DeepSeek论文的文章：《洞见 —— 硬件与模型协同设计，突破Scaling挑战》（）。如今，看到国内AI企业在这条道路上迈出关键一步，实在令人欣喜。 4，国产芯片代表：寒武纪与华为的FP8路径 🔹 寒武纪（Cambricon）690系列据多家媒体报道，寒武纪MLU370、思元590及最新的思元690均已支持FP8或“Block FP8”。其NeuWare软件栈在低精度支持上提供了完整的工具链，包括量化、混合精度调度以及对主流框架的适配。在硬件层面，寒武纪的MLU架构通过算子引擎、片上缓存和张量内核优化，实现了高吞吐的低精度计算。媒体称思元690在低精度算力与能效上提升明显，已能够兼容DeepSeek模型。需要强调的是，公司公开资料并未披露是否支持UE8M0这类极端格式，实际效果依赖SDK与模型方的适配验证。 🔹 华为（Ascend/昇腾）华为提出了HiFloat8（HiF8）方案（），不同于E4M3/E5M2，而是一种“渐进式（tapered precision）”设计，根据数值区间动态分配指数与尾数，以在范围与精度之间取得平衡。华为的Ascend系列已在OptiQuant、Atlas等平台上支持量化和混合精度，并将HiF8作为未来关键方向。与寒武纪偏重推理优化不同，华为强调同时支持训练的前向与反向传播，力图构建更通用的FP8训练方案。 5，大局观：AI已是国家战略中国的AI发展早已超越实验室阶段，成为国家战略的重要组成部分。通过将AI软件与国产半导体深度结合，北京正在减少对外部技术的依赖，并为未来创新绘制蓝图。 DeepSeek的UE8M0 FP8优化，不仅是数值表示的一次尝试，更是中国在AI软硬件协同上的战略突破。对投资者而言，启示清晰： 🔹 AI的未来不仅仅是算法，而是完整的生态系统。 🔹 DeepSeek与国产半导体生态的绑定，正在塑造这一趋势。最终，问题不是中国能否实现AI自主，而是多块能够实现。而凭借UE8M0 FP8优化与深度产业整合，DeepSeek无疑是目前最值得关注的AI企业之一。

DeepSeek数据泄露：德国下架，信任崩盘· 446 条信息

中国DeepSeek引发美国科技股暴跌事件· 170 条信息

#DeepSeek #UE8M0 FP8 #国产AI #半导体协同 #战略转折

6个月前

DeepSeek V3.1引爆市场：国产芯片概念股集体飙升在DeepSeek V3.1正式发布后，一则简短的官方留言在AI圈内掀起轩然大波。短短不足20个字的表述，却释放出“新架构”“下一代国产芯片”的重磅信号。这一消息迅速传导至资本市场，国产芯片及半导体产业链企业股价应声大涨。寒武纪（#688256）股价强势涨停，创下历史新高1243.20元人民币，市值突破5200亿元，跃居科创板首位。同时，半导体ETF（#159813）收盘也直接触及涨停板。这一波行情不仅体现了市场对国产AI大模型与芯片协同发展（Co-Design）的高度期待，也反映出投资者对中国半导体自主可控进程的信心正在快速升温。

#DeepSeek V3.1 #国产芯片 #寒武纪涨停 #半导体ETF #AI大模型

6个月前

台积电美国工厂迎来盈利拐点：四年亏损近400亿新台币后首次转正 $TSM 日前，全球半导体代工龙头台积电（TSMC）公布2025年第二季度财报，凭借在先进制程领域的持续领先，公司本季税后净利润达3982.7亿新台币，同比增长逾六成，净利润率高达42.7%，展现出强劲的盈利能力。值得关注的是，台积电位于美国亚利桑那州的晶圆厂在历经四年、累计亏损近400亿新台币后，终于在本季度实现税后净利润42.32亿新台币，并在上半年累计盈利47.28亿新台币。这一里程碑意味着台积电在美国的先进制程布局正式步入盈利阶段。相比之下，由台积电、索尼及丰田共同投资的日本熊本厂（JASM）仍处于亏损状态，凸显出美国资产率先完成从“烧钱”到盈利的转折。业内人士认为，这不仅提升了台积电在全球供应链中的战略价值，也为其在国际市场的长期布局注入信心。

#台积电 #美国工厂 #盈利 #亚利桑那州 #半导体