駿HaYaO

统计数据

11

文章

0

粉丝

0

获赞

149

阅读

10小时前

HDD 與記憶體： Google TurboQuant 疑慮過度，HDD與記憶體股迎來進場良機 Google Research 於 2026 年 3 月 24 日發表 TurboQuant 壓縮技術，宣稱可將 KV cache 記憶體用量降低 6 倍、Nvidia H100 GPU 推論效能提升最高 8 倍。此消息導致 HDD 與記憶體相關股票大幅回落，其中 WDC 下跌 21%、STX 下跌 17%、SNDK 下跌 26%。然而，分析師認為此疑慮嚴重過度反應。 TurboQuant 僅針對推論階段的 KV cache 進行壓縮，對模型權重、訓練資料或靜態儲存完全無影響，因此對 HDD 需求毫無衝擊，對 NAND 的影響也僅屬間接且微小。AI 工作負載持續強勁，搭配豐富內容創作、更長資料保留需求及資料主權規範，HDD 與 NAND 的需求及平均售價（ASP）均優於預期。分析師大幅上調成長預估，預期 WDC 與 STX 合併營收自 FY25 至 FY30 將以 24% CAGR 成長，由 24% 位元成長與持平 ASP 所支撐，遠優於先前預估。面對股價回檔，分析師將 WDC 評級升至 Outperform，目標價調升，預估 FY25-30 五年 EPS CAGR 達 46%。WDC 的 ePMR 技術可延長傳統製程 1-2 年，但 HAMR 時程略為延後。 STX 全力發展 HAMR，預計 FY27 起面密度優勢將顯著顯現，五年 EPS CAGR 高達 51%，目標價上調，仍為 HDD 產業首選。

1周前

三星電子正與 Google、Microsoft 洽談史上首個具約束力的長期記憶體供應協議（LTAs），標誌記憶體產業重大典範轉移。AI 資料中心爆發式建置導致記憶體嚴重短缺，DRAM 價格已飆升至接近 HBM 利潤水準，美國 hyperscalers 急於鎖定穩定供貨。合約結構多採「固定供貨量＋價格連動現貨市場」，客戶需支付大額預付款（傳 Microsoft 逾 100 億美元），若未提領約定量則從預付款扣除，合約期約 3–5 年。此模式讓三星、SK 海力士、美光獲得長期需求可見度，可放心加速擴產投資，避免過去週期性庫存過剩與價格崩跌。美光已簽署首個五年策略客戶協議，SK 海力士也與部分客戶達成 LTAs，預計年中前涵蓋所有主要雲端巨頭。三星 CEO 強調，此舉將大幅降低中長期業務不確定性，維持健康供需平衡與可預測的利潤穩定性。這波具強制約束力的 LTAs（靠預付款執行），代表記憶體產業進入「供給端更有主導權」的新時代。

1个月前

三星與SK海力士Q2大幅調漲DRAM價格，漲勢恐延續至明年全球兩大DRAM龍頭三星電子與SK海力士已通知客戶，第二季將再次大幅調漲DRAM供應價格。受全球AI投資熱潮推動，DRAM需求爆炸性成長，遠超兩家公司產能，業界預估全年累計漲幅可能高達130%。產業消息指出，三星目前產能僅能滿足約60%的持續激增需求，客戶更重視確保供貨量而非抗拒漲價，因此漲幅推行阻力小。非主要客戶可能需接受價格翻倍以上的條件才能取得配額。自去年下半年AI基礎設施建設潮以來，DRAM價格已大幅飆升，傳統交易模式徹底改變：大型科技巨頭如NVIDIA、Apple享有長期合約與優惠價格，而中小型客戶被迫轉為季度「前瞻承諾」合約，第二季到期合約面臨更劇烈的漲幅。 Gartner預測，包含DRAM在內的記憶體價格今年將上漲130%。DRAMeXchange數據顯示，DDR4 8Gb價格從去年3月的1.3美元，飆升至今年2月的13美元，漲幅驚人。產業分析認為，這非短期供需失衡，而是結構性問題：AI正從搜尋型應用轉向「代理型AI」，企業、政府乃至手機同時採用多種模型，推升對DRAM（用於推論與運算）的需求持續爆炸。三大記憶體廠商今年產能僅持平或微增7%（SK海力士），明年供貨量已提前售罄，價格上漲趨勢預計將延續至2026年。

1个月前

一直在強調半導體測試（semiconductor test）的重要性日益提升，以及相關供應鏈中的關鍵贏家。最近日月光(ASE)的財報持續釋放正面訊號支持此觀點： - 測試部門成長速度持續超越封裝部門（以百分比計算） - 測試收入佔總 ATM 部門的比例持續上升 - 測試機台產能年增 +17%

1个月前

NOR Flash 短缺隱現：AI 資料中心需求衝擊 AI 資料中心熱潮持續延燒，先前已導致 DRAM 與 NAND 供應緊繃，如今連 NOR Flash 也即將面臨短缺危機。 EEtimes 指出，AI 伺服器與高效能運算裝置對 NOR Flash 需求急速上升，主要用於儲存開機程式碼、韌體及元資料設定，這些程式碼可直接在 NOR 上就地執行（execute in place），提供極低延遲的隨機存取。據台灣《工商時報》報導，一個 GPU 伺服器機架現今可能搭載高達 30 個 NOR 裝置；以 Nvidia GB200 NVL72 系統為例，NOR 成本最高可達 600 美元，預估未來幾年恐攀升至 900 美元。 NOR Flash 與 NAND 的核心差異在於單元結構：NOR 採用並聯設計，讀取速度快、適合就地執行，但寫入較慢；NAND 則串聯，容量更大卻隨機存取效能較低，因此 NOR 在 AI 伺服器等低延遲場景中不可或缺。主要供應商部分，旺宏電子（Macronix）表示 2D NOR 需求強勁，但因擴大 NAND 產能，3D NOR 導入延後兩年。華邦電（Winbond）則計畫將 NOR 產能年增 30% 至 40%，並透露今年與明年的 DRAM、NOR、NAND 產能皆已全數訂滿，預期產業上行週期將延續較長時間。

1个月前

話雖如此，即使三星在 HBM4 的性能差距正在縮小，SK 海力士憑藉其經過驗證的往績與可靠性，仍將繼續定位為 Rubin 世代的主要 HBM 供應商。因此，對於 R200 等級的 HBM 供應，我們預計 SK 海力士在 Rubin 上市後首 12 個月內將佔據約 60% 的市場份額，其次為三星約 30%，而美光在這段期間則無供應份額。

1个月前

III. 記憶體半導體產業現況與展望中國記憶體半導體企業趨勢 - CXMT 目前正在上海興建新的第二條生產線，預計第1階段於2028年（CY28）開始量產，第2階段於2029年（CY29）量產。 - 華為自2024年底起已運營一條約10萬片規模的DRAM生產線（包括Swaysure），用於生產特殊用途DRAM。有傳言稱該生產線未來可能移轉給CXMT或長江存儲（YMTC）。 - 有傳聞指出，長江存儲（YMTC）將把武漢新生產線轉為DRAM或HBM生產。 - 普遍認為，未來中國DRAM產能將持續大幅增加的可能性存在。 - 然而，由於過去幾年累積的設備即將耗盡，中國企業將主要依賴國產設備來生產1A奈米以下的製程DRAM。因此，儘管產線擴張，DRAM產能的增長速度仍極不可能非常高。〈表6〉中國記憶體半導體企業現況 CXMT - 主要產品: DRAM（DDR4/5、LPDDR4/5，未來HBM） - 專案/技術: ~18.5nm級DUV DRAM - 產能（每月晶圓片數）: 目前約250K，上海預計新增200K YMTC - 主要產品: 3D NAND（232層、294層TLC等）未來DRAM及HBM生產計畫 - 專案/技術: 3D NAND Stack - 產能（每月晶圓片數）:目前150K/月（設計產能300K）華為（記憶體） - 主要產品: 特殊用途DDR4 - 專案/技術: 成熟工程中心 - 產能（每月晶圓片數）: 目前100K/月

2个月前

中國長江存儲發動 NAND 快閃記憶體產量擴大攻勢…「武漢新廠提前投產」中國最大 NAND 快閃記憶體企業長江存儲科技（YMTC）正在以前所未有的速度推進位於中國武漢的新建第三期投資計畫。業界消息人士透露，原本預定2027年才投產的武漢新廠（第三工廠），目前建設進度大幅超前，企業內部已將投產時程提前至2026年內，甚至可能更早實現量產。 YMTC 正積極擴大產能，以搶攻全球 NAND 快閃記憶體市場占有率。尤其在 AI 伺服器需求爆炸性成長帶動下，高效能 NAND 與 QLC（四位元儲存單元）產品需求急增，YMTC 希望趁勢超越競爭對手三星電子、SK 海力士與鎧俠（Kioxia）等韓日廠商。據熟悉內情人士表示：「YMTC 第三工廠的設備導入與潔淨室建設速度非常快，預計將比原計畫提前至少半年以上投產。這是為了因應 AI 時代記憶體需求暴增，展現出極為強勢的擴產意志。」 YMTC 自從被美國列入實體清單（Entity List）後，雖然面臨先進設備進口限制，但仍透過中國國內設備廠商（如北方華創 NAURA、盛美上海 ACM Research 等）與自主技術突破，持續提升 3D NAND 層數與良率。目前已量產超過 200 層以上的產品，並積極開發 300 層級以上的下一代技術。此次提前投產計畫，被視為中國政府強力支持半導體自給自足戰略的具體展現。儘管受到美方制裁，YMTC 的全球市場占有率仍從數年前的約 5% 逐步提升至接近 10%，並有預測指出 2026–2027 年間可能進入全球前四強。業界分析指出：「YMTC 以極具攻擊性的價格策略與快速擴產，正在改變 NAND 市場競爭格局。韓國與日本企業若無法加速技術迭代與產能投資，可能會失去更多市占。」

5个月前

"這應該是明年2026除了NV 的GB方案之外,最大的AI Data center 所使用的產品方案,可以留意Google 這個方案的相關供應鏈,明年2026的業績應該都相當不錯,Google 這次委託ASIC 廠商3nm的量產交付時間,比Nvidia的Vera, Rubin 還早。"

#Google #AI Data Center #2026 #ASIC 3nm #业绩积极

6个月前

NVIDIA Rubin CPX：解耦推理革命與 GDDR7 重塑記憶體供應鏈 1. 核心理念：解耦推理（Disaggregated Inference） - 背景：AI 大模型推理分為兩個階段：預輸入（Prefill/Context）階段：運算密集型（FLOPS 重），但記憶體頻寬利用率低（<10%）。傳統 GPU 使用昂貴 HBM 處理此階段，造成資源浪費。生成（Decode/Generation）階段：記憶體頻寬密集型（>90% 利用率），適合 HBM。 - Rubin CPX 創新：專為預輸入階段設計，強調 FLOPS 計算（單晶片達 30 petaFLOPS NVFP4），而非高頻寬。單一單片晶片搭載 128GB GDDR7（頻寬約 2 TB/s），成本僅 HBM 的 1/2，製造成本估計為標準 Rubin R200 的 1/4。 - 效益：解耦後，預輸入成本降低，ROI 達 30~50 倍。整體系統效率提升 3~7.5 倍（如 Vera Rubin NVL144 CPX 機架達 8 exaFLOPS）。 - 補充：NVIDIA 官方表示，此設計支援長上下文（>1M tokens）工作負載，如影片生成與程式碼編寫，整合 NVENC/NVDEC 影片編解碼器。 2. 技術規格與設計靈活性規格項目: Rubin CPX (預輸入專用) | 標準 Rubin R200 (通用) 計算性能: 30 petaFLOPS NVFP4 | 33.3 petaFLOPS NVFP4 記憶體類型: 128GB GDDR7 (2 TB/s) | 288GB HBM4 (20.5 TB/s) 封裝設計: 單片晶片 (Monolithic) | 雙晶片封裝互聯: PCIe Gen 6 (無 NVLink) | NVLink 適用階段: Prefill (運算重) | Decode (頻寬重) 成本優勢: 每 GB 成本 < HBM/2 | 高端但通用 - 機架整合：Vera Rubin NVL144 CPX 機架混合 Rubin GPU 與 CPX，支援異質部署（e.g., 144 顆 GPU + 36 顆 Vera CPU）。雙機架方案允許獨立擴展，調整 Prefill/Decode 比例。 - 軟體支援：整合 NVIDIA Dynamo、TensorRT-LLM，提升吞吐量並降低延遲。 3. 對產業路線圖的重塑 - NVIDIA 優勢擴大：此為 GPU 發展「新方向」，拉大與競爭對手的機架級差距。AMD（MI400）及 ASIC 供應商（如 Google TPU、Meta MTIA）需重新投資預輸入專用晶片，否則 TCO（總擁有成本）更高。 - 競爭壓力：AMD 等先前追趕 NVIDIA 機架方案，現須加倍開發專用硬體。ASIC 雖高效，但缺乏靈活性（無法適應算法變化，如 Transformer 轉量子計算）。 - 市場影響：預輸入成本降，需求增（類似摩爾定律效應），整體推理市場擴大。NVIDIA 預估每 $1 億投資產生 $50 億 tokens 收入。 - 補充：有投資者視此為 NVIDIA 對 ASIC 威脅的「第三條路」（非純 GPU/ASIC），強化 disaggregated computing。 4. GDDR7 重塑記憶體供應鏈 - 需求激增：Rubin CPX 減少 HBM 依賴（系統成本中 HBM 佔比降），轉向 GDDR7。RTX Pro 6000 已下大規模訂單，CPX 將放大此趨勢。 - 受益者：三星電子（Samsung）最大贏家，獨佔 NVIDIA 大批量 GDDR7 訂單（產能靈活）。SK Hynix 與 Micron 產能被 HBM 佔用，無法跟上（非技術問題）。 - 供應鏈變革： - GDDR7 利潤率低（技術門檻低、競爭激烈），但需求爆發將擴大市場規模（成本降 > 需求增）。 - HBM 需求不會崩盤（仍主導 Decode），但總市場轉向 GDDR7 平衡。SemiAnalysis 預測：整體記憶體市場成長，HBM 佔比降但絕對值升。 - 補充：Rubin CPX 上市（2026 年底）將重塑 AI 記憶體需求，GDDR7 訂單已翻倍。有人指出，三星 GDDR7 供應鏈將受益於 NVIDIA 的「突然湧現」訂單。結語與展望 Rubin CPX 不僅解決推理效率瓶頸，更象徵 NVIDIA 從「通用 GPU」轉向「專用生態」策略，迫使產業跟進 disaggregated 設計。供應鏈方面，GDDR7 的崛起將緩解 HBM 短缺，但加劇三星 vs. SK Hynix/Micron 的競爭。預計 2026 年底上市後，將加速 AI 推理「經濟性」革命，ROI 潛力巨大。

#NVIDIA Rubin CPX #解耦推理 #GDDR7 #三星 #AI推理

1年前

Morgan Stanley的NVIDIA GTC預覽： NVIDIA將於下週舉行其年度GTC大會，首席執行官黃仁勳將於3月18日發表主題演講。本報告總結了對亞洲科技供應鏈的預期和影響。 Blackwell Ultra預計於2025年第二季度推出 Blackwell Ultra很可能是NVIDIA在2025年GTC上推出的關鍵產品，作為Blackwell（B200）的後繼者。我們的研究顯示，Blackwell Ultra（基於台積電N4P製程的B300晶片）包括與B200晶片相似的邏輯晶片，具有以下特點： - 更高的HBM（高頻寬記憶體）容量（288GB，採用4x/8x HBM3e 12hi） - 更高的功耗（TDP：1.4kW）我們估計Blackwell Ultra的FP4性能將比B200高出50%，首批出貨將於2025年第三季度開始。 Blackwell Ultra潛在的關鍵規格變化 1. 採用GPU插座架構 2. 回歸OAM+UBB計算板：單板搭載四個GPU模組和兩個Grace CPU（代號：Cordelia） 3. 功耗增加 4. 可能採用BBU（電池備援單元）和超級電容器 5. 液冷設計的變化，特別是UQD和冷板 6. 採用ConnectX 8800G網絡卡 7. 可選整合HMC和DC-SCM 這些規格變化的主要受益者 - 電源與BBU/超級電容器系統：台達電子（Delta Electronics） - 電池組供應商：AES - 液冷與冷板供應商： AVC、Auras - UQD供應商：Fositek - OAM/UBB伺服器供應商：緯創（Wistron） - HBM（高頻寬記憶體）供應商：SK海力士（HBM容量增加50%） - 網絡與插座供應商：FIT、Lotes Vera Rubin平台預覽：Rubin Ultra的暗示？雖然Rubin GPU（基於台積電N3P製程）預計要到2026年才會推出，但根據去年GTC的採用速度，NVIDIA可能會透露一些關於Rubin平台的細節。根據我們的研究，Rubin GPU可能採用雙邏輯晶片設計（類似Blackwell），包括： - 兩個台積電N3晶片 - 八個HBM4立方體，總HBM容量為384GB（比Blackwell Ultra增加33%）我們預計功耗將進一步增加至約1.8kW TDP，Vera ARM CPU將遷移至台積電N3製程，可能採用2.5D封裝結構。供應鏈分析表明，Rubin的時間表可能會加速，大規模生產可能在2025年底或2026年初開始，但有意義的出貨最早要到2026年第二季度才會開始。 Rubin平台預計將配備1.6T網絡，並採用雙ConnectX9網絡卡。雖然系統設計細節尚不清楚，但我們認為NVL144和可能的NVL288機架結構可能會被考慮用於Rubin平台。機架GPU密度增加和功耗上升趨勢對電源和冷卻解決方案供應商有利。此外，系統設計複雜性的增加對ODM供應商有利。然而，我們預計2025年GTC不會透露太多關於Rubin Ultra的細節——我們的初步研究表明，其矽片將更加複雜。機架GPU密度增加的影響：NVL144與NVL288 我們的研究表明，NVIDIA可能會增加每個機架的GPU密度，從目前的NVL36/72提升至NVL144/288，以提高成本效率。這一變化可能需要部署獨立的電源機架（而不是NVL72機架內整合的電源）。每個機架可能支援300,000W至700,000W的功率，伺服器機架需要更高的電壓（400V+）以減少功率損耗。潛在的關鍵受益者 - BBU/超級電容器與電壓調節模組供應商：台達電子 - 電池組供應商：AES NVIDIA的CPO（共封裝光學）路線圖與受益者供應鏈研究表明，NVIDIA可能會在GTC上概述其CPO（共封裝光學）路線圖。 CPO採用預計將從交換機開始，作為Blackwell Ultra平台中Infiniband（Quantum）和乙太網（Spectrum）的頂級機架數據中心交換機解決方案的可選方案。 CPO對於提高頻寬和降低延遲同時減少功耗至關重要。然而，CPO交換機的立即採用率仍然相對較低。 CPO採用的關鍵轉折點將取決於其在GPU中的整合，這可能要到2027年的Rubin Ultra才會發生。 CPO在AI GPU中採用的關鍵技術挑戰 - 熱管理：光學引擎產生大量熱量 - 可靠性問題 - IC基板翹曲：由於所需更大尺寸隨著CPO交換機基板尺寸增加20-30%，這為基板供應商提供了關鍵機會。對於CPO-on-Interposer GPU，基板設計可能比當前GPU大2-3倍，推動對玻璃核心基板的需求，並惠及UMC等供應商。 GB300液冷採用可能增加我們估計，GB300計算托盤的冷板模組成本將比GB200高出至少10%，原因是快速斷開（QD）連接器和內部管道的增加。雖然Vera Rubin平台的細節尚不清楚，但我們推測更高的TDP將繼續推動液冷需求。關鍵受益者 - 冷板供應商：AVC - UQD供應商：Fositek（GB300相較GB200的QD出貨量增加） Blackwell Ultra與Rubin中伺服器ODM的價值提升隨著伺服器設計更複雜且內部組件比例更高（例如液冷組件），伺服器ODM可能在Blackwell Ultra和Rubin GPU世代中創造更大價值。在組件層面，緯創在GB300 OAM/UBB中獲得了更多份額，但競爭和PCB相對於GPU的較慢增長仍令人擔憂。在系統層面，我們認為廣達（Quanta）和鴻海（Foxconn）將繼續是關鍵參與者，因為它們擁有強大的資本地位和美國製造基礎。如果GB300出貨量達到一定規模，客戶可能會引入第二個ODM來源。

#NVIDIA #GTC会议 #黄仁勋 #亚洲科技供应链 #Blackwell Ultra