时政
财经
科技
虚拟货币
其他
登录
駿HaYaO
关注
统计数据
11
文章
0
粉丝
0
获赞
149
阅读
热门文章
1
TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...
145
32
駿HaYaO
10小时前
HDD 與記憶體: Google TurboQuant 疑慮過度,HDD與記憶體股迎來進場良機 Google Research 於 2026 年 3 月 24 日發表 TurboQuant 壓縮技術,宣稱可將 KV cache 記憶體用量降低 6 倍、Nvidia H100 GPU 推論效能提升最高 8 倍。此消息導致 HDD 與記憶體相關股票大幅回落,其中 WDC 下跌 21%、STX 下跌 17%、SNDK 下跌 26%。然而,分析師認為此疑慮嚴重過度反應。 TurboQuant 僅針對推論階段的 KV cache 進行壓縮,對模型權重、訓練資料或靜態儲存完全無影響,因此對 HDD 需求毫無衝擊,對 NAND 的影響也僅屬間接且微小。AI 工作負載持續強勁,搭配豐富內容創作、更長資料保留需求及資料主權規範,HDD 與 NAND 的需求及平均售價(ASP)均優於預期。 分析師大幅上調成長預估,預期 WDC 與 STX 合併營收自 FY25 至 FY30 將以 24% CAGR 成長,由 24% 位元成長與持平 ASP 所支撐,遠優於先前預估。 面對股價回檔,分析師將 WDC 評級升至 Outperform,目標價調升,預估 FY25-30 五年 EPS CAGR 達 46%。WDC 的 ePMR 技術可延長傳統製程 1-2 年,但 HAMR 時程略為延後。 STX 全力發展 HAMR,預計 FY27 起面密度優勢將顯著顯現,五年 EPS CAGR 高達 51%,目標價上調,仍為 HDD 產業首選。
分享
评论 0
0
駿HaYaO
1周前
三星電子正與 Google、Microsoft 洽談史上首個具約束力的長期記憶體供應協議(LTAs),標誌記憶體產業重大典範轉移。AI 資料中心爆發式建置導致記憶體嚴重短缺,DRAM 價格已飆升至接近 HBM 利潤水準,美國 hyperscalers 急於鎖定穩定供貨。 合約結構多採「固定供貨量+價格連動現貨市場」,客戶需支付大額預付款(傳 Microsoft 逾 100 億美元),若未提領約定量則從預付款扣除,合約期約 3–5 年。此模式讓三星、SK 海力士、美光獲得長期需求可見度,可放心加速擴產投資,避免過去週期性庫存過剩與價格崩跌。 美光已簽署首個五年策略客戶協議,SK 海力士也與部分客戶達成 LTAs,預計年中前涵蓋所有主要雲端巨頭。三星 CEO 強調,此舉將大幅降低中長期業務不確定性,維持健康供需平衡與可預測的利潤穩定性。這波具強制約束力的 LTAs(靠預付款執行),代表記憶體產業進入「供給端更有主導權」的新時代。
分享
评论 0
0
駿HaYaO
1个月前
三星與SK海力士Q2大幅調漲DRAM價格,漲勢恐延續至明年 全球兩大DRAM龍頭三星電子與SK海力士已通知客戶,第二季將再次大幅調漲DRAM供應價格。受全球AI投資熱潮推動,DRAM需求爆炸性成長,遠超兩家公司產能,業界預估全年累計漲幅可能高達130%。 產業消息指出,三星目前產能僅能滿足約60%的持續激增需求,客戶更重視確保供貨量而非抗拒漲價,因此漲幅推行阻力小。非主要客戶可能需接受價格翻倍以上的條件才能取得配額。自去年下半年AI基礎設施建設潮以來,DRAM價格已大幅飆升,傳統交易模式徹底改變:大型科技巨頭如NVIDIA、Apple享有長期合約與優惠價格,而中小型客戶被迫轉為季度「前瞻承諾」合約,第二季到期合約面臨更劇烈的漲幅。 Gartner預測,包含DRAM在內的記憶體價格今年將上漲130%。DRAMeXchange數據顯示,DDR4 8Gb價格從去年3月的1.3美元,飆升至今年2月的13美元,漲幅驚人。產業分析認為,這非短期供需失衡,而是結構性問題:AI正從搜尋型應用轉向「代理型AI」,企業、政府乃至手機同時採用多種模型,推升對DRAM(用於推論與運算)的需求持續爆炸。 三大記憶體廠商今年產能僅持平或微增7%(SK海力士),明年供貨量已提前售罄,價格上漲趨勢預計將延續至2026年。
分享
评论 0
0
駿HaYaO
1个月前
一直在強調半導體測試(semiconductor test)的重要性日益提升,以及相關供應鏈中的關鍵贏家。 最近 日月光(ASE)的財報持續釋放正面訊號支持此觀點: - 測試部門成長速度持續超越封裝部門(以百分比計算) - 測試收入佔總 ATM 部門的比例持續上升 - 測試機台產能年增 +17%
分享
评论 0
0
駿HaYaO
1个月前
NOR Flash 短缺隱現:AI 資料中心需求衝擊 AI 資料中心熱潮持續延燒,先前已導致 DRAM 與 NAND 供應緊繃,如今連 NOR Flash 也即將面臨短缺危機。 EEtimes 指出,AI 伺服器與高效能運算裝置對 NOR Flash 需求急速上升,主要用於儲存開機程式碼、韌體及元資料設定,這些程式碼可直接在 NOR 上就地執行(execute in place),提供極低延遲的隨機存取。 據台灣《工商時報》報導,一個 GPU 伺服器機架現今可能搭載高達 30 個 NOR 裝置;以 Nvidia GB200 NVL72 系統為例,NOR 成本最高可達 600 美元,預估未來幾年恐攀升至 900 美元。 NOR Flash 與 NAND 的核心差異在於單元結構:NOR 採用並聯設計,讀取速度快、適合就地執行,但寫入較慢;NAND 則串聯,容量更大卻隨機存取效能較低,因此 NOR 在 AI 伺服器等低延遲場景中不可或缺。 主要供應商部分,旺宏電子(Macronix)表示 2D NOR 需求強勁,但因擴大 NAND 產能,3D NOR 導入延後兩年。華邦電(Winbond)則計畫將 NOR 產能年增 30% 至 40%,並透露今年與明年的 DRAM、NOR、NAND 產能皆已全數訂滿,預期產業上行週期將延續較長時間。
分享
评论 0
0
駿HaYaO
1个月前
話雖如此,即使三星在 HBM4 的性能差距正在縮小,SK 海力士憑藉其經過驗證的往績與可靠性,仍將繼續定位為 Rubin 世代的主要 HBM 供應商。因此,對於 R200 等級的 HBM 供應,我們預計 SK 海力士在 Rubin 上市後首 12 個月內將佔據約 60% 的市場份額,其次為三星約 30%,而美光在這段期間則無供應份額。
分享
评论 0
0
駿HaYaO
1个月前
III. 記憶體半導體產業現況與展望 中國記憶體半導體企業趨勢 - CXMT 目前正在上海興建新的第二條生產線,預計第1階段於2028年(CY28)開始量產,第2階段於2029年(CY29)量產。 - 華為自2024年底起已運營一條約10萬片規模的DRAM生產線(包括Swaysure),用於生產特殊用途DRAM。有傳言稱該生產線未來可能移轉給CXMT或長江存儲(YMTC)。 - 有傳聞指出,長江存儲(YMTC)將把武漢新生產線轉為DRAM或HBM生產。 - 普遍認為,未來中國DRAM產能將持續大幅增加的可能性存在。 - 然而,由於過去幾年累積的設備即將耗盡,中國企業將主要依賴國產設備來生產1A奈米以下的製程DRAM。因此,儘管產線擴張,DRAM產能的增長速度仍極不可能非常高。 〈表6〉中國記憶體半導體企業現況 CXMT - 主要產品: DRAM(DDR4/5、LPDDR4/5,未來HBM) - 專案/技術: ~18.5nm級DUV DRAM - 產能(每月晶圓片數): 目前約250K,上海預計新增200K YMTC - 主要產品: 3D NAND(232層、294層TLC等) 未來DRAM及HBM生產計畫 - 專案/技術: 3D NAND Stack - 產能(每月晶圓片數):目前150K/月(設計產能300K) 華為(記憶體) - 主要產品: 特殊用途DDR4 - 專案/技術: 成熟工程中心 - 產能(每月晶圓片數): 目前100K/月
分享
评论 0
0
駿HaYaO
2个月前
中國長江存儲發動 NAND 快閃記憶體產量擴大攻勢…「武漢新廠提前投產」 中國最大 NAND 快閃記憶體企業長江存儲科技(YMTC)正在以前所未有的速度推進位於中國武漢的新建第三期投資計畫。 業界消息人士透露,原本預定2027年才投產的武漢新廠(第三工廠),目前建設進度大幅超前,企業內部已將投產時程提前至2026年內,甚至可能更早實現量產。 YMTC 正積極擴大產能,以搶攻全球 NAND 快閃記憶體市場占有率。尤其在 AI 伺服器需求爆炸性成長帶動下,高效能 NAND 與 QLC(四位元儲存單元)產品需求急增,YMTC 希望趁勢超越競爭對手三星電子、SK 海力士與鎧俠(Kioxia)等韓日廠商。 據熟悉內情人士表示:「YMTC 第三工廠的設備導入與潔淨室建設速度非常快,預計將比原計畫提前至少半年以上投產。這是為了因應 AI 時代記憶體需求暴增,展現出極為強勢的擴產意志。」 YMTC 自從被美國列入實體清單(Entity List)後,雖然面臨先進設備進口限制,但仍透過中國國內設備廠商(如北方華創 NAURA、盛美上海 ACM Research 等)與自主技術突破,持續提升 3D NAND 層數與良率。目前已量產超過 200 層以上的產品,並積極開發 300 層級以上的下一代技術。 此次提前投產計畫,被視為中國政府強力支持半導體自給自足戰略的具體展現。儘管受到美方制裁,YMTC 的全球市場占有率仍從數年前的約 5% 逐步提升至接近 10%,並有預測指出 2026–2027 年間可能進入全球前四強。 業界分析指出:「YMTC 以極具攻擊性的價格策略與快速擴產,正在改變 NAND 市場競爭格局。韓國與日本企業若無法加速技術迭代與產能投資,可能會失去更多市占。」
分享
评论 0
0
駿HaYaO
5个月前
"這應該是明年2026除了NV 的GB方案之外,最大的AI Data center 所使用的產品方案,可以留意Google 這個方案的相關供應鏈,明年2026的業績應該都相當不錯,Google 這次委託ASIC 廠商3nm的量產交付時間,比Nvidia的Vera, Rubin 還早。"
#Google
#AI Data Center
#2026
#ASIC 3nm
#业绩积极
分享
评论 0
0
駿HaYaO
6个月前
NVIDIA Rubin CPX:解耦推理革命與 GDDR7 重塑記憶體供應鏈 1. 核心理念:解耦推理(Disaggregated Inference) - 背景:AI 大模型推理分為兩個階段: 預輸入(Prefill/Context)階段:運算密集型(FLOPS 重),但記憶體頻寬利用率低(<10%)。傳統 GPU 使用昂貴 HBM 處理此階段,造成資源浪費。 生成(Decode/Generation)階段:記憶體頻寬密集型(>90% 利用率),適合 HBM。 - Rubin CPX 創新:專為預輸入階段設計,強調 FLOPS 計算(單晶片達 30 petaFLOPS NVFP4),而非高頻寬。單一單片晶片搭載 128GB GDDR7(頻寬約 2 TB/s),成本僅 HBM 的 1/2,製造成本估計為標準 Rubin R200 的 1/4。 - 效益:解耦後,預輸入成本降低,ROI 達 30~50 倍。整體系統效率提升 3~7.5 倍(如 Vera Rubin NVL144 CPX 機架達 8 exaFLOPS)。 - 補充:NVIDIA 官方表示,此設計支援長上下文(>1M tokens)工作負載,如影片生成與程式碼編寫,整合 NVENC/NVDEC 影片編解碼器。 2. 技術規格與設計靈活性 規格項目: Rubin CPX (預輸入專用) | 標準 Rubin R200 (通用) 計算性能: 30 petaFLOPS NVFP4 | 33.3 petaFLOPS NVFP4 記憶體類型: 128GB GDDR7 (2 TB/s) | 288GB HBM4 (20.5 TB/s) 封裝設計: 單片晶片 (Monolithic) | 雙晶片封裝 互聯: PCIe Gen 6 (無 NVLink) | NVLink 適用階段: Prefill (運算重) | Decode (頻寬重) 成本優勢: 每 GB 成本 < HBM/2 | 高端但通用 - 機架整合:Vera Rubin NVL144 CPX 機架混合 Rubin GPU 與 CPX,支援異質部署(e.g., 144 顆 GPU + 36 顆 Vera CPU)。雙機架方案允許獨立擴展,調整 Prefill/Decode 比例。 - 軟體支援:整合 NVIDIA Dynamo、TensorRT-LLM,提升吞吐量並降低延遲。 3. 對產業路線圖的重塑 - NVIDIA 優勢擴大:此為 GPU 發展「新方向」,拉大與競爭對手的機架級差距。AMD(MI400)及 ASIC 供應商(如 Google TPU、Meta MTIA)需重新投資預輸入專用晶片,否則 TCO(總擁有成本)更高。 - 競爭壓力:AMD 等先前追趕 NVIDIA 機架方案,現須加倍開發專用硬體。ASIC 雖高效,但缺乏靈活性(無法適應算法變化,如 Transformer 轉量子計算)。 - 市場影響:預輸入成本降,需求增(類似摩爾定律效應),整體推理市場擴大。NVIDIA 預估每 $1 億投資產生 $50 億 tokens 收入。 - 補充:有投資者視此為 NVIDIA 對 ASIC 威脅的「第三條路」(非純 GPU/ASIC),強化 disaggregated computing。 4. GDDR7 重塑記憶體供應鏈 - 需求激增:Rubin CPX 減少 HBM 依賴(系統成本中 HBM 佔比降),轉向 GDDR7。RTX Pro 6000 已下大規模訂單,CPX 將放大此趨勢。 - 受益者:三星電子(Samsung) 最大贏家,獨佔 NVIDIA 大批量 GDDR7 訂單(產能靈活)。SK Hynix 與 Micron 產能被 HBM 佔用,無法跟上(非技術問題)。 - 供應鏈變革: - GDDR7 利潤率低(技術門檻低、競爭激烈),但需求爆發將擴大市場規模(成本降 > 需求增)。 - HBM 需求不會崩盤(仍主導 Decode),但總市場轉向 GDDR7 平衡。SemiAnalysis 預測:整體記憶體市場成長,HBM 佔比降但絕對值升。 - 補充:Rubin CPX 上市(2026 年底)將重塑 AI 記憶體需求,GDDR7 訂單已翻倍。有人指出,三星 GDDR7 供應鏈將受益於 NVIDIA 的「突然湧現」訂單。 結語與展望 Rubin CPX 不僅解決推理效率瓶頸,更象徵 NVIDIA 從「通用 GPU」轉向「專用生態」策略,迫使產業跟進 disaggregated 設計。供應鏈方面,GDDR7 的崛起將緩解 HBM 短缺,但加劇三星 vs. SK Hynix/Micron 的競爭。預計 2026 年底上市後,將加速 AI 推理「經濟性」革命,ROI 潛力巨大。
#NVIDIA Rubin CPX
#解耦推理
#GDDR7
#三星
#AI推理
分享
评论 0
0
駿HaYaO
1年前
Morgan Stanley的NVIDIA GTC預覽: NVIDIA將於下週舉行其年度GTC大會,首席執行官黃仁勳將於3月18日發表主題演講。本報告總結了對亞洲科技供應鏈的預期和影響。 Blackwell Ultra預計於2025年第二季度推出 Blackwell Ultra很可能是NVIDIA在2025年GTC上推出的關鍵產品,作為Blackwell(B200)的後繼者。 我們的研究顯示,Blackwell Ultra(基於台積電N4P製程的B300晶片)包括與B200晶片相似的邏輯晶片,具有以下特點: - 更高的HBM(高頻寬記憶體)容量(288GB,採用4x/8x HBM3e 12hi) - 更高的功耗(TDP:1.4kW) 我們估計Blackwell Ultra的FP4性能將比B200高出50%,首批出貨將於2025年第三季度開始。 Blackwell Ultra潛在的關鍵規格變化 1. 採用GPU插座架構 2. 回歸OAM+UBB計算板:單板搭載四個GPU模組和兩個Grace CPU(代號:Cordelia) 3. 功耗增加 4. 可能採用BBU(電池備援單元)和超級電容器 5. 液冷設計的變化,特別是UQD和冷板 6. 採用ConnectX 8800G網絡卡 7. 可選整合HMC和DC-SCM 這些規格變化的主要受益者 - 電源與BBU/超級電容器系統:台達電子(Delta Electronics) - 電池組供應商:AES - 液冷與冷板供應商: AVC、Auras - UQD供應商:Fositek - OAM/UBB伺服器供應商:緯創(Wistron) - HBM(高頻寬記憶體)供應商:SK海力士(HBM容量增加50%) - 網絡與插座供應商:FIT、Lotes Vera Rubin平台預覽:Rubin Ultra的暗示? 雖然Rubin GPU(基於台積電N3P製程)預計要到2026年才會推出,但根據去年GTC的採用速度,NVIDIA可能會透露一些關於Rubin平台的細節。 根據我們的研究,Rubin GPU可能採用雙邏輯晶片設計(類似Blackwell),包括: - 兩個台積電N3晶片 - 八個HBM4立方體,總HBM容量為384GB(比Blackwell Ultra增加33%) 我們預計功耗將進一步增加至約1.8kW TDP,Vera ARM CPU將遷移至台積電N3製程,可能採用2.5D封裝結構。 供應鏈分析表明,Rubin的時間表可能會加速,大規模生產可能在2025年底或2026年初開始,但有意義的出貨最早要到2026年第二季度才會開始。 Rubin平台預計將配備1.6T網絡,並採用雙ConnectX9網絡卡。 雖然系統設計細節尚不清楚,但我們認為NVL144和可能的NVL288機架結構可能會被考慮用於Rubin平台。 機架GPU密度增加和功耗上升趨勢對電源和冷卻解決方案供應商有利。 此外,系統設計複雜性的增加對ODM供應商有利。 然而,我們預計2025年GTC不會透露太多關於Rubin Ultra的細節——我們的初步研究表明,其矽片將更加複雜。 機架GPU密度增加的影響:NVL144與NVL288 我們的研究表明,NVIDIA可能會增加每個機架的GPU密度,從目前的NVL36/72提升至NVL144/288,以提高成本效率。 這一變化可能需要部署獨立的電源機架(而不是NVL72機架內整合的電源)。 每個機架可能支援300,000W至700,000W的功率,伺服器機架需要更高的電壓(400V+)以減少功率損耗。 潛在的關鍵受益者 - BBU/超級電容器與電壓調節模組供應商:台達電子 - 電池組供應商:AES NVIDIA的CPO(共封裝光學)路線圖與受益者 供應鏈研究表明,NVIDIA可能會在GTC上概述其CPO(共封裝光學)路線圖。 CPO採用預計將從交換機開始,作為Blackwell Ultra平台中Infiniband(Quantum)和乙太網(Spectrum)的頂級機架數據中心交換機解決方案的可選方案。 CPO對於提高頻寬和降低延遲同時減少功耗至關重要。 然而,CPO交換機的立即採用率仍然相對較低。 CPO採用的關鍵轉折點將取決於其在GPU中的整合,這可能要到2027年的Rubin Ultra才會發生。 CPO在AI GPU中採用的關鍵技術挑戰 - 熱管理:光學引擎產生大量熱量 - 可靠性問題 - IC基板翹曲:由於所需更大尺寸 隨著CPO交換機基板尺寸增加20-30%,這為基板供應商提供了關鍵機會。 對於CPO-on-Interposer GPU,基板設計可能比當前GPU大2-3倍,推動對玻璃核心基板的需求,並惠及UMC等供應商。 GB300液冷採用可能增加 我們估計,GB300計算托盤的冷板模組成本將比GB200高出至少10%,原因是快速斷開(QD)連接器和內部管道的增加。 雖然Vera Rubin平台的細節尚不清楚,但我們推測更高的TDP將繼續推動液冷需求。 關鍵受益者 - 冷板供應商:AVC - UQD供應商:Fositek(GB300相較GB200的QD出貨量增加) Blackwell Ultra與Rubin中伺服器ODM的價值提升 隨著伺服器設計更複雜且內部組件比例更高(例如液冷組件),伺服器ODM可能在Blackwell Ultra和Rubin GPU世代中創造更大價值。 在組件層面,緯創在GB300 OAM/UBB中獲得了更多份額,但競爭和PCB相對於GPU的較慢增長仍令人擔憂。 在系統層面,我們認為廣達(Quanta)和鴻海(Foxconn)將繼續是關鍵參與者,因為它們擁有強大的資本地位和美國製造基礎。 如果GB300出貨量達到一定規模,客戶可能會引入第二個ODM來源。
#NVIDIA
#GTC会议
#黄仁勋
#亚洲科技供应链
#Blackwell Ultra
分享
评论 0
0
1
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞