HBM4“通道翻倍”,性能躍升與制造難度并存
HBM4與HBM3e相比最大的變化在于I/O通道數(shù)量從1024個翻倍至2048個,雖然單通道數(shù)據(jù)速率維持在8Gbps以上,但總帶寬實現(xiàn)成倍提升。更高的通道數(shù)量使HBM4即使在同等速率下,也能實現(xiàn)雙倍數(shù)據(jù)吞吐,大幅緩解AI推理與訓(xùn)練中“內(nèi)存帶寬瓶頸”。
但這種躍升也帶來了顯著的制造挑戰(zhàn):
Die面積顯著擴(kuò)大,增加了封裝成本與良率壓力;
更復(fù)雜的信號布線對TSV(硅通孔)工藝、封裝對位精度、熱設(shè)計等提出更高要求;
越來越多廠商從“純內(nèi)存Base Die”轉(zhuǎn)向“邏輯型Base Die”架構(gòu),這不僅增加設(shè)計復(fù)雜度,也抬高了與邏輯芯片協(xié)同的門檻。
因此,HBM4的價格溢價預(yù)計將高于HBM3e的20%,達(dá)到30%以上,未來也可能進(jìn)一步上升。這種成本上浮將直接傳導(dǎo)至AI芯片、整機(jī)服務(wù)器甚至終端應(yīng)用中。
AI大模型的參數(shù)量、上下文長度和推理并發(fā)能力持續(xù)增長,對GPU架構(gòu)提出前所未有的帶寬挑戰(zhàn)。在這個背景下,HBM4已成為高端GPU的必選項。
在2025年GTC大會上,NVIDIA劇透了新一代Rubin GPU架構(gòu),明確配套HBM4作為主存;與此同時,AMD也在準(zhǔn)備與之抗衡的MI400系列,預(yù)計同樣會引入HBM4技術(shù)。
這意味著,未來AI算力競爭的焦點,不只是TFLOPS多少,而是“每秒能處理多少數(shù)據(jù)”。而這背后,HBM4將成為衡量AI芯片綜合性能的關(guān)鍵支點之一。
可以預(yù)見,HBM4的部署不僅會出現(xiàn)在頂級GPU中,還將向AI推理芯片、邊緣計算模塊、AI PC處理器等領(lǐng)域延伸。它將逐步從“旗艦專屬”變?yōu)椤案叨藰?biāo)配”。
邏輯基底成為趨勢,HBM走向“智能化協(xié)同”
除了通道數(shù)量的躍升,HBM4另一關(guān)鍵創(chuàng)新在于:引入邏輯型Base Die架構(gòu)。
以往的HBM3e采用“純內(nèi)存型”Base Die,僅起到信號中轉(zhuǎn)作用,功能相對簡單。而在HBM4中,SK海力士、三星等廠商開始與晶圓代工廠合作,探索引入輕量邏輯功能的底層控制模塊,例如錯誤檢測、電源管理、通道優(yōu)化、SoC協(xié)同等。
這種架構(gòu)升級帶來的價值在于:
降低SoC與HBM之間的延遲,提升帶寬利用率;
更好支持AI芯片復(fù)雜的訪存模式;
為HBM未來嵌入輕計算能力打基礎(chǔ),比如近存計算(Near-Memory Compute)等形態(tài)。
TrendForce預(yù)測說,到2026年,HBM總出貨量將超過300億Gb,HBM4也將在當(dāng)年下半年取代HBM3e成為主流產(chǎn)品。但同時,產(chǎn)業(yè)競爭格局也日趨集中與不均衡。
SK海力士仍將保持超50%的市場份額,在良率、技術(shù)路徑、客戶綁定方面領(lǐng)先;
三星雖具工藝與封裝能力,但需提升HBM4良率與穩(wěn)定性;
美光仍處于追趕階段,HBM3e尚未規(guī)模交付,HBM4量產(chǎn)能力仍待驗證。
此外,由于HBM需要HBM Die + Base Die + TSV封裝 + SoC協(xié)同的完整能力,整個產(chǎn)業(yè)鏈的協(xié)同壓力巨大,任何一環(huán)的不成熟都可能影響產(chǎn)品交付節(jié)奏。
對于下游AI芯片、服務(wù)器整機(jī)廠商而言,選對合作供應(yīng)鏈、預(yù)判量產(chǎn)時點、控制成本溢價,將是能否把握新一代AI基礎(chǔ)設(shè)施機(jī)會的關(guān)鍵。
未來,誰能率先把HBM4穩(wěn)定落地,誰就有可能在下一輪AI芯片大戰(zhàn)中占據(jù)上風(fēng)。我們看到的不僅是一款存儲產(chǎn)品的更替,還是AI基礎(chǔ)設(shè)施底座競爭格局的重構(gòu)。