西安紫光國芯左豐國:以存儲系統(tǒng)結(jié)構(gòu)創(chuàng)新突破存儲墻

算力和存力雖然也在不斷提升,但是比不過數(shù)據(jù)爆炸式增長的速度,于是便出現(xiàn)了不平衡的現(xiàn)象,這被叫做 “存儲墻”。提起存儲墻這個問題,其實行業(yè)里的朋友都很清楚,它是一個由來已久的問題。從上個世紀80年代開始,處理器的性能基本上是按照每1.5年兩倍的速度向前演進……

8月29日,西安紫光國芯半導體股份有限公司(以下簡稱“西安紫光國芯”)副總裁左豐國在杭州開元名都大酒店召開的以“芯存儲 AI未來”為主題的2023閃存峰會上,發(fā)表“以存儲系統(tǒng)結(jié)構(gòu)創(chuàng)新突破存儲墻”的演講,以及西安紫光國芯在相關技術領域的儲備和突破。

以下內(nèi)容根據(jù)演講速記整理。

紫光國芯副總裁左豐國

左豐國:各位嘉賓,各位行業(yè)的朋友,非常榮幸接受邀請來參加FMW會議。我是來自西安紫光國芯的左豐國。西安紫光國芯是一家以DRAM技術為核心的產(chǎn)品和服務提供商。

今天我分享的題目是“用存儲系統(tǒng)結(jié)構(gòu)創(chuàng)新突破存儲墻”。

提起存儲墻這個問題,其實行業(yè)里的朋友都很清楚,它是一個由來已久的問題。從上個世紀80年代開始,處理器的性能基本上是按照每1.5年兩倍的速度向前演進,而存儲系統(tǒng)則是按照每10年兩倍的速度向前演進,最終出現(xiàn)的性能鴻溝表現(xiàn)為“存儲墻”問題。

今天,面對大數(shù)據(jù)大算力需求的情況下,僅僅談CPU處理器的算力顯然是不夠的。我們已經(jīng)進入了一個大算力的時代,在過去的幾年里,我們每個人都見證了大模型數(shù)規(guī)模從千萬級別到千億級別的驚人增長。同時也都感受了ChatGPT這個超級怪物的強大實力,它反映出的是大模型的落地。近年來,大模型帶來的算力需求是以每兩年750倍驚人的速度向前發(fā)展。作為當前全世界算力芯片擔當?shù)腘VIDIA公司,因為算力爆炸性需求也在創(chuàng)造一個又一個歷史,它的市值在2020年首次超過了Intel,今年二季營收135億美元,更是首次單季營收超Intel。

可以說,算力時代帶來了太多意外和驚喜。

回到“存儲墻”話題。事實上,在大算力時代,存儲墻問題比以往任何時候都要凸顯。這個圖上列了兩個存儲基礎圖,上面講了HBM的發(fā)展趨勢,下面講的是GDDR的發(fā)展趨勢??梢钥闯?,從2014年之后,算力芯片已經(jīng)切入到HBM賽道上,隨后HBM芯片一路飆升,今天HBM3已經(jīng)進入量產(chǎn),但是頭部廠商依然覺得HBM3無法滿足需求。所以大家已經(jīng)開始討論HBM3E,說明在大算力時代存儲系統(tǒng)依然是算力系統(tǒng)拖后退的“人”,“存儲墻”問題依然很突出。

紫光國芯副總裁左豐國

今天,我從兩個點分享自己關于突破“存儲墻”的思考。

在芯片級,3D嵌入式DRAM技術是一個非常有潛力的技術。回顧一下GPU系統(tǒng)存儲方案的演進,左邊的圖可以看到典型的板級系統(tǒng),十年前GPU系統(tǒng)都是典型的平面結(jié)構(gòu),GPU芯片和GDDR芯片之間通過毫米級的連接進行數(shù)據(jù)傳輸。2014年HBM器件進入人們的視野,本質(zhì)上是2.5D封裝技術進入到算力芯片領域。它的連接距離達到微米級別。按照這個趨勢,采用3D異質(zhì)集成嵌入式技術在實現(xiàn)提升存儲性能方面有極大的幫助,可為算力系統(tǒng)提供上百TB級別的帶寬,同時在能效比、延遲上好于2.5D結(jié)構(gòu)的。整個存儲系統(tǒng)在結(jié)構(gòu)上,完成了從平面的2D到2.5D再到3D面的演進。

西安紫光國芯提供成熟的三維異質(zhì)集成嵌入式DRAM技術,可以提供數(shù)十到數(shù)百TB的超大帶寬,同時也是一種超低延遲、超低功耗的存儲方案。

目前西安紫光國芯在該技術上已經(jīng)做了比較多的積累,研發(fā)了三代產(chǎn)品。這三代產(chǎn)品不是替換關系,而是針對不同的細分領域。

第一代是實現(xiàn)一層邏輯和一層DRAM的堆疊;第二代實現(xiàn)一層邏輯和兩層DRAM的堆疊;今年推出的第三代產(chǎn)品實現(xiàn)了多層邏輯和多層的DRAM堆疊。這三代結(jié)構(gòu)被證明對于目前的大算力芯片在解決帶寬問題方面是非常好的對策。在設計的時候需要在代碼集成階段、在后端實現(xiàn)的階段把相應的IP集成進去,隨后關鍵點在于在拿到邏輯晶圓的時候做一個3D的堆疊,完成之后多張晶圓變成形式上的單張晶圓,再去做CP測試、封裝。這是在工程上非常容易實現(xiàn)的方案。

接下來分享的是從系統(tǒng)級對于突破存儲墻的思考。CXL技術本身一個開放性的互聯(lián)標準,是Intel在2019年提出來的技術方案,隨后得到了行業(yè)上下游大廠的支持。從本質(zhì)上講CXL技術其實是為了解決處理器和設備之間如何實現(xiàn)存儲數(shù)據(jù)高速訪問的辦法,發(fā)展比較快,2019年提出來第一版,2022年第三版都已經(jīng)推出了。

從技術上,CXL設計的初衷有三個方面,一是實現(xiàn)智能網(wǎng)卡、加速卡的接口的形式存在;二是作為內(nèi)存一致性的接口存在;三是把CXL協(xié)議作為存儲模組或者器件的接口使用,這是在各個場景中跑的比較快的應用。用CXL type 3器件來實現(xiàn)內(nèi)存的容量擴展、帶寬擴展。

CXL Type3如何實現(xiàn)內(nèi)存帶寬的擴展?這個圖是一個典型的2DPC的方案,CPU旁邊還有8個X8的CXL接口,如果在這個方案里面把2DPC改成1DPC,插上另外的一組CXL,內(nèi)存容量保持不變但帶寬增加了。如果在現(xiàn)有的接口上插上CXL的設備,發(fā)現(xiàn)容量和帶寬均實現(xiàn)了拓展。

目前CXL Type3在設備接口和物理形態(tài)上已經(jīng)基本定型,比如接口物理層采用PCIe 5或6,物理形態(tài)上推薦度最高的是E3.S 1T或2T的形態(tài)。

西安紫光國芯是國內(nèi)比較早關注這個技術的公司,在2019年聯(lián)盟開放擴容的時候第一時間加入了,并非常緊密的跟隨技術向前走,參與了標準和技術的討論。基于前面的積累,也發(fā)布了自己相關產(chǎn)品的路線圖,形成了自身CXL技術上的積累。

西安紫光國芯歷史比較久,前身為成立于2004年德國英飛凌西安研發(fā)中心的存儲事業(yè)部,2015年加入到紫光集團,是以DRAM(動態(tài)隨機存取存儲器)技術為核心的產(chǎn)品和服務提供商。作為以科技創(chuàng)新為驅(qū)動的綜合性集成電路設計企業(yè),核心業(yè)務包括標準存儲芯片,模組和系統(tǒng)產(chǎn)品,嵌入式DRAM和存儲控制芯片,以及專用集成電路設計開發(fā)服務。

憑借領先的科技研發(fā)能力、豐富的設計測試量產(chǎn)經(jīng)驗、完善的產(chǎn)品開發(fā)流程和嚴謹?shù)馁|(zhì)量管理體系,公司研發(fā)的DRAM存儲系列產(chǎn)品實現(xiàn)了包括DRAM KGD、DRAM顆粒、模組產(chǎn)品的全系列、全種類覆蓋,填補了國內(nèi)存儲器領域多項高端產(chǎn)品的空白。同時,公司成功開發(fā)超大帶寬、超低功耗、超大容量嵌入式DRAM,多款搭載該技術的高性能SoC芯片產(chǎn)品已實現(xiàn)大規(guī)模量產(chǎn)和銷售。

紫光集團創(chuàng)建于1988年,是具有全球競爭力的領先智能科技產(chǎn)業(yè)集團,擁有覆蓋芯片半導體、信息通信基礎設施、云服務和數(shù)字化解決方案的廣泛產(chǎn)業(yè)布局,致力于成為數(shù)字經(jīng)濟時代科技創(chuàng)新的中堅力量,推動智能科技全產(chǎn)業(yè)鏈生態(tài)體系建設。

這是我報告的所有內(nèi)容,謝謝大家!

【編注:由DOIT傳媒主辦、杭州華瀾微電子股份有限公司協(xié)辦,以“芯存儲 AI未來”為主題的2023閃存峰會,由杭州市蕭山區(qū)人民政府、蕭山經(jīng)濟技術開發(fā)區(qū)管理委員會指導,中國計算機學會信息存儲專委會、中國計算機行業(yè)協(xié)會信息存儲與安全專委會、武漢光電國家研究中心、浙江省半導體行業(yè)協(xié)會等單位支持?!?

分享到

xiesc

相關推薦