我們用擴(kuò)展的香農(nóng)的理論分析存儲(chǔ),這時(shí)候我們就發(fā)現(xiàn)其科學(xué)道理很清楚了:什么是可靠的存儲(chǔ)?讀出的信息完全復(fù)現(xiàn)寫入的信息,但是它是經(jīng)過(guò)一個(gè)信道,這個(gè)信道不是跨越空間的信道,而是跨越時(shí)間的信道。如果我們把通訊理論向時(shí)間軸上拓展,它就變成存儲(chǔ)的理論。
對(duì)于存儲(chǔ)介質(zhì)的基本要求是時(shí)間穩(wěn)態(tài),要在時(shí)間上保持,但是時(shí)間信道是有噪聲的,我們刻在石頭上、寫在竹簡(jiǎn)上、刻在光盤上的東西會(huì)有時(shí)間信道的噪聲,會(huì)隨著時(shí)間的老化而磨損、受損,這些都是屬于時(shí)間信道的噪聲。
我們今天講閃存,閃存的存儲(chǔ)原理是電荷要保持時(shí)間穩(wěn)態(tài),把電子拉到浮柵里面它就是“0”,沒(méi)有電荷的時(shí)候就是“1”。如今,閃存的容量越來(lái)越大,這就是為什么閃存會(huì)逐漸取代硬盤。
閃存現(xiàn)在基本上采用三條技術(shù)路線,一個(gè)是減小線寬,第二是單元多bit,第三是3D堆疊,這幾個(gè)因素對(duì)可靠性帶來(lái)的影響是什么?
線寬變窄了每個(gè)單元就變小了,單元電荷就變少了,電荷少了泄露后對(duì)電位的影響就特別大。窄了以后干擾也大,隧道氧化層變薄。用一個(gè)單元存多個(gè)bit,圖上藍(lán)色的是TPC的比率,它會(huì)越來(lái)越多,如此其讀、寫、擦出的時(shí)間都變長(zhǎng),變得越來(lái)越不可靠。3D堆疊可以減緩線寬,但是會(huì)產(chǎn)生層間的干擾,這也是一個(gè)問(wèn)題。
如今越來(lái)越不可靠的閃存介質(zhì),時(shí)間信道的噪聲越來(lái)越大,如此,我們?cè)趺从迷絹?lái)越不可靠的介質(zhì)構(gòu)建一個(gè)可靠的系統(tǒng)?這就是今天的主題。
在香農(nóng)的理論框架下,首先要想辦法減少噪聲,如果一個(gè)信道完全沒(méi)有噪聲,寫進(jìn)去讀出來(lái)就是完全一樣的。但是現(xiàn)在噪聲越來(lái)越大,所以我們第一點(diǎn)是要盡量降低時(shí)間信道的噪聲,如果降到不能再降了還有噪聲就要用有效的編碼來(lái)保證可靠性。
有了理論框架這個(gè)問(wèn)題就不是很復(fù)雜了。
第一降低信道噪聲。
第二采用編碼。
通訊的信號(hào)隨著距離的增加而衰減,信噪比增加。降低噪聲采用的措施是中繼和放大,我們分析一下,閃存介質(zhì)是一個(gè)不簡(jiǎn)單又不優(yōu)美的介質(zhì),電荷泄露要考慮的因素很復(fù)雜,所以很多情況下就要分析和處理的情況太多,很復(fù)雜。
當(dāng)然,這也為各廠家顯示技術(shù)實(shí)力提供了舞臺(tái),同樣的介質(zhì)不同的廠家的固態(tài)盤產(chǎn)品會(huì)有較大的差別,路遙知馬力,后期的性能、鋪靠性、壽命有很大的差別。
時(shí)間信道的噪聲是閃存不可靠的來(lái)源。
第一是工藝缺陷,第二是電荷泄露,最重要的就是擦寫磨損,P/E是最需要注意的,還有讀寫的干擾。?磨損均衡,最好的效果是均衡地讓每一塊壽命都耗盡,直至徹底失效,第二是減小寫放大,第三是減小位間和層間干擾,第四是用Chorge Trap(電荷捕獲)代替金屬浮柵,減少泄露。
降低信道噪聲更細(xì)致的技術(shù),第一考察塊之間的不均衡性,強(qiáng)塊和弱塊區(qū)別對(duì)待,進(jìn)一步挖掘介質(zhì)潛力,挖掘空間分布的潛力。
第二是全生命周期管理,不同的階段不同對(duì)待,剛開(kāi)始的錯(cuò)誤很少,后面磨損的比較厲害了就需要加強(qiáng),剛才是挖掘空間的潛力,現(xiàn)在是挖掘時(shí)間的潛力。
第三減少讀干擾和編程干擾的新方法。
第四用編程誤碼率作為均衡指標(biāo),反映更真實(shí)的磨損狀態(tài)。
第五通過(guò)新的FLT減小寫放大。
第六為位置感知重分布。
我們對(duì)3D閃存芯片內(nèi)部差異性進(jìn)行了研究,發(fā)現(xiàn)差別是很大的,研究成果發(fā)表在sigmetrics雜志上。錯(cuò)誤模式的研究,研究變成干擾、讀干擾、寫錯(cuò)誤,用合適的pattern進(jìn)行寫入也可以減少磨損。這些細(xì)節(jié)大家可以看我們的論文。
第一是降低噪聲。
二是采用更好的糾錯(cuò)編碼。現(xiàn)在的LDPC有很多改進(jìn),我們這里做了一些研究,我們?cè)O(shè)計(jì)了一個(gè)編碼,它可以使碼源錯(cuò)誤降低30%,還有自適應(yīng)能力,針對(duì)剛開(kāi)始錯(cuò)誤比較少的時(shí)候和后期錯(cuò)誤比較多的時(shí)候,采用不同能力的糾錯(cuò)編碼。
我下面還要介紹一下我們一個(gè)新的研究,叫耗散結(jié)構(gòu)——?jiǎng)討B(tài)超可靠系統(tǒng)。什么意思?心跳平均每分鐘跳70次,一天跳10萬(wàn)次,一年跳3650萬(wàn)次,70年跳26億次,但是世界上沒(méi)有任何一種材料可以經(jīng)得起26億次的疲勞測(cè)試。
但心臟為什么可以?
心肌并不是高可靠材料,關(guān)鍵在于它是一種耗散結(jié)構(gòu),就是說(shuō)它有物質(zhì)能量不斷的進(jìn)入,保持一個(gè)穩(wěn)定的結(jié)構(gòu)。細(xì)胞工作一段時(shí)間就新陳代謝了,它永遠(yuǎn)是很健康的。
它可以新陳代謝,但是總體結(jié)構(gòu)不變,這是一種動(dòng)態(tài)的超可靠系統(tǒng),如果我們把這個(gè)思想用到存儲(chǔ)系統(tǒng)上,就是不可靠不要緊,但是有進(jìn)有出,就可以保持穩(wěn)定,這是上帝的智慧,或者是大自然的智慧。
耗散存儲(chǔ)系統(tǒng)的基本思想,就是快不行的時(shí)候把它傳譯一下,簡(jiǎn)單的說(shuō)是這樣的,但是我們還要把科學(xué)道理講清楚,把理論建立起來(lái),我們系統(tǒng)的研究了一下?;舅枷胧窃诖鎯?chǔ)單元即將失效之前,將數(shù)據(jù)轉(zhuǎn)移到新的存儲(chǔ)單元,使數(shù)據(jù)總是在健康的介質(zhì)中保存。對(duì)數(shù)據(jù)而言,其保存它的介質(zhì)實(shí)現(xiàn)了新陳代謝,從而實(shí)現(xiàn)了數(shù)據(jù)存儲(chǔ)的超可靠性。
這與糾錯(cuò)的概念有本質(zhì)的不同,糾錯(cuò)碼和盤鎮(zhèn)技術(shù)都是存儲(chǔ)單元壞了,數(shù)據(jù)丟了以后,通過(guò)編碼糾錯(cuò),算出正確的數(shù)據(jù),然后再恢復(fù)。而且恢復(fù)的時(shí)間比較長(zhǎng)。對(duì)時(shí)間使用長(zhǎng)的系統(tǒng),大部分?jǐn)?shù)據(jù)都是老化狀態(tài)了,這時(shí)候就比較危險(xiǎn),像磁陣列這樣,平均壽命是5年,都快到5年了快幾個(gè)盤的概率大大上升,所以新系統(tǒng)和老系統(tǒng)在前期和后期的危險(xiǎn)性是非常不一樣的。
耗散性系統(tǒng)有哪些關(guān)鍵性技術(shù)?
第一準(zhǔn)確預(yù)測(cè)存儲(chǔ)單元什么時(shí)候失效。以前測(cè)不準(zhǔn),測(cè)早了時(shí)間沒(méi)有到,浪費(fèi)了資源,晚了數(shù)據(jù)就丟了。存儲(chǔ)單元的顆粒有bit、Byte、word、page、block、die、chip、Drive、note,其中Block和Drive適合用這種方法。
判斷的標(biāo)準(zhǔn)是基于當(dāng)前比較熱的機(jī)器學(xué)習(xí),我們也做了一個(gè)工作,通過(guò)深度學(xué)習(xí)算法訓(xùn)練,這是我們對(duì)3D閃存的預(yù)測(cè),橫坐標(biāo)是P/E,縱坐標(biāo)是保持的時(shí)間。我們預(yù)測(cè)的準(zhǔn)確率初步的超過(guò)了92%,預(yù)測(cè)負(fù)載準(zhǔn)確率超過(guò)98%,我們的研究還有很大的空間。
如果通過(guò)介質(zhì)預(yù)測(cè)什么時(shí)候壞,通過(guò)負(fù)載預(yù)測(cè)什么時(shí)候進(jìn)行轉(zhuǎn)移,通過(guò)這兩個(gè)預(yù)測(cè)就可以知道介質(zhì)什么時(shí)候壞。預(yù)測(cè)準(zhǔn)了,我們?cè)O(shè)計(jì)了一個(gè)預(yù)警轉(zhuǎn)移技術(shù),這是工作區(qū)域,把新盤放到這里,假如我預(yù)測(cè)它一個(gè)星期以后要壞,我可以有一個(gè)星期的時(shí)間轉(zhuǎn)移數(shù)據(jù),預(yù)測(cè)以后我就把數(shù)據(jù)遷移到新盤中,一旦遷移完了我就告訴它這個(gè)盤的任務(wù)完成了,就到旁邊的池子里,完全淘汰了。
淘汰以后就把新盤拔下來(lái)放進(jìn)去,這樣就形成新陳代謝,保證非常好的可靠性。這樣就更加沒(méi)有性能降級(jí)的說(shuō)法了,不需要恢復(fù)數(shù)據(jù),整體保持在健康的狀態(tài)下。這非常適合用于數(shù)據(jù)中心,免維護(hù)的,一旦進(jìn)入淘汰池了換掉就完了,而且新介質(zhì)的速度、可靠性比老盤要高,不斷得用新盤換舊盤,系統(tǒng)和容量都產(chǎn)生了凈化,所以我們叫可凈化的耗材存儲(chǔ)技術(shù),這個(gè)技術(shù)以后可以用機(jī)器人來(lái)實(shí)現(xiàn),實(shí)現(xiàn)了超高的可靠性,這些都是理論,我們需要和廣大的企業(yè)合作,把它用到實(shí)踐當(dāng)中。
總結(jié)一下,閃存芯片隨著工藝制程、單元多bit、3D堆疊技術(shù)的進(jìn)步,容量的迅速提高,但可靠性越來(lái)越差。如何用不可靠的芯片來(lái)構(gòu)建可靠的系統(tǒng),是每一個(gè)系統(tǒng)設(shè)計(jì)者必須面對(duì)的問(wèn)題。在香農(nóng)的理論框架下,主要是通過(guò)降低時(shí)間通道的噪聲和采用更強(qiáng)的糾錯(cuò)編碼進(jìn)行。建立耗散存儲(chǔ)系統(tǒng)超可靠體系框架,使存儲(chǔ)數(shù)據(jù)實(shí)現(xiàn)新陳代謝,可實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)系統(tǒng)的超高可靠。(本文根據(jù)武漢光電國(guó)家研究中心教授謝長(zhǎng)生教授,在2018全球存儲(chǔ)半導(dǎo)體大會(huì)暨全球閃存技術(shù)峰會(huì)的主題演講,整理而成。未經(jīng)過(guò)本人審閱。)