我們都知道NAND閃存的一些基本特性,那就是隨著TLC、QLC及PLC的升級(jí),P/E壽命會(huì)下降,同時(shí)制程工藝升級(jí)的話P/E壽命也會(huì)下降,雙重疊加之后先進(jìn)工藝的QLC、PLC壽命就會(huì)很難看。而且從SLC、MLC、TLC、QLC到PLC,這一路上的性能也是逐漸下降。原本NAND主打的就是性能,沖著高性能,大家才去容忍N(yùn)AND的低容量高成本。

NAND介質(zhì)照這樣發(fā)展下去,會(huì)不會(huì)有商用的HLC恐怕都要兩說了。有人說,那怕什么,只要容量大,性能低一些,耐久度低一些,照樣會(huì)有應(yīng)用場景,比如冷存儲(chǔ)啊什么的。實(shí)際上,NAND目前已經(jīng)開始與機(jī)械硬盤正面交鋒了。機(jī)械硬盤除了性能,在容量、耐久度、成本上,NAND目前望塵莫及。此外,機(jī)械硬盤也在使用新技術(shù)來提升密度和容量,比如單盤體含雙盤的Dual Actuator雙磁頭臂技術(shù), 下一代的BPMR技術(shù)等等。

感覺上,NAND在技術(shù)上不斷閹割自己,而機(jī)械硬盤則是不斷提升自己,一個(gè)往下走,一個(gè)往上走,這怎么說也感覺怪怪的,前者還能走多遠(yuǎn)?甚至除了3D堆疊之外,還能不能走出一條新路?我持懷疑態(tài)度。

目前的NAND市場已經(jīng)是硝煙滾滾,大家已然殺紅了眼,而且性能上似乎已經(jīng)遇到了天花板,前途不好說??傊说夭灰司昧?。作為老江湖,Intel已經(jīng)覺察到了。

 2轉(zhuǎn)戰(zhàn)新領(lǐng)域

Intel作為業(yè)界的Explorer和Pioneer以及Leader,善于在無人問津的地帶從零開始建立生態(tài)。比如,NAND的出現(xiàn)填補(bǔ)了RAM和HDD之間的性能落差,而在RAM和NAND之間,仍然有較大的性能落差,尤其是隨著大數(shù)據(jù)業(yè)務(wù)增長,對(duì)于這種細(xì)化的性能分級(jí)又有了大量的剛需。

從CPU核數(shù)的提升和內(nèi)存容量提升的趨勢來看,內(nèi)存的發(fā)展步伐出現(xiàn)了明顯放緩的趨勢,以前的內(nèi)存容量大概每三年翻一番,而現(xiàn)在大概是四年翻一番。不僅如此,從一臺(tái)服務(wù)器的成本構(gòu)成來看,內(nèi)存的成本越來越高,甚至有時(shí)候能占到服務(wù)器整體成本的一半,內(nèi)存不僅容量提升困難,成本也越來越高。

作為一種極具創(chuàng)新和顛覆性的解決方案,傲騰為傳統(tǒng)計(jì)算體系結(jié)構(gòu)提供了新的內(nèi)存和存儲(chǔ)層級(jí),解決內(nèi)存成本高和NAND SSD性能不足的問題,彌補(bǔ)DRAM內(nèi)存和NAND SSD之間的空白。

英特爾傲騰作為一種創(chuàng)新的解決方案,憑借四大技術(shù)特性,構(gòu)建了DRAM和內(nèi)存之間的存儲(chǔ)層級(jí),與DRAM內(nèi)存相比,它具有非易失性,掉電之后也不會(huì)丟失數(shù)據(jù)。與NAND SSD相比,傲騰還支持字節(jié)尋址,可以每次只訪問部分字節(jié),而不是像硬盤需要訪問512字節(jié)或者4KB那么多,有效減少了寫放大,同時(shí),傲騰支持的就地寫入,從而省去了垃圾回收機(jī)制,最后,配合低延遲的特性,最終讓傲騰的性能表現(xiàn)遠(yuǎn)超普通NAND SSD。

傲騰持久內(nèi)存有兩種操作模式,一種叫做內(nèi)存模式,在這種情況下,傲騰也具有內(nèi)存一樣的易失性,與DRAM構(gòu)成內(nèi)存池,DRAM作為高頻熱數(shù)據(jù)的緩存,用戶無需對(duì)應(yīng)用做任何修改就可以直接啟用這種模式。

另一種模式是App Direct模式,這種模式下傲騰具有非易失性,需要低延遲同時(shí)不需要永久存儲(chǔ)的數(shù)據(jù)可以放在DRAM上。需要持久存儲(chǔ)或者結(jié)構(gòu)化存儲(chǔ)的大量數(shù)據(jù)適合放在傲騰數(shù)據(jù)中心持久內(nèi)存上。如果想讓內(nèi)存中的數(shù)據(jù)持久化,那么肯定就得選App Direct模式了。

App Direct模式其實(shí)還有一個(gè)變種叫Storage over AD,這種模式中傲騰持久內(nèi)存仍舊保持非易失性,這是一種NVDIMM方案,插在DIMM插槽上的存儲(chǔ),這種模式要求操作系統(tǒng)提供NVDIMM驅(qū)動(dòng),而且,無需修改應(yīng)用就可以直接用。值得一提的是,它支持塊尋址而非字節(jié)尋址。

隨著第三代至強(qiáng)可擴(kuò)展處理器發(fā)布的還有新一代傲騰持久內(nèi)存——Optane Persistent Memory 200系列,傲騰持久內(nèi)存的提升非常明顯,就是容量更大,性能更高,更安全。

與上一代100系列相比,200系列的帶寬提升了32%,容量方面,可為每一路服務(wù)器提供高達(dá)6TB的總內(nèi)存。從性價(jià)比來看,200系列傲騰持久內(nèi)存能將運(yùn)行每臺(tái)虛擬機(jī)的成本降低25%。 

2020年,英特爾還發(fā)布了第二代傲騰SSD P5800X系列,號(hào)稱是全球最快的SSD。P5800X與上代相比,性能提升了近四倍,延遲降低了一半。與英特爾自家最快的NAND SSD相比,P5800X的延遲低了13倍,QoS高了66倍,IOPS/GB的性能是27倍,耐久性是33倍。

在系統(tǒng)架構(gòu)中,傲騰SSD主要是配合NAND SSD使用,作為NAND SSD的加速層,具體用法上有三種:加速(accelerating),緩存(caching)和分層(tiering)。在optane上加快系統(tǒng)性能,例如與TOC解決方案相比,可將延遲降低70%。

用作加速時(shí),傲騰SSD上存放大量元數(shù)據(jù)(Metadata),與單純使用TLC相比,能降低70%的延遲。用作緩存時(shí),能大幅提高應(yīng)用性能,比如在VMware vSAN集群里使用,能將支撐的虛擬機(jī)數(shù)量提高60%。分層也非常好理解,熱數(shù)據(jù)先放在傲騰SSD上,數(shù)據(jù)變冷之后則遷移到NAND SSD上,這種方案能將延遲降低50%,同時(shí)降低TCO。

 3生態(tài)加速鋪開

英特爾傲騰多用在數(shù)據(jù)挑戰(zhàn)比較多的場景,比如數(shù)據(jù)庫、高級(jí)分析(包括AI)、云計(jì)算、HPC以及存儲(chǔ)系統(tǒng)方面,用戶覆蓋包括云服務(wù)商、金融行業(yè)、醫(yī)療健康、政府、能源運(yùn)輸?shù)榷鄠€(gè)行業(yè),全球許多大型知名企業(yè)都用上了傲騰。

據(jù)了解,《財(cái)富》世界500強(qiáng)中有200多家已部署英特爾傲騰持久內(nèi)存,其中,企業(yè)客戶占比最多,達(dá)到了40%,其次是云服務(wù)提供商占13%,金融服務(wù)領(lǐng)域占12%?!敦?cái)富》世界500強(qiáng)公司中的80多家都部署了英特爾傲騰固態(tài)硬盤,其中,云服務(wù)提供商占24%,企業(yè)占17%。

傲騰的POC轉(zhuǎn)化率非常高,也就是說,只要是做了PoC的企業(yè),大部分都成了傲騰的用戶,用戶對(duì)于傲騰價(jià)值的認(rèn)可度還是非常高的。

從應(yīng)用類型來看,傲騰持久內(nèi)存最常見的應(yīng)用就是內(nèi)存數(shù)據(jù)庫(IMDB),占比達(dá)37%,其次是AI和數(shù)據(jù)分析應(yīng)用。傲騰SSD的最典型場景是定制化場景,占到了27%,vSAN的場景占到了21%,然后是云服務(wù)商以及數(shù)據(jù)庫這類應(yīng)用。

以中國用戶更熟悉的燕京啤酒為例,燕京啤酒使用了傲騰持久內(nèi)存和傲騰SSD兩種方案,在傲騰持久內(nèi)存的幫助下,超融合方案可以支撐更多的虛擬機(jī),在傲騰SSD幫助下,提高了存儲(chǔ)的性能并降低了延遲。

凱克薩銀行(CaixaBank)是西班牙著名的金融服務(wù)公司,他們?cè)谖磥順I(yè)務(wù)發(fā)展特別看重分析能力。凱克薩銀行有20%的交易都是在移動(dòng)端完成的,業(yè)務(wù)形態(tài)正在向金融服務(wù)的數(shù)字化轉(zhuǎn)型,同時(shí),基于對(duì)多渠道的客戶數(shù)據(jù)進(jìn)行分析創(chuàng)建新的商業(yè)模式。

為了實(shí)現(xiàn)這些目標(biāo),凱克薩銀行部署了一個(gè)Oracle Exadata大數(shù)據(jù)解決方案,該方案使用了英特爾至強(qiáng)處理器和英特爾傲騰持久內(nèi)存。這套方案在存儲(chǔ)層中采用持久內(nèi)存,可加快密集型數(shù)據(jù)分析,并提供實(shí)時(shí)響應(yīng)能力,從而獲得更具可操作性的客戶洞察。

為了更好了解新冠病毒的傳播方式和對(duì)患者的影響,美國醫(yī)療機(jī)構(gòu)Mercy使用了基于SAP HANA、英特爾至強(qiáng)可擴(kuò)展器和傲騰持久內(nèi)存的數(shù)據(jù)分析系統(tǒng),使用自然語言處理和人工智能技術(shù)從臨床數(shù)據(jù)中獲得了很多重要信息。在內(nèi)存層中使用持久內(nèi)存后,能快速分析大量結(jié)構(gòu)和非結(jié)構(gòu)化數(shù)據(jù),從而為病人提供更智能的護(hù)理,提高響應(yīng)和協(xié)調(diào)疫情的能力。

西班牙電信是全球最大的電信運(yùn)營商之一,在16個(gè)國家和地區(qū),為3.36億人提供服務(wù)。它所提供的虛擬數(shù)據(jù)中心服務(wù)于關(guān)鍵工作負(fù)載,要求有持續(xù)的高吞吐量和低存儲(chǔ)延遲,西班牙電信開發(fā)了基于VMware vSAN和英特爾志強(qiáng)可擴(kuò)展處理器的超融合解決方案,提供整合的、易于管理的解決方案,有較高的吞吐量和低延遲表現(xiàn),在vSAN的緩存層中使用了英特爾數(shù)據(jù)中心SSD,最終基于vSAN架構(gòu)構(gòu)建了滿足SLA要求的存儲(chǔ)方案。

時(shí)至2021年,傲騰的應(yīng)用生態(tài)越發(fā)壯大,越來越多的軟件開發(fā)商,云服務(wù)商以及OEM服務(wù)商加入了傲騰生態(tài)。

在一次測試中,阿里的Mars分布式內(nèi)存計(jì)算框架利用傲騰持久內(nèi)存,取得了很不錯(cuò)的性能加成。如下圖所示,當(dāng)需要處理的數(shù)據(jù)集超過了主存承載能力之后,溢出后的數(shù)據(jù)被放置在傲騰存儲(chǔ)器而不是之前的NVMe硬盤中,隨著數(shù)據(jù)量溢出主存,傲騰方案的性能會(huì)有顯著提升。 

 Mars是一個(gè)基于張量的統(tǒng)一分布式計(jì)算框架,突破了現(xiàn)有大數(shù)據(jù)計(jì)算引擎以關(guān)系代數(shù)為主的計(jì)算模型,將分布式技術(shù)引入科學(xué)計(jì)算和數(shù)值計(jì)算領(lǐng)域,極大地?cái)U(kuò)展了科學(xué)計(jì)算的計(jì)算規(guī)模和效率。目前Mars已經(jīng)實(shí)現(xiàn)了70%的Numpy常見接口,用戶只需要通過import Mars就可以將已經(jīng)編寫好的基于Numpy的代碼移植到Mars中。 

Mars會(huì)將張量自動(dòng)在各個(gè)維度上切分成小的chunk來分布式處理從而提升并行性,以便于將小顆粒任務(wù)派發(fā)到GPU,或者網(wǎng)絡(luò)遠(yuǎn)端的其它集群節(jié)點(diǎn)上并行計(jì)算。

舉例來講,對(duì)于張量矩陣乘法,Mars會(huì)生成如下圖所示的chunk級(jí)別執(zhí)行圖。在執(zhí)行過程中,會(huì)有大量的中間過程,這些過程生成大量的數(shù)據(jù)會(huì)占用寶貴的主存資源。

每個(gè)chunk執(zhí)行完畢之后,結(jié)果數(shù)據(jù)會(huì)被放置在shared memory中,當(dāng)share memory中數(shù)據(jù)過多時(shí),Mars會(huì)啟動(dòng)spill溢出控制機(jī)制,將溢出的數(shù)據(jù)轉(zhuǎn)移到下層更大容量的存儲(chǔ)器中。

經(jīng)過評(píng)估,阿里發(fā)現(xiàn)使用Intel傲騰持久內(nèi)存來作為主存的下一層存儲(chǔ)器,無論是在性能上還是TCO上,相比直接用NVMe盤作為下層,都非常符合Mars系統(tǒng)的預(yù)期。

 傲騰持久內(nèi)存提供128GB、256GB和512GB容量,遠(yuǎn)高于目前最大容量僅限于每DIMM 128GB的可用SDRAM DIMM,而且與傳統(tǒng)DRAM DIMM相比,傲騰持久內(nèi)存的每GB成本更低。傲騰持久內(nèi)存通過內(nèi)存總線直接連接到處理器,在基于App Direct(簡稱AD)模式下,應(yīng)用程序可以完全繞過操作系統(tǒng),不需要設(shè)備驅(qū)動(dòng)程序、系統(tǒng)調(diào)用、中斷和上下文切換,就可以從用戶空間直接訪問持久內(nèi)存上的數(shù)據(jù)。下圖所示為采用NVMe閃存盤、NVMe傲騰盤和傲騰持久內(nèi)存的訪問延遲對(duì)比。

總體而言,使用Intel傲騰持久內(nèi)存,解決了Mars科學(xué)計(jì)算中因數(shù)據(jù)溢出傳到硬盤,導(dǎo)致I/O開銷增大,計(jì)算性能降低的問題。通過測試,驗(yàn)證了在TCO成本相當(dāng)?shù)那闆r下,使用傲騰持久內(nèi)存能夠有效提升Mars科學(xué)計(jì)算性能。

分享到

崔歡歡

相關(guān)推薦