在Dorado V6 的設(shè)計(jì)中,前端共享卡、控制器、后端共享卡三層點(diǎn)對(duì)點(diǎn)全連接,通過(guò)高效的全連接,實(shí)現(xiàn)高可靠,高性能。控制器故障后 1 秒切換,主機(jī)鏈路不斷,上層業(yè)務(wù)無(wú)感知。
?????? 在主要處理器的選擇上,控制器、SSD盤(pán)控等采用鯤鵬 920 等處理器,AI則采用升騰芯片設(shè)計(jì)。
在一些領(lǐng)域的關(guān)鍵業(yè)務(wù)應(yīng)用中,如銀行核心交易系統(tǒng),電信計(jì)費(fèi)系統(tǒng)等,它們要求系統(tǒng)提供高可靠性的服務(wù)能力,對(duì)于存儲(chǔ)IOPS,以及時(shí)延有很高的要求。
與上一代產(chǎn)品OceanStor Dorado V3相比,Dorado V6最突出表現(xiàn)在于2000萬(wàn)IOPS以及0.1ms延遲的性能表現(xiàn),一方面得益于鯤鵬 920 處理器多核處理能力和業(yè)界獨(dú)有的 CoreFarm 智能調(diào)度算法,另一方面,也得益于智能芯片昇騰 A310對(duì)數(shù)據(jù)存儲(chǔ)的自我加速,特別是對(duì)于延遲的控制。
對(duì)于存儲(chǔ)產(chǎn)品而言,供應(yīng)商津津樂(lè)道的是IOPS,就像高性能計(jì)算中的Linkpack測(cè)試一樣,IOPS成為了衡量存儲(chǔ)產(chǎn)品性能高低的重要指標(biāo)。但是,對(duì)于數(shù)據(jù)庫(kù)等OLTP等在線(xiàn)交易類(lèi)型應(yīng)用而言,高IOPS并不意味著交易處理能力(TPS)強(qiáng),時(shí)延則是影響TPS的重要指標(biāo)。這也是為什么會(huì)有“不談時(shí)延的IOPS,都是耍流氓”說(shuō)法的原因。
接下來(lái)我們看看可靠性,存儲(chǔ)控制器的故障是存儲(chǔ)系統(tǒng)常見(jiàn)的一類(lèi)故障。業(yè)界存儲(chǔ)普遍都能做到1-2個(gè)控制器故障的冗余,這是不是就足夠了呢,有沒(méi)有考慮過(guò)控制框整體故障/掉電的場(chǎng)景?往往涉及多個(gè)控制器同時(shí)故障。此時(shí)對(duì)于客戶(hù)的核心業(yè)務(wù)系統(tǒng)來(lái)講,也是不能中斷的。華為在可靠性架構(gòu)設(shè)計(jì)上更進(jìn)一步,實(shí)現(xiàn)8控制器故障7個(gè)業(yè)務(wù)不中斷,有效解決了控制框整體故障的場(chǎng)景。
系統(tǒng)升級(jí)在存儲(chǔ)生命周期中是常出現(xiàn)的,將系統(tǒng)升級(jí)對(duì)客戶(hù)業(yè)務(wù)影響降至最低是客戶(hù)的關(guān)鍵需求。業(yè)界最佳的能做到的升級(jí)能力是2小時(shí)以?xún)?nèi)完成升級(jí),從升級(jí)前檢查、執(zhí)行升級(jí)到升級(jí)后檢查,其中業(yè)務(wù)受損的窗口控制在10秒內(nèi)。華為在此基礎(chǔ)上更進(jìn)一步,升級(jí)做到30分鐘內(nèi)完成,業(yè)務(wù)受損窗口1秒以?xún)?nèi)。華為之所以能夠在可靠性上取得如此極致的能力,得益于SmartMatrix全互聯(lián)架構(gòu)。SmartMatrix全互聯(lián)架構(gòu)通過(guò)RDMA高速網(wǎng)絡(luò),實(shí)現(xiàn)了前端IO接口卡、控制器、后端盤(pán)框全互聯(lián)。
華為不僅做閃存系統(tǒng),同時(shí)也自研SSD。為了加速閃存的普及,華為在中國(guó)區(qū)已發(fā)布SSD 1:1替代10K SAS的活動(dòng)。后續(xù),將持續(xù)通過(guò)華為獨(dú)有的深度盤(pán)控配合實(shí)現(xiàn)SSD更好的成本、壽命與性能,同時(shí)通過(guò)場(chǎng)景化與算力,實(shí)現(xiàn)更好的數(shù)據(jù)縮減能力,進(jìn)一步的普惠閃存。