根據在 IDC 前段時間發(fā)布的 2023 年度的中國存儲市場報告,在 2023 年分布式全閃的增長極其亮眼,其市場份額從 2022 年的 7% 劇增到 2023 年的 17.7%,增長了 152%。
然而,因為最近企業(yè)級 SSD 價格狂飆,采購分布式全閃的客戶遭遇到了巨大的成本挑戰(zhàn)。
01?SSD 價格狂飆?全閃的采購成本大幅上升
最近,企業(yè)級 SSD 的價格以火箭般的速度飆升。從國內外的媒體報道來看,企業(yè)級 SSD 首當其沖,漲幅最大。
禍不單行的是,SSD 的主要成本來源,也就是 NAND 芯片未來的價格預計也會繼續(xù)上漲。很多 NAND 廠商還一直維持去年決定的減產策略,比如據國外某媒體報道,三星 NAND 還要減產 50%,這進一步推動了 SSD 價格的上漲預期。
從我們掌握的數據看,目前大部分企業(yè) SSD 的采購價格,相比去年的最低點,價格已經都翻了一倍,而且,由于 NAND 顆粒減產原因,企業(yè) SSD 未來的價格還會進一步上漲。根據我們跟蹤的歷史數據,NVMe 7.68TB 的企業(yè) SSD,現在的采購價基本是去年同期的 2.5 倍以上了。
但市場需求依舊旺盛。由于 AI 和信創(chuàng)的推動,國內的分布式全閃需求激增。根據 IDC 最新的數據, 2023 年軟件定義存儲的市場占比進一步擴大,分布式全閃的增長尤其亮眼,其市場份額從 2022 年的 7% 劇增到 2023 年的 17.7%,增長了 152%。
在很多對性能和可靠性、擴展性都有較高要求的場景,分布式全閃已經成為剛需。但是,分布式全閃超過一半的成本基本都在企業(yè)級 SSD 上,SSD 價格的飆升,也就造成分布式全閃的采購成本大幅上升。很多企業(yè)已經感受到這個壓力,尤其是數據量比較大的企業(yè)。
02?不能再用三副本了,EC+壓縮可以大幅降低分布式全閃的采購成本
縱觀目前國內市場的分布式全閃和超融合產品,我們發(fā)現,90%的產品還在采用傳統(tǒng)的 3 副本的數據冗余方式,造成全閃的采購成本居高不下,特別在 SSD 價格大幅上漲趨勢下更是如此。
部分廠商,為了降低成本,被迫從 3 副本改成 2 副本,但是,對于分布式存儲來說,集群總的硬盤數比較多,2 副本的可靠性不夠,因為它只能容忍 1 塊硬盤失效。如果一個系統(tǒng)硬盤數量比較多,同時壞 2 塊盤的概率還是比較高的,我們還是不建議關鍵業(yè)務采用 2 副本的方式。
萬幸的是,現在已經有更好的方式來節(jié)省采購成本,即選擇支持 EC(糾刪碼)+壓縮的分布式全閃產品,比如 XSKY星辰天合的 XINFINI 星飛 9000 系列。
星飛 9000,采用 XSEA 星海極速全共享架構(XSEA),采用單層介質,無需昂貴的 DWPD=3 的 Cache 盤,并且支持 EC+壓縮,壓縮還支持硬件壓縮(如 Intel QAT),在保障性能的同時,整體的硬盤利用率是三副本的 300%,大大降低用戶的 SSD 采購成本。
因此,即便現在 SSD 價格是去年最低點的 3 倍,但只要選擇星飛 9000,在同樣可用容量的需求下,企業(yè)的采購成本也不會高于去年。也就意味著,企業(yè)無需增加預算,繼續(xù)可以采用分布式全閃來滿足您對高性能,高可靠性,高擴展的存儲要求。
除了降低 SSD 的采購成本外,星飛也可以降低存儲服務器的采購成本。一個 2U 的存儲服務器,一般支持 24 個 NVMe SSD。由于采用 EC+壓縮的方式,所需要的 SSD 的盤數只有原來的 1/3,也就是說企業(yè)可能可以節(jié)省一半以上的服務器節(jié)點。特別是現在,H信創(chuàng) CPU 存儲服務器漲幅比較大,價格基本上都比同檔次的 Intel CPU 服務器貴 50%以上(下圖是一個典型的混閃配置的價格情況,但一樣可以說明問題)。
因此,分布式全閃必須支持 EC+壓縮,才能幫助企業(yè)更好控制采購成本,SSD 盤的減少,一般也意味著所需存儲服務器數量的減少(節(jié)點的數量主要考慮性能因素即可),同時也就讓企業(yè)采購成本大幅減少。當然,后期的運維成本也減少了,因為機房空間和耗電等也會相應減少。
03?為什么業(yè)界支持塊(快)EC的,分布式存儲這么少?
從上面的分析,我們可以看到,EC+壓縮的價值是非常高的,特別在現在 SSD 價格狂飆,信創(chuàng)服務器成本居高不下的情況下。
但是,為什么業(yè)界的分布式全閃,很少支持塊 EC 的呢?
這個其實就是問題的關鍵了,因為分布式存儲支持 EC 并不難,很多文件存儲和對象存儲都支持 EC,但塊存儲或者超融合,由于對時延要求高,支持塊 EC 的產品不多。有些產品,如 Ceph 也是支持塊 EC 的,但是,如果沒有經過架構優(yōu)化,那么是無法保證 EC 的性能的。
因此,我們看到很多廠商雖然也宣傳支持塊 EC,都只能用在視頻監(jiān)控這類對性能要求不高的場景。也就是說,大部分的塊 EC 都不“快”,無法用在關鍵業(yè)務上。但是,分布式全閃,性能是不能妥協(xié)的,也就是 EC 不僅要支持塊協(xié)議,還要求全閃的快速度。
因為塊(快)EC 的實現沒有開源借鑒,而且技術難度很大,所以業(yè)界內能夠實現此技術架構的廠商非常少,除了 XSKY 外,只有部分在研發(fā)上投入較大的大廠商解決了這個問題。
XSKY 一直通過創(chuàng)新的架構來解決塊(快)EC 的性能問題,從 XSpeed 到 XSEA,我們做了很多的研發(fā)攻關,圓滿解決了這個問題。
在 XSpeed 混閃架構中,我們引入了 Appendonly 寫機制,數據先在 NVMe 緩存層進行條帶化和整形,數據寫到持久化層都是整條帶大塊順序寫入,因此,可以無需全閃,就可以支持 EC+壓縮。
到了 XSEA 星海極速全共享全閃架構,由于采用了全新的 shared-everything 單層架構,不再需要專用的緩存 SSD。
但是,我們改造了 Appendonly 的實現方式,大塊順序的日志會并發(fā)寫到所有的 NVMe SSD 上(僅供節(jié)點掉電后恢復使用),數據會在存儲節(jié)點的內存中直接進行條帶化和整形,所有的臟數據都采用內存直寫的方式持久化到所有的 NVMe SSD 上。
這種機制,既保證了所有的數據都是大塊順序寫入,也保證了數據的寫入時延。
04?EC的性能?是不是比三副本低?
有很多客戶擔心 EC 的性能不如副本,這個擔心是多余的。通過 XSEA 星海極速全共享架構,保證 EC 的性能跟三副本齊平,在某些場景下的性能還優(yōu)于三副本。下面是我們使用的 3 臺全閃服務器做的性能測試對比,我們可以看到,EC 的性能和三副本是相當的。
這是由于 XSKY 在 SDS 領域的多年積累,才能從架構上進行創(chuàng)新,采用最新的軟硬件技術,解決這些棘手的問題。而市場上的很多分布式全閃,軟件和架構都沒有變,僅僅把 HDD 更換成 SSD,這樣的偽全閃的性能和成本是無法滿足市場需求的。
XSKY 一直致力于給客戶提供最佳性價比的分布式存儲,讓客戶性能和容量兼得。在目前 SSD 和信創(chuàng)服務器成本都居高不下的情況下,XSKY 的星飛 9000,將會大大幫助企業(yè)降低分布式全閃的采購成本和運維成本,更好實現信創(chuàng)轉型。