2018年中國存儲與數(shù)據(jù)峰會期間,Bigtera總經(jīng)理游宗霖在Bigtera VirtualStor Extreme發(fā)布會上回顧了數(shù)據(jù)中心基礎(chǔ)架構(gòu)的發(fā)展變化,闡述了軟件定義數(shù)據(jù)中心所倡導(dǎo)的理念,梳理了超融合架構(gòu)存在的一些問題,也介紹了更為先進的可組合架構(gòu)的優(yōu)勢,當然還有一些Bigtera在超融合產(chǎn)品設(shè)計上的創(chuàng)新點。
服務(wù)器的數(shù)據(jù)計算,存儲系統(tǒng)的數(shù)據(jù)存儲以及網(wǎng)絡(luò)的數(shù)據(jù)傳輸功能,最終都是是要服務(wù)于企業(yè)的業(yè)務(wù)。人們對數(shù)據(jù)中的要求越來越高,最急迫的需求就是快速上線,軟件定義數(shù)據(jù)中心便由此而生?!败浖x數(shù)據(jù)中心就是希望用軟件的方式,在既有硬件基礎(chǔ)上,快速提供用戶所需的計算資源、網(wǎng)絡(luò)資源以及存儲資源”,游宗霖總結(jié)道。
軟件定義數(shù)據(jù)中心并沒有解決數(shù)據(jù)中心管理復(fù)雜的問題。隨著用戶應(yīng)用的變化,不同時期,不同應(yīng)用對于存儲的需求是不一樣的,用戶遇到的問題可能是IOPS不夠,也可能是容量不夠,用戶對存儲數(shù)據(jù)保護等級的要求不同,每次不同需求可能都需要購置新的存儲,長此以往就形成各種數(shù)據(jù)孤島,也讓管理的復(fù)雜性水漲船高。
有調(diào)查數(shù)據(jù)顯示,由于存儲數(shù)據(jù)孤島非常普遍,使得存儲系統(tǒng)復(fù)雜度提升,帶來最直接的問題就是資源浪費。有調(diào)查報告提供的數(shù)據(jù)顯示,數(shù)據(jù)中心里的存儲空間有50%以上是閑置或者未使用的。管理的復(fù)雜度最后也將轉(zhuǎn)化為企業(yè)的運營成本。存儲系統(tǒng)只能被動地跟著應(yīng)用跑,效率很低下。
于是軟件定義存儲跟超融合出現(xiàn)了,但是仍然沒有很好的解決所有的問題。
超融合HCI就是為了解決用戶遇到的這些問題,超融合把計算、網(wǎng)絡(luò)、存儲放在同一個物理設(shè)備上,用軟件的方式將計算、網(wǎng)絡(luò)、存儲變成資源池,以增加節(jié)點的方式擴展資源,最后根據(jù)應(yīng)用的需要去分配這些資源。
超融合本身也存在問題。游宗霖介紹說,超融合為了降低計算和存儲兩者之間的物理延遲,所以才將兩者緊緊放在一起,但由于分布式存儲需要將副本放到多個節(jié)點上,最后還是需要跨設(shè)備的網(wǎng)絡(luò)傳輸,還是會有延遲。
在實際應(yīng)用中,用戶需要多種存儲類型,塊存儲,文件存儲還有對象存儲,然而,超融合通常只是提供SAN塊存儲,對于文件存儲的支持比較困難,對于對象存儲的支持更少。
第三個問題也很關(guān)鍵,通常,超融合只提供(二)三副本的數(shù)據(jù)保護方案,但并不是所有應(yīng)用都能用(二)三副本來滿足。
所以,很多時候,超融合本身存在的問題需要用別的手段來彌補,這些手段通常不是超融合。作為數(shù)據(jù)中心基礎(chǔ)架構(gòu),只靠超融合是不行的。在游宗霖看來,這需要再度創(chuàng)新,這就是SCI(Software Composable Infrastructure-軟件可組合架構(gòu))
可組合架構(gòu)Software Composable Infrastructure
如果說超融合費盡心機把計算、存儲和網(wǎng)絡(luò)組合在一起,那么SCI則是又把三者進行了拆分,拆分的同時還把各種資源打散,切成小碎塊然后用軟件組合在一起,這就是SCI的核心思想。
在游宗霖看來,閃存是新變化的根本動因。因為以前磁盤慢延遲高,所以才將存儲與計算結(jié)合在了一起,但現(xiàn)在閃存動輒幾千幾萬甚至幾十萬的IOPS簡直不要太快。閃存這么快,還要靠CPU的配合,磁盤存儲時代,人們總說CPU過剩,而隨著閃存的興起,所有人都在抱怨CPU不夠用了,很多人在做閃存加速方案,究其根本就是閃存存儲太吃CPU資源了。
幾年前,筆者在采訪某全球超融合領(lǐng)先廠商的專家時問道,為什么現(xiàn)在超融合這么火,閃存也這么火,為什么沒有人說全閃存的超融合呢?對方表示,閃存對CPU的占用太高,無力正常支持超融合各種的軟件計算任務(wù)。
回過頭來一想,閃存是基礎(chǔ)層面上的創(chuàng)新,如今閃存的容量越來越大,性能越來越高,價格越來越低,從磁盤到閃存的變化已斷無回頭路,CPU也不是說變就變的,后摩爾定律時代,CPU的發(fā)展步伐越來越穩(wěn)定。所以,要變的只有架構(gòu)上的創(chuàng)新——超融合了。
NVMe over Fabrics的出現(xiàn)為存儲網(wǎng)絡(luò)打開一扇新的大門,很多業(yè)內(nèi)TOP級廠商都在致力于做基于NVMe over Fabrics的閃存存儲系統(tǒng),性能上也有質(zhì)的飛躍,能大大降低存儲延遲。NVMe over Fabrics的出現(xiàn)也讓存儲與計算再度分離成為可能,既然有這么快的網(wǎng)絡(luò)了,存儲也沒必要非得跟計算靠那么近了,這為SCI的發(fā)展制造了客觀條件。
Bigtera是慧榮(SMI)旗下的一家存儲系統(tǒng)公司,2010年就開始做軟件定義存儲,2013年開始陸續(xù)推出軟件定義存儲的產(chǎn)品,他們推出的分布式軟件定義存儲產(chǎn)品VirtualStor Scaler,以軟件定義的方式來做大量數(shù)據(jù)的存儲,作為分布式存儲的核心Bigtera的分布式存儲核心都是自研的,支持的Ceph的原生協(xié)議。
作為分布式存儲最主流的產(chǎn)品形態(tài),Bigtera也自然會有超融合產(chǎn)品線。Bigtera從2013年第一款產(chǎn)品就開始做融合存儲,融合SAN塊和NAS文件存儲,降低存儲復(fù)雜度,Bigtera可提供高性能、高效率的數(shù)據(jù)保護機制,較好的異構(gòu)特性可納管用戶原有的存儲資產(chǎn)。
Bigtera在SCI方面軟件組合的能力最為引人矚目。游宗霖介紹說,Bigtera在2014年已經(jīng)具備了軟件組合的能力,可以根據(jù)用戶需要劃分資源,如果需要跑數(shù)據(jù)庫那么就用塊存儲;如果重視安全性,可以選擇配置雙副本,有需要的還能做跨數(shù)據(jù)中心多活。所有的應(yīng)用都共用同一個存儲基礎(chǔ)建設(shè),同一個存儲集群可以支持各種不同應(yīng)用。
分布式全閃存延續(xù)SCI
在2018中國存儲與數(shù)據(jù)峰會上,Bigtera新發(fā)布了分布式全閃存產(chǎn)品VirtualStor Extreme,通常常見的全閃存都是雙控存儲,而像Bigtera所說的分布式全閃存則非常少,游宗霖表示,目之所及,只有DELL EMC,PureStorage提供相關(guān)產(chǎn)品。
與之相比Bigtera的產(chǎn)品思路也有不同,Bigtera是把原來的可組合架構(gòu)的思想延伸到了閃存產(chǎn)品的設(shè)計上,同樣是以一套架構(gòu)來滿足各種需求,支持多種協(xié)議,不限于塊存儲,還有文件共享存儲,能把數(shù)據(jù)放在同一個命名空間下。
Bigtera的異構(gòu)特性能很好的兼容別的系統(tǒng),非常神奇的是,如果說用戶原來就有存儲,新買了閃存之后,在Bigtera系統(tǒng)的幫助下,系統(tǒng)可以自動幫用戶完成數(shù)據(jù)遷移,將數(shù)據(jù)從原有系統(tǒng)遷移到新的閃存系統(tǒng)中,能做到業(yè)務(wù)無中斷。
說起閃存系統(tǒng),免不了會講講性能和穩(wěn)定性的問題。
雖然Bigtera是一家軟件為主的存儲公司,但在硬件設(shè)計方面也頗有心得。得益于慧榮科技在存儲控制器業(yè)務(wù)領(lǐng)域的領(lǐng)導(dǎo)地位,及同為慧榮科技子公司的寶存在企業(yè)級SSD市場的表現(xiàn),Bigtera的閃存產(chǎn)品可以基于閃存底層控制器級別進行通信與設(shè)計,所以在一些黑科技的表現(xiàn)上顯得尤為搶眼。比如Bigtera VirtualStor Extreme在減少寫放大方面表現(xiàn)優(yōu)異,在傳統(tǒng)的閃存設(shè)備7.31倍的寫放大表現(xiàn)上,Bigtera的新產(chǎn)品可以做到1.05倍的寫放大,寫放大能降低7倍,這足以使Bigtera敢于承諾閃存系統(tǒng)可持續(xù)穩(wěn)定運行3-5年。
VirtualStor Extreme能實現(xiàn)性能線性擴展,游宗霖介紹說,一臺2U 24盤位的閃存系統(tǒng)能提供80萬IOPS,如果買14臺設(shè)備,那么就會有1000多萬IOPS,橫向擴展的性能,VirtualStor Extreme不是雙控系統(tǒng),不存在性能瓶頸,當然,有些用戶可能用不了這么高的性能,但是當企業(yè)的應(yīng)用數(shù)量多的時候,分布式的閃存存儲給了充足的靈活性。
Bigtera VirtualStor Extreme的延遲非常穩(wěn)定,與分布式存儲Ceph相比優(yōu)勢還是很明顯的,Ceph的延遲抖動范圍覆蓋到40ms,而VirtualStor Extreme的延遲則穩(wěn)定的低于1ms。據(jù)游宗霖介紹說VirtualStor Extreme是用了SCM(存儲級內(nèi)存)技術(shù),SCM技術(shù)作為緩存用的話,對于上文提到的減少寫放大也大有裨益。
結(jié)語
作為一家以軟件為核心能力的存儲公司,Bigtera在硬件上的創(chuàng)新性還是挺讓人驚喜。不過,最核心和與眾不同的能力還是軟件,還是在SCI架構(gòu)上的領(lǐng)先性。講可組合架構(gòu)Composable Infrastructure的不Bigtera只一家,但是Bigtera是軟件的可組合架構(gòu),軟件定義的概念深入人心,進一步的軟件定義則能帶來更高的自由度和靈活性。
隨著未來閃存價格的不斷降低,NVMe over Fabric技術(shù)的逐步成熟,Bigtera所推崇的SCI架構(gòu)將有更大的發(fā)展空間。采訪中,游宗霖表示,Bigtera承載著慧榮科技集團從底層控制器芯片拓展到上層系統(tǒng)的戰(zhàn)略任務(wù),在發(fā)展中有慧榮作為支撐可以給Bigtera帶來很大幫助。