“如果NVMe硬盤標準在OCP里得以建立,那受益的群體不僅僅是互聯(lián)網企業(yè)客戶,還有傳統(tǒng)企業(yè)客戶,乃至存儲系統(tǒng)供應商。”在當天召開的主論壇上,希捷中國區(qū)產品經理劉嘉如是說。
超大規(guī)模數據架構的演進方向
在大規(guī)模數據架構的演進方向方面,劉嘉針對優(yōu)化QoS以及性能、存儲與計算分離,以及Composable Open Data Center架構進行了探討以及希捷在這些方面的實踐。
針對計算和存儲分離這個話題,劉嘉在主題演講表示,計算存儲分離,即把CPU、GPU從存儲完全獨立出來,這是當下全球CSP應用的一個方向,目的是為了應對硬盤容量越來越大的情況下提升存儲密度的問題。
當數據量發(fā)展到一定程度,越來越多的用戶在做數據湖、數據倉的時候就會考慮把存儲單獨出來,一方面降低TCO,另一方面,對存儲的優(yōu)化也更有針對性,包括散熱、振動。劉嘉認為,超大規(guī)模數據架構上將會向著存算分離,以及Composable Data Center這個架構方向去發(fā)展。
Composable Open Data Center架構誕生的背景是容器技術不斷地普及,對計算和存儲資源產生更加細?;慕怦詈弦?,與現有硬件基礎架構之間產生的矛盾。其技術優(yōu)勢在于可以對所有的計算和存儲資源做解耦合,用統(tǒng)一的管理接口與容器的接口去做調度,提升靈活性,其背后有兩個連接的技術提供支撐,之一就是為人熟知的NVMe Over Fabric——它能夠以100微秒的延遲去連接存儲設備。
目前市場上還只是對存儲和計算做一些簡單的分離,尚無法對CPU、內存、FPGA、GPU做完全的解耦合和顆?;N磥懋擯CIe Gen5得到普及后,最新的CXL和Gen-Z技術將通過把連接的延遲從微秒級降到納秒級,對諸如CPU與內存這樣的計算資源做解耦合,朝高性能和高存儲方向再邁進。
2020年底,希捷已經交付20TB熱輔助磁記錄技術(HAMR)硬盤產品給到業(yè)內領先的OEM與云計算用戶,進行測試與試用。
雙碳話題:踐行社會責任
碳達峰、碳中和是今年的政府工作報告中提出的年度重要任務之一,也是“十四五”規(guī)劃和2030/2060應對排放的重要目標。作為一個全球領先的科技企業(yè),希捷正在承擔起這樣的社會責任。
數據中心的TCO分成采購成本與運維成本兩部分,在運維成本中又有一部分跟服務器的功耗,包括數據中心的PUE密切相關。
早在四、五年前,希捷就跟重要的合作伙伴一起探討和落實進一步降低排放的舉措。例如,將之前得到了廣泛使用的空氣硬盤以功耗比更優(yōu)秀的氦氣硬盤來替代,如一塊16TB的氦氣硬盤,就會比之前的兩塊8TB能耗更低,這其實就達成降碳目標的做法。而研發(fā)采用雙磁臂技術和熱輔助磁記錄技術的硬盤,當容量可以做到50TB,也就是能夠替代三塊16TB容量的硬盤,這就意味著在降碳的同時實現性能和容量的兼得。
此外,液冷的技術也得到了越來越多企業(yè)的關注,越來越多的廠商正在把這個技術以一種更低的成本落地。
談到機械硬盤,有兩個話題無法回避。
一是與固態(tài)盤的市場競爭問題。從存儲系統(tǒng)市場的角度,業(yè)界的發(fā)展方向是從全硬盤的陣列逐漸過渡到混合陣列,并且有向全閃陣列發(fā)展過渡的趨勢。很多人認為閃存盤因為讀寫速度等方面的優(yōu)勢會逐漸取代傳統(tǒng)磁盤,但實際上二者近年來始終都在高速成長,希捷也同時提供了這兩方面的產品。
針對實時分析的場景需求,固態(tài)硬盤的確更合適一些。但并不是所有采用固態(tài)硬盤的做法就是最優(yōu)的方案。劉嘉認為,在大部分場合,企業(yè)盡量都把數據存下來展開大數據的離線分析等工作,尤其是業(yè)務對性能和及時度、有效度要求并不那么高的情況下,機械硬盤其實具備更好的TCO。
那么,機械硬盤與閃存盤優(yōu)勢結合,會不會取得1+1>2的效果呢?答案是否定的。
在超大規(guī)模的數據架構方面,90%的數據量仍然還會依托到硬盤上,原因不外乎是硬盤整體的TCO優(yōu)勢與數據耐寫度、數據存儲壽命的優(yōu)勢。所以很多客戶除了在嘗試新的閃存技術以外,也在嘗試新的硬盤技術,比如上面提到的雙磁臂技術就可能大幅度提升硬盤的性能。采用硬盤展開冷存類的業(yè)務也是另外一種嘗試。
在劉嘉看來,存儲市場始終是一個動態(tài)發(fā)展的過程,短期內市場還將維持以傳統(tǒng)機械硬盤應用為主的局面。
系統(tǒng)智能性的優(yōu)化實踐
系統(tǒng)智能性的最佳實踐,是希捷在OCP具有引領地位的另一個項目。
希捷正在與浪潮等服務器廠商一起探索在硬盤磁道密度不斷增加的同時,化解類似于風扇、機箱等高頻噪聲和機械振動給硬盤在性能方面帶來的影響。據介紹,希捷的對策,除了在初期跟服務器廠商聯(lián)合對機箱進行設計,還把Surrogate Acoustic Drive等技術置于服務器中,通過驅動麥克風捕捉到噪聲的振動,實現對服務器的設計的優(yōu)化。
優(yōu)化后的數據顯示,硬盤的性能能達到了100%。
對微軟數據中心的JBOD部署模式和Facebook數據中心服務器機箱的設計,是OCP落地的兩個非常成功案例。包括微軟,美國所有大型CSP都通過JBOD/JBOF方式部署磁盤,通過計算和存儲分離,確保最大的資源利用率與提供最佳的TCO;而在Facebook,通過對機架和機箱進行優(yōu)化,實現了最佳的散熱管理,降低了噪聲和振動的影響,并提升了硬盤性能和存儲容量。
此外希捷還提供相關的硬件和測試套件,以提升自己在相關領域的領導能力。