以下為澤塔云CTO明晨的演講實錄整理:
澤塔云背景:澤塔云英文名稱ZETTAKIT。公司旨在將海量數(shù)據(jù)放到一個很小的容器內(nèi),實現(xiàn)客觀交付。公司成立兩年多時間,員工約80人,其中一半以上都是研發(fā)和技術人員。 經(jīng)過兩年的發(fā)展,澤塔云在全國有六個分支機構,北京為總部和研發(fā)中心。南京、西安、成都、鄭州、深圳設有分公司。今年12月份,澤塔云計劃做B輪融資,之后將在廣州、沈陽、上海、杭州設立分公司,進一步覆蓋全國的市場。
2015年9月份澤塔云獲得國內(nèi)頂級創(chuàng)投團隊深圳達晨給我們A輪投資1500萬。今年4月份發(fā)布V2.0版本產(chǎn)品。這個版本涵蓋了包括計算、存儲、網(wǎng)絡,包括安全的完整數(shù)據(jù)中心軟件定義解決方案。
此外澤塔云在吉林農(nóng)信,吉林銀行、國聯(lián)證券、民生證券有相應的項目部署落地。今年跟神州數(shù)碼聯(lián)合開發(fā)做GPU云還有VR云虛擬現(xiàn)實。(順便一提,澤塔云在展廳搭了VR體驗環(huán)境,小編嘗試了一下,和血戰(zhàn)上海灘的槍戰(zhàn)游戲相仿,VR確實體驗更佳,但容易忘我,排我前面體驗的妹子一掄手把就朝著圍觀群眾去了……)
超融合帶來的改變
回歸正題,超融合到底改變了什么?人們?yōu)槭裁从盟?因為相對傳統(tǒng)架構來講,超融合有自身的提升,包括它的性能、可靠性、擴展能力、管理的程度等等。當然我們可以看到超融合里面所用的技術,包括虛擬化,包括網(wǎng)絡技術、存儲技術其實都是過去比較長的一段時間里我們在沿用的技術。
現(xiàn)在我們從項目的落地,用戶的反饋來看超融合帶來的改變,用戶感受最深的改變是服務的交互方式。可能之前上一個業(yè)務系統(tǒng),異構環(huán)境,服務器,交換機,磁盤陣列,虛擬化軟件。先是需要專家選型,討論方案、對接方案,項目周期可能兩三個月甚至半年時間。項目周期很慢,而超融合部署可以快速簡單交付使用。三臺一體機,化繁為簡的交付方式。
關于傳統(tǒng)架構,我們可以看到一個現(xiàn)狀,傳統(tǒng)架構里面的層級很多,包括服務器虛擬化,服務器硬件、交換設備,包括磁盤陣列等等——總的來說,異構環(huán)境,管理復雜。另外一點從性能方面講,縱向IO路徑很深,從業(yè)務端產(chǎn)生以后需要經(jīng)過每層周轉最終落到磁盤陣列上面。另外一點在我們購買存儲之初看到它的上限。廠家告訴你一拖二,一拖三就OK。你加拓展柜,容量雖然能增長,性能反而有一定程度的衰減——SaaS鏈路,延長、衰減等等??蛻絷P心的成本問題,構建這個架構的采購成本,服務器、網(wǎng)絡、交換、虛擬等等,大約硬件成本不少于150萬,可能更大規(guī)模兩三百萬,四五百萬都很常見,這是傳統(tǒng)一個架構。
再來看超融合,超融合給我們帶來什么?第一點簡單的管理。一套管理平臺,我們平臺可以涵蓋計算資源,虛擬化資源的管理。網(wǎng)絡資源的管理,存儲資源管理包括一些安全的管理。
另外就是性能上,是很扁平化的架構,IO效率得到一定程度的提升。另外提到建設成本,原來硬件、服務器、存儲、交換這些硬件,150萬硬件成本。我實現(xiàn)同樣的能力,比如同樣的存儲空間,同樣的CPU內(nèi)存計算資源,可能三臺X86服務器搞定,這是超融合帶來價值的提升。
除了剛才提到像性能、成本,包括擴展能力以外,我們看到包括功耗上,本身磁盤陣列把存儲歸還給服務器,功耗一定是減少的。機房里面相應配套,像UPS,電源,機柜空間的節(jié)省都是會帶來的。另外一方面就是管理運維,人力成本節(jié)省,時間成本、初始建設成本等等。這里提一點,傳統(tǒng)架構中做IDC運維的時候,真的很難做到說有很多異構設備,你放幾臺備件,形成備機。而在超融合架構里,標準的X86硬件,我不挑硬件,CPU能做虛擬化就OK。拿過來以后就可以預置系統(tǒng)。當硬件壞掉時,直接頂上,非常的便捷。
ZETTAKIT超融合產(chǎn)品的架構分了幾層,下面是硬件,中間是資源池,上面是資源管理調(diào)度和管理自動化。我們現(xiàn)在跟硬件是完全解耦,我們做利舊,如果有現(xiàn)成的服務器,像X3650 M3,M2的服務器,戴爾、惠普服務器,我們可以幫你利用。包括異構存儲的設備,像IPSAN,包括NAS我可以容納進來做整體的管理和交換機。
ZETTAKIT超融合產(chǎn)品的整個存儲,我們把它稱之為去中心化的全分布式架構。我們這個節(jié)點,集群里面每個節(jié)點,每個服務器都是對等的。有幾個角色,第一是集群數(shù)據(jù),第二是源數(shù)據(jù)節(jié)點,第三是管理仲裁節(jié)點。我們源數(shù)據(jù)打散,放在一臺兩臺服務器里面,可能存在單點可能是風險,另外性能瓶頸都會有。這里我們把源數(shù)據(jù)拆散,分散每個節(jié)點,性能并發(fā)。而管理仲裁,我們集群節(jié)點初始部署的時候,每個節(jié)點都會預置一個管理仲裁模塊。任意時刻只有一部分的節(jié)點,你是十個集群,我選三五七個都可以。只有一部分節(jié)點行使管理仲裁,稱為董事會,當一個壞了,整個集群會從其它的默認節(jié)點里推出一個節(jié)點進董事會。后端組網(wǎng)我們支持普通千兆、萬兆都是可以支持。對上層接口,包括像普通的文件,塊接口都可以支持。
而宕機遷移的時間,澤塔云可以做到一分鐘以內(nèi)。為什么不是秒級?這里討論兩點,第一是你的業(yè)務是否需要這么短的時間保持業(yè)務連續(xù)性。我們做金融行業(yè)用戶,保險、證券,15分鐘的宕機時間足夠。一兩分鐘足夠你去做安全的規(guī)劃和手段。另外一點我們會規(guī)避一個風險,就是監(jiān)聽,工商局去機房做運維,不小心把網(wǎng)線踢斷了,我們馬上做遷移,反而對集群造成不必要的影響。我們有一個監(jiān)聽周期大概30秒鐘,判斷完成之后,我們再去做遷移的動作,保證你遷移的準確性和無誤性。
超融合為什么更安全?很多廠家提了副本策略。可能做法不同,我們這里兩副本、三副本都OK,以兩副本為例看澤塔云的實現(xiàn)方式。ABCD數(shù)據(jù)為例,首先我們會把它完整的寫入,另外一個副本打散切片相對均衡分配在其它網(wǎng)絡遠端節(jié)點之上。這樣做的好處,第一副本策略帶來的容量提升,這毋庸置疑。第二我們在性能方面有優(yōu)化,遠端節(jié)點和本地節(jié)點IO是差不多的。網(wǎng)絡上遠端節(jié)點沒有明確的寫短板效應。一個架構里面寫一個數(shù)據(jù),基本上接近本地IO性能,這是寫方面的優(yōu)化。另外一點就是讀,大家可以看到ABCD數(shù)據(jù)過來以后,完整落到本地。你的虛擬機和業(yè)務對數(shù)據(jù)有請求的時候,從本地支持。
傳統(tǒng)硬件定義場景,二層三層交換機,定義之后你的網(wǎng)絡邊界,你的網(wǎng)絡架構。幾個問題,資源利用問題,網(wǎng)絡安全都會有。我們實現(xiàn)這些主要通過軟件方式來讓用戶自己去決定網(wǎng)絡邊界所處位置。通過界面,通過這些配置非常具有靈活性。
我們來看第一個就是分布式虛擬路由,分布式虛擬交換,大二層網(wǎng)絡,這樣的做法用戶可以自己定義它的網(wǎng)絡外延到底在哪兒,它可以做多租戶,一個大云里有多個小云都可以實現(xiàn)。
安全方面,南北向流量,軟件防火墻,四防七層的負載均衡。云主機防護是SDN實現(xiàn)的事。
這是我們界面截圖,叫做所畫即所得網(wǎng)絡拓撲,我們真的把軟件定義權力交給客戶,讓用戶定義你的網(wǎng)絡是什么樣。界面里的小圖標有虛擬機、交換、路由、防火墻、主機防護,可以直接拖拽。比如創(chuàng)虛機、創(chuàng)路由交換,直接拖到這個里面,就創(chuàng)建出來了。誰跟誰組網(wǎng),某個虛機跟某個交換設備去連,把鼠標拖到這個節(jié)點附近就撒手,這個網(wǎng)絡拓撲建成了,運維方式簡單。另外通過數(shù)據(jù)中心的大屏顯示器,在我的辦公室直接展示出來,你的網(wǎng)絡當前狀態(tài)可以直觀呈現(xiàn),方便運維。我們在資源監(jiān)視,存儲、計算都會有一些。
我們的自動彈性擴縮,沒有1.0版本。有一個互聯(lián)網(wǎng)電商用戶曾提出一個需求,像雙11、雙12這樣的場景,資源要求會突發(fā)激增,該如何做?我們在這里面實現(xiàn)一個東西就是虛機的彈性擴縮。針對當前虛機的資源使用情況,超過80%或者90%的時候,負載均衡調(diào)度就出發(fā),動態(tài)添加加虛機資源,滿客戶業(yè)務需求。當業(yè)務某個時刻變溫或者變冷,不需要那么多資源的時候,將會相應做一個回收。
關于安全這一塊,實際上我們對安全的理解,安全一定是多維度,這里面可能涵蓋計算安全,虛擬化安全,存儲安全,網(wǎng)絡安全,管理安全等等,這里面主要是網(wǎng)絡安全這塊。在實際項目中,絕大多數(shù)的用戶都傾向于硬件安全防護設備。究其原因有兩點,第一用戶的使用習慣,慣性在那。第二一些安全設備不適合做虛擬化。這里面要說的尤其是超額場景中,最緊迫的還不是外部安全防護,實際上是內(nèi)網(wǎng)安全。在這方面,要做的一個是云主機防火墻,另外一個就是病毒木馬防毒,通過防火墻我們有端口,路由流量管控,限制子網(wǎng)之間主機之間隔離。通過防毒實現(xiàn)向虛機,病毒木馬向虛機掛馬,避免這種場景出現(xiàn)。
大家知道機械盤最慢,我們做的事就是在機械盤和業(yè)務之間加一個序列化層??梢允歉咝阅躍SD,也可以是普通的HDD。這里面要實現(xiàn)的就是把上層隨機無序的數(shù)據(jù)通過序列化層做打包,相當于把隨機轉順序的過程。通過這樣的優(yōu)化,可以把IO提升10倍左右,后面有一些數(shù)據(jù)跟大家分享。
這是我們實際運行的項目,左邊是傳統(tǒng)架構,典型SAN網(wǎng)絡場景。三臺一體機,6U,2200W。相應的配套,UPS,空調(diào),機柜空間等等。我們通過隨機序列化,同樣硬盤做到6000。相當于什么概念?二甲醫(yī)院的看病,開方子都是根據(jù)這個系統(tǒng)。
GPU,目前我們在這塊主要做的一件事就是我們在整合江蘇和山東,包括安徽整個市的網(wǎng)吧。建設的時候成本除了場地以外最貴的占用最多成本就是機箱,主機一臺3000塊錢,2000塊錢都是顯卡,每兩年更新?lián)Q代一次。我們怎么做?把原來分散每個主機里面GPU資源,放到一個集中高密度的Server里面做虛擬化。這個Server可能支持十個、十六個顯卡。針對虛擬化,我們針對不同用戶。有的用戶區(qū)網(wǎng)吧聽歌、看電影,分很少資源甚至不分,打游戲我們就分很多的資源。
災備方面現(xiàn)在有兩套方案,異地的場景,數(shù)據(jù)級的保護,兩個節(jié)點之間分別部署超融合,兩套超融合之間去做數(shù)據(jù)級別異地復制。中間時間策略還有打快照保證它的邏輯。
另外一塊就是雙活數(shù)據(jù)中心,一套超融合我們把它拆開,中間第三地布一個仲裁站點。兩中心之間做大二層網(wǎng)絡打通。東北銀行做的就是這種場景,主行和分行之間七公里距離,主中心一份副本,災備中心一份副本,完成之后測試整體切換的時間??傊行臄嚯?,測試之后時間是兩分鐘。遷往大二層的網(wǎng)絡,非常快,不用改中間的中間件。另外整個數(shù)據(jù)做這個場景,數(shù)據(jù)兜一圈是五毫秒。
這是澤塔云產(chǎn)品當前的交互方式,第一種針對用戶既有資產(chǎn)比較重的情況,做利舊。只要你的服務器支持虛擬化就可以做,另外就是虛擬機。
案例分享
這里分享兩個案例,這是國家衛(wèi)計委管理中心做得項目,最早用戶想做一個云數(shù)據(jù)中心。當時找一家集成商幫它做打包方案,包括虛擬化、服務器硬件、存儲硬件、網(wǎng)絡硬件。整個方案做下來以后,給用戶報價四百萬。2014年財政緊縮,預算未批,批了兩百萬。用戶與我們溝通后指定了我們。幫他做兩件事,第一就是我們在他的數(shù)據(jù)中心部署8臺戴爾的2820服務器。這里部署一套超融合,支撐整個醫(yī)療云的項目。第二在他的災備中心機關辦公室改的機房,淘汰下來四臺服務器部署對等。在兩套中心之間做了數(shù)據(jù)級的異地災備。大家可以看到傳統(tǒng)架構方案400萬沒做的事,只是云數(shù)據(jù)中心,200萬預算,不光把用戶想做云數(shù)據(jù)中心實現(xiàn)了。同時做數(shù)據(jù)級的災備。整個項目做完了。做宕機遷移現(xiàn)場測試,直接到托管機房拔電源,遠程一分鐘之內(nèi),這臺被拔電源物理機虛機平滑地做了遷移。而這整個項目做下來之后,統(tǒng)計資源利用率使用情況,CPU、硬盤資源情況,總體資源利用率不到30%。也就是說衛(wèi)計委未來三年不用再采硬件設備。
做天津職大的項目,當時用戶采取了虛擬化,他們的痛點是存儲不穩(wěn)定,經(jīng)常閃斷。用戶表示想將所有的數(shù)據(jù),業(yè)務放到服務器里面,不想用存儲。他提出了一個超融合的需求,我們就把他所有虛機業(yè)務和數(shù)據(jù)做了一個遷移。整個業(yè)務做下來,業(yè)務系統(tǒng)非常多,大概60多個。我們遷移過程中,通過P2V、V2V遷移工具,2天時間60多個業(yè)務系統(tǒng)搞定。這個上面沒有上一個新硬件,完全是既有硬件幫他實現(xiàn),純利舊的場景。
澤塔云愿景:12月份將啟動B輪融資,大概按照十億估值來做。B輪做完以后,澤塔云計劃做兩件事,第一就是成立ZETTAKIT創(chuàng)新架構研究院,像微軟、英特爾研究院一樣,專門進行前沿領域研發(fā)。第二收購大數(shù)據(jù)團隊,打造IaaS+PaaS的整體云計算解決方案?,F(xiàn)在數(shù)據(jù)中心基礎架構朝著新一代基礎架構轉型,未來IT變化五年十年如何誰也不知道。我們想不管未來架構什么樣,不再來自美國硅谷,不再來自印度,來自ZETTAKIT,來自中國的廠商,謝謝。