與IBM、EMC、富士通、Intel等先后推出Hadoop發(fā)行版不同,Vmware更專注于基礎(chǔ)架構(gòu)層面。在一場2000余人到場的VMware & EMC大數(shù)據(jù)云高峰論壇上,VMware公司大中華區(qū)總裁宋家瑜表示,云的平臺才是唯一能解決爆炸性大數(shù)據(jù)使用的需求,把關(guān)鍵應(yīng)用移到云平臺已經(jīng)是一個必然趨勢。
Vmware之道:從vHadoop到GemFire
在介紹數(shù)據(jù)管理技術(shù)《從數(shù)據(jù)庫到數(shù)據(jù)云 虛擬化與開源搭橋》五大趨勢之后,VMware全球高級副總裁范承工表示,傳統(tǒng)數(shù)據(jù)庫技術(shù)hold不住一些這樣的應(yīng)用:海量數(shù)據(jù)的需求,實時數(shù)據(jù)的需求,和靈活數(shù)據(jù)的需求。Vmware和EMC一道,致力于在vsphere云平臺之上提供面向這些應(yīng)用的整體解決方案。
Hadoop由于其低成本和高擴(kuò)展性的優(yōu)勢,成為各大廠商處理海量數(shù)據(jù)的法寶,但虛擬基礎(chǔ)架構(gòu)云上的Hadoop,存在可靠性問題。根據(jù)阿帕奇Virtual Hadoop wiki文檔給出的結(jié)論,可以將Hadoop帶到云基礎(chǔ)架構(gòu)上,但物理和虛擬基礎(chǔ)設(shè)施之間的差異可能危及數(shù)據(jù)完整性和安全性。
現(xiàn)在,VMware開源項目Serengeti試圖改變這個問題。該項目將允許企業(yè)在云端和虛擬環(huán)境中,在 vSphere 上部署和管理Hadoop。
范承工介紹,Serengeti將Hadoop在虛擬基礎(chǔ)架構(gòu)的部署時間從很多天縮短到10分鐘,同時還能夠提高硬件的利用率,能夠滿足多租戶的需求,有更好的安全隔離,也有更好的伸縮性。Vmware還介紹,通過 vSphere,Hadoop應(yīng)用如果節(jié)點失敗能夠自動重啟。