DataDomain創(chuàng)始人兼首席科學(xué)家 李凱
李凱說,那是因?yàn)榻?jīng)過調(diào)查,“人們都不怎么喜歡磁帶,而且不喜歡磁帶的原因是多方面的,這不僅是數(shù)據(jù)中心的問題。”他認(rèn)為,如果有了好的替代產(chǎn)品的話,沒有人會(huì)繼續(xù)回去使用磁帶——“現(xiàn)在大家都在用ipod、mp3的播放器,很少有人會(huì)回去用音樂磁帶,因?yàn)槲覀兌疾幌矚g磁帶,很少有人用VCR,而是用DVR或是DVD,他們也是不喜歡磁帶。”
但是,數(shù)據(jù)中心與其他領(lǐng)域不同的是,“數(shù)據(jù)中心里面需要做出產(chǎn)品來,需要像ipod這么酷,所以我們的產(chǎn)品就是這么設(shè)計(jì)的,我們的技術(shù)是為了解決市場(chǎng)的要求和問題來發(fā)明的。”李凱在談到創(chuàng)立公司時(shí),如是說。
后來的事情我們也就都清楚了,DataDomain成為了業(yè)界知名的虛擬磁帶庫供應(yīng)商,推動(dòng)著磁盤在數(shù)據(jù)保護(hù)領(lǐng)域代替磁帶的浪潮。
虛擬磁帶庫:為何與“他人”意見相左
不過,與DataDomain不同,在同一個(gè)虛擬磁帶庫市場(chǎng)上,也有人認(rèn)為,虛擬磁帶庫只是主存儲(chǔ)、近線存儲(chǔ)與磁帶系統(tǒng)間的一個(gè)“中間層”,更得保護(hù),更快的速度,但無法替代磁帶,也無法替代近線存儲(chǔ)系統(tǒng),當(dāng)然,更何提在線存儲(chǔ)系統(tǒng)??“他們”認(rèn)為,虛擬磁帶庫的主要作用,是在現(xiàn)有的大量采用磁帶為基礎(chǔ)的備份架構(gòu)和備份軟件之下,加快備份的速度。
但李凱不這么認(rèn)為,他相信,一方面是“其他人”的產(chǎn)品速度達(dá)不到,另一方面,是磁帶的消亡還沒有那么快。
實(shí)際上,由于虛擬磁帶庫常與重復(fù)數(shù)據(jù)刪除聯(lián)系在一起,以及虛擬磁帶庫是否能取代近線備份系統(tǒng),而直接成為近線存儲(chǔ)系統(tǒng),并進(jìn)而取代磁帶的可能,虛擬磁帶庫的性能一直被人們所關(guān)注,而對(duì)于DataDomain來說,鑒于一直將虛擬磁帶庫列作備份的直接系統(tǒng),而不是“中間層”,這一問題也就顯得更為引人關(guān)注。
“要看產(chǎn)品的性能,主要是他們的性能不能夠代替磁帶,要有一個(gè)理由,有一些用戶要有要求。從剛才的話題來說,ipod代替磁帶用了10年,在有些地方還是有人用磁帶,不可能幾年內(nèi)就完全的換掉?!睂?duì)于DataDomain的產(chǎn)品設(shè)計(jì),李凱有話要說。
“DataDomain最近推出的880產(chǎn)品,如果用10Gb的連接做產(chǎn)品的話,速度已經(jīng)達(dá)到了物理連接的極限速度,就是10Gb,看下市場(chǎng)上的產(chǎn)品會(huì)發(fā)現(xiàn)做重復(fù)數(shù)據(jù)刪除會(huì)比不做的速度還會(huì)看。”??李凱表示,這是因?yàn)镈ataDomain從開始就考慮到了性能的問題,并將軟件進(jìn)行了并行化的設(shè)計(jì),李凱說,在2001年的時(shí)候,他開始對(duì)多核處理器的可能性產(chǎn)生了思考,并相信,多核、并行會(huì)是一種趨勢(shì)。
“DataDomain的產(chǎn)品為什么速度會(huì)很高,因?yàn)槲覀円婚_始就把軟件設(shè)計(jì)成并行的,利用多核的處理能力,很多廠商需要帶很多磁盤才有吞吐量,帶很多磁盤為什么還要用重復(fù)數(shù)據(jù)刪除?我們的就是不用很多的磁盤,我們用10個(gè)磁盤就可以完成,其他人要用1000個(gè),只要英特爾做更多的多核芯片,我們就能提供更多吞吐量?!??在2001年李凱設(shè)計(jì)并行的DataDomain處理程序時(shí),x86系統(tǒng)的多核處理器還需要再等3年,當(dāng)然,2001年的時(shí)候,IBM已經(jīng)在小范圍推出它的第一款雙核Power 4處理器,但I(xiàn)BM當(dāng)時(shí)是用在了它的RISC服務(wù)器中,何談存儲(chǔ)?
李凱還談到,由于知道“與數(shù)據(jù)中心的人聊會(huì)知道磁帶不可靠”。因此,DataDomain的產(chǎn)品是在不停的做校驗(yàn),寫進(jìn)去馬上讀出來校驗(yàn),之后每天每個(gè)星期都在校驗(yàn),磁帶庫不能夠校驗(yàn),可靠性的量級(jí)是不一樣的。
重復(fù)數(shù)據(jù)刪除:未來的“中間”一層
李凱認(rèn)為,未來“重復(fù)數(shù)據(jù)刪除技術(shù)在很多地方都會(huì)有貢獻(xiàn)的,主存里面也會(huì)有”。
“很多DataDomain的用戶用產(chǎn)品來做近線的應(yīng)用,和主存儲(chǔ)已經(jīng)很接近了,他有很多的接口,包括NFS、VTL、NDMP等等,這些接口都可以同時(shí)用,多用戶多應(yīng)用的用,就可以考慮,很多用戶買的時(shí)候可能只用VTL,后來發(fā)現(xiàn)不用付錢就可以用作近線存儲(chǔ),他們發(fā)現(xiàn)新的用法,用作近線存儲(chǔ)的時(shí)候自動(dòng)的解決數(shù)據(jù)遷移的問題?!崩顒P認(rèn)為,重復(fù)數(shù)據(jù)刪除技術(shù),未來將會(huì)是大眾化、普及化的,就像RAID一樣,是“數(shù)據(jù)保護(hù)的一個(gè)層”,存儲(chǔ)系統(tǒng)很自然就擁有的能力。
“DataDomain的重復(fù)數(shù)據(jù)刪除,相當(dāng)于存儲(chǔ)系統(tǒng)中加了一層,最開始大家用磁盤的時(shí)候沒有RAID,就沒有可靠性,用多了磁盤就有可靠性,RAID就加了一層,重復(fù)數(shù)據(jù)刪除技術(shù)就在上面又加了一層,減少你用磁盤的數(shù)量,提高了可靠性,因?yàn)榇疟P越少可靠性越高,減少了用戶的消費(fèi),這個(gè)層會(huì)變?yōu)闃?biāo)準(zhǔn)的一層,很多存儲(chǔ)器會(huì)考慮這一層?!?/p>
當(dāng)然,李凱也深知,即使是能夠刪除大量的冗余數(shù)據(jù),重復(fù)數(shù)據(jù)刪除仍然在成為標(biāo)準(zhǔn)上有需要的做的地方,比如說功耗:
“在數(shù)據(jù)中心里面,功耗是一個(gè)很大的問題,DataDomain的產(chǎn)品在做備份的方面,壓縮比能夠達(dá)到10-30倍,能夠減少10倍以上的空間、耗電量,以前可能用10個(gè)甚至30個(gè)盒子?,F(xiàn)在只需要一個(gè),在消耗電量管理人員方面節(jié)省了很多。”李凱認(rèn)為:“這也是成為標(biāo)準(zhǔn)的基本要求。”
不過,李凱在采訪中表示,他相信,重復(fù)數(shù)據(jù)刪除將會(huì)成為“存儲(chǔ)系統(tǒng)中一個(gè)層”,一個(gè)“自然”的層次。
與EMC:很好的結(jié)果,一致的目標(biāo)
談起收購,李凱表示,EMC最后把DataDomain買進(jìn)來,是因?yàn)楣疽呀?jīng)上市了,上市的公司的董事會(huì)會(huì)為了股東的利益著想,不是創(chuàng)始人、管理層能夠做決定的,唯一的出發(fā)點(diǎn)就是擁有股份的投資人和擁有股份的人的利益這是不是一個(gè)好的決定。
不過,作為他個(gè)人來說,他很高興看到DataDomain未來能夠獲得更好發(fā)展的機(jī)會(huì)。
“當(dāng)時(shí)成立公司的時(shí)候是為了數(shù)據(jù)中心解決問題,不是從技術(shù)角度出發(fā),是從解決問題的角度出發(fā),創(chuàng)立革命的改變讓數(shù)據(jù)中心做數(shù)據(jù)保護(hù)方面用新的辦法來做,這是一個(gè)主要的出發(fā)點(diǎn)。當(dāng)時(shí)主要做這個(gè)公司也沒有很遠(yuǎn)的想法,因?yàn)楹苓h(yuǎn)的事情很難想出來,我們的目的也是為了更多的數(shù)據(jù)中心解決問題,代替磁帶庫的解決方案,數(shù)據(jù)備份、遠(yuǎn)程備份、近線存儲(chǔ)、歸檔的存儲(chǔ),在很多領(lǐng)域都有磁帶,我們想的是要代替磁帶?!倍诮鉀Q數(shù)據(jù)存儲(chǔ)的問題上,李凱看到,DataDomain與EMC的目的和方向是一致的。
李凱表示:“我本人覺得這個(gè)結(jié)果很好,這和我們最開始成立公司的目標(biāo)是一致的?!彼硎?,因?yàn)镋MC是存儲(chǔ)工業(yè)里面最大的公司,產(chǎn)品線是非常好的產(chǎn)品線,DataDomain進(jìn)來之后,可以利用EMC的平臺(tái)把市場(chǎng)做得更大,為更多的數(shù)據(jù)中心解決問題。
而對(duì)于收購后的公司定位與產(chǎn)品線重疊的問題,李凱的態(tài)度是:公司仍然保持獨(dú)立,定位上很容易。
“EMC的公司好處就是之前收購很多大公司,比如VMware,這些大的公司進(jìn)來之后,這些公司還按以前的辦法來執(zhí)行,同一批管理人員,所有人都留下,DataDomain現(xiàn)在還是一個(gè)單獨(dú)的EMC下的公司,我們的總裁還是原來的總裁,管理的班子還是原來的?!币虼?,李凱說所以DataDomain的人感覺沒有變化,工作環(huán)境、目標(biāo)都沒變化,只不過現(xiàn)在資金更多了,而且市場(chǎng)更大了,大家是這樣的感覺,而至于與其他的重復(fù)數(shù)據(jù)刪除產(chǎn)品,李凱談到“實(shí)際上Avamar是在備份軟件上做重復(fù)數(shù)據(jù)刪除,DataDomain是和系統(tǒng)里面做,和所有的備份軟件都可以做,中間會(huì)有重疊的市場(chǎng)很小。所以定位上很容易的。”
實(shí)際上,在7月20日前后EMC全球發(fā)布的新聞稿中,EMC方面已經(jīng)正式表示,“一旦EMC對(duì)Data Domain收購?fù)瓿桑瑢⒁訢ata Domain為基礎(chǔ)組建一個(gè)新產(chǎn)品部門,隸屬于EMC存儲(chǔ)業(yè)務(wù)部,專注新一代磁盤備份、恢復(fù)和歸檔解決方案的開發(fā)和交付。”而這個(gè)新的EMC產(chǎn)品部門則仍將由Data Domain總裁兼首席執(zhí)行官Frank Slootman領(lǐng)導(dǎo)。
而談起在中國區(qū)的合作,Data Domain大中華區(qū)總裁許躍奏表示:“在中國會(huì)和EMC有很緊密的合作,但是這個(gè)是雙贏的,兩邊的產(chǎn)品都在賣,會(huì)有一個(gè)合作的,我們現(xiàn)在在做培訓(xùn),我們的工程師幫EMC的工程師、合作伙伴做培訓(xùn),我們90%的渠道就是EMC現(xiàn)在的渠道,融合會(huì)是非??旌头浅H菀椎摹!?/p>
李凱和許躍奏都認(rèn)為,DataDomain在波音、AT&T以及紐約銀行的成功案例證明,在找到正確的團(tuán)隊(duì),擁有強(qiáng)大的支持之后,DataDomain能夠在中國獲得持續(xù)的增長(zhǎng)和更多的具有代表性的大型客戶。
DataDomain對(duì)此充滿信心。