Hollerith打孔卡
由于“單元記錄”太小,無法作為獨(dú)立記錄保留在存儲設(shè)備上(如磁帶),所以單元記錄被收集到稱之為“塊”的記錄組。這和塊存儲有什么關(guān)系?其實是與Hollerith卡的首次廣泛應(yīng)用有關(guān)——1890年,美國人口普查局已經(jīng)將所有戶口普查資料編碼到Hollerith卡上,然后使用分類機(jī)將數(shù)據(jù)進(jìn)行制表和分類。
這就是我認(rèn)為在計算機(jī)上使用的塊存儲已經(jīng)125歲高齡的原因。
2.基礎(chǔ)文件存儲是基于對象存儲的嗎,怎么來的?
Robert Novak:大部分對象存儲都是作為文件收集從存儲對象開始的。一些對象存儲實際上在自身文件系統(tǒng)里直接管理塊頂部的對象,但大多數(shù)是在文件存儲頂部構(gòu)建,采用文件存儲內(nèi)的獨(dú)立空間從數(shù)據(jù)(圖片,視頻,文件)中分離元數(shù)據(jù)(對象名稱,創(chuàng)造日期,擁有者等),如圖分層:
3.鍵/值存儲和直接磁盤尋址會如何改善?
Robert Novak:讓我們先來談?wù)勬I/值存儲。2013年,希捷發(fā)布其構(gòu)建鍵/值存儲設(shè)備計劃——Kinetic驅(qū)動器,但實際正式出售則晚了一年。
對于這些驅(qū)動器,你不需要了解它的大小,塊存儲大小或者數(shù)據(jù)實際存儲地點(diǎn)。只需要知道“鍵”(在Kinetic模型里高達(dá)4096 bits)。我有時會把它比作洗衣房存儲模式。你把衣服放到洗衣房存放,然后洗凈甩干。老板會給你一個帶編號的票據(jù)。
幾天后你回洗衣房取衣服(值),但你忘了拿票據(jù)(鍵),老板說,沒票據(jù),沒衣服。
鍵/值存儲驅(qū)動器工作也是類似模式。但不是老板給你票據(jù)(鍵),而是你創(chuàng)建自己的鍵用于數(shù)據(jù),這是獨(dú)一無二的。
而造成的差異是主機(jī)服務(wù)器對數(shù)據(jù)存儲地點(diǎn)一無所知。它并沒有像其它文件系統(tǒng)那樣對數(shù)據(jù)建立任何依賴關(guān)系。而這種依賴類型也導(dǎo)致了塊指針重寫(Block Pointer Rewrite)問題,阻礙了疊瓦式磁存儲用于許多文件系統(tǒng)。
在鍵/值存儲驅(qū)動器里沒有數(shù)據(jù)“地址”。驅(qū)動器的“地址”是一個(或多個)IP地址分配給驅(qū)動器的。使用正確的廣播或多路廣播技術(shù),你甚至不需要知道這個驅(qū)動器的地址。換言之,鍵/值代表了一種延遲綁定形式。
對象存儲/塊存儲速度競賽
4.對象存儲要如何改為使用直接IP地址驅(qū)動器?
Robert Novak:具備直接把對象存儲到一個存儲設(shè)備的能力,沒必要把對象名稱轉(zhuǎn)化為一系列代表元數(shù)據(jù)文件 “家族”的文件名。
5.對象存儲能在速度上能比得上塊存儲嗎?
Robert Novak:我的想法和大眾觀點(diǎn)截然相反。對象存儲的速度確實能超過塊存儲。在塊存儲模式里,它已經(jīng)在促進(jìn)最快訪問到數(shù)據(jù)方面有了逐步的轉(zhuǎn)變。
磁盤驅(qū)動器的早期,所謂最快訪問就是數(shù)據(jù)可以順序從磁盤驅(qū)動器讀取連續(xù)的塊。隨著復(fù)雜度增加,RAID技術(shù)演變成了跨多個驅(qū)動器對數(shù)據(jù)進(jìn)行分段。
然而,對于對象存儲,如果你將數(shù)據(jù)劃分成塊,跨許多不同的驅(qū)動器存儲這些塊(可能冗余),那么你會在讀取數(shù)據(jù)時實現(xiàn)一個比特流效果,使得讀取速度限制變成你的入站數(shù)據(jù)通道帶寬(如,以太網(wǎng))。
6.你對現(xiàn)下存儲行業(yè)的狀態(tài)怎么看?
Robert Novak:我個人的看法,并不反映任何主流行業(yè)廠商的心理——業(yè)內(nèi)處于整合和收縮狀態(tài),因為它在努力解決我們所產(chǎn)生數(shù)據(jù)量的巨大轉(zhuǎn)變,而這些轉(zhuǎn)變阻礙了我們管理和存儲數(shù)據(jù)。
許多人還未意識到采用對象存儲模式,與過去的40-50年相比,我們實際上只需要更少的存儲來進(jìn)行可信賴地保存數(shù)據(jù)。
在過去,作為一名CIO,你被勒令不但要你的主要RAID/MIRROR存儲持續(xù)在線,每年月周天還要盡可能多地存儲數(shù)據(jù)副本進(jìn)行備份。
其中一些備份會發(fā)送到異地用于環(huán)境災(zāi)難(颶風(fēng),龍卷風(fēng),洪水,地震),政治災(zāi)難(將數(shù)據(jù)放置在海外以防止政府訪問)或沖突災(zāi)難如911事件的恢復(fù)。
對象存儲能夠不僅能實現(xiàn)所有這些相同目標(biāo),而且相比傳統(tǒng)存儲還能節(jié)約50-80%的成本。
7.公有云將如何影響存儲業(yè)界?
Robert Novak:公有云是通過對象技術(shù)實現(xiàn)空間節(jié)約的一部分?,F(xiàn)在的問題是云里的數(shù)據(jù)只能以廣域網(wǎng)速度訪問。如果數(shù)據(jù)是在你的手機(jī)或平板上那還不錯,但如果你想在存檔記錄上運(yùn)行分析應(yīng)用程序并不合適。
此外,公有云在成本上有一定迷惑性。對于手機(jī)或平板數(shù)據(jù),價格相當(dāng)劃算。但當(dāng)你達(dá)到海量數(shù)據(jù)需求時,檢索云數(shù)據(jù)的成本甚至能壓垮一家不在內(nèi)部進(jìn)行數(shù)據(jù)保存的公司。
短期內(nèi)我們會看到,由于IT經(jīng)理停止購買決議同時評估它們用于容災(zāi)和云存儲需求的公有云成本,存儲部門數(shù)量將呈現(xiàn)扁平化。
8.大型存儲供應(yīng)商的并購浪潮有沒有對您造成影響?
Robert Novak:并購風(fēng)表現(xiàn)出在存儲供應(yīng)商管理團(tuán)隊部分明顯地缺乏想象力。他們根本無法想象這是導(dǎo)致我們進(jìn)入一個全新模式的條件。作為并購的一部分,很多公司也正在進(jìn)行裁員。而許多裁員正在影響最具創(chuàng)新性的團(tuán)隊和技術(shù)。
9.創(chuàng)業(yè)公司可能會出現(xiàn)什么情況?
Robert Novak:因為投資商對收購產(chǎn)生了一些警覺,新的創(chuàng)業(yè)公司數(shù)量會有短期下降。主要有兩家之見。一種認(rèn)為并購產(chǎn)生是因為業(yè)界容不下更多的廠商。
另一種則意識到并購發(fā)生是因為大型廠商都沒有采用和推廣新技術(shù),而這時可能是投資新創(chuàng)業(yè)公司的最佳時機(jī)。
后者最初可能會很弱小,而由于研發(fā)周期問題,證明它們的投資價值也需要一定的時間。
10.如何看待業(yè)界的未來?
Robert Novak:業(yè)界將會遠(yuǎn)離圈在單一服務(wù)器里的SAS/SATA存儲。采用無狀態(tài)UDP訪問的以太網(wǎng)連接存儲設(shè)備將逐漸變得更加智能化以便處理更多重要存儲和搜索功能。服務(wù)器除了啟動和交換將不再使用本地存儲,甚至隨著時間推移還會有變數(shù)。
唯一的“本地”存儲會是0層存儲級別內(nèi)存,在一段時期內(nèi)數(shù)據(jù)未被引用,它將遷移到更慢的層。