国产精品一区二区av交换,中文字幕人成无码免费视频,永久免费av无码网站性色av,欧美一道本一区二区三区,樱桃熟了a级毛片

NVIDIA借助NetApp存儲(chǔ)打造創(chuàng)新計(jì)算場(chǎng)

Pethuraj Perumal 發(fā)表于:14年04月14日 14:00 [綜述] DOIT.com.cn

  • 分享:
[導(dǎo)讀]NetApp 技術(shù)對(duì)我們計(jì)算工廠的性能、效率和可靠性發(fā)揮著重要作用,有助于我們使用相同的存儲(chǔ)平臺(tái)優(yōu)化順序工作負(fù)載和隨機(jī)工作負(fù)載, 進(jìn)而加快上市速度。

作者:NVIDIA Corporation IT 存儲(chǔ)經(jīng)理,Pethuraj Perumal

NVIDIA如何借助NetApp存儲(chǔ)實(shí)現(xiàn)工程計(jì)算容量翻倍,并加快創(chuàng)新步伐以開(kāi)辟新市場(chǎng)

不懈的創(chuàng)新以及將新處理器設(shè)計(jì)快速推向市場(chǎng)的能力是NVIDIA走向成功的推動(dòng)力,同時(shí)也是決定NVIDIA 成敗的關(guān)鍵。作為視覺(jué)計(jì)算領(lǐng)域公認(rèn)的領(lǐng)導(dǎo)者,我們力求產(chǎn)品多元化并迅速打入新的市場(chǎng)。

我們的圖形處理單元(GPU)技術(shù)正在推動(dòng)著醫(yī)療保健、科技、交通、娛樂(lè)等領(lǐng)域的發(fā)展和進(jìn)步,同時(shí)也為 NVIDIA 帶來(lái)大量新的機(jī)遇。我們的工程計(jì)算場(chǎng)的性能和可靠性無(wú)疑是NVIDIA率先向市場(chǎng)推出新款芯片設(shè)計(jì)、最終增加創(chuàng)收并為我們的合作伙伴和客戶提供價(jià)值的關(guān)鍵。要實(shí)現(xiàn)我們當(dāng)前及未來(lái)的業(yè)務(wù)目標(biāo),我們必須擁有一個(gè)高性能的存儲(chǔ)平臺(tái)。

支持世界級(jí)的研發(fā)

NVIDIA工程師設(shè)計(jì)了一系列的處理器,從為智能手機(jī)和平板電腦提供處理動(dòng)力的微芯片到包含70億個(gè)晶體管的巨型超級(jí)計(jì)算處理器,一應(yīng)俱全。設(shè)計(jì)和模擬這些芯片是一項(xiàng)日益繁重且具有技術(shù)挑戰(zhàn)性的任務(wù)。我們不斷地生成文件,文件數(shù)量越來(lái)越多且文件越來(lái)越大。在過(guò)去的九個(gè)月里,我們的工程師創(chuàng)建24億份文件 — 相當(dāng)于每天將近1000萬(wàn)份文件。我們已積累超過(guò)15 PB的工程數(shù)據(jù),且數(shù)據(jù)量幾乎是每?jī)赡攴槐。在預(yù)算維持不變而需求卻持續(xù)增長(zhǎng)的情況下,要應(yīng)對(duì)這樣的數(shù)據(jù)增長(zhǎng)水平極具挑戰(zhàn)。

我們不希望產(chǎn)品工程團(tuán)隊(duì)在測(cè)試設(shè)計(jì)的同時(shí)還要分神去考慮存儲(chǔ)問(wèn)題,我們當(dāng)然也不希望存儲(chǔ)成為研發(fā) (R&D) 工作流程中的瓶頸。在任何情況下,我們的電子設(shè)計(jì)自動(dòng)化(EDA)工作流都不能被延誤或中斷。計(jì)算作業(yè)一旦停止,就必須從頭開(kāi)始重新運(yùn)行,可能會(huì)影響整個(gè)測(cè)試周期并推遲上市時(shí)間。所幸的是,我們基于NetApp®存儲(chǔ)的計(jì)算工廠能緊跟我們數(shù)千名工程師的創(chuàng)新步伐,幫助他們快速可靠地完成芯片設(shè)計(jì)、模擬和邏輯驗(yàn)證。
為使我們工程師的創(chuàng)新工作不出現(xiàn)中斷或延誤,IT必須為他們提供具有最高性能的可用存儲(chǔ)平臺(tái),專(zhuān)門(mén)用來(lái)為文件驅(qū)動(dòng)式I/O密集型工程工作流提供“暫存空間”和數(shù)據(jù)卷。隨著數(shù)據(jù)的增長(zhǎng),我們團(tuán)隊(duì)的主要目標(biāo)之一是最大限度地提高“CPU時(shí)間與實(shí)際時(shí)間”的比率,其中實(shí)際時(shí)間表示處理計(jì)算作業(yè)所需的總時(shí)間,而 CPU時(shí)間計(jì)算的是CPU主動(dòng)處理任務(wù)所花的時(shí)間。比率越高,我們計(jì)算工廠的效率就越高;不過(guò),提高此比率需要一個(gè)I/O速度極快的存儲(chǔ)平臺(tái)。CPU等待存儲(chǔ)響應(yīng)所花費(fèi)的時(shí)間屬于空閑時(shí)間,會(huì)降低我們的整體效率。

對(duì)存儲(chǔ)層的技術(shù)要求

幾年前,我們?cè)鴩L試使用其他供應(yīng)商的存儲(chǔ)技術(shù),即將所有磁盤(pán)呈帶狀分布到一個(gè)更大的陣列中去,致使我們?cè)庥隽艘韵氯齻(gè)問(wèn)題:

系統(tǒng)無(wú)法提供我們所需的線性性能。

小文件隨機(jī)I/O成為瓶頸。

穩(wěn)定性和可靠性不夠。存儲(chǔ)控制器故障可能會(huì)導(dǎo)致延遲上市;工作流中的所有活動(dòng)作業(yè)可能要從頭開(kāi)始再來(lái)一遍。

在評(píng)估問(wèn)題解決方法的同時(shí),替換當(dāng)前的系統(tǒng)成為明智之舉。鑒于以下原因,我們的團(tuán)隊(duì)選擇了NetApp作為我們研發(fā)計(jì)算操作的支持后盾:

性能。我們的研發(fā)計(jì)算操作具有很高的并發(fā)性,同時(shí)會(huì)有超過(guò)5000個(gè)計(jì)算節(jié)點(diǎn)訪問(wèn)存儲(chǔ),因此性能高低在很大程度上取決于存儲(chǔ)控制器。我們始終希望存儲(chǔ)控制器能用上最快的處理器,這樣存儲(chǔ)控制器就能以最多的并行網(wǎng)絡(luò)線程來(lái)處理I/O請(qǐng)求。我們還需要高效處理小文件隨機(jī)I/O操作的能力,因?yàn)檫@也是影響我們工作負(fù)載性能的主要決定因素。

可擴(kuò)展性。NetApp可讓我們以模塊化方式添加更多的控制器,從而在數(shù)據(jù)增長(zhǎng)的同時(shí)確保最佳性能。我們可以水平擴(kuò)展存儲(chǔ),這種模式對(duì)我們來(lái)說(shuō)非常有效。同時(shí)還會(huì)降低風(fēng)險(xiǎn),因?yàn)槲覀儾粫?huì)受單點(diǎn)故障的影響。

可靠性。我們需要類(lèi)似NetApp Data ONTAP這樣的成熟可靠的數(shù)據(jù)管理平臺(tái)。使用高可用性對(duì)中的NetApp存儲(chǔ)控制器集群可使我們?cè)诔霈F(xiàn)硬件故障的情況下提供無(wú)縫故障轉(zhuǎn)移并執(zhí)行更新,而不會(huì)對(duì)計(jì)算工廠中正在運(yùn)行的作業(yè)造成任何中斷。即使某個(gè)域發(fā)生故障,也不會(huì)讓整個(gè)集群崩潰。

效率。我們不斷努力控制整體能耗和硬件占用空間,并盡可能地提高密度。NetApp提供許多能實(shí)現(xiàn)效率最大化的技術(shù),包括與占用最少存儲(chǔ)空間的時(shí)間點(diǎn) Snapshot副本保持?jǐn)?shù)據(jù)一致性的功能。默認(rèn)情況下,NetApp卷已經(jīng)過(guò)精簡(jiǎn)配置,能減少初始存儲(chǔ)空間使用量。

精簡(jiǎn)性。能否靈活使用網(wǎng)絡(luò)文件系統(tǒng)(NFS)和通用 Internet文件系統(tǒng)(CIFS)快速配置存儲(chǔ)并對(duì)工程文件提供共享訪問(wèn)非常重要。憑借NetApp統(tǒng)一存儲(chǔ)架構(gòu)中的多協(xié)議支持,我們可以使用以下兩種協(xié)議(見(jiàn)圖 1)。


 
圖 1)NVIDIA工程計(jì)算工廠采用NetApp Data ONTAP 8.2。通過(guò)NFS和CIFS訪問(wèn)相同的文件系統(tǒng)時(shí),Data ONTAP完全保持了數(shù)據(jù)的完整性。

如何借助NetApp存儲(chǔ)使容量翻倍

截至2012年,以NetApp存儲(chǔ)為后盾,我們的工程計(jì)算基礎(chǔ)架構(gòu)基本能夠滿足需求。為了保證創(chuàng)新工作有條不紊,我們需要支持更多的并發(fā)工作流并提高計(jì)算作業(yè)的性能。

為解決這一難題,我們部署了采用智能緩存技術(shù)的NetApp FAS6280和FAS6290存儲(chǔ)系統(tǒng)以提高吞吐量,并將多個(gè)獨(dú)立系統(tǒng)整合為高可用性對(duì)。同時(shí),我們升級(jí)到了Data ONTAP的更新版本,它提供了更多的并行網(wǎng)絡(luò)線程來(lái)處理I/O請(qǐng)求,而且使CPU在所有核心間的利用率更加平衡。此外,我們還與NetApp工程部展開(kāi)密切合作,聯(lián)手進(jìn)行基準(zhǔn)測(cè)試并針對(duì)我們特定的EDA工具進(jìn)行存儲(chǔ)優(yōu)化,這并未改變或影響我們工程團(tuán)隊(duì)的底層工作流。

借助其他NetApp 存儲(chǔ)系統(tǒng)、緩存和優(yōu)化操作,最終我們計(jì)算工廠的整體處理效率提高了一倍多,每天的計(jì)算作業(yè)量從200萬(wàn)增加到450萬(wàn)。我們可以在任何指定時(shí)間同時(shí)執(zhí)行60,000項(xiàng)計(jì)算作業(yè)。CPU時(shí)間與實(shí)際時(shí)間的整體比率也有所提升 — 我們發(fā)現(xiàn)實(shí)際編譯性能提高多達(dá) 19% 且模擬運(yùn)行次數(shù)增加多達(dá)25%。

高效存儲(chǔ)為產(chǎn)品上市提速

NetApp 技術(shù)對(duì)我們計(jì)算工廠的性能、效率和可靠性發(fā)揮著重要作用,有助于我們使用相同的存儲(chǔ)平臺(tái)優(yōu)化順序工作負(fù)載和隨機(jī)工作負(fù)載, 進(jìn)而加快上市速度。

提升小文件隨機(jī) I/O 性能

NetApp能出色地處理通過(guò)NFS傳入的I/O請(qǐng)求,一部分是因?yàn)?WAFL(任意位置寫(xiě)入文件布局),這是最令我印象深刻的NetApp功能之一。WAFL使用臨時(shí)數(shù)據(jù)布局同時(shí)寫(xiě)入元數(shù)據(jù)和用戶數(shù)據(jù),以盡量減少將數(shù)據(jù)提交到存儲(chǔ)所需的磁盤(pán)操作次數(shù),而不是將數(shù)據(jù)和元數(shù)據(jù)存儲(chǔ)到磁盤(pán)上的預(yù)定位置。將非常小的文件(小于64字節(jié))存儲(chǔ)到文件系統(tǒng)內(nèi)的索引節(jié)點(diǎn)數(shù)據(jù)結(jié)構(gòu)中,而非磁盤(pán)塊中;因此,無(wú)需訪問(wèn)磁盤(pán)(省下了查找時(shí)間),提升了性能。
借助智能緩存節(jié)省空間和能耗的同時(shí)優(yōu)化讀取性能

我們借助NetApp Flash Cache來(lái)提升決定著大部分工作負(fù)載速度的讀取性能。通過(guò)在連接到控制器的 PCIe卡上緩存最近讀取的數(shù)據(jù)和元數(shù)據(jù),F(xiàn)lash Cache在PCI 總線中充當(dāng)WAFL擴(kuò)展緩沖區(qū),從而幫助我們?nèi)菁{非常大的數(shù)據(jù)集。我們與 NetApp 緊密合作,共同確定工作負(fù)載所需的Flash Cache數(shù)量并決定使用512 GB和1 TB PCIe卡。這樣一來(lái),緩存使用率就始終高于90%。

借助Flash Cache,我們可以使用混合存儲(chǔ)模式,以便最大限度地減少存儲(chǔ)占用空間并控制成本。在該模式下,我們使用了具有較高密度的高性能串行連接SCSI(SAS)驅(qū)動(dòng)器和成本較低的串行 ATA(SATA)驅(qū)動(dòng)器。若不采用Flash Cache,要達(dá)到我們目前的性能水平,我們需要的磁盤(pán)架數(shù)量以及相應(yīng)的能耗和散熱資源可能要增加三倍多;而且,若不采用 Flash Cache,我們可能無(wú)法在現(xiàn)有環(huán)境下使用高容量 SATA 磁盤(pán),且很難擴(kuò)展計(jì)算工廠的容量。我們的數(shù)據(jù)中心可能已不堪負(fù)重。事實(shí)上,在我們對(duì)計(jì)算工廠進(jìn)行容量擴(kuò)展之后,借助新NetApp存儲(chǔ)系統(tǒng)的能效,我們已從電力公司贏得了200,000美元的返利。

降低風(fēng)險(xiǎn),同時(shí)保持?jǐn)?shù)據(jù)一致性

NetApp存儲(chǔ)另一個(gè)極具吸引力的功能是Snapshot副本,它們是活動(dòng)文件系統(tǒng)基于指針的只讀副本。WAFL利用寫(xiě)時(shí)復(fù)制技術(shù)最大限度地減少Snapshot副本占用的磁盤(pán)空間,這樣我們就可以在保留數(shù)據(jù)集的時(shí)間點(diǎn)副本時(shí),既無(wú)需占用存儲(chǔ)空間,又不會(huì)影響性能。Snapshot副本可幫助我們保持?jǐn)?shù)據(jù)一致性,這在工程環(huán)境中至關(guān)重要,而且有助于避免數(shù)據(jù)丟失的風(fēng)險(xiǎn)。計(jì)算作業(yè)完成后,我們可以使用 Snapshot 副本臨時(shí)保護(hù)無(wú)需保留的數(shù)據(jù),避免因重復(fù)存儲(chǔ)而產(chǎn)生費(fèi)用,這一方法十分簡(jiǎn)便。Snapshot 副本可以在我們這種文件數(shù)量巨大的環(huán)境中提供快速恢復(fù),只需翻轉(zhuǎn)文件系統(tǒng)指針即可 — 如果實(shí)驗(yàn)過(guò)程中出錯(cuò),我們可以使用Snapshot副本中的數(shù)據(jù)副本快速恢復(fù)到已知狀態(tài)。NVIDIA目前使用NetApp SnapVault®進(jìn)行備份并使用 NetApp SnapMirror將數(shù)據(jù)復(fù)制到位于薩克拉門(mén)托的災(zāi)難恢復(fù)站點(diǎn)。

我們還使用 NetApp 重復(fù)數(shù)據(jù)刪除來(lái)消除某些卷內(nèi)的冗余數(shù)據(jù)塊,并因此而獲益。重復(fù)數(shù)據(jù)刪除技術(shù)會(huì)找到相同的數(shù)據(jù)塊,并以引用單個(gè)共享數(shù)據(jù)塊的方式將其替換。這種方法特別適合我們保留了多個(gè)副本的 Perforce 軟件配置管理系統(tǒng),因?yàn)檫@些副本中有大量的重復(fù)數(shù)據(jù)。我們將這些卷的容量要求降低了 30%。

用更少的人手管理更多的存儲(chǔ)

盡管我們計(jì)算工廠的存儲(chǔ)容量已大幅提升,但我們未雇用更多的基礎(chǔ)架構(gòu)人員,且我們的預(yù)算與往年持平。實(shí)際上,少一個(gè)全職員工我們也可以正常運(yùn)行。正是因?yàn)镹etApp讓我們能夠輕松簡(jiǎn)單地管理15 PB的數(shù)據(jù)占用空間,才讓這成為可能。

借助NetApp OnCommand Unified Manager管理軟件,我們可以快速了解性能指標(biāo)和利用率統(tǒng)計(jì)信息。為了盡早發(fā)現(xiàn)存儲(chǔ)基礎(chǔ)架構(gòu)中的問(wèn)題以免對(duì)計(jì)算作業(yè)造成影響,我們選擇使用NetApp AutoSupport,它可在出現(xiàn)磁盤(pán)故障或其他潛在問(wèn)題時(shí)迅速做出響應(yīng)并向我們發(fā)出警報(bào)。

業(yè)務(wù)影響:加快NVIDIA及客戶的上市速度

對(duì)NVIDIA而言,計(jì)算工廠的效率提升25%意味著可以在更短的時(shí)間內(nèi)測(cè)試、驗(yàn)證芯片設(shè)計(jì)并將其推向市場(chǎng)。NetApp幫助我們提升了CPU時(shí)間與實(shí)際時(shí)間的比率,這對(duì)我們的上市時(shí)間至關(guān)重要。隨著性能和容量的提升,我們每天可以支持的作業(yè)量將是之前的兩倍多,反過(guò)來(lái)這將促使我們推出更多的設(shè)計(jì)。我們不再受停機(jī)時(shí)間的影響,借助NetApp系統(tǒng),我們實(shí)現(xiàn)了高于99.99%的可用性。我們不再關(guān)注存儲(chǔ)正常運(yùn)行時(shí)間,因?yàn)槲覀兊腘etApp 存儲(chǔ)隨時(shí)可供工程師們使用。

縮短發(fā)布周期也將為我們的客戶帶來(lái)巨大的商業(yè)價(jià)值,這不僅能夠鞏固我們的戰(zhàn)略業(yè)務(wù)合作伙伴地位,而且有助于客戶推出基于NVIDIA技術(shù)的突破性產(chǎn)品。

未來(lái)規(guī)劃

借助NetApp Flash Cache和其他存儲(chǔ)效率,NVIDIA實(shí)現(xiàn)了R&D計(jì)算轉(zhuǎn)型并成功打造了一個(gè)支持不斷創(chuàng)新的計(jì)算工廠。在擴(kuò)大和完善計(jì)算工廠的過(guò)程中,我們將繼續(xù)信賴與NetApp之間的合作,我們還期望借助新一代NetApp FAS6000存儲(chǔ)系統(tǒng)提高性能并在能耗和散熱方面獲得更多優(yōu)勢(shì)。同時(shí),我們還將擴(kuò)大NetApp存儲(chǔ)在其他業(yè)務(wù)領(lǐng)域的應(yīng)用,包括公司IT和我們的VMware vSphere®虛擬服務(wù)器環(huán)境。

在不久的將來(lái),我們計(jì)劃將計(jì)算工廠遷移到NetApp集群模式Data ONTAP操作系統(tǒng),目前我們正處于測(cè)試階段。通過(guò)將我們現(xiàn)有的NetApp存儲(chǔ)系統(tǒng)合并到集群模式Data ONTAP下的單個(gè)全局命名空間,我們將從無(wú)縫橫向擴(kuò)展、簡(jiǎn)易負(fù)載平衡以及整個(gè)生命周期內(nèi)保持聯(lián)機(jī)的芯片設(shè)計(jì)數(shù)據(jù)中獲益。

[責(zé)任編輯:任新勃]
任新勃
VMware根據(jù)應(yīng)用者的實(shí)際應(yīng)用需求推出通過(guò)單一平臺(tái)交付應(yīng)用和桌面的綜合解決方案VMware Horizon 6。Horizon 6能夠幫助企業(yè)在移動(dòng)云時(shí)代為IT部門(mén)與終端用戶提供支持面向物理、虛擬和員工自有設(shè)備的綜合解決方案。
官方微信
weixin
精彩專(zhuān)題更多
存儲(chǔ)風(fēng)云榜”是由DOIT傳媒主辦的年度大型活動(dòng)。回顧2014年,存儲(chǔ)作為IT系統(tǒng)架構(gòu)中最基礎(chǔ)的元素,已經(jīng)成為了推動(dòng)信息產(chǎn)業(yè)發(fā)展的核心動(dòng)力,存儲(chǔ)產(chǎn)業(yè)的發(fā)展邁向成熟,數(shù)據(jù)經(jīng)濟(jì)的概念順勢(shì)而為的提出。
華為OceanStor V3系列存儲(chǔ)系統(tǒng)是面向企業(yè)級(jí)應(yīng)用的新一代統(tǒng)一存儲(chǔ)產(chǎn)品。在功能、性能、效率、可靠性和易用性上都達(dá)到業(yè)界領(lǐng)先水平,很好的滿足了大型數(shù)據(jù)庫(kù)OLTP/OLAP、文件共享、云計(jì)算等各種應(yīng)用下的數(shù)據(jù)存儲(chǔ)需求。
聯(lián)想攜ThinkServer+System+七大行業(yè)解決方案驚艷第十六屆高交會(huì)
 

公司簡(jiǎn)介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶寄語(yǔ) | DOIT歷程 | 誠(chéng)聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心

Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.