1:大數(shù)據(jù)、快速數(shù)據(jù)和RISC-V機(jī)會(huì)

1a中,云數(shù)據(jù)中心服務(wù)器利用在大型大數(shù)據(jù)集上訓(xùn)練的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)來(lái)執(zhí)行機(jī)器學(xué)習(xí)的功能。在1b中,邊緣設(shè)備中的安全攝像機(jī)采用經(jīng)過(guò)大數(shù)據(jù)訓(xùn)練的推理引擎來(lái)實(shí)時(shí)識(shí)別圖像(快速數(shù)據(jù))。在1c中,智能固態(tài)硬盤(pán)設(shè)備采用推理引擎進(jìn)行數(shù)據(jù)識(shí)別和分類(lèi),從而有效地利用了此設(shè)備的帶寬。圖1展示了RISC-V內(nèi)核的潛在機(jī)會(huì),它可以自由地添加專(zhuān)有的及未來(lái)標(biāo)準(zhǔn)化的矢量指令,這些指令對(duì)于處理深度學(xué)習(xí)和推理技術(shù)相當(dāng)有效。

另一個(gè)類(lèi)似且重要的趨勢(shì)是大數(shù)據(jù)端和云端上數(shù)據(jù)的移動(dòng)及訪(fǎng)問(wèn)方式(圖2)。傳統(tǒng)的計(jì)算機(jī)體系結(jié)構(gòu)(圖2a)采用慢速外圍總線(xiàn),該總線(xiàn)連接到許多其他設(shè)備(例如,專(zhuān)用機(jī)器學(xué)習(xí)加速器、圖形卡、高速固態(tài)硬盤(pán)、智能網(wǎng)絡(luò)控制器,等等)。低速總線(xiàn)會(huì)影響設(shè)備的利用率,因?yàn)樗拗屏丝偩€(xiàn)本身、主CPU以及主要的潛在持久內(nèi)存之間的通信能力。這些新型計(jì)算設(shè)備也不可能在它們之間或與主CPU共享內(nèi)存,從而導(dǎo)致在慢速總線(xiàn)上進(jìn)行徒勞且受限制的數(shù)據(jù)移動(dòng)。

關(guān)于如何改善不同計(jì)算設(shè)備(例如CPU和計(jì)算機(jī)及網(wǎng)絡(luò)加速器)之間的數(shù)據(jù)移動(dòng),以及如何在內(nèi)存或快速存儲(chǔ)中訪(fǎng)問(wèn)數(shù)據(jù),出現(xiàn)了幾個(gè)重要的行業(yè)趨勢(shì)。這些新趨勢(shì)集中在開(kāi)放標(biāo)準(zhǔn)化工作上,能夠提供更快、更低延遲的串行結(jié)構(gòu)以及更智能的邏輯協(xié)議,從而實(shí)現(xiàn)對(duì)共享內(nèi)存的一致訪(fǎng)問(wèn)。

新一代以數(shù)據(jù)為中心的計(jì)算

未來(lái)的架構(gòu)將需要部署開(kāi)放接口,以連接到持久性?xún)?nèi)存以及接入計(jì)算加速器并支持高速緩存一致性的快速總線(xiàn)(例如TileLink、RapidIOOpenCAPIGen-Z),以期大幅度提高性能,而且使所有設(shè)備共享內(nèi)存并減少不必要的數(shù)據(jù)移動(dòng)。


圖2:計(jì)算體系結(jié)構(gòu)中的數(shù)據(jù)移動(dòng)和訪(fǎng)問(wèn)

圖2a中,傳統(tǒng)的計(jì)算體系結(jié)構(gòu)由于把一條慢速外設(shè)總線(xiàn)用于快速存儲(chǔ)器及計(jì)算加速設(shè)備,其能力已達(dá)到其極限。在圖2b中,未來(lái)的計(jì)算體系結(jié)構(gòu)采用了開(kāi)放接口,能夠?yàn)槠脚_(tái)上所有的計(jì)算資源提供統(tǒng)一并支持高速緩存一致性的訪(fǎng)問(wèn)方式來(lái)訪(fǎng)問(wèn)共享持久內(nèi)存,(這稱(chēng)為以數(shù)據(jù)為中心的體系結(jié)構(gòu))。在圖2c中,所部署的設(shè)備能夠使用相同的共享內(nèi)存,從而減少了不必要的數(shù)據(jù)復(fù)制。

CPU 外圍核心及網(wǎng)絡(luò)接口控制器的作用將成為支持?jǐn)?shù)據(jù)移動(dòng)的關(guān)鍵因素。CPU外圍核心組件必須支持密鑰內(nèi)存和永久內(nèi)存接口(例如NVDIMM-P),也必須支持駐留在CPU附近的內(nèi)存。還需要實(shí)施面向計(jì)算加速器、智能網(wǎng)絡(luò)和遠(yuǎn)程持久內(nèi)存的智能快速總線(xiàn)。這種總線(xiàn)上的任何設(shè)備(例如CPU、通用或?qū)S糜?jì)算加速器、網(wǎng)絡(luò)適配器、存儲(chǔ)器或內(nèi)存)都可以包含其自己的計(jì)算資源并具有訪(fǎng)問(wèn)共享內(nèi)存的能力(圖2b和圖2c)。

RISC-V技術(shù)正是優(yōu)化數(shù)據(jù)移動(dòng)的關(guān)鍵推動(dòng)因素,因?yàn)樗軌蛟谒械挠?jì)算加速器設(shè)備上針對(duì)新的機(jī)器學(xué)習(xí)工作負(fù)載來(lái)執(zhí)行矢量指令。它實(shí)現(xiàn)了多種開(kāi)源CPU技術(shù),能夠支持開(kāi)放內(nèi)存和智能總線(xiàn)接口;且實(shí)現(xiàn)了以數(shù)據(jù)為中心具有一致性共享內(nèi)存的體系結(jié)構(gòu)。

利用RISC-V解決挑戰(zhàn)

大數(shù)據(jù)和快速數(shù)據(jù)為未來(lái)的數(shù)據(jù)移動(dòng)帶來(lái)了挑戰(zhàn),也為RISC-V指令集架構(gòu)(ISA)鋪平了道路。這種架構(gòu)開(kāi)放的、模塊化的方法非常適合用作以數(shù)據(jù)為中心的計(jì)算體系結(jié)構(gòu)的基礎(chǔ)。它提供了以下功能:

RISC-V由超過(guò)100個(gè)組織機(jī)構(gòu)的眾多成員共同開(kāi)發(fā),這其中包含一個(gè)由軟件和硬件創(chuàng)新者組成的協(xié)作性社區(qū)。這些創(chuàng)新者能夠?qū)SA進(jìn)行改編,使其適應(yīng)特定的目的或項(xiàng)目。任何加入該組織的人都可以根據(jù)一份“Berkeley Software Distribution”(BSD軟件發(fā)布)許可證來(lái)設(shè)計(jì)、制造和/或銷(xiāo)售RISC-V芯片和軟件。?

結(jié)語(yǔ)

為了實(shí)現(xiàn)其價(jià)值和可能性,數(shù)據(jù)需要捕獲、保存、訪(fǎng)問(wèn)并轉(zhuǎn)換,以發(fā)揮其全部潛力。含有大數(shù)據(jù)和快速數(shù)據(jù)應(yīng)用的環(huán)境已經(jīng)使通用計(jì)算體系結(jié)構(gòu)的處理能力相形見(jiàn)絀。未來(lái)以數(shù)據(jù)為中心的極端應(yīng)用將需要針對(duì)特定用途設(shè)計(jì)的處理能力,以便以開(kāi)放的方式支持?jǐn)?shù)據(jù)資源的獨(dú)立擴(kuò)展。

擁有一套以在持久內(nèi)存中存儲(chǔ)的數(shù)據(jù)為中心的通用開(kāi)放計(jì)算機(jī)體系結(jié)構(gòu),同時(shí)又能夠讓所有的設(shè)備發(fā)揮一定的計(jì)算作用,這是由新類(lèi)型機(jī)器學(xué)習(xí)計(jì)算工作負(fù)載所推動(dòng)的這些新型可擴(kuò)展體系結(jié)構(gòu)得以出現(xiàn)的關(guān)鍵因素。跨越云端及邊緣設(shè)備各個(gè)部分的下一代應(yīng)用都需要這種新型的低能耗處理方式,因?yàn)閷?zhuān)門(mén)的計(jì)算加速處理器將能夠?qū)W⒂谔幚砥涫诌叺娜蝿?wù),從而能夠減少來(lái)回移動(dòng)數(shù)據(jù)所浪費(fèi)的時(shí)間,或者能夠執(zhí)行與數(shù)據(jù)無(wú)關(guān)的額外計(jì)算。通過(guò)發(fā)揮數(shù)據(jù)的力量、潛力和可能性,人類(lèi)、社會(huì)以及我們的星球都能夠蓬勃發(fā)展。

分享到

zhupb

相關(guān)推薦