2019年鳴鑼的OpenPOWER + OpenCAPI異構(gòu)計算設(shè)計大賽則是吸引了來自14所高校的21支隊伍。顯然,OpenPOWER + OpenCAPI的組合正在吸引更多的關(guān)注,新的生態(tài)逐漸孵育成熟,正在蓄勢待發(fā)。
OpenPOWER+OpenCAPI
李孝聰,西安交通大學(xué)在讀碩士。本次大賽中,他和他的隊友們順利闖過初賽,與其他9支隊伍共同殺入到復(fù)賽當中。
作為一枚經(jīng)常參加各種校外比賽的“研究僧”,李孝聰表示,在大學(xué)里接觸異構(gòu)計算的場合并不是很多,此前基本上是通過閱讀論文、搜索資料這樣遠距離的學(xué)習(xí)來獲取理解,而大賽提供了多次與OpenPOWER+OpenCAPI“親密接觸”的機會,李孝聰和他的隊友們也得以與許多共同學(xué)習(xí)OpenCAPI技術(shù)的參賽團隊進行深入交流。
遠超李孝聰預(yù)期的是,主辦方為參賽隊伍提供了一對一的企業(yè)導(dǎo)師,導(dǎo)師們傳播知識、理解應(yīng)用場景,能為參賽方案提出優(yōu)化建議和點睛式的改進點撥,這是同類賽事其它主辦方難以提供的優(yōu)勢資源。
此外,主辦方還提供了服務(wù)器與板卡,參賽者不僅可以在理論上討論加速效果,更可以在服務(wù)器上實現(xiàn)加速效果,親自感受OpenCAPI異構(gòu)計算的巨大威力。在接下來的時間里,李孝聰希望進一步改進方案,完成最終的設(shè)計。
李孝聰團隊的方案主要是圍繞密碼學(xué)的算法。由于計算量非常大,算法也比較復(fù)雜、串行度大,因此團隊的設(shè)計初衷就是利用FPGA(Field-Programmable Gate Array,現(xiàn)場可編程門陣列),更靈活地設(shè)計邏輯電路,賦予它更強大的加速能力。
相較而言,他的感受是,OpenCAPI有著非常領(lǐng)先的前瞻性和技術(shù)水準。譬如AES、SM3等算法,它們在計算速度上沒有什么問題,但是對帶寬要求非常高,一般的系統(tǒng)上是很難實現(xiàn)的。而OpenCAPI則是優(yōu)勢明顯,第三代協(xié)議的OpenCAPI已經(jīng)能夠提供25GB/s的接口速度。
李孝聰表示,在不占用資源的情況下,團隊會盡可能使用OpenCAPI的接口帶寬,并根據(jù)FPGA的資源情況適當?shù)卣{(diào)整一下它的流水線級數(shù),保證更好的工作效率。
在高帶寬之外,OpenCAPI還具有低延時的特性,能夠為數(shù)據(jù)從FPGA端傳送到CPU端或是反向傳輸,提供極好的支撐。
以SM2橢圓曲線公鑰密碼算法為例,如我們所知,這是個運算量比較大的算法,同時也對數(shù)據(jù)傳輸有著很高的要求。由于具備低延時的特點,OpenCAPI不僅能夠加速SM2算法的運算,還可以讓數(shù)據(jù)的傳輸更快,整個系統(tǒng)也由此更具安全優(yōu)勢。
生態(tài)的“移山”之旅
大賽規(guī)模的擴充,一方面令I(lǐng)BM中國OpenPOWER總經(jīng)理吳偉明欣喜不已,另一方面也令他深陷“煩惱”:與上屆比賽相比,主辦方需要做出更多“痛苦”的決定,比如將21支初賽隊伍最終縮減為10支挺進復(fù)賽的隊伍。
從2013年一路走來,OpenCAPI已經(jīng)迭代到第三代,日趨成熟,并且擁有上佳的技術(shù)水準。然而現(xiàn)實是以GPU為主的開發(fā),仍未被充分利用,IBM提供開源工具套件的初衷,是希望幫助開發(fā)者更加快捷、容易地開發(fā)應(yīng)用,加速創(chuàng)新。
IBM一貫重視與大學(xué)和科研機構(gòu)的合作,他們客觀、包容,可以接受新的東西,也樂于實現(xiàn)科技的快速落地。吳偉明表示,大賽的目的是把創(chuàng)新技術(shù)展示出來,讓客戶們看到在單純的CPU加持之外,實際上還有一條更為可靠的、CPU+加速器的硬件加速解決方案。
他注意到,與上屆相比,本屆大賽的參賽方案出現(xiàn)了一些極具意義的變化:此前的應(yīng)用基本是面向超算中心或是互聯(lián)網(wǎng)公司,而本次則涌現(xiàn)出一批與工業(yè)控制相關(guān)的方案。與此同時,很多方案也瞄準了企業(yè)應(yīng)用的實際方向,這是一個非常好的跡象。
針對本次大賽,主辦方的OpenPOWER 基金會和OpenCAPI 聯(lián)盟,承辦方的IBM,協(xié)辦方的浪潮商用機器等伙伴,均投入了大量的資源,就是希望為新做開發(fā)的年輕人,或是正在做加速應(yīng)用的開發(fā)者,開啟不同的計算視角、提供更為務(wù)實和高效的計算途徑。
吳偉明指出,大賽的目的是改變整個以CPU為大腦的現(xiàn)有計算模式,改變?nèi)瞬诺哪芰?,這是革命性的創(chuàng)新之舉,也是一次對原有計算生態(tài)的“移山”之旅,難度可想而知。
采用全新的異構(gòu)計算架構(gòu),要求開發(fā)者具有更好的軟硬件協(xié)同開發(fā)意識,能夠清楚了解不同核心之間的性能優(yōu)勢,通過CPU協(xié)調(diào)各個異構(gòu)核心的計算算力,從而實現(xiàn)最優(yōu)的異構(gòu)計算方案。對于開發(fā)者而言,從原先單一挖掘CPU的計算能力,提升到能夠合理調(diào)度各個計算核心的算力,其轉(zhuǎn)變充滿挑戰(zhàn)。
這可能是一個漫長的過程,或許還需要兩到三年才能看到初步成效,但是一旦起步就會進入到加速期,并感染和鼓舞更多的人群,實現(xiàn)滾雪球式的發(fā)展。千里之行始于足下,新計算世界的開疆拓土勢在必行,主辦方與IBM愿意為此一盡綿薄之力。
“在現(xiàn)階段,我們希望通過大賽對CPU+加速器的模式做出回應(yīng),將OpenPOWER + OpenCAPI的能力更加真實和全面地注入市場,帶動市場的同步發(fā)展?!眳莻ッ鞅硎?。
迭代:技術(shù)的進化
在本次大賽中,IBM中國系統(tǒng)實驗室芯片研發(fā)工程師錢晨以企業(yè)導(dǎo)師的身份,與同事一道參與了初賽團隊的參賽方案指導(dǎo)工作。他認為,參賽方案涉及到視頻編解碼、深度學(xué)習(xí)以及密碼學(xué)等方面,很多奇異的構(gòu)思和創(chuàng)新的方案都令人拍案叫絕。
應(yīng)該說,此次提交的方案都具備較好的落地價值,與當前的網(wǎng)絡(luò)熱點和企業(yè)應(yīng)用相契合。譬如錢晨負責指導(dǎo)的一個變壓器繞組模型在線監(jiān)測的課題,非常具有創(chuàng)新性而且貼近生產(chǎn)實際,可以很好地提升生產(chǎn)效率。
此外,方案的技術(shù)選擇也在某種意義上完成了迭代:復(fù)旦大學(xué)的視頻風格遷移方案實現(xiàn)了CPU和FPGA的聯(lián)合計算加速,又進一步引入了GPU,從而做到了CPU、GPU和FPGA的聯(lián)合加速,為視頻遷移提供了良好的實時性,同時保持了高計算密度。
在這一方案中,CPU實際上是GPU與FPGA之間的調(diào)度者。吳偉明認為,這也是OpenPOWER + OpenCAPI的發(fā)展愿景,既讓CPU從繁重的計算處理中解脫出來,更多地擔當調(diào)度的角色,也讓GPU、FPGA等加速器部件發(fā)揮更好的作用。
雖然OpenCAPI非常強大,但是駕馭它并不困難,學(xué)習(xí)和使用非常簡單、易于上手,對開發(fā)者也很友善。一方面,這是因為OpenCAPI擁有非常豐富的技術(shù)文檔,另一方面則是由于IBM提供了一套非常成熟的軟硬件開發(fā)環(huán)境,這套環(huán)境包括:
基于OpenCAPI C1模式的加速框架oc-accel(OpenCAPI Acceleration Framework);OpenCAPI的FPGA板卡支持套件,OpenCAPI 3.0_Client_Ref Design;OpenCAPI的軟件開發(fā)庫libocxl;OpenCAPI軟硬件協(xié)同仿真引擎OCSE,OpenCAPI Simulation Engine。
這套開發(fā)環(huán)境經(jīng)過IBM工程師的努力,已經(jīng)全部在GitHub上開源,全世界所有異構(gòu)計算的開發(fā)者可以快速掌握。
毋庸置疑,大賽的目的是在大學(xué)里培養(yǎng)和引導(dǎo)人才,但是這并不意味著OpenCAPI的推廣會一直在象牙塔中進行。吳偉明表示,在繼續(xù)推動大賽的同時,IBM接下來也會在不同的場合,向更多的開發(fā)企業(yè)和開發(fā)人員推廣OpenCAPI。今年的OpenPOWER中國高峰論壇就將邀請一大批合作伙伴,并且會對部分已有的成果進行集中展示。
未來,IBM將進一步加強與OpenPOWER基金會和OpenCAPI聯(lián)盟的合作,與基金會會員和聯(lián)盟成員增進互動,以異構(gòu)計算引領(lǐng)計算的真正嬗變,為目前的計算世界開啟全新的紀元。(作者:“胖頭陀” 康翔)