浪潮 發(fā)表于:14年11月24日 10:32 [來稿] DOIT.com.cn
呂克·貝松執(zhí)導(dǎo)的《超體》,讓人們?cè)僖淮螌⒛抗馔断虼竽X開發(fā)。而對(duì)于眾多從事人工智能研究的工程師們來說,讓機(jī)器“超體”則是夢(mèng)寐以求的目標(biāo)。在人工智能領(lǐng)域,智能語(yǔ)音識(shí)別被眾多專家認(rèn)為是未來10年間信息技術(shù)領(lǐng)域十大重點(diǎn)發(fā)展技術(shù)之一,而一項(xiàng)由科大訊飛主導(dǎo)的“訊飛超腦計(jì)劃”正在致力于將這一夢(mèng)想變成現(xiàn)實(shí)。
無解?人腦能耗比=天河2號(hào)的200萬倍
智能語(yǔ)音目前主要依靠深度學(xué)習(xí)的技術(shù)實(shí)現(xiàn),作為機(jī)器學(xué)習(xí)的一個(gè)重要分支,深度學(xué)習(xí)在于建立、模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),使得機(jī)器能從大量歷史數(shù)據(jù)中學(xué)習(xí)規(guī)律,從而對(duì)新的樣本做智能識(shí)別或?qū)ξ磥碜鲱A(yù)測(cè),以達(dá)到具有人類一樣的思考能力。目前,F(xiàn)acebook、Google、IBM、蘋果、微軟、百度、科大訊飛等均在此方面做了多種嘗試。
深度學(xué)習(xí)技術(shù)有很多支撐的計(jì)算機(jī)算法,而目前最常用的是DNN算法(k近鄰分類算法),它能比較好地模擬人腦神經(jīng)元多層深度傳遞的過程,解決智能語(yǔ)音中的復(fù)雜問題。然而,要模擬人腦絕非易事,人腦的計(jì)算能耗比是世界上最快的超級(jí)計(jì)算機(jī)天河2號(hào)的200萬倍,據(jù)了解,人類大腦大致有1000億神經(jīng)元,每個(gè)神經(jīng)元有大約5000個(gè)神經(jīng)突觸。要使機(jī)器無限接近人類的思考能力意味著要模擬出更多的神經(jīng)元和神經(jīng)突觸,這就會(huì)帶來巨大的計(jì)算挑戰(zhàn)。
挑戰(zhàn)!模擬1/10人腦神經(jīng)元
對(duì)于神經(jīng)學(xué)領(lǐng)域的工程師們來說,他們所面臨的最終挑戰(zhàn)就是在提供更好配置性和規(guī)模的同時(shí),實(shí)現(xiàn)類似于人腦一般的超高能耗比。
在現(xiàn)階段,即使世界IT巨頭都無法徹底解決上述難題,不過科大訊飛卻宣布要實(shí)現(xiàn)基于類人神經(jīng)網(wǎng)絡(luò)的認(rèn)知智能引擎,預(yù)期成果是實(shí)現(xiàn)世界上第一個(gè)中文認(rèn)知智能計(jì)算引擎。
目前,科大訊飛已經(jīng)集結(jié)了在認(rèn)知智能領(lǐng)域最強(qiáng)研究團(tuán)隊(duì),將在知識(shí)圖譜構(gòu)建與推理、人工神經(jīng)網(wǎng)絡(luò)模擬、人腦原理分析模擬幾個(gè)方向展開研究。
為了搶占國(guó)內(nèi)智能語(yǔ)音市場(chǎng)先機(jī),科大訊飛計(jì)劃將模擬人腦神經(jīng)元的1/10,以期讓該公司的智能語(yǔ)音設(shè)備擁有初步的人類思考能力。
破題!算法優(yōu)化+高效集群
要實(shí)現(xiàn)人腦神經(jīng)元的1/10的深度模擬,意味著科大訊飛面臨著數(shù)千倍訓(xùn)練數(shù)據(jù)及數(shù)千倍模型參數(shù)的巨大挑戰(zhàn),迫切需求更大規(guī)模、更多存儲(chǔ)的超算平臺(tái)集群建設(shè)、更優(yōu)的深度學(xué)習(xí)并行化及集群調(diào)度算法和深度定制的人工神經(jīng)網(wǎng)絡(luò)專屬芯片系統(tǒng)。
面對(duì)這些棘手的問題,該采用何種方式有效解決?首先是算法上優(yōu)化,科大訊飛將整個(gè)DNN環(huán)節(jié)進(jìn)行優(yōu)化壓縮,只保留部分核心等流程,整個(gè)架構(gòu)循環(huán)由優(yōu)化了40%,大幅度的增加了運(yùn)算速度與效率。
在算法調(diào)整完以后面臨的就是基礎(chǔ)設(shè)施的建設(shè),如何設(shè)計(jì)一套占地面積小、計(jì)算性能高、又綠色節(jié)能的高性能計(jì)算集群成為科大訊飛面臨的下一個(gè)難題。浪潮曾參與研制天河1A、天河2號(hào)超級(jí)計(jì)算機(jī)具備非常豐富和領(lǐng)先的系統(tǒng)構(gòu)建能力,并且擁有一支上百人的應(yīng)用專家團(tuán)隊(duì),對(duì)高性能計(jì)算的專業(yè)應(yīng)用也十分了解,因此浪潮成為科大訊飛的選擇的廠商之一。
浪潮!伙伴的力量
針對(duì)該公司面臨的問題,雙方聯(lián)合設(shè)計(jì)了針對(duì)DNN算法特點(diǎn)的GPU集群并行計(jì)算框架,通過GPU提高計(jì)算能力、通過IB網(wǎng)絡(luò)提速節(jié)點(diǎn)之間的通信速度,最終完成GPU集群版的DNN并行算法,大幅減低了DNN的計(jì)算時(shí)間。
除了為科大訊飛構(gòu)建高性能集群系統(tǒng),浪潮還特別在軟件方面與該公司算法專家團(tuán)隊(duì)共同成立專門聯(lián)合項(xiàng)目組,節(jié)點(diǎn)內(nèi)使用CPU+GPU協(xié)同計(jì)算,大幅降低了計(jì)算時(shí)間。雙方聯(lián)合針對(duì)GPU架構(gòu)進(jìn)行了算法層面的優(yōu)化,重寫了計(jì)算部分代碼,將整體速度大幅提升。
解決了算法和平臺(tái)的問題,浪潮成功幫助科大訊飛有效提升了語(yǔ)音識(shí)別的正確率。浪潮-英特爾中國(guó)并行計(jì)算聯(lián)合實(shí)驗(yàn)室首席工程師張清介紹:“浪潮已經(jīng)分別與英特爾和英偉達(dá)成立聯(lián)合并行計(jì)算實(shí)驗(yàn)室,合作開發(fā)優(yōu)化基于MIC和GPU的并行應(yīng)用。目前已經(jīng)建立了一套非常完善的高性能計(jì)算集群解決方案,將不僅為用戶提供好用的高性能計(jì)算集群,還會(huì)針對(duì)每一個(gè)用戶的應(yīng)用特點(diǎn)量身定制集群解決方案,這也就說明未來浪潮將跟用戶在應(yīng)用測(cè)試、集群搭建、加速優(yōu)化等各方面展開合作,把用戶的需求看作是浪潮設(shè)計(jì)構(gòu)建集群的根本要求。”而這些聯(lián)合實(shí)驗(yàn)室的成果對(duì)于支持科大訊飛人工智能超算應(yīng)用需求起到了關(guān)鍵性的作用。
公司簡(jiǎn)介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶寄語(yǔ) | DOIT歷程 | 誠(chéng)聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.