凌琦認(rèn)為,中國(guó)市場(chǎng)的高性能計(jì)算發(fā)展速度會(huì)持續(xù)加快,這是與高性能計(jì)算在各個(gè)行業(yè)的普及程度及經(jīng)濟(jì)發(fā)展密不可分的,但前提條件是必須要用好,而不是“為了建設(shè)為建設(shè)”。
而隨著這一活動(dòng)進(jìn)入到第七年,英特爾在高性能計(jì)算領(lǐng)域也獲得了全面的發(fā)展。核心處理器方面,英特爾除提供傳統(tǒng)的至強(qiáng)處理器之外,還提供至強(qiáng)融核協(xié)處理器產(chǎn)品,并構(gòu)成面向高性能計(jì)算的微異構(gòu)架構(gòu)。與此同時(shí),英特爾在大數(shù)據(jù)、Lustre、編程工具、數(shù)據(jù)中心管理、固態(tài)存儲(chǔ)、及True Scale Fabric架構(gòu)方面構(gòu)建成了完整的生態(tài)環(huán)境。
對(duì)此,凌琦表示,技術(shù)與產(chǎn)品只是英特爾為高性能計(jì)算用戶(hù)所提供產(chǎn)品的“冰山一角”,他談到,英特爾針對(duì)用戶(hù)的需求有很好的、貼近用戶(hù)的業(yè)務(wù)開(kāi)發(fā)團(tuán)隊(duì)。同時(shí),英特爾還有前端的業(yè)務(wù)支持團(tuán)隊(duì),如Xeon Phi的開(kāi)發(fā)培訓(xùn)工作,甚至是直接上機(jī)的機(jī)會(huì),讓開(kāi)發(fā)人員能夠在系統(tǒng)上線(xiàn)的同時(shí)就熟悉系統(tǒng)和應(yīng)用,開(kāi)發(fā)新的應(yīng)用與業(yè)務(wù)。
此外,凌琦表示:“英特爾在高性能計(jì)算領(lǐng)域的工作是全球化的,有著大量的全球化的工程資源服務(wù)中國(guó)用戶(hù)。”
英特爾至強(qiáng)融核:用戶(hù)體驗(yàn)良好 助力百億億次
“我們的目標(biāo)是實(shí)現(xiàn)百億億次計(jì)算,但以現(xiàn)在的計(jì)算能力,最少還要增加20倍的計(jì)算能力,這對(duì)于我們的計(jì)算系統(tǒng)來(lái)說(shuō),是一個(gè)巨大的挑戰(zhàn)。”凌琦在接受DOIT記者采訪(fǎng)時(shí)表示,高性能計(jì)算系統(tǒng)的設(shè)計(jì)應(yīng)當(dāng)在“恰當(dāng)?shù)臅r(shí)候使用恰當(dāng)?shù)姆椒?rdquo;,這意味著業(yè)界必須要使用加速器技術(shù),但“需要在效率、性能、成本等方面,達(dá)成平衡。”
凌琦談到,在前不久他參加了在德國(guó)萊比錫舉辦的2013國(guó)際超級(jí)計(jì)算大會(huì),在會(huì)場(chǎng)上有一種聲音正成為主流:建設(shè)HPC不是為了建設(shè),而是要為了應(yīng)用,而雖然規(guī)模可以快速抬升上去,但是應(yīng)用開(kāi)發(fā)將受到極大的挑戰(zhàn),業(yè)界需要找到可以平滑的、Offload的方式,提升高性能計(jì)算系統(tǒng)的性能。
他認(rèn)為,這也就是為何近期傳統(tǒng)異構(gòu)系統(tǒng)在最新一期TOP500上的數(shù)量有所降低,主要原因在于傳統(tǒng)異構(gòu)架構(gòu)在兩個(gè)方面存在問(wèn)題:1、用戶(hù)需要找到可以向量化、高度并行化的代碼,并交予協(xié)處理器運(yùn)行,而在幾百萬(wàn)行代碼的應(yīng)用中這個(gè)工作非常困難;2、內(nèi)部互聯(lián)技術(shù)在傳統(tǒng)異構(gòu)架構(gòu)中對(duì)性能、效率有很大影響,性能受限于連接,且越來(lái)越明顯。
“英特爾的想法是,用比較小的核,做高度的集成,仍然遵循x86處理器架構(gòu),提升內(nèi)部通信的效率,使用單一的編程模式。”凌琦表示,使用英特爾至強(qiáng)與至強(qiáng)融核組成的英特爾微異構(gòu)架構(gòu),代碼遷移的工作更簡(jiǎn)單,只要是代碼中“適合多核、多線(xiàn)程、向量化的部分”都可以在至強(qiáng)融核及英特爾微異構(gòu)架構(gòu)中運(yùn)行:“用戶(hù)唯一要做的就是優(yōu)化和重新編譯,用戶(hù)往往會(huì)考慮:已有的代碼怎么辦?轉(zhuǎn)移代碼怎么辦?英特爾提供他們希望的遵循現(xiàn)有架構(gòu)的、平滑的遷移工作。”
凌琦認(rèn)為,從幾百萬(wàn)行代碼中捕捉到一些部分適合的代碼,重新編程、編譯到傳統(tǒng)的異構(gòu)架構(gòu)中,工作量是巨大的,但在遵循x86的英特爾微異構(gòu)架構(gòu)中,代碼僅需要“重新編譯與優(yōu)化”,工作量存在著極大的區(qū)別。
英特爾數(shù)據(jù)中心及互聯(lián)系統(tǒng)事業(yè)部技術(shù)計(jì)算和平臺(tái)應(yīng)用支持團(tuán)隊(duì)平臺(tái)架構(gòu)師何萬(wàn)青博士則給出了用戶(hù)使用至強(qiáng)融核,采用英特爾微異構(gòu)架構(gòu)的“指導(dǎo)”,他表示,理論上至強(qiáng)融核適合所有的應(yīng)用,但如果想充分的用好,“超過(guò)至強(qiáng)處理器48個(gè)線(xiàn)程的應(yīng)用能力之后,密集計(jì)算100個(gè)線(xiàn)程以上的應(yīng)用”是最適合至強(qiáng)融核的應(yīng)用模型。
三位嘉賓接受采訪(fǎng)時(shí)都談到,英特爾微異構(gòu)架構(gòu)延續(xù)了英特爾x86指令集、編程模式和編程、編譯平臺(tái),底層的機(jī)制仍然是多核多線(xiàn)程,只是針對(duì)并行計(jì)算、向量化進(jìn)行優(yōu)化,這是英特爾對(duì)用戶(hù)的重要承諾。
何萬(wàn)青透露,未來(lái)英特爾融核的發(fā)展趨勢(shì)有兩點(diǎn):1、增強(qiáng)對(duì)單線(xiàn)程的支持,支持更多通用應(yīng)用;2、增加更多的向量單元——這也是針對(duì)此前披露的代號(hào)為”Knights Landing“的第二代至強(qiáng)融核的特性所進(jìn)行的開(kāi)發(fā)。
據(jù)英特爾披露的代號(hào)為”Knights Landing“的第二代至強(qiáng)融核,將提供兩種模式:主處理器及協(xié)處理器模式,分別采用與至強(qiáng)處理器一樣的插座及PCIe插座接口,14納米工藝生產(chǎn)。
其最重要的改變是”Knights Landing“中將引入可集成在其封裝內(nèi)的內(nèi)存,大幅度提高其內(nèi)存帶寬——顯然將改善內(nèi)存帶寬瓶頸問(wèn)題,而這一產(chǎn)品集成內(nèi)存的改變或許將是至強(qiáng)處理器集成更多功能:IO、交換等的開(kāi)端,也是x86處理器開(kāi)始朝著SoC方向發(fā)展的開(kāi)端。
英特爾企業(yè)解決方案部能源行業(yè)資深企業(yè)客戶(hù)經(jīng)理杭曉東針對(duì)有媒體對(duì)至強(qiáng)融核在石油行業(yè)客戶(hù)使用情況的問(wèn)題表示:“至強(qiáng)微架構(gòu)的用戶(hù)使用的感覺(jué)都很好,雖然我不能披露具體的數(shù)據(jù),但是他們?cè)诘玫降男阅?、遷移的難度、未來(lái)投資的保護(hù)三方面,都是滿(mǎn)意的。”
何萬(wàn)青則根據(jù)國(guó)外分析機(jī)構(gòu)的調(diào)查結(jié)果表示:“有78.4%的用戶(hù)在考慮采用主處理器之外的加速卡、協(xié)處理器時(shí)表示,會(huì)考慮至強(qiáng)融核,這說(shuō)明英特爾做的事情是符合用戶(hù)需求的。”