首先來(lái)看定位。與日常關(guān)注度更高的數(shù)據(jù)中心級(jí)顯卡定位有所不同,GPU Flex系列主要面向視頻轉(zhuǎn)碼與傳輸、視覺(jué)AI推理、云游戲、桌面虛擬化等應(yīng)用場(chǎng)景。
GPU Flex系列不包括用于機(jī)器學(xué)習(xí)訓(xùn)練和HPC高性能計(jì)算的場(chǎng)景,后者可以由Ponte Vecchio高性能顯卡來(lái)承擔(dān),當(dāng)然,也可以用Habana Gaudi來(lái)做機(jī)器學(xué)習(xí)訓(xùn)練。
今年發(fā)布的GPU Flex系列包括75W的Flex 140(12GB顯存)和150W的Flex 170(16GB顯存),算得上是功耗比較低的輕量級(jí)顯卡。
其中,F(xiàn)lex 140是半高設(shè)計(jì),F(xiàn)lex 170是全高的設(shè)計(jì),兩者分別配備了16個(gè)Xe內(nèi)核、16個(gè)光追單元和32個(gè)Xe內(nèi)核、32個(gè)光追單元,算力最高達(dá)256TOPS(INT8)。
英特爾公司市場(chǎng)營(yíng)銷(xiāo)集團(tuán)副總裁、中國(guó)區(qū)云與行業(yè)解決方案部總經(jīng)理梁雅莉在介紹GPU Flex系列產(chǎn)品時(shí),強(qiáng)調(diào)它能滿(mǎn)足智能視覺(jué)云的工作負(fù)載需求,能提供更出色的媒體轉(zhuǎn)碼吞吐性能和支持多達(dá)68路實(shí)時(shí)云游戲流。
接下來(lái),我們看看GPU Flex系列顯卡在視頻轉(zhuǎn)碼與傳輸、視覺(jué)AI推理、云游戲等應(yīng)用場(chǎng)景中的表現(xiàn)。
媒體處理與傳輸場(chǎng)景,編解碼能力突出
在媒體處理與傳輸場(chǎng)景中,GPU Flex系列的一大亮點(diǎn)是支持AV1編解碼功能。AV1的優(yōu)勢(shì)很明顯,比如,它是免費(fèi)的,而H.264和H.265都是需要收費(fèi)的,但是,AV1編解碼的硬件支持普遍差一點(diǎn),GPU Flex系列看來(lái)是要打破這一局面,推動(dòng)AV1的進(jìn)一步普及。
AV1還省流量,與常見(jiàn)的AVC(也就是常說(shuō)的H.264)編碼相比,在同樣的視頻質(zhì)量下,AV1可節(jié)省30%以上的傳輸帶寬。這對(duì)于提供在線(xiàn)視頻類(lèi)服務(wù)的企業(yè)而言,意味著網(wǎng)絡(luò)帶寬成本和數(shù)據(jù)存儲(chǔ)成本將會(huì)有大幅的壓縮。
將英特爾的Flex 140與英偉達(dá)同等功能定位的A10做對(duì)比,F(xiàn)lex 140的解碼吞吐量?jī)?yōu)勢(shì)非常明顯,而且,英偉達(dá)A10的TDP為150瓦,而Flex 140僅為75瓦,在解碼性能和解碼效率上,F(xiàn)lex 140優(yōu)勢(shì)非常明顯。
在H.265(HEVC)轉(zhuǎn)碼性能對(duì)比中,英特爾數(shù)據(jù)中心GPU Flex系列140的性能也明顯優(yōu)于英偉達(dá)A10,能支持36路的1080p60幀,甚至還能支持1路8K60幀的視頻轉(zhuǎn)碼。
中科大洋是國(guó)內(nèi)一家大型廣電企業(yè),旗下自研的LeoVideo Cloud云轉(zhuǎn)碼產(chǎn)品中使用了英特爾數(shù)據(jù)中心GPU Flex140,實(shí)際部署和測(cè)試發(fā)現(xiàn),英特爾數(shù)據(jù)中心GPU Flex140能夠解碼16路4K并發(fā)或4路8K并發(fā)或60路1080p的并發(fā)。與競(jìng)品相比,F(xiàn)lex 140有明顯優(yōu)勢(shì)。
PSNR是衡量畫(huà)面質(zhì)量的一個(gè)常用指標(biāo),中科大洋在測(cè)試中發(fā)現(xiàn)Flex 140編碼質(zhì)量比CPU的效果還要好。通常,CPU的編碼質(zhì)量要比顯卡效果要好,但效率比較低下,而現(xiàn)在,F(xiàn)lex 140讓解碼和轉(zhuǎn)碼的性能和質(zhì)量都有了較大提升。
億聯(lián)網(wǎng)絡(luò)是一家遠(yuǎn)程視頻會(huì)議服務(wù)商,原本是用CPU來(lái)做軟編解時(shí),效率和性能都存在很多問(wèn)題。當(dāng)使用英特爾Flex GPU來(lái)做圖像的編解、處理、縮放時(shí),讓CPU可以專(zhuān)注在業(yè)務(wù)處理上,從而使得處理的性能和方案整體的可靠性都上了一個(gè)新臺(tái)階。
云游戲場(chǎng)景降本增效
在云游戲場(chǎng)景中,F(xiàn)lex GPU系列對(duì)于降本增效很有幫助。
上圖中,英特爾市場(chǎng)營(yíng)銷(xiāo)集團(tuán)副總裁、中國(guó)區(qū)數(shù)據(jù)中心銷(xiāo)售總經(jīng)理兼中國(guó)區(qū)運(yùn)營(yíng)商銷(xiāo)售總經(jīng)理莊秉翰展示了如何用兩張F(tuán)lex 170支持120路以上安卓云游戲的能力。
如圖所示,英特爾數(shù)據(jù)中心GPU Flex 170和140可以支持包括《王者榮耀》、《荒野行動(dòng)》、《狂野飆車(chē)9:競(jìng)速傳奇》等多款熱門(mén)游戲,一塊顯卡可以輕松支持幾十路游戲在1080p和720p分辨率下進(jìn)行游玩。
基于英特爾數(shù)據(jù)中心GPU Flex的云游戲服務(wù)可以帶來(lái)極大的成本優(yōu)化,除了支持安卓云游戲以外,最近的一次更新中,還宣布支持Windows平臺(tái)的云游戲,這也將提升GPU Flex顯卡的適用性。
火山引擎的云游戲解決方案中使用了GPU Flex。火山引擎系統(tǒng)架構(gòu)師梁宇表示,F(xiàn)lex 140自帶的硬件編解碼功能對(duì)于該方案中的軟硬件的整合和成本控制有很大幫助。
上圖展示的是用Flex 140支持火山引擎自研游戲《航海王熱血航線(xiàn)》的性能表現(xiàn),得益于其編碼能力,它能支持更多路的游戲??磥?lái),用戶(hù)想用GPU Flex提供別的云游戲服務(wù)也并不是很難。
GPU Flex也非常適合用來(lái)做AI推理
上圖展示的是GPU Flex做AI視覺(jué)推理時(shí)候的性能優(yōu)勢(shì),所謂AI視覺(jué)推理,考驗(yàn)的是視頻流的解碼處理能力和AI推理運(yùn)算能力。與英偉達(dá)的A10相比,GPU Flex系列在目標(biāo)分類(lèi)、目標(biāo)檢測(cè)等推理場(chǎng)景中的表現(xiàn)都更有優(yōu)勢(shì)。
當(dāng)虹科技老片修復(fù)系統(tǒng)中使用了GPU Flex系列顯卡,通過(guò)它來(lái)做AI插幀、AI HDR轉(zhuǎn)換、AI超分(提高分辨率)和AI畫(huà)質(zhì)增強(qiáng)。修復(fù)過(guò)程中會(huì)涉及很多編解碼的操作,通過(guò)使用CPU和GPU Flex的組合提高了處理效率,降低了方案的整體成本。
另外,GPU Flex系列顯卡的另外一大亮點(diǎn)是支持基于硬件的SR-IOV技術(shù),并且不需要軟件授權(quán)費(fèi)用,這對(duì)于桌面虛擬化場(chǎng)景非常有幫助,可以幫助用戶(hù)優(yōu)化總體擁有成本,省下一大筆錢(qián)。
結(jié)束語(yǔ)
英特爾的數(shù)據(jù)中心顯卡市場(chǎng)的未來(lái)表現(xiàn)還是很值得期待的。
除了本身的GPU相關(guān)技術(shù)積累以外,它還可以利用英特爾至強(qiáng)可擴(kuò)展處理器的生態(tài)優(yōu)勢(shì)。比如,用戶(hù)在用英特爾GPU和英特爾CPU時(shí)候能開(kāi)啟一項(xiàng)叫Deep Link的技術(shù),它能智能地把一部分工作負(fù)載放在GPU上,一部分工作負(fù)載放在CPU上,以此來(lái)提升工作效率。
英特爾能在框架層面能解決應(yīng)用生態(tài)的難題。任何新的硬件都需要漫長(zhǎng)過(guò)程來(lái)構(gòu)建生態(tài),英特爾規(guī)劃設(shè)計(jì)了一個(gè)叫oneAPI的框架,它能讓用戶(hù)在不同架構(gòu)下開(kāi)發(fā)的應(yīng)用運(yùn)行在其它異構(gòu)產(chǎn)品上,比如,它可以讓一個(gè)應(yīng)用既能運(yùn)行在CPU上,也能運(yùn)行在GPU甚至是FPGA上。
在走向市場(chǎng)方面,得益于英特爾在企業(yè)級(jí)市場(chǎng)上的特殊地位,GPU Flex系列顯卡得到了新華三、浪潮、寧暢、寶德、超聚變?cè)趦?nèi)的OEM的支持,在第一時(shí)間就對(duì)于Flex系列GPU的適配工作,支持Flex GPU的服務(wù)器產(chǎn)品已陸續(xù)上市。
下一階段,此次GPU Flex系列的亮點(diǎn)在于編解碼以及各種偏輕量級(jí)的工作負(fù)載,強(qiáng)在專(zhuān)卡專(zhuān)用效率更高,而在不久的未來(lái)即將發(fā)布的適合重型負(fù)載的Ponte Vecchio其實(shí)也非常值得期待。