首先來看定位。與日常關注度更高的數(shù)據(jù)中心級顯卡定位有所不同,GPU Flex系列主要面向視頻轉碼與傳輸、視覺AI推理、云游戲、桌面虛擬化等應用場景。

GPU Flex系列不包括用于機器學習訓練和HPC高性能計算的場景,后者可以由Ponte Vecchio高性能顯卡來承擔,當然,也可以用Habana Gaudi來做機器學習訓練。

今年發(fā)布的GPU Flex系列包括75W的Flex 140(12GB顯存)和150W的Flex 170(16GB顯存),算得上是功耗比較低的輕量級顯卡。

其中,F(xiàn)lex 140是半高設計,F(xiàn)lex 170是全高的設計,兩者分別配備了16個Xe內(nèi)核、16個光追單元和32個Xe內(nèi)核、32個光追單元,算力最高達256TOPS(INT8)。

英特爾公司市場營銷集團副總裁、中國區(qū)云與行業(yè)解決方案部總經(jīng)理梁雅莉在介紹GPU Flex系列產(chǎn)品時,強調(diào)它能滿足智能視覺云的工作負載需求,能提供更出色的媒體轉碼吞吐性能和支持多達68路實時云游戲流。

接下來,我們看看GPU Flex系列顯卡在視頻轉碼與傳輸、視覺AI推理、云游戲等應用場景中的表現(xiàn)。

媒體處理與傳輸場景,編解碼能力突出

在媒體處理與傳輸場景中,GPU Flex系列的一大亮點是支持AV1編解碼功能。AV1的優(yōu)勢很明顯,比如,它是免費的,而H.264和H.265都是需要收費的,但是,AV1編解碼的硬件支持普遍差一點,GPU Flex系列看來是要打破這一局面,推動AV1的進一步普及。

AV1還省流量,與常見的AVC(也就是常說的H.264)編碼相比,在同樣的視頻質量下,AV1可節(jié)省30%以上的傳輸帶寬。這對于提供在線視頻類服務的企業(yè)而言,意味著網(wǎng)絡帶寬成本和數(shù)據(jù)存儲成本將會有大幅的壓縮。

將英特爾的Flex 140與英偉達同等功能定位的A10做對比,F(xiàn)lex 140的解碼吞吐量優(yōu)勢非常明顯,而且,英偉達A10的TDP為150瓦,而Flex 140僅為75瓦,在解碼性能和解碼效率上,F(xiàn)lex 140優(yōu)勢非常明顯。

在H.265(HEVC)轉碼性能對比中,英特爾數(shù)據(jù)中心GPU Flex系列140的性能也明顯優(yōu)于英偉達A10,能支持36路的1080p60幀,甚至還能支持1路8K60幀的視頻轉碼。

中科大洋是國內(nèi)一家大型廣電企業(yè),旗下自研的LeoVideo Cloud云轉碼產(chǎn)品中使用了英特爾數(shù)據(jù)中心GPU Flex140,實際部署和測試發(fā)現(xiàn),英特爾數(shù)據(jù)中心GPU Flex140能夠解碼16路4K并發(fā)或4路8K并發(fā)或60路1080p的并發(fā)。與競品相比,F(xiàn)lex 140有明顯優(yōu)勢。

PSNR是衡量畫面質量的一個常用指標,中科大洋在測試中發(fā)現(xiàn)Flex 140編碼質量比CPU的效果還要好。通常,CPU的編碼質量要比顯卡效果要好,但效率比較低下,而現(xiàn)在,F(xiàn)lex 140讓解碼和轉碼的性能和質量都有了較大提升。

億聯(lián)網(wǎng)絡是一家遠程視頻會議服務商,原本是用CPU來做軟編解時,效率和性能都存在很多問題。當使用英特爾Flex GPU來做圖像的編解、處理、縮放時,讓CPU可以專注在業(yè)務處理上,從而使得處理的性能和方案整體的可靠性都上了一個新臺階。

云游戲場景降本增效

在云游戲場景中,F(xiàn)lex GPU系列對于降本增效很有幫助。

上圖中,英特爾市場營銷集團副總裁、中國區(qū)數(shù)據(jù)中心銷售總經(jīng)理兼中國區(qū)運營商銷售總經(jīng)理莊秉翰展示了如何用兩張Flex 170支持120路以上安卓云游戲的能力。

如圖所示,英特爾數(shù)據(jù)中心GPU Flex 170和140可以支持包括《王者榮耀》、《荒野行動》、《狂野飆車9:競速傳奇》等多款熱門游戲,一塊顯卡可以輕松支持幾十路游戲在1080p和720p分辨率下進行游玩。

基于英特爾數(shù)據(jù)中心GPU Flex的云游戲服務可以帶來極大的成本優(yōu)化,除了支持安卓云游戲以外,最近的一次更新中,還宣布支持Windows平臺的云游戲,這也將提升GPU Flex顯卡的適用性。

火山引擎的云游戲解決方案中使用了GPU Flex?;鹕揭嫦到y(tǒng)架構師梁宇表示,F(xiàn)lex 140自帶的硬件編解碼功能對于該方案中的軟硬件的整合和成本控制有很大幫助。

上圖展示的是用Flex 140支持火山引擎自研游戲《航海王熱血航線》的性能表現(xiàn),得益于其編碼能力,它能支持更多路的游戲。看來,用戶想用GPU Flex提供別的云游戲服務也并不是很難。

GPU Flex也非常適合用來做AI推理

上圖展示的是GPU Flex做AI視覺推理時候的性能優(yōu)勢,所謂AI視覺推理,考驗的是視頻流的解碼處理能力和AI推理運算能力。與英偉達的A10相比,GPU Flex系列在目標分類、目標檢測等推理場景中的表現(xiàn)都更有優(yōu)勢。

當虹科技老片修復系統(tǒng)中使用了GPU Flex系列顯卡,通過它來做AI插幀、AI HDR轉換、AI超分(提高分辨率)和AI畫質增強。修復過程中會涉及很多編解碼的操作,通過使用CPU和GPU Flex的組合提高了處理效率,降低了方案的整體成本。

另外,GPU Flex系列顯卡的另外一大亮點是支持基于硬件的SR-IOV技術,并且不需要軟件授權費用,這對于桌面虛擬化場景非常有幫助,可以幫助用戶優(yōu)化總體擁有成本,省下一大筆錢。

結束語

英特爾的數(shù)據(jù)中心顯卡市場的未來表現(xiàn)還是很值得期待的。

除了本身的GPU相關技術積累以外,它還可以利用英特爾至強可擴展處理器的生態(tài)優(yōu)勢。比如,用戶在用英特爾GPU和英特爾CPU時候能開啟一項叫Deep Link的技術,它能智能地把一部分工作負載放在GPU上,一部分工作負載放在CPU上,以此來提升工作效率。

英特爾能在框架層面能解決應用生態(tài)的難題。任何新的硬件都需要漫長過程來構建生態(tài),英特爾規(guī)劃設計了一個叫oneAPI的框架,它能讓用戶在不同架構下開發(fā)的應用運行在其它異構產(chǎn)品上,比如,它可以讓一個應用既能運行在CPU上,也能運行在GPU甚至是FPGA上。

在走向市場方面,得益于英特爾在企業(yè)級市場上的特殊地位,GPU Flex系列顯卡得到了新華三、浪潮、寧暢、寶德、超聚變在內(nèi)的OEM的支持,在第一時間就對于Flex系列GPU的適配工作,支持Flex GPU的服務器產(chǎn)品已陸續(xù)上市。

下一階段,此次GPU Flex系列的亮點在于編解碼以及各種偏輕量級的工作負載,強在??▽S眯矢?,而在不久的未來即將發(fā)布的適合重型負載的Ponte Vecchio其實也非常值得期待。

分享到

zhupb

相關推薦