英特爾(中國)有限公司數據中心及云計算業(yè)務產品市場總監(jiān)賀曉東

“我們希望和業(yè)界的合作伙伴一起,把傳統(tǒng)的RISC架構挪到英特爾的更加廉價、開放、標準化的標準的服務器平臺上來降低成本。”賀曉東說。

通過至強E7、E5等產品,英特爾為數據分析提供了涵蓋整個數據生命周期的支撐,首先是核心業(yè)務系統(tǒng)、數據庫、業(yè)務數據的收集,比如傳統(tǒng)的CRM、ERP等,英特爾都可以提供至強E7這樣的高可用、穩(wěn)定性的平臺來給用戶提供數據分析。我們知道,最新的E7 v2,具備5個9的可用性,4路內存可達6TB。

而在數據進一步的抽取、梳理,然后把它存檔,再進行深度挖掘分析時,需要可彈性擴充的平臺,這是E5平臺的用武之地。(說句題外話,根據此前爆出的英特爾產品路線圖,基于Haswell-EP架構的新一代至強E5 v3將會在近期發(fā)布,屆時DOIT也會有相關報道,敬請關注。)

此外,數據中心角度來講,如何降低數據的存儲、處理,整個流程數據中心的功耗等等,英特爾在可管理性方面也會做很多平臺化的工作。

“英特爾的產品線,我們認為從性能、可擴展性、能耗、成本方面是涵蓋整個數據的全生命周期的支撐的。”賀曉東說。

為SAP HANA優(yōu)化應對實時分析

提到大數據,通常我們會想到Hadoop,用它可以存儲PB級的數據量,可以應對數據量不斷膨脹、數據的種類、樣式非常多的情況。

不過,SAP公司數據庫及技術平臺部售前總監(jiān)、數據管理技術首席架構師宋一平指出,在整個數據的存儲量到PB級的時候,在Hadoop上做很多的查詢和計算時,效率會有很大的折扣。但如果利用內存、利用芯片本身的一些最新的技術,就可以很好地加速分析能力。

SAP公司數據庫及技術平臺部售前總監(jiān)、數據管理技術首席架構師宋一平

SAP恰好有HANA的內存的實時計算環(huán)境,可以加速在大數據上的一些計算事和實時處理能力。宋一平認為,HANA與Hadoop兩方面的結合是非常好的開端。

SAP通過平臺、上面的應用、數據科學(一種提供如何做模型的服務)三個方面來切入大數據,其中的平臺,也就是HANA+Hadoop,正是和英特爾聯(lián)手打造的。

我們知道英特爾曾經自己開發(fā)Hadoop發(fā)行版,后來選擇與Cloudera強強聯(lián)合。而在HANA端,宋一平介紹,SAP每次推出HANA,它的版本研發(fā)一定是跟英特爾的具體工程師在做一些底層的優(yōu)化。這個優(yōu)化涉及到芯片上的態(tài)勢、具體的指令等等方面的能力,都作了很多拓展。

英特爾云創(chuàng)新中心加速創(chuàng)新應用落地

好的技術,也要有適合的場景才能產生效果,如果用戶想嘗試,又擔心測試環(huán)境的投資,怎么辦?英特爾說,我們還有云創(chuàng)新中心。

賀曉東表示,大數據、及時分析、SAPHANA等相對較新,同時解決方案的復雜度又比較高,硬件平臺集成度要求也比較復雜的項目,英特爾希望通過云創(chuàng)新中心這樣一個平臺把它落地,更重要的是把落地的速度給提起來,讓用戶更好、更提前地來享受到這些新的技術、新的創(chuàng)新,為生產運營做支撐的服務。

英特爾云創(chuàng)新中心解決方案架構師程從超介紹,英特爾在云創(chuàng)新中心里面大概用了十臺機器做了一個整個的端對端的環(huán)境,計算平臺和存儲平臺統(tǒng)一用Cloudera來實現(xiàn)(當然所有的Hadoop),用了9臺E5的2680來做Hadoop scale-out服務器,主要是兩路的。SAP HANA裝了一個4路的,E7的4890V2的平臺上用了450G內存,6塊SSD的硬盤,模擬了電信的系統(tǒng)分析平臺,把詳單數據加載到ClouderaHadoop平臺之后,通過ClouderaMapReduce作了匯總,把這個詳單形成輕度匯總的數據,加載到HANA里面去。通過BO和開源的spring來訪問HANA里面的數據,是傳統(tǒng)的BI工具和spring的結合。

英特爾云創(chuàng)新中心解決方案架構師程從超

模擬了某個省2011年兩天的移動數據(共40億條記錄,匯總大概3.8億條數據存在SAPHANA上)的結果顯示,任意的即席查詢,可以達到秒級響應。這是HANA的傳統(tǒng)的內存數據倉庫加上RDB架構,保證即席查詢。而HBase的Scale-out架構和單鍵查詢的測試,也可以做到分鐘級響應。

據英特爾透露,目前已經有一些敏感客戶在使用這個平臺進行測試項目。

分享到

zhoujianding

相關推薦