英特爾亞太研發(fā)有限公司總經(jīng)理、軟件與服務(wù)事業(yè)部中國區(qū)總經(jīng)理何京翔博士

信息是二十一世紀(jì)的石油

何京翔表示,信息成為21世紀(jì)的石油,這確實是非常好的比喻。石油剛剛開采出來的時候,原油的價值并不是那么高。一百多年前,石油作為一種累贅,沒有人很好地利用起來,直到我們把石油變成化學(xué)品,變成汽油的時候才真正體現(xiàn)出價值。大數(shù)據(jù)同樣的,僅僅是存儲起來,而不利用起來并沒有價值,必須通過分析和處理才能體現(xiàn)它的價值。

在中國市場上,大數(shù)據(jù)哪些機遇?何京翔表示,中國市場上有很好的機遇。2012年6月的數(shù)據(jù)顯示,中國有將近3.9億的移動客戶、5.3億的互聯(lián)網(wǎng)客戶,市場的推動和政府的推動,在一個比較典型的智能城市的應(yīng)用中,每個季度就可能產(chǎn)生出200PB的視頻數(shù)據(jù),一個筆記本電腦假如是200G,就是一百萬個筆記本所能夠存儲的數(shù)據(jù),這就是200PB的概念。未來的醫(yī)療檔案也會產(chǎn)生海量的數(shù)據(jù)。所有這些數(shù)據(jù)不能用傳統(tǒng)方法處理,需要有新的思考、新的作為。

數(shù)據(jù)量、速度、多樣化、價值,這四個方面的特性決定了大數(shù)據(jù)和傳統(tǒng)數(shù)據(jù)時代有本質(zhì)的區(qū)別,因此需要新的方法解決問題。

它僅僅是個技術(shù)問題嗎?當(dāng)然不是。英特爾有一個非常好的傳統(tǒng)——把技術(shù)變成一種生態(tài)環(huán)境、變成一種解決方案的,變成真正能夠產(chǎn)生出商業(yè)價值的商業(yè)模式。所以英特爾在考慮大數(shù)據(jù)的時候,不僅是在新技術(shù)上有創(chuàng)新,同時在人員培訓(xùn)、生態(tài)系統(tǒng)的構(gòu)造以及最佳實踐,怎么樣提供大數(shù)據(jù)的解決案例方面有全盤的考慮。同時和商業(yè)伙伴合作,通過多贏的商業(yè)模式與大家一起把這個盤子做大。

英特爾大數(shù)據(jù)領(lǐng)域四大舉措

作為IT行業(yè)的領(lǐng)頭羊,英特爾在大數(shù)據(jù)方面有什么具體舉措呢?何京翔分享了英特爾在大數(shù)據(jù)領(lǐng)域所做的四個方面的工作。

首先,從英特爾產(chǎn)品線上,包括CPU、存儲、內(nèi)存的技術(shù),正在考慮怎么樣使得新一代的系統(tǒng)架構(gòu),以及數(shù)據(jù)中心的解決方案更適合大數(shù)據(jù)的要求。

另一方面,我們知道大數(shù)據(jù)不僅僅是在硬件上能夠有多少I/O、處理速度多快,更重要的是軟件,怎么提供優(yōu)化的軟件工具,提供優(yōu)化的中間件,包括Hadoop。

第三方面,構(gòu)造健康的生態(tài)系統(tǒng)。大數(shù)據(jù)時代因為數(shù)據(jù)的性質(zhì)和過去完全不一樣,需要新的有ISV,以及不同行業(yè)的特定解決方案,所以構(gòu)建生態(tài)系統(tǒng)方面,特別是和中國的合作伙伴進(jìn)行合作方面,我們已經(jīng)有了很多有益的嘗試。

第四方面,大數(shù)據(jù)領(lǐng)域的投資。未來還要考慮,我們現(xiàn)在有英特爾投資,包括今年年初我們和直真科技的合作,它是一家電信集成商,合作的內(nèi)容就包括了大數(shù)據(jù),我們希望在中國市場通過投資的手段構(gòu)建我們的生態(tài)系統(tǒng)。

英特爾Hadoop發(fā)行版的特點

Hadoop的優(yōu)化方面,除了硬件系統(tǒng)的優(yōu)化,英特爾還在軟件方面,特別是Hadoop系統(tǒng)方面做了優(yōu)化。英特爾以開源為基礎(chǔ),在Hadoop系統(tǒng),包括Hbase、HDFS里面都做了增強和優(yōu)化,使得開源平臺在英特爾的硬件上的運行效率得到顯著的提高。

此外,Hadoop如果只是開源的,在配置、安裝、報表的監(jiān)控和管理上都沒有很好的工具,這就會導(dǎo)致Hadoop的部署很方便,不適合企業(yè)和具體的行業(yè)應(yīng)用,為此英特爾專門做了Intel Hadoop Manager2.0,現(xiàn)在有了Hadoop的發(fā)行版。

圖 英特爾Hadoop Manager 2.0發(fā)行版 幫助企業(yè)進(jìn)行Hadoop的安裝、部署、監(jiān)控、警告和訪問控制

Hadoop發(fā)行版有什么特點呢?何京翔介紹道,Hadoop本身是批處理的方式來做的,這個發(fā)行版做了優(yōu)化,它的處理能力達(dá)到了接近于實時的。

所謂的實時系統(tǒng)是指能夠根據(jù)數(shù)據(jù)的反饋,用幾秒鐘反饋的系統(tǒng),這是實時控制系統(tǒng)。大部分?jǐn)?shù)據(jù)處理系統(tǒng)都是批處理系統(tǒng)或者非實時處理系統(tǒng),通過對Hadoop的優(yōu)化,可以把擬數(shù)據(jù)采集到數(shù)據(jù)處理縮短到近于實時處理,這是優(yōu)化的結(jié)果。

另一方面,Hadoop發(fā)行版還在英特爾的硬件上性能做了優(yōu)化,通過我們的優(yōu)化使得它在英特爾平臺上的性能會成倍增長。

此外,Hadoop發(fā)行版還根據(jù)中國市場的應(yīng)用特點進(jìn)行了一些優(yōu)化。何京翔表示,通過和中國的一些客戶的合作,包括電信系統(tǒng)的、智能城市的、醫(yī)療的,我們進(jìn)行深入的合作,根據(jù)用戶的用戶,根據(jù)中國市場的應(yīng)用特點做了一些行業(yè)優(yōu)化。

英特爾大數(shù)據(jù)戰(zhàn)略:打造端到端的大數(shù)據(jù)解決方案

何京翔強調(diào),僅僅做到硬件的端到端的覆蓋,并不能自動帶來我們對客戶的價值。所以英特爾在Hadoop這樣對數(shù)據(jù)挖掘、存儲、轉(zhuǎn)換、分析的軟件分析方面也做了相應(yīng)的工作,所以英特爾的定位是做大數(shù)據(jù)發(fā)掘中間件,并有自己的一套解決方案。

CPU產(chǎn)品方面,英特爾已經(jīng)真正做到了端到端的覆蓋。大數(shù)據(jù)的解決方案包括數(shù)據(jù)的采集、包括攝像頭、AVI、嵌入式的設(shè)備、傳統(tǒng)的筆記本電腦、PAD、智能手機,這是傳統(tǒng)的或者已經(jīng)用的數(shù)據(jù)采集和數(shù)據(jù)傳輸?shù)脑O(shè)備,這些設(shè)備很多都用到了英特爾的處理器。在采集完之后,首先要經(jīng)過一層預(yù)處理,需要在邊緣服務(wù)器進(jìn)行一些處理,然后送到后臺,預(yù)處理可以用Atom或者Xeon。然后把數(shù)據(jù)傳輸?shù)胶笈_數(shù)據(jù)中心,而數(shù)據(jù)中心的服務(wù)器,包括傳輸過程中的交換機、存儲都會用到英特爾的Xeon處理器。

軟件方面,英特爾通過Hadoop的軟件包能夠提供對平臺優(yōu)化過的軟件和服務(wù),并對分析工具和用戶界面上有面向不同行業(yè)的定制化的分析和解決方案。

在應(yīng)用層面,通過和合作伙伴的合作,也通過在硬件上的支持,比如說可視化上能夠做到更好的可視,展示大數(shù)據(jù)分析的結(jié)果。

在研發(fā)層面,英特爾對不同的行業(yè)有不同的基準(zhǔn)研究,對Hadoop在不同行業(yè)的應(yīng)用怎么進(jìn)行分析,怎么提高使用性能,英特爾專門有軟件院來進(jìn)行研究。

最后,英特爾軟件與服務(wù)部門合作共同構(gòu)建基于英特爾Hadoop的解決方案。

分享到

tangrong

相關(guān)推薦