圖 微軟亞太研發(fā)集團(tuán)首席技術(shù)官 孫博凱(Prakash)
兩個(gè)月后,在北京舉辦的TechEd 2012 微軟技術(shù)大會(huì)上,微軟亞太研發(fā)集團(tuán)首席技術(shù)官孫博凱(Prakash)詳細(xì)介紹了微軟的大數(shù)據(jù)解決方案,其可以快速?gòu)臄?shù)據(jù)庫(kù)中抽取三個(gè)類型的數(shù)據(jù):結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)(視頻、地圖、圖片等)和流式數(shù)據(jù)(各種傳感器、自媒體如微博等來(lái)源的數(shù)據(jù)),并在此基礎(chǔ)上幫助數(shù)據(jù)實(shí)現(xiàn)統(tǒng)一的管理與分析。在他看來(lái),對(duì)于大數(shù)據(jù)應(yīng)用而言,一個(gè)重要的方向就是:打通SQL-MapReduce之間,不同數(shù)據(jù)倉(cāng)庫(kù),不同來(lái)源數(shù)據(jù)流動(dòng)的通路,讓數(shù)據(jù),尤其是結(jié)構(gòu)化數(shù)據(jù)以外的半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),可以在各類數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)上統(tǒng)一,真正為數(shù)據(jù)分析師、運(yùn)營(yíng)團(tuán)隊(duì)、管理層等數(shù)據(jù)使用者服務(wù),實(shí)現(xiàn)真正透明的底層技術(shù),指導(dǎo)營(yíng)銷方向,進(jìn)行決策支持。
支持Hadoop,發(fā)布HDInsight,只是微軟的第一個(gè)動(dòng)作。大數(shù)據(jù),注定是一個(gè)浩大的工程。
大數(shù)據(jù):管理、豐富與洞察
在此工程中,孫博凱認(rèn)為有三個(gè)必要步驟:即數(shù)據(jù)的管理、豐富和洞察。為了加深理解,孫博凱利用美國(guó)汽油和汽車銷售車型之間的對(duì)應(yīng)關(guān)系來(lái)舉例。“美國(guó)油價(jià)比中國(guó)油價(jià)波動(dòng)大很多。油價(jià)持續(xù)走高時(shí),節(jié)能型車型如混合動(dòng)力車銷售就高,油價(jià)降低時(shí),高耗油車型如SUV就暢銷。從不同的曲線中,汽車廠商通過(guò)不同數(shù)據(jù)量化銷售狀況,獲得洞察力,提前作出生產(chǎn)安排,競(jìng)爭(zhēng)中占據(jù)更多優(yōu)勢(shì)。”
圖片說(shuō)明
不過(guò),要實(shí)現(xiàn)大數(shù)據(jù)的普及,需要眾多企業(yè)的合力來(lái)完成。事實(shí)上,IT產(chǎn)業(yè)鏈和生態(tài)系統(tǒng)上各方力量從來(lái)沒(méi)有像現(xiàn)在這樣重視相互的合作關(guān)系,也從未如此緊密合作過(guò)。正如孫博凱對(duì)CSDN所表示的:“微軟日益開(kāi)放。作為公有云平臺(tái),Azure更加擁抱開(kāi)源。很多開(kāi)源技術(shù)如PHP、MySQL、WordPress都可以在Windows Azure上運(yùn)行。Hadoop方面,我們已經(jīng)和Hortonworks通力合作,而對(duì)于一些初創(chuàng)企業(yè),尤其是在工具設(shè)計(jì)及垂直行業(yè)解決方案的企業(yè),微軟也希望他們可以成為Windows Azure平臺(tái)的伙伴。不止如此,Windows Azure平臺(tái)還有支持Mobile Services、Media Services等服務(wù),如Streaming to iOS,IE瀏覽器以外也提供著更多其他瀏覽器的自由選擇。另一方面,微軟的技術(shù)也已經(jīng)回饋開(kāi)源社區(qū),ODBC Liver和Entity Framework(LINQ)。相信以后,還會(huì)有越來(lái)越多的開(kāi)源技術(shù)出現(xiàn)在微軟的Azure平臺(tái)上。”