(圖說:阿里巴巴副總裁車品覺擁有豐富的數據實戰(zhàn)經驗,他指出很多企業(yè)常陷入數據迷思,為數據而數據。照片來源:林衍億攝。)
車品覺笑說:「觀察一個人的行為只能回答一部分的問題,如果不面對面討論的話,很多問題的答案是你怎么蒐集都蒐集不來的,這就是用數據拿數據(data gets data)。」車品覺一語道破大數據的迷思,他認為,現在很多企業(yè)都陷入了數據迷思,為了數據而數據,卻忽略了更快更精確的方法,就好像去觀察一個人的家想要了解這個人,卻忘了其實直接問本人更快,「所以如果你今天很擔心大數據的問題,你不如去擔心將來有很多人會為了數據而數據,多愚蠢啊,舍近而求遠?!?/p>
用面試說明現在許多企業(yè)陷入的數據迷思,俯拾即是生動的例子,將生硬難懂的大數據說得動聽、說得生活化,這就是在大數據中打滾數十年,自稱「每天在玩數據活兒」的阿里巴巴副總裁車品覺的魅力。
車品覺日前來臺宣傳新書《大數據的關鍵思考》,在接受《數位時代》專訪時,他分享了三個常見的大數據迷思和八個大數據實戰(zhàn)密技,具體而微地解說現在企業(yè)在透過大數據變現的過程中,遇到了什么樣的問題以及該如何解決,以下為專訪內容摘要:
三個大數據迷思
1.忘掉大數據吧!如果大數據已經成為大家用數據的常態(tài)了,你何必特別講他出來呢?98年的時候互聯網是一個流行語,現在還有人會說他是流行語嗎?現在有很多電子商務公司叫做傳統(tǒng)電子商務啊,多悲哀啊,有人還以為電子商務是新東西的時候,已經有所謂的傳統(tǒng)互聯網公司。
2.數據也只是創(chuàng)新決策其中一部分,他只不過是新工具,也不用把他想得這么萬能這么神。不是所有的問題都是數據問題,也不是所有的問題都是大數據問題,你就把他想成單純的工具使用,該用刀就用刀,該用槍就用槍,有些地方會比較適合使用數據,不用太神化他,太多的行外人把他講得很神,反而我們業(yè)內人不敢說得太神話,因為知道兌現不了。
3.不要為數據而數據。以前我們做一B2B的網站,客單價不停地掉,我們用很多數據方法去解決問題,但都沒有起色,有一天早上我覺得不對,我說我們不要看數據了,我跟工程師說,你在顧客進網站時問他:「你是幫自己買東西嗎?」結果有50%以上的人說對,你知道我花了半年的時間去尋找答案,這根本就是為了數據而數據啊,所以如果你今天很擔心大數據的問題,你不如去擔心將來有很多人會為了數據而數據
(圖說:車品覺在新書中噼頭就說「忘掉大數據吧!」,未來數據將會成為每家公司的常態(tài),無須多言。照片來源:林衍億攝。)
八個大數據實戰(zhàn)密技
1.不要說大數據,就說我們使用數據的時候到底我們知不知道這個背后數據的數據是什么?如果我的判斷是對的,你要用什么數據去證明我是對的?比如說今天氣象局說今天的溫度是12度,那我問說,過去來講這個環(huán)境中,他預測12度的正確的概率是多少?錯的概率是多少?這就是數據的數據,我要用一個數據之前,我一定會問,這個數據可不可信啊,可靠性是如何,沒有對數據的可靠性,你就先使用,你是盲目地使用,所以數據的數據是一個層面,決定可不可靠。
2.中小企業(yè)先用數據量化自己,再來談大數據。如何用好數據來量化自己?用數據理解自己,量化自己,我覺得在這個基礎上去思考我們有什么東西是可以用大數據的?這樣會更有效。小企業(yè)應該去嘗試用數據量化決策,而不是大數據,沒大這件事,就是用數據做決策,其實公司本身內部有的數據問題很多的,像是大部分公司客服數據從來沒跟公司主要數據連上,因為很多公司的客服中心都在外部,所以這個數據他拿不到,他不知道消費者的反應,這個數據又無法跟你的經營數據做關聯,所以整個數據在一個中小企業(yè)里面也是四分五裂的嘛,你在這個地方沒用好的情況下,你居然說你想用大數據,其實是有點難以理解。
3.數據案例很多會失敗都是因為蒐集數據歸蒐集,但蒐集起來之后這跟塬本的數據決策是沒有辦法合在一起的。這不僅線下會發(fā)生問題,線上也有這個問題,你可以問問現在管理首頁的人,他管理首頁有多少是根據數據去設計的,你不如問他們如果他們改版首頁,他們如何評估這個改版后的首頁是成功的?用什么數據去決定?
4.數據的刷新頻率是什么?這個值非常關鍵。刷新得快不一定比慢好,有些地方要刷得慢一點。有些東西太敏感了,你刷新的數據不一定正確,比如你要買一個二十年的保險,就是很長遠的東西,或者你要做重大投資,在這個時候你應該去看歷史的穩(wěn)定數據,如果今天你剛從電影院看完一部戲,你剛看完想吃麻辣火鍋,這秒鐘,你不需要猜他的歷史性格,你應該去猜他下個場景會是什么,這個時候地點的數據非常關鍵。
5.真正的數據創(chuàng)新還沒出現,現在大部分的企業(yè)沒法串起數據、算法和應用創(chuàng)新,沒有人既懂商業(yè)又懂數據,要抓到這種機會點的人極少,我算是,但是我只是電商和零售領域的專家而已。
6.數據的創(chuàng)新來自兩點:一、把不該再分裂的數據分裂;二、把兩個不該拼合的數據拼合。這會產生很大的力量,例如性別不是男就是女,這兩個東西應該再也不能分裂了,但在數據上我們可以說這個人的態(tài)度有三成很女生,有七成很男生,他的態(tài)度有男生的態(tài)度在里面。有些數據已經是塬子了,但你一剖開發(fā)現不是塬子,還可以再分裂,在這個時候分出來的數據的破壞力或創(chuàng)意是很大的,你沒想過嘛,這對推薦引擎來講太關鍵了。商業(yè)的世界很競爭,當兩個敵對公司一結盟,像是根據開車數據調整保費,就是一個數據結合的創(chuàng)新案例。
7.我看到的大數據項目都是失望比較多的,很多大數據項目都還在實驗室,當這些東西到企業(yè)就不行了,企業(yè)需要準確,還有很多問題是要分場景化的。
8.數據分析師要量化自己的量化,這對我們這行很重要。我們整個行業(yè)最討厭什么東西你知道嗎?你找一個人去準確算出一個東西,不難,但是六個月都準,很難,時間一長,就不準確了。時間一長,整個模型是用歷史數據建立出來的,當歷史數據變得越來越不重要的時候,這個模型就會變得沒那么準確了,這個時候你就要改進你的算法了。