36大數(shù)據(jù) 發(fā)表于:14年06月10日 17:35 [轉(zhuǎn)載] DOIT.com.cn
高級(jí)階段:《復(fù)雜性》
作者:[美]尼古拉斯·雷舍爾(NICHOLAS RESCHER)
翻譯:吳彤
?
學(xué)完中級(jí)階段,你接觸到了一件事,“復(fù)雜性”,知道了事情復(fù)雜到一定程度,就不可能用尋找因果的方法去進(jìn)行預(yù)測(cè)。
那么到底什么是復(fù)雜性,它的本質(zhì)和原理是什么?想成為大數(shù)據(jù)高手,你不能對(duì)此一無所知,因?yàn)槟銓⒁惠呑优c復(fù)雜甚至是極其復(fù)雜的事情打交道。
如果你讀完了《失控》,可能此時(shí)心理在想:尼瑪,《失控》這本書已經(jīng)夠難讀懂的了(沒錯(cuò),要不微信老總張小龍也不會(huì)說,能讀完這本書的可以直接去他公司上班。注意他說的是“讀完”,不是“讀懂”),那也才是個(gè)中級(jí),這個(gè)高級(jí)不是要把腦子都燒壞嗎?(你又預(yù)測(cè)對(duì)了,和這本比起來,《失控》只能算本休閑書)那我能不看這本書嗎?它和我想學(xué)的東西到底有多大關(guān)系?(你這么不聽老師話,你爸媽造嗎?)
為了你這不聽話的學(xué)生,老師就透露些內(nèi)容吧:
?
不再試圖根據(jù)事物如何必須按照理論的一般原理發(fā)展去解決問題,而是根據(jù)事物如何在通常的情況下按照我們能夠確定的最好情況去解決問題。與其尋求抽象必然性的一般原理,不如以某種經(jīng)驗(yàn)主義的精神,在經(jīng)驗(yàn)——帶有它的全部特征偶然性和潛在不完備性——中尋求指引。
被稱為科學(xué)規(guī)律的牛頓世界秩序(Newtonian world order)的狂熱愛好者。他們的觀點(diǎn)是牛頓、拉普拉斯(Laplace)和達(dá)爾文的相應(yīng)世界觀,將世界看作自然規(guī)律的有序框架?档轮髁x因果關(guān)系原理(Kantian principle of causality)是他們思維中的最重要部分,世界——自然世界和人類世界——被視為宇宙,每一個(gè)事物都是有序的、規(guī)律的、理智的、可解釋的。實(shí)在被視為某種有條理的系統(tǒng),類似于有條理的花園,排列有序且有整齊的邊界。
愛因斯坦、普朗克、薛定諤(Schrodinger)及其同伴破壞了舊物理學(xué)秩序?低袪(Cantor)、哥德爾、海丁(Heyting)等人打破了舊的數(shù)學(xué)秩序。量子力學(xué)理論造成了因果關(guān)系的崩潰。進(jìn)化論現(xiàn)在鄭重強(qiáng)調(diào)的不是“適者生存”,而是自然選擇不得不在其基礎(chǔ)上發(fā)揮作用的全然隨機(jī)的平臺(tái)。
(然而)機(jī)會(huì)和混沌的宇宙不是不守秩序的(無政府狀態(tài)的),而只是復(fù)雜的,通過其自然的運(yùn)轉(zhuǎn)展現(xiàn)著更高階規(guī)律的涌現(xiàn)。而當(dāng)形式邏輯屈從于它的經(jīng)典不變性時(shí),一種新的非經(jīng)典的、多值的(或者“模糊的”)邏輯業(yè)已誕生并取而代之。確定性(certainties)也有效地被或然性(probabilities)和似真性(plausibilities)所取代。
鑒于在復(fù)雜世界中對(duì)行動(dòng)過程做出理智選擇難免是困難的……如果我們是相信統(tǒng)計(jì)學(xué)結(jié)論的學(xué)者,用概率統(tǒng)計(jì)推斷行為的正確性,那么事情就變得更容易處理。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ——摘自《復(fù)雜性》
?
好了,讀還是不讀,你自己看著辦吧。
對(duì)了,推薦這本書還有個(gè)原因。大家都知道大數(shù)據(jù)是研究數(shù)據(jù)的相關(guān)性,即找出數(shù)據(jù)之間的關(guān)系。當(dāng)我經(jīng)歷了15年統(tǒng)計(jì)學(xué)人工智能數(shù)據(jù)相關(guān)性的探索和研究,感覺已經(jīng)研究得差不多了,但又覺得要解決所有的問題還有不小的距離,這時(shí)就感到很迷茫,不知下一步的研究該往何方去,有種路越走越窄的感覺,又有一種達(dá)到頂峰的幻覺,直到看到這本書中的一句話:
“可以考慮它們的關(guān)系,再考慮這些關(guān)系中的關(guān)系,如此下去!
當(dāng)看到這句話,用醍醐灌頂已不足以形容我當(dāng)時(shí)的感受,簡(jiǎn)直就是五雷轟頂。就好象原來我以為世界只有自家的一畝三分地,這句話如一道劃破夜空的明亮閃電,讓我突然看到了無限廣袤的宇宙,為我指明了方向,并開辟出一條金光大道。(原諒我用了這么多的有點(diǎn)亂的形容,每當(dāng)想起這句話,我就抑制不住激動(dòng)的心情)現(xiàn)在想起來,自己那達(dá)到頂峰的幻覺是多么幼稚可笑啊,可笑還不在于我沒有達(dá)到頂峰,而在于這世上本沒有頂峰(挺具有佛性的一句話,不由得讓我想起六祖的話:菩提本無樹,明鏡亦非臺(tái),本來無一物,何處惹塵埃)。
大家千萬不要小看這句話中的“如此下去”幾個(gè)字,他指明了一個(gè)無窮疊代,即 “關(guān)系的關(guān)系的……關(guān)系”,而智能將在這里涌現(xiàn),解決復(fù)雜性問題預(yù)測(cè)的關(guān)鍵很可能就在這里,這句話打開了一個(gè)非常廣闊的前景,將象宇宙一樣沒有窮盡。
看完這句話后,待心情稍稍平復(fù),我立即把它寫成一個(gè)函數(shù):
x=f(f(a,b),f(c,d))
然后告訴自己:這就是你后半生要去全力研究的東西!
現(xiàn)在我們接著往下講,還記得我一開始說過要轉(zhuǎn)變世界觀嗎?讀完這三本書,你已經(jīng)做好了世界觀轉(zhuǎn)變的準(zhǔn)備,現(xiàn)在就要來最后一擊,完成這個(gè)轉(zhuǎn)變!
也就是說,高級(jí)階段你還要讀一本書(尼妹,還要不要人活?我?guī)湍阏f了)。你已經(jīng)了解了復(fù)雜性的原理,但這個(gè)世界到底有多復(fù)雜,你可能還沒有感性的認(rèn)識(shí)。你一定覺得自己經(jīng)歷過很多非常復(fù)雜的事,比如你炒過股票、管理過幾百上千人、研究過社會(huì)學(xué)問題等等,但是和這個(gè)世界真正最復(fù)雜的事比起來,這些都不過是小兒科。
也許你已經(jīng)猜到了是什么方面的書,對(duì),量子理論。鑒于這個(gè)理論實(shí)在太難、太復(fù)雜,愛因斯坦致死也沒把它搞明白,科學(xué)家們現(xiàn)在也都還沒把它搞明白,我輩就不用費(fèi)神想去把它真正搞懂了,但由于我們是在探求事物的復(fù)雜性,或者也可以說研究事物的本質(zhì),那么不可不對(duì)此有所了解,因此我給大家的書是這方面的最初級(jí)的科普讀物。(實(shí)在不忍心再嚇你們了。?
?
高級(jí)階段(2):量子物理史話
作者:曹天元(沒錯(cuò),中國人)
遼寧教育出版社
你一定有疑問,“這本書就能讓我改變世界觀?”
那么我們就來看看書中說些什么吧:
?
量子世界的本質(zhì)是“隨機(jī)性”。傳統(tǒng)觀念中的嚴(yán)格因果關(guān)系在量子世界是不存在的,必須以一種統(tǒng)計(jì)性的解釋來取而代之,波函數(shù)ψ就是一種統(tǒng)計(jì),它的平方代表了粒子在某處出現(xiàn)的概率。當(dāng)我們說“電子出現(xiàn)在x處”時(shí),我們并不知道這個(gè)事件的“原因”是什么,它是一個(gè)完全隨機(jī)的過程,沒有因果關(guān)系。
因果性必須死,因?yàn)槲锢韺W(xué)需要生!
停止?fàn)幷摪,上帝真的擲骰子!隨機(jī)性是世界的基石,當(dāng)電子出現(xiàn)在這里時(shí),它是一個(gè)隨機(jī)的過程,并不需要有誰給它加上難以忍受的條條框框。……而統(tǒng)計(jì)規(guī)律則把微觀上的無法無天抹平成為宏觀上的井井有條。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ——摘自《量子物理史話》
“統(tǒng)計(jì)規(guī)律則把微觀上的無法無天抹平成為宏觀上的井井有條”,這句話實(shí)際上就是表明,統(tǒng)計(jì)方法可以使極其復(fù)雜的隨機(jī)事件成為可預(yù)測(cè)。我認(rèn)為,社會(huì)、市場(chǎng)、股票等等與量子世界有著很多相似之處。由于量子理論實(shí)際上是從最本質(zhì)上去研究我們存在于其中的這個(gè)世界,因此正如書中的一句話:
“這個(gè)世界的本質(zhì):它本就是統(tǒng)計(jì)性的!”
如果你用根深蒂固的唯物主義思想(認(rèn)為唯心主義絕對(duì)是錯(cuò)的)去看量子理論,那么你可能很難理解它,而帶著對(duì)唯心主義一定程度的理解(不一定非要完全贊同)去看會(huì)非常有幫助。因此,我在這里建議大家也可以了解一些佛學(xué),比如看看凈空法師說的話,這樣會(huì)有助于你站在唯心主義的角度去看問題。
????? 不是幡動(dòng),也不是風(fēng)動(dòng),而是心動(dòng)。
佛說:極微細(xì)的心動(dòng)一下,宇宙就出現(xiàn),森羅萬象都現(xiàn)前,同時(shí)我也出現(xiàn)了。心動(dòng),分三段,第一它動(dòng),一動(dòng)就變,一轉(zhuǎn)變就成能見相,有能見立刻就有所見,所見就出現(xiàn)。能見就是意識(shí),意識(shí)出現(xiàn)后,立刻就有所見,即物質(zhì)出現(xiàn),故物質(zhì)是幻象,你想它就現(xiàn)相,物質(zhì)現(xiàn)相即宇宙,故宇宙的現(xiàn)前是頓現(xiàn),不是進(jìn)化的。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ——摘自《凈空法師說華嚴(yán)經(jīng)》
?
量子物理學(xué)家說:“意識(shí)”使得一切從量子疊加態(tài)中脫離,成為真正的現(xiàn)實(shí)。即第一個(gè)有意識(shí)的生物的出現(xiàn)才使得從創(chuàng)生起至那一剎那的宇宙瞬間成為現(xiàn)實(shí),“意識(shí)”的參與可以在那一刻改變過去,而這個(gè)“過去”甚至包含了那個(gè)有意識(shí)的生物自身的演化歷史。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?——摘自《量子物理史話》
?
感覺到量子理論有多復(fù)雜了嗎?如果你對(duì)上面兩段很繞的話沒太看明白,我給你個(gè)精簡(jiǎn)版本:
佛說:心動(dòng),宇宙就出現(xiàn),森羅萬象現(xiàn)前,同時(shí)我也出現(xiàn);
量子物理學(xué)家說:意識(shí)使一切從量子疊加態(tài)中脫離,使宇宙歷史瞬間成現(xiàn)實(shí),其中含有那意識(shí)生物自身。
你肯定還是覺得無法理解這些話,沒關(guān)系,你只需明白一件事就行了,佛祖在兩千多年前就預(yù)言了量子物理學(xué)家現(xiàn)在要說的話。
好了,等看完這本書,你的世界觀不改變,你來找我請(qǐng)你吃飯。
另外,還有一本書作為參考書可以讀一讀(別罵我,參考書,不一定非要讀),侯世達(dá)(Douglas, R. Hofstardter)的《哥德爾、艾舍爾、巴赫》(比磚頭還厚,《失控》只是和磚頭一樣厚)。
此書的介紹:本書是在英語世界中有極高評(píng)價(jià)的科普著作。曾獲得普利策文學(xué)獎(jiǎng)。它通過對(duì)哥德爾的數(shù)理邏輯,艾舍爾的版畫和巴赫的音樂三者的綜合闡述,引人入勝地介紹了數(shù)理邏輯學(xué)、可計(jì)算理論、人工智能學(xué)、語言學(xué)、遺傳學(xué)、音樂、繪畫的理論等方面,構(gòu)思精巧、含義深刻、視野廣闊、富于哲學(xué)韻味。
數(shù)理邏輯學(xué)、可計(jì)算理論、人工智能學(xué)、語言學(xué),這些對(duì)你后面要學(xué)的東西是有幫助的。
推薦這本書的另外一個(gè)原因是,《復(fù)雜性》這本書引用了它的內(nèi)容。
除了《大數(shù)據(jù)時(shí)代》,推薦以上這些書還有一個(gè)共同的原因,那就是這些書的作者可以說都是預(yù)測(cè)的高手(佛祖的功力你剛才已經(jīng)領(lǐng)教了),讓人實(shí)在佩服得五體投地。
《失控》寫于20年前,據(jù)說是史上唯一一本歷經(jīng)20年越來越好賣的書,原因就是人們發(fā)現(xiàn)20年前書中說的事,這些年來正在一件件地被實(shí)現(xiàn),人們都在奇怪,KK他是怎么知道的。
《復(fù)雜性》也寫于近20年前。
《哥德爾、艾舍爾、巴赫》寫于30年前。
《量子物理史話》雖然是2008年寫的,但是量子理論誕生一百多年了。
《華嚴(yán)經(jīng)》誕生于兩千多年前。
然而它們竟然對(duì)今天的大數(shù)據(jù)有如此的指導(dǎo)意義,我還能說什么?
《復(fù)雜性》的作者尼古拉斯·雷舍爾還有一本書(還有?!),別急,這本書你一定會(huì)很想看,因?yàn)闀纱嗑徒小额A(yù)測(cè)未來》。可惜,這本書沒有中文版,英語好的同學(xué)可以去國外找來看看,如果你能幫我也弄一本,俺將不勝感激!
現(xiàn)在你已轉(zhuǎn)變了世界觀,具備了成為一個(gè)大數(shù)據(jù)高手的思想,可以開始學(xué)習(xí)具體方法了,即學(xué)習(xí)人工智能。
你一定在想,是不是又要讀一大堆書?理論上說:是的,需要學(xué)習(xí)人工智能基礎(chǔ)、自然語言處理、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)人工智能等等。不過,看你們被虐了這么久,我也動(dòng)了惻隱之心,將給你們指一條捷徑,就學(xué)習(xí)一本書(高興吧?)。
?
統(tǒng)計(jì)自然語言處理基礎(chǔ)
作者:[美]Christopher D. Manning [德]hinrich Schutze
翻譯:苑春法 李慶中 王昀 李偉 曹德芳等
電子工業(yè)出版社
你可能有一個(gè)疑問,為什么是“語言”,這有兩個(gè)原因:
第一,在計(jì)算機(jī)專業(yè),數(shù)據(jù)并不僅僅是指數(shù)字,文字、圖片、聲音、視頻等都叫數(shù)據(jù);
第二,語言比數(shù)字難很多,如果你能處理語言,那處理純數(shù)字就容易很多。(可參看我的另一篇文章,“什么是真正的大數(shù)據(jù)”,https://www.36dsj.com/archives/7828)
你可能還有一個(gè)疑問,統(tǒng)計(jì)自然語言處理與一般的自然語言處理有什么本質(zhì)不同之處?
給你講一個(gè)有趣的事,我的一個(gè)侄兒,4歲左右,一次去機(jī)場(chǎng)第一次看見自動(dòng)人行道,就是類似商場(chǎng)那種自動(dòng)扶梯,只不過是放平的,人站在上面就自動(dòng)往前走,他脫口就說出“平電梯”。很形象,是不是?他之所以能造出這個(gè)詞,就是因?yàn)槿擞兄悄堋?/p>
這里就引出一個(gè)小問題,他為什么會(huì)把“平”字放在“電梯”的前面?如果用人工智能的一般自然語言處理來解決這個(gè)問題,就會(huì)從詞性、語法、句法等方面著手,中學(xué)的時(shí)候你一定學(xué)過什么偏正結(jié)構(gòu)、主謂結(jié)構(gòu)、動(dòng)賓結(jié)構(gòu)等等吧?對(duì),經(jīng)過這一翻分析和處理,找出原因并推導(dǎo)出結(jié)果,可能就會(huì)知道“平”字應(yīng)該放在前面;
然而統(tǒng)計(jì)自然語言處理的路數(shù)不同,經(jīng)過統(tǒng)計(jì),“平”字大多數(shù)時(shí)候都是放在前面,比如平均、平等、平臺(tái)、平的、平時(shí)、平坦、平常、平衡、平移、平板電腦……,好吧,那就把“平”字放在前面吧。嗯,就這么簡(jiǎn)單。
當(dāng)然,這里只是打個(gè)比方,實(shí)際不會(huì)是這么簡(jiǎn)單。
但是,這又引出一個(gè)問題,我們仔細(xì)想想,那個(gè)4歲的小孩是怎么處理的,難道他懂什么語法、句法、編正結(jié)構(gòu)嗎?肯定不是,所以他一定是用的歸納統(tǒng)計(jì)的方法,無數(shù)次聽到大人說到類似詞時(shí)都是把平放在前面,所以他就放在前面了,他才不知道是什么原因呢,和接那個(gè)棒球是一個(gè)道理,他的大腦里并沒有那個(gè)物理公式。
因此,統(tǒng)計(jì)自然語言處理是更接近自然的自然語言處理方式(繞口令?),也就是說更接近我們?nèi)说奶幚矸绞,甚至可以說就是人或自然的處理方式,只是人的大腦處理方式更復(fù)雜而已,但本質(zhì)是一樣的。
關(guān)于這一點(diǎn),也有不同看法,我把不同觀點(diǎn)也呈現(xiàn)給你,你可以自己去思考和判斷。著名語言學(xué)家喬姆斯基就認(rèn)為“兒童被假定為天生具有適用于所有人類語言的基本語法結(jié)構(gòu)的知識(shí),這種與生俱來的知識(shí)通常被稱作普遍語法理論!(摘自百度百科)
?
自然,我本人是很難茍同這種觀點(diǎn)。這一觀點(diǎn)也遭到相當(dāng)一部份語言學(xué)家的反對(duì),“認(rèn)為在尚未對(duì)所有人類語言進(jìn)行研究之前就假設(shè)所有人類語言有共同的‘底層語法’,這樣做太冒進(jìn);而且在應(yīng)用普遍語法研究未知語言時(shí),不得不假設(shè)許多‘空白詞類’,在研究基本語法為‘謂主賓’的語言(如愛爾蘭蓋爾語)時(shí),更不得不假設(shè)這些語言的‘底層基本結(jié)構(gòu)’為主謂賓,這種做法本身可能已經(jīng)違反了描述性原則。也有語言學(xué)家(如Michael Evans和Stephan Levinson)主張,普遍語法是基於種族中心主義而得出的假設(shè),而這會(huì)對(duì)認(rèn)知科學(xué)造成很不良的影響。”(摘自百度百科)
讀完了這本書,不代表你就成為大數(shù)據(jù)高手了,實(shí)際上它只是為你打下基礎(chǔ)知識(shí),真正掌握大數(shù)據(jù)的方法,需要你在這個(gè)基礎(chǔ)上去探索或者說悟出來。
至此為止,師父領(lǐng)進(jìn)門、修行在個(gè)人,GOOD LUCK!
我寫這篇文章其實(shí)有兩個(gè)原因,一個(gè)就是為想成為大數(shù)據(jù)高手的人指一條路;
另一個(gè)原因,就是想做一個(gè)反擊,對(duì)反對(duì)大數(shù)據(jù)、懷疑大數(shù)據(jù)、用小數(shù)據(jù)當(dāng)大數(shù)據(jù)忽悠的人進(jìn)行反擊。注意,我這里絕對(duì)沒有反對(duì)小數(shù)據(jù)的意思,大數(shù)據(jù)并不是萬能的,傳統(tǒng)數(shù)據(jù)分析方式、抽樣數(shù)據(jù)分析仍然是非常有用的,或至少在相當(dāng)長的時(shí)間里是如此,我只是反對(duì)現(xiàn)在很多人把傳統(tǒng)數(shù)據(jù)分析方式當(dāng)作大數(shù)據(jù)方式來忽悠大眾。如果把這反擊濃縮成一句話,那就是:
這個(gè)世界的本質(zhì)是統(tǒng)!計(jì)!的!?
公司簡(jiǎn)介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶寄語 | DOIT歷程 | 誠聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.