中科院院士、曙光公司董事長(zhǎng)李國(guó)杰

今后的二十年,將是人工智能技術(shù)的基本創(chuàng)新爆發(fā)期,會(huì)產(chǎn)生觸發(fā)2030年開(kāi)始的新一波經(jīng)濟(jì)的繁榮期。

這里得出什么結(jié)論呢?在未來(lái)10-15年,對(duì)經(jīng)濟(jì)貢獻(xiàn)最大的可能不是大數(shù)據(jù)和人工智能的新技術(shù),而是信息技術(shù)(包括大數(shù)據(jù)和人工智能)融入各個(gè)產(chǎn)業(yè)的新產(chǎn)品,提供個(gè)性化產(chǎn)品和服務(wù)的新業(yè)態(tài),產(chǎn)業(yè)跨接融合的新模式,這些創(chuàng)新主要是已知技術(shù)的新組合。任何新技術(shù)的推廣需要一二十年的時(shí)間。

在經(jīng)濟(jì)衰退復(fù)蘇期要特別重視基礎(chǔ)性技術(shù)的發(fā)明,未來(lái)10-15年應(yīng)力爭(zhēng)在大數(shù)據(jù)和人工智能領(lǐng)域做出像電子計(jì)算機(jī)、集成電路、互聯(lián)網(wǎng)一樣的重大發(fā)明(重大發(fā)明是自己冒出來(lái)的,不是規(guī)劃出來(lái)的)。歷史上重大基礎(chǔ)發(fā)明都是經(jīng)過(guò)較長(zhǎng)時(shí)間的技術(shù)改進(jìn)和擴(kuò)散之后才產(chǎn)生巨大經(jīng)濟(jì)效益,人工智能也不應(yīng)例外。

很多公司都預(yù)測(cè),從2016年到2025年的10年內(nèi),汽車(chē)、消費(fèi)品、電力、物流等行業(yè)的數(shù)字化轉(zhuǎn)型將有望帶來(lái)100萬(wàn)億美元的市場(chǎng)份額。

流行的說(shuō)法是,人工智能=A+B+C。但我個(gè)人的看法,人工智能和大數(shù)據(jù)基本一回事,A+B+C+D+E。A是算法,B是基本理論和基礎(chǔ)設(shè)施,C是計(jì)算能力,D是領(lǐng)域知識(shí),E是生態(tài)環(huán)境。

發(fā)展人工智能和大數(shù)據(jù)要重視大眾的剛性需求。2011年我跟徐志偉寫(xiě)了一篇文章在CACM上發(fā)表了,與“Computing for the Masses”的追求一樣,我們要努力實(shí)現(xiàn)“Big Data for Masses,AI for the Masses”,不能只關(guān)注高端消費(fèi)人群。發(fā)展大數(shù)據(jù)與人工智能要重視大眾的剛性需求(如健康、出行、安全等)。過(guò)去工業(yè)化時(shí)代就是所謂 “鐵公機(jī)”,鐵路、公路、機(jī)場(chǎng)。

信息時(shí)代的基礎(chǔ)設(shè)施是互聯(lián)網(wǎng)、云計(jì)算中心,到了智能化階段的基礎(chǔ)設(shè)施是大數(shù)據(jù)中心、機(jī)器學(xué)習(xí)訓(xùn)練平臺(tái)等。大數(shù)據(jù)的存儲(chǔ)分析和機(jī)器學(xué)習(xí)能力已成為新的基礎(chǔ)設(shè)施需求,計(jì)算機(jī)能力的高低將決定人工智能產(chǎn)業(yè)和智能服務(wù)的水平。目前,網(wǎng)絡(luò)服務(wù)的龍頭企業(yè)(BAT、滴滴打車(chē)等)都有自己的大數(shù)據(jù)平臺(tái),但智能軟件和服務(wù)行業(yè)每個(gè)中小型創(chuàng)業(yè)公司都建立自己的機(jī)器學(xué)習(xí)訓(xùn)練平臺(tái),既無(wú)必要也不可能。各地雙創(chuàng)園區(qū)要建立共享的大數(shù)據(jù)分析平臺(tái)和機(jī)器學(xué)習(xí)訓(xùn)練平臺(tái),這是新時(shí)代的重要基礎(chǔ)設(shè)施。

我國(guó)一半以上的HPC用于大數(shù)據(jù)/AI。過(guò)去HPC主要用于科學(xué)計(jì)算,現(xiàn)在HPC主要用于大數(shù)據(jù)分析和機(jī)器學(xué)習(xí)。2015年,HPC在數(shù)據(jù)分析與機(jī)器學(xué)習(xí)領(lǐng)域的應(yīng)用只有27%,2016年達(dá)到了48%,今年有進(jìn)一步提升。另外每個(gè)行業(yè)都需要AI,每個(gè)行業(yè)分別做是很累人的,有些東西是又有區(qū)別又有共性,我的想法是將來(lái)要有生產(chǎn)每個(gè)行業(yè)的AI引擎生產(chǎn)線(xiàn),前面有公共的東西做局部化調(diào)整,有局部的參數(shù)調(diào)整,調(diào)完了以后出一個(gè)行業(yè)的AI引進(jìn)來(lái)。

要擺脫人工智能創(chuàng)業(yè)公司被收購(gòu)的命運(yùn)。人工智能創(chuàng)業(yè)公司只有兩個(gè)命運(yùn):一個(gè)是被大公司收購(gòu),一個(gè)是倒閉。即使像科大訊飛這樣的大企業(yè),科大訊飛市值約700億元,凈利潤(rùn)不到1.7億元,在座的也有科大訊飛,沒(méi)有貶低的意思,市盈率已經(jīng)超過(guò)300倍,所以如何提高凈利潤(rùn)是AI公司的一大困擾。人工智能企業(yè)史說(shuō)明,算法固然很重要,但是光有算法決定不了公司的命運(yùn)。AI公司要在賣(mài)產(chǎn)品、授權(quán)、廣告、服務(wù)模式中找到新的賺錢(qián)模式,或者另外開(kāi)辟技術(shù)變成錢(qián)的商業(yè)模式。AI公司要做大做強(qiáng),不但要有一技之長(zhǎng),而且要有自己的平臺(tái)和特有的數(shù)據(jù),軟件和硬件都要有過(guò)人的實(shí)力。

現(xiàn)在的問(wèn)題,我國(guó)人工智能應(yīng)用技術(shù)與國(guó)外差距不大,有些應(yīng)用領(lǐng)域已經(jīng)超過(guò)美國(guó),但是基礎(chǔ)軟硬件與國(guó)外還有較大差距。在全球企業(yè)2000強(qiáng)名單中,美國(guó)有14家芯片公司和14家軟件公司,中國(guó)尚未沒(méi)有一家(我講的是以軟件作為主要產(chǎn)業(yè)的公司);全球集成電路企業(yè)前20名沒(méi)有一家中國(guó)企業(yè),華為可能擦邊。我國(guó)集成電路與國(guó)外仍有兩代差距。美國(guó)對(duì)中國(guó)實(shí)行禁運(yùn)和限制企業(yè)收購(gòu)的主要是集成電路。所以人工智能產(chǎn)業(yè)像一棵大樹(shù),必須扎根在系統(tǒng)結(jié)構(gòu)和軟件理論的深土中,發(fā)展人工智能不能停留在算法層面,要關(guān)注從算法、軟件、人機(jī)截面到系統(tǒng)結(jié)構(gòu)和芯片這一完整的產(chǎn)業(yè)鏈和生態(tài)系統(tǒng)。

發(fā)展人工智能和大數(shù)據(jù),還是要特別重視基礎(chǔ)的東西。中國(guó)人很重“名”,“名不正則言不順”,信息領(lǐng)域不斷創(chuàng)造新名詞,一旦新名詞(新學(xué)科)上升為國(guó)家意志,原來(lái)的基礎(chǔ)學(xué)科就被邊緣化,現(xiàn)在以“系統(tǒng)結(jié)構(gòu)”和“基礎(chǔ)軟件”申請(qǐng)國(guó)家項(xiàng)目,已經(jīng)很難拿到經(jīng)費(fèi)。去年國(guó)家自然科學(xué)基金計(jì)算機(jī)學(xué)科的4863項(xiàng)申請(qǐng)項(xiàng)目中,計(jì)算機(jī)科學(xué)的基礎(chǔ)理論只有16項(xiàng),計(jì)算機(jī)體系結(jié)構(gòu)22項(xiàng),程序設(shè)計(jì)語(yǔ)言及支撐環(huán)境13項(xiàng),高速數(shù)據(jù)傳輸技術(shù)2項(xiàng)。但是,計(jì)算機(jī)圖像與視頻處理有439項(xiàng),模式識(shí)別理論及應(yīng)用357項(xiàng),人工智能應(yīng)用258項(xiàng)。這是巨大的反差,所以沒(méi)有基礎(chǔ)的話(huà),將來(lái)還是返回的局面。

國(guó)家新一代人工智能發(fā)展規(guī)劃中,偏應(yīng)用的研究還是多一些,基礎(chǔ)設(shè)施的部署偏少一點(diǎn),在未來(lái)的實(shí)施中應(yīng)高度重視打造人工智能的基礎(chǔ)設(shè)施。要跟數(shù)字化、網(wǎng)絡(luò)化、算法等要結(jié)合起來(lái)。

再講講我的一個(gè)判斷,什么是人工智能?人工智能從科學(xué)上講,它是計(jì)算機(jī)科學(xué)的前沿研究,從應(yīng)用來(lái)講,它是計(jì)算機(jī)技術(shù)的的非平凡應(yīng)用。人工智能本就是計(jì)算機(jī)技術(shù),現(xiàn)在很多人講人工智能是新的科學(xué),內(nèi)容涉及腦科學(xué)、計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)、社會(huì)科學(xué)等。但是迄今為止,腦科學(xué)(神經(jīng)科學(xué))對(duì)人工智能的貢獻(xiàn)很小,統(tǒng)計(jì)學(xué)對(duì)推動(dòng)機(jī)器學(xué)習(xí)的崛起起了較大作用,但是沒(méi)有人把人工智能看成統(tǒng)計(jì)學(xué)的分支。目前來(lái)講,人工智能本質(zhì)上是計(jì)算機(jī)學(xué)科的一個(gè)分支,人工智能再多,國(guó)際上還是把它統(tǒng)計(jì)到計(jì)算機(jī)學(xué)科名下。智能化的前提是計(jì)算機(jī)化,目前不存在脫離計(jì)算機(jī)的人工智能。所以說(shuō),沒(méi)有計(jì)算就沒(méi)有智能。

有人總說(shuō)現(xiàn)在是智能化的時(shí)代,信息化時(shí)代已經(jīng)過(guò)去了,這恐怕不夠全面,智能時(shí)代不是后信息時(shí)代,真正的后信息時(shí)代可能是生物時(shí)代。與其過(guò)分強(qiáng)調(diào)智能與數(shù)字化、網(wǎng)絡(luò)化的區(qū)別,不如多強(qiáng)調(diào)智能化與信息化的聯(lián)系,數(shù)字化和網(wǎng)絡(luò)化沒(méi)有做好,智能化就是空話(huà)。我們吸取歷史上的教訓(xùn),八十年代有段時(shí)間人工智能也很熱,但是它的很多需求通過(guò)計(jì)算機(jī)組合技術(shù)是能滿(mǎn)足的,那時(shí)候講的要從第四代發(fā)展到第五代,但是后來(lái)計(jì)算機(jī)走了一條與此相反的道路,是從底層做起,所以人工智能的很多硬件軟件都并入了計(jì)算機(jī)主流。今天的形勢(shì)跟80年代不一樣,但是歷史教訓(xùn)要汲取,我們既要重視智能應(yīng)用的特殊要求,但是也不能忽視通用的計(jì)算機(jī)主流技術(shù)的巨大包容能力。

曙光公司是國(guó)家智能計(jì)算機(jī)研究開(kāi)發(fā)中心創(chuàng)辦的企業(yè),是國(guó)家863計(jì)劃智能計(jì)算機(jī)主題長(zhǎng)期支持下成長(zhǎng)起來(lái)的高技術(shù)公司,智能應(yīng)用一直是國(guó)家智能計(jì)算機(jī)研究開(kāi)發(fā)中心和曙光公司關(guān)注的重點(diǎn)之一。上世紀(jì)九十年代在建立了國(guó)家智能計(jì)算機(jī)研究開(kāi)發(fā)中心中國(guó)科大分中心,專(zhuān)門(mén)從事語(yǔ)音識(shí)別/合成的評(píng)測(cè),后來(lái)孵化出科大訊飛公司。我留學(xué)回國(guó)后指導(dǎo)的第一個(gè)博士是姚新,現(xiàn)在是英國(guó)伯明瀚大學(xué)的講座教授,南方科技大學(xué)計(jì)算系主任。中科曙光和寒武紀(jì)是同根生的兄弟公司,寒武紀(jì)研究芯片不但用在華為的手機(jī)上,也會(huì)用在曙光服務(wù)器上。要特別注重知識(shí)的融合,錢(qián)老說(shuō)過(guò)“必集大成,才能得智慧”,人工智能是對(duì)付復(fù)雜性的科學(xué),發(fā)展人工智能不能追求“另立山頭,分道揚(yáng)鑣”,要跟其它學(xué)科密切融合。

如何看待領(lǐng)域知識(shí)呢?10月19日,谷歌DeepMind團(tuán)隊(duì)新成果,名為阿爾法元的機(jī)器完全靠增強(qiáng)型自我學(xué)習(xí),訓(xùn)練3天就戰(zhàn)勝了阿爾法狗,比分100:0。這表明在某些領(lǐng)域,AI不再需要人類(lèi)知識(shí)。過(guò)去我們相信知識(shí)就是力量,現(xiàn)在有些領(lǐng)域數(shù)據(jù)和機(jī)器學(xué)習(xí)比知識(shí)和人類(lèi)經(jīng)驗(yàn)更有力量。

最后引用一段話(huà),是美國(guó)曼哈頓負(fù)責(zé)人澳本海默在二戰(zhàn)勝利以后說(shuō)的:“我們得到了一棵碩果累累的大樹(shù),并拼命地?fù)u晃,結(jié)果得到了雷達(dá)和原子彈……其全部精神實(shí)質(zhì)在于對(duì)已知的瘋狂而粗暴掠奪,而毫無(wú)對(duì)未知的認(rèn)真而謙恭地探索?!?/p>

人工智能已經(jīng)六十年了,我們是拼命搖晃這棵大樹(shù)不變,還是懷抱對(duì)未知的認(rèn)真和謙恭,自己新種幾棵樹(shù)苗?深度學(xué)習(xí)為什么這么有效,沒(méi)有人講得清楚。最近以色列科學(xué)家提出“信息瓶頸”理論,發(fā)現(xiàn)深度學(xué)習(xí)與物理重整化。

“莫言下嶺便無(wú)難,賺得行人空歡喜。正入萬(wàn)山圈子里,一山望過(guò)一山難?!敝x謝!

【注:本文根據(jù)中科院院士、曙光公司董事長(zhǎng)李國(guó)杰10月24日在以“從未知到可能”為主題的2017中科曙光智能峰會(huì)發(fā)言錄音整理,未經(jīng)本人審定】

 

分享到

xiesc

相關(guān)推薦