而這樣的應用背后,其實也揭示了AI與云計算深度結合朝著基礎平臺方轉型,并且由感知智能向認知全面升級的趨勢。
近日IDC詳細調研了國內主要云廠商的AI云服務能力,涵蓋人臉人體、圖像視頻、智能語音、對話式AI、NLP、機器學習等六大主要AI領域。 并發(fā)布了《中國AI云服務市場半年度研究報告》,根據(jù)IDC的預測, 2020年中國人工智能市場規(guī)模將會突破五十億人民幣,已經形成一個不可忽略的細分市場,尤其是在疫情影響下各行業(yè)上云意愿明顯加強,而且這也將使智能外呼、對話機器人等交互式AI迎來一波發(fā)展機會。
認知智能全面升級
在2019華為全聯(lián)接大會上,Atlas 900 AI訓練群再次強勢來襲。Atlas 900 AI集群基于昇騰910 AI處理器搭建,通過華為通信庫和作業(yè)調度平臺,整合HCCS、 PCIe 4.0和100G RoCE三種高速接口,充分釋放昇騰910 AI處理器的強大性能。Atlas900在20萬顆星星里找到一顆有類似特征的星體只需要10秒,而在之前這個任務是需要科學家半年的時間才能完成。在實地測試當中,Atlas 900速度比處于第二位的平臺快了五分之一,用華為副董事長胡厚崑的話說“這就好比是在一場短跑里,第1名跑完了全程,然后上了個廁所再回來時第二名才終于氣喘吁吁的到達?!?/p>
今年9月,華為ModelArts2.0正式對外發(fā)布,其理念是打造一站式的開發(fā)平臺,支撐用戶從數(shù)據(jù)到應用的全流程開發(fā)過程,包含數(shù)據(jù)處理、模型訓練、模型管理、部署等操作,并且提供AI市場功能,能夠在市場內與其他開發(fā)者分享模型、API和數(shù)據(jù)集。
另外一款代表了華為AI算力的產品ModelArts,也可以在華為云上輕松(https://www.huaweicloud.com/product/modelarts.html)完成注冊后,就可以免費得到10小時的GPU訓練時長,免費體驗在線Notebook的開發(fā)環(huán)境,筆者親身使用的感受是ModelArts是一個相當開放的平臺,自帶有華為的深度學習框架moxing-framework,但是不限制用戶使用其它深度學習框架進行訓練。
ModelArts主要優(yōu)勢就是開放,并且預置多種模型,而且支持零代碼開發(fā),簡單操作訓練出自己的模型。用戶完全可以不寫一行代碼,完成如車輛識別的模型訓練,可以說上手體驗相當不錯。
Atlas框架和ModelArts等相關產品的耦合,為業(yè)界利用AI算力提供了極大的便利性,也反應出人工智能正在從感知智能到認知智能演進方向。這種演進的關鍵突破口就是跨過深度學習去做研究。由于深度學習只能處理單一模態(tài)的數(shù)據(jù),深度學習模型下的智能機器只能夠照章辦事,缺乏靈活性,認知智能就是要找到多模態(tài)信息之間的關系,這樣的升級使得多模態(tài)成為完成由感知到認知這一跨越的必然途徑。
如果將數(shù)據(jù)比作這個數(shù)字時代的石油,那么華為等大廠,豐富的業(yè)務場景與龐大的用戶基數(shù),就為其AI團隊提供了世界上最大的原油儲存基地,這些都為前沿的AI研究成果提供了令整個業(yè)界都非常羨慕的絕佳“訓練場”,而擁有了這樣高的訓練水平。
正如前文所述IDC將報告的重點放在了智能語音、對話式AI、NLP等方面,這些場景的背后是智能語音、機器翻譯及對話、多模信息等領域的支持,先帶大家來解讀一下這個幾領域的基本情況:
文本生成:這個領域之所以會抱得大名,主要還是因為《權力的游戲》第八季崩盤,在一片“爛尾結局”的評價聲中落下帷幕。而隨后,便有極客用 OpenAI 提出的 GPT-2 文本生成模型進行了實踐。模型學習的是《冰與火之歌》原著,最終輸出了一個大結局,結果得到很多網友的好評,這也讓人們不禁驚呼,原來AI還能寫小說。
智能語音:這是實現(xiàn)人機語言的通信,包括語音識別技術(ASR)和語音合成技術(TTS)。 智能語音技術的研究是以語音識別技術為開端,最早可以追溯到20世紀50年代。隨著信息技術的發(fā)展,智能語音技術已經成為人們信息獲取和溝通最便捷、最有效的手段。
多模態(tài)特征提取與翻譯:目前尤其是90后,在對話當中經常使用表情圖、動態(tài)圖等方式來表達情感,而將這些非語言信息的語義提取并翻譯出來,就是多模態(tài)提取的任務了。比如今年KDD Cup的一道賽題就是“多模態(tài)商品推薦”, 其中多模態(tài)商品推薦指的是關聯(lián)融合視頻、圖片、文本等多模態(tài)用戶數(shù)據(jù),并結合用戶的購買習慣、瀏覽序列等多維信息進行建模學習,精準理解用戶的檢索需求,推薦并返回用戶真正關心、感興趣的產品圖片或視頻。
對話系統(tǒng)與無感交互:其實筆者在經歷異地戀的時候也曾經做過一款基于Windows Mobile MSN的對話機器人(https://blog.csdn.net/BEYONDMA/article/details/99690305 ),不過現(xiàn)在微信基于海量對話信息制作的聊天機器人,已經真假難辯了。而對話系統(tǒng)與文本生成最大的不同之處在于,對話系統(tǒng)一般只生成短句,語義群較少,而文本生成系統(tǒng)則恰恰相反。
而無感交互的終極奧義恰恰在于它要比用戶更懂用戶。比如前段時間筆者經常熬夜加班,結果打開淘寶會發(fā)現(xiàn)總給我推薦防脫洗發(fā)水,當然目前已經推薦枸杞了。不過這其實也說明認知智能的終極發(fā)展就是讓用戶在使用過程中對于“人工智能”不斷淡化,甚至無感化?,F(xiàn)在用戶使用人工智能時還會明顯感受到它的存在,比如你打開電視還需要說“我要看**的電視劇”,還要對手機說“給**打電話”,而真正實現(xiàn)認知智能之后,將會讓你覺得你的這些交互行為變?yōu)槎嘤?比如你回到家,人工智能系統(tǒng)會根據(jù)你的步態(tài),推薦一個適合你當下身體狀況的食譜,等你吃完飯下樓去超市的時候,你的手機會建議補充一些牛奶,因為你剛剛已經把家里最一袋牛奶喝掉了。相信讀到這里讀者也就會明白,化有形于無形,就是用戶交互的最終奧義。
從筆者一個AI云服務的用戶角度上看,其實人工智能由感知到認知的升級,就是對于客戶個性化與定制化需求,進行快速響應的過程,比如金融行業(yè)的呼叫中心需要分析客戶的語氣,以快速處理投訴類案例;出行類APP遇到客戶說出某些關鍵詞時,則需要立刻與110聯(lián)動報警。在面對各行業(yè)個性化定制需求日益增長的情況下,華為走在了業(yè)界前列,尤其是華為云在滿足用戶定制化需求方面可謂做到了極致。最近在朋友圈刷屏的得到總裁羅振宇《如何說服一個人》的分享,更是將他們是如何被華為說服的過程展示的淋漓盡致,讓業(yè)界相信華為不是要從客戶身上賺錢,更是要與客戶共同發(fā)展,共創(chuàng)價值。
“云上AI”是實現(xiàn)AI普惠的最好方式。云的出現(xiàn),讓誕生60多年的語音技術從少數(shù)人掌握的高端工具變成了人人可用的“平民技術”。而AI的認知化升級,也更好地為生態(tài)賦能。
雖然短期來看,在AI領域,主流趨勢仍是私有化部署。但云服務、混合云的浪潮也將帶動AI云服務市場的快速增長。隨著技術的升級,未來3-5年,今天用戶已經部署的AI產品,也有可能被新一代更智能的產品替代。讓我們做好準備迎接新一代認知AI云產品的到來。
為助力更多企業(yè)普惠上云,華為云11.11上云嘉年華現(xiàn)已正式啟動。企業(yè)用戶額外優(yōu)惠、千萬企業(yè)權利禮包、十大產品專場,超多產品特惠、還有11110元上云禮包等你領,快前往華為云官網選購吧!
https://activity.huaweicloud.com/1111_promotion/index.html?utm_source=zhizhe&utm_medium=ruanwen&utm_campaign=&utm_content=&utm_term=&utm_adplace=AdPlace033369
文/華為云MVP-馬超