佚名 發(fā)表于:14年07月18日 00:43 [轉(zhuǎn)載] 賽迪網(wǎng)
回顧2013,智能語(yǔ)音熱潮整整嗨了一整年,最終以工信部牽頭主辦的中國(guó)語(yǔ)音產(chǎn)業(yè)聯(lián)盟年會(huì)為此畫上了一個(gè)圓滿的句號(hào)。然而2014年國(guó)內(nèi)整個(gè)語(yǔ)音產(chǎn)業(yè)開局卻顯疲軟,熱度呈下滑趨勢(shì),而智能圖像、人工智能等新概念卻逐漸興起,為何?
一波三折的“智能語(yǔ)音”熱
早在2013年底中國(guó)語(yǔ)音產(chǎn)業(yè)聯(lián)盟年會(huì)上,北大信息技術(shù)學(xué)院智能科學(xué)系副主任吳璽宏教授就已拋出了“隨意說”一詞,他說:“現(xiàn)在的語(yǔ)音識(shí)別是否能在噪音環(huán)境中優(yōu)先識(shí)別人聲?是否真正能達(dá)到語(yǔ)義理解?……”并且著重強(qiáng)調(diào)產(chǎn)業(yè)界切勿過早過度宣傳“語(yǔ)音識(shí)別”準(zhǔn)確率、“語(yǔ)義理解”等大詞,這容易拉高用戶的期望值,其實(shí)對(duì)產(chǎn)業(yè)的發(fā)展有阻礙作用。而清華大學(xué)鄭方博士也對(duì)北大觀點(diǎn)給予了支持,表示產(chǎn)業(yè)界切勿過早熱炒“語(yǔ)義理解”等熱詞,在語(yǔ)音熱潮背后更需務(wù)實(shí),技術(shù)與宣傳應(yīng)保持一致;同時(shí)也建議政府多多支持中小型創(chuàng)新企業(yè),強(qiáng)調(diào)好點(diǎn)子多來自中小型公司,對(duì)于中小型企業(yè)而言沒有創(chuàng)新突破就意味著馬上被市場(chǎng)淘汰,生存就是一個(gè)很大的問題,而大公司可能更多地需要照顧整體發(fā)展,創(chuàng)新進(jìn)度相比之下較慢于中小型企業(yè)。此外,也希望加強(qiáng)學(xué)院與產(chǎn)業(yè)的合作,政府給予支持,以此吸引流失在外的尖端科技人才回歸祖國(guó)。
果不其然,一語(yǔ)成讖,一大批新興智能語(yǔ)音技術(shù)公司拔地而起,擁擠進(jìn)智能語(yǔ)音圈,百度、騰訊、谷歌、微軟等大公司也紛紛進(jìn)入這一領(lǐng)域,整體看上去一片大好的景象,然而實(shí)際情況卻不容樂觀。從用戶的使用率和體驗(yàn)評(píng)價(jià)可以看出,大多數(shù)移動(dòng)端和其它硬件上的智能語(yǔ)音交互功能基本還是一個(gè)你有我也有的“擺飾”,就連最著名的蘋果Siri的使用率也低至15.2%。
進(jìn)入2014年后,隨著人工智能概念的崛起,語(yǔ)音熱潮暫時(shí)脫離了大眾和媒體的關(guān)注視野,這股熱潮也隨之“又”再次落去——之所以說“又”,是因?yàn)橹悄苷Z(yǔ)音熱潮早在幾年前就已經(jīng)歷了幾次起起落落,因此有專家笑稱“智能語(yǔ)音五年火一次,經(jīng)歷著‘熱一陣、死一陣’的輪回。”
追其原因,高AI智能語(yǔ)音的實(shí)現(xiàn)還是一個(gè)任重而道遠(yuǎn)的夢(mèng)想,除了用戶數(shù)據(jù)積累等技術(shù)因素,語(yǔ)音識(shí)別率、用戶習(xí)慣與對(duì)智能語(yǔ)音單方面的理解仍然是不得小視的問題。
那么,借鑒國(guó)內(nèi)最高學(xué)府兩位教授的勸言,國(guó)內(nèi)又有多少企業(yè)接納并實(shí)行了以上建議了呢?
“ASR+TTS”智能語(yǔ)音的完整組合
作為國(guó)內(nèi)智能語(yǔ)音圈數(shù)一數(shù)二的語(yǔ)音技術(shù)服務(wù)商捷通華聲在中國(guó)語(yǔ)音產(chǎn)業(yè)聯(lián)盟年會(huì)結(jié)束后,審時(shí)度勢(shì),借助在京城中關(guān)村軟件園的“地利”之勢(shì)以及核心團(tuán)隊(duì)人員來自清華大學(xué)的“人和”關(guān)系,積極聯(lián)動(dòng)清華學(xué)府,并成功吸引清華大學(xué)注資捷通華聲,成為第二大股東。更重要的是捷通華聲得到了清華大學(xué)的長(zhǎng)年積累研究的學(xué)術(shù)和技術(shù)支持,打通了國(guó)內(nèi)產(chǎn)、學(xué)、研三派互通有無的“任督二脈”,也成就了“TTS+ASR”雙劍合璧的靈云智能語(yǔ)音完美展現(xiàn)。
縱觀國(guó)內(nèi)外語(yǔ)音產(chǎn)業(yè)發(fā)展規(guī)律,生存下來的企業(yè)無外有幾種方式,國(guó)外首推美國(guó)Nuance,伴隨語(yǔ)音產(chǎn)業(yè)的發(fā)展規(guī)律,通過全球范圍不斷的兼并,Nuance形成全球范圍內(nèi)的壟斷得以生存發(fā)展。國(guó)內(nèi)企業(yè)則以訊飛、捷通華聲為代表,兩家公司均以高校為支撐,捷通華聲依托清華大學(xué)、訊飛依靠科大; 訊飛長(zhǎng)于調(diào)動(dòng)各種社會(huì)資源,高打高唱;捷通華聲相對(duì)低調(diào),以務(wù)實(shí)為本,強(qiáng)調(diào)合作共贏。三家公司雖各具特點(diǎn),卻有一個(gè)共同點(diǎn),均以TTS贏取市場(chǎng)與利潤(rùn),ASR多為企業(yè)品牌知名度服務(wù)。國(guó)外語(yǔ)音市場(chǎng)相對(duì)成熟理性,Nuance經(jīng)過不斷的收購(gòu)擴(kuò)大實(shí)力,但終于在蘋果Siri的高潮過后,先后傳出將要被蘋果、三星收購(gòu)的傳聞。如果Nuance出售收購(gòu),多少也標(biāo)示著智能語(yǔ)音經(jīng)過幾起幾落發(fā)展之后,進(jìn)入到一個(gè)相對(duì)理性的發(fā)展階段,也預(yù)示著人工智能一個(gè)新的時(shí)代的開始。
捷通華聲雖為國(guó)內(nèi)的老牌語(yǔ)音技術(shù)服務(wù)商,早在三年前即推出國(guó)內(nèi)外第一個(gè)全方位人工智能技術(shù)云服務(wù)平臺(tái)靈云(www.hcicloud.com),智能語(yǔ)音則為其人工智能整體布局中關(guān)鍵一環(huán)。
在這里不得不提的是,智能語(yǔ)音交互技術(shù)涵蓋語(yǔ)音合成(TTS)和語(yǔ)音識(shí)別(ASR)兩項(xiàng)技術(shù)——而2013年整整一年都在炒作語(yǔ)音識(shí)別——捷通華聲靈云以支持13種國(guó)際語(yǔ)言的語(yǔ)音合成技術(shù)在國(guó)內(nèi)獨(dú)占鰲頭,雖然語(yǔ)音識(shí)別技術(shù)在2012年的時(shí)候還稍遜于國(guó)際IT巨頭Nuance、Google,但是在自2013年后,借助清華的力量,語(yǔ)音識(shí)別技術(shù)突飛猛進(jìn),迅速實(shí)現(xiàn)商品化,具有中國(guó)特色的漢語(yǔ)言智能語(yǔ)音體系嶄露頭角,靈云語(yǔ)音合成與語(yǔ)音識(shí)別相輔相成,形成一套完整的智能語(yǔ)音解決方案,目前已應(yīng)用于國(guó)內(nèi)眾多產(chǎn)業(yè)中,并加速布局移動(dòng)互聯(lián)網(wǎng)應(yīng)用。現(xiàn)在,靈云智能語(yǔ)音已成功為百度地圖、搜狗導(dǎo)航、導(dǎo)航犬等經(jīng)典應(yīng)用提供語(yǔ)音服務(wù)。伴隨靈云語(yǔ)音識(shí)別技術(shù)的升級(jí),靈云語(yǔ)音技術(shù)在語(yǔ)音質(zhì)檢領(lǐng)域也取得突破,將幫助電信、金融等領(lǐng)域的企業(yè)大大提升客服的服務(wù)質(zhì)量和效率。
捷通靈云智能語(yǔ)音交互技術(shù)目前已在全新改版的靈云全方位人工智能開放平臺(tái)上免費(fèi)開放,可供開發(fā)者、企業(yè)自由調(diào)用,而除了“TTS+ASR”雙劍合璧的特性外,捷通靈云智能語(yǔ)音還提供“云+端”服務(wù),既可提供私有云服務(wù)器解決企業(yè)內(nèi)部服務(wù)器運(yùn)行壓力,也可以派遣專業(yè)技術(shù)人員前往企業(yè)內(nèi)部搭建私人定制的智能語(yǔ)音技術(shù)平臺(tái),并且永久跟蹤服務(wù),響應(yīng)及時(shí),無后顧之憂。
壯志靈云,開啟人工智能新時(shí)代
作為國(guó)內(nèi)老牌語(yǔ)音技術(shù)民族企業(yè),捷通華聲立足智能語(yǔ)音,全面發(fā)展圖像識(shí)別(OCR)、手寫識(shí)別(HWR)、自然語(yǔ)言理解(NLU)、機(jī)器翻譯(MT)等人工智能技術(shù)能力,率先突破傳統(tǒng)語(yǔ)音范圍,形成獨(dú)特的“全智能”效應(yīng),2011年,捷通華聲全面整合具有自主知識(shí)產(chǎn)權(quán)的多項(xiàng)智能人機(jī)交互技術(shù),突破性地創(chuàng)建了第一個(gè)最大最全的人工智能技術(shù)云服務(wù)開放平臺(tái)——靈云(www.hcicloud.com),率先拉開了中國(guó)人工智能產(chǎn)業(yè)化的大幕!
2014年伊始,人工智能在幾大互聯(lián)網(wǎng)巨頭的推波助瀾中成為產(chǎn)業(yè)焦點(diǎn),而智能語(yǔ)音則為人工智能領(lǐng)域中不可或缺的組成部分。人工智能是一個(gè)由淺入深的智能化模型、機(jī)制和過程,智能語(yǔ)音處于較淺層次上;在深層次上,人工智能意味著基于機(jī)器學(xué)習(xí)技術(shù)的知識(shí)表達(dá)、歸納、推理等智能計(jì)算過程。可以說智能語(yǔ)音等人機(jī)交互技術(shù)是人工智能的觸角,智能計(jì)算是人工智能的核心,二者缺一不可,共同組成一個(gè)智能網(wǎng)絡(luò)。在清華大學(xué)各人工智能頂尖學(xué)科團(tuán)隊(duì)的支持下,捷通靈云智能語(yǔ)音等人機(jī)交互能力更加成熟。靈云語(yǔ)音識(shí)別,采用最新深度神經(jīng)網(wǎng)絡(luò)算法技術(shù),識(shí)別準(zhǔn)確率突破95%;語(yǔ)音合成方面,捷通靈云在國(guó)內(nèi)率先推出支持中、英、德、法、阿拉伯等多達(dá)十三種國(guó)際語(yǔ)言的語(yǔ)音合成技術(shù)服務(wù),在國(guó)內(nèi)智能語(yǔ)音服務(wù)達(dá)到了50%的市場(chǎng)占有率,而靈云智能語(yǔ)音 “TTS+ASR”使人與機(jī)器之間“說與聽”兩項(xiàng)能力的強(qiáng)化,讓人與機(jī)器的自然交流變得更加通暢。
靈云OCR與手寫識(shí)別等智能圖像識(shí)別技術(shù),又猶如人的“眼睛與手”。目前靈云手寫識(shí)別已能夠識(shí)別92種國(guó)際語(yǔ)言;靈云OCR更是在文檔、票據(jù)、證照識(shí)別領(lǐng)域中異軍突起,保證靈云智能平臺(tái)擁有更全面的“視覺與感觀”能力。
人類無論用語(yǔ)音交互還是通過文字傳遞信息,其獲取信息的目的都是為了在相互理解之后進(jìn)行彼此的溝通。靈云智能平臺(tái)近日全面升級(jí)并推出的語(yǔ)義分析、意圖理解及機(jī)器翻譯,進(jìn)一步推動(dòng)靈云向人工智能更深層次發(fā)展,不僅讓靈云“能說會(huì)聽”、“能寫會(huì)看”,也開始學(xué)會(huì)如何思考。如今,通過靈云語(yǔ)音識(shí)別不在僅是聽懂人的話,同時(shí)能夠?qū)λR(shí)別出的文字信息進(jìn)行分析理解,然后應(yīng)用靈云語(yǔ)音合成技術(shù)將所要表達(dá)的信息以語(yǔ)音方式朗讀出來,從而實(shí)現(xiàn)人與機(jī)器交流的一個(gè)完整應(yīng)用過程。
隨著人工智能在互聯(lián)網(wǎng)產(chǎn)業(yè)中關(guān)注度越來越高,人工智能似乎一夜間成為產(chǎn)業(yè)的熱點(diǎn),捷通靈云智能平臺(tái)憑借對(duì)人工智能產(chǎn)業(yè)發(fā)展的獨(dú)特理念與執(zhí)著信心,終于逐漸顯現(xiàn)出其超前的魄力的魅力。
捷通華聲創(chuàng)始人張連毅表示:“靈云智能平臺(tái)的創(chuàng)建,不僅有力推動(dòng)智能語(yǔ)音等人機(jī)交互技術(shù)在中國(guó)的發(fā)展與普及化應(yīng)用,也改變了智能語(yǔ)音產(chǎn)業(yè)發(fā)展的趨勢(shì)。伴隨產(chǎn)業(yè)的需求變化、技術(shù)的跨越式進(jìn)步,在清華大學(xué)的支持下,靈云智能平臺(tái)已成功完成向多模態(tài)、全方位人工智能云平臺(tái)的升級(jí)與發(fā)展。如果說捷通華聲是中國(guó)人工智能產(chǎn)業(yè)的倡導(dǎo)者,那么捷通華聲靈云智能平臺(tái)就是中國(guó)人工智能產(chǎn)業(yè)的開拓者。”
靈云全方位人工智能體驗(yàn)平臺(tái)www.hcicloud.com
公司簡(jiǎn)介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶寄語(yǔ) | DOIT歷程 | 誠(chéng)聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.