率先打造音視頻專屬語音識別模型,準確率提升10% 隨著互聯(lián)網(wǎng)直播浪潮的興起,如何利用智能語音技術(shù)快速識別用戶的音視頻內(nèi)容、進行精準推薦和不健康內(nèi)容過濾,已經(jīng)成為各大直播和內(nèi)容分享平臺在日益激烈的市場競爭中的核心競爭力。但由于音視頻背景環(huán)境復雜且屬于半遠場,需要有大量數(shù)據(jù)積累才能實現(xiàn)準確識別。 憑借自身在音視頻領(lǐng)域數(shù)據(jù)的大量積累,騰訊云在業(yè)界率先推出了音視頻領(lǐng)域?qū)僬Z音識別模型,目前已在多家音視頻領(lǐng)域直播平臺和電商直播平臺應(yīng)用,經(jīng)客戶實測,識別準確率提升近10%。 

語種豐富度進一步提升,騰訊云語音識別加速落地 為滿足不同客戶群體需求,騰訊云語音識別今年在語種豐富度上持續(xù)發(fā)力,聯(lián)合微信智聆、騰訊國際業(yè)務(wù)語音技術(shù)實驗室、騰訊民漢翻譯等多個人工智能實驗室,在原有常見語種基礎(chǔ)上,開放了韓語、粵語的識別能力,后面會陸續(xù)開放對上海話等方言以及日語、泰語、印尼語等國外語言的語音識別能力。經(jīng)過長期的打磨訓練和效果調(diào)優(yōu),目前騰訊云語音識別各語種已廣泛應(yīng)用于會議記錄轉(zhuǎn)寫、視頻字幕、電話錄音質(zhì)檢等業(yè)務(wù)場景。 

 實際上,騰訊云憑借多年在智能語音領(lǐng)域的耕耘,已經(jīng)收獲眾多權(quán)威機構(gòu)的認可。在Gartner今年首次正式發(fā)布的《Magic Quadrant for Cloud AI Developer Services》研究報告中,騰訊云成為中國唯一入選Gartner云AI開發(fā)者服務(wù)魔力象限的云廠商。 騰訊云AI語音產(chǎn)品負責人周超表示:“騰訊云AI語音團隊未來仍將繼續(xù)打磨技術(shù),提供業(yè)界最具性價比的智能語音產(chǎn)品,推動智能語音在產(chǎn)業(yè)互聯(lián)網(wǎng)的廣泛落地。用更前沿的技術(shù)、更極致的產(chǎn)品體驗,幫助合作伙伴和客戶打造高效的專屬解決方案,助力各行各業(yè)的數(shù)字化和智能化轉(zhuǎn)型?!?nbsp;

分享到

zhangnn

相關(guān)推薦