數(shù)智人主播當(dāng)家,從形似到神似
據(jù)了解,第一財(cái)經(jīng)頻道此次采用的數(shù)智人主播,根據(jù)欄目場(chǎng)景需求做到了更加精細(xì)化的定制,華院計(jì)算基于自研的大規(guī)模多模態(tài)預(yù)訓(xùn)練技術(shù)及少樣本可控生成技術(shù),僅需采集主持人數(shù)分鐘自由講話視頻,便創(chuàng)建出了生動(dòng)的數(shù)智人形象,擁有如同真人主播的情感表情、形象氣質(zhì)、語(yǔ)音語(yǔ)調(diào)、口唇表情、肢體動(dòng)作。
利用這一少樣本可控生成技術(shù),節(jié)目組在后續(xù)使用中無(wú)需真人出鏡,解決拍攝、視頻制作周期漫長(zhǎng)等一系列問(wèn)題,可以實(shí)現(xiàn)在短時(shí)間內(nèi)即生成一期節(jié)目。在這個(gè)過(guò)程中,用戶僅需輸入文本,即可實(shí)現(xiàn)同音色語(yǔ)音合成、口型同步生成、軀體動(dòng)作自適應(yīng)匹配等多位一體的形象生成,輸出信息包括聲音、姿態(tài)、表情、動(dòng)作等,與輸入文本自然匹配。
華院計(jì)算為頻道提供了端云協(xié)同2D真人數(shù)智人驅(qū)動(dòng)技術(shù),其中云端算法主要負(fù)責(zé)聲音合成、姿態(tài)和表情等內(nèi)容生成相關(guān)任務(wù),而端側(cè)負(fù)責(zé)將這些內(nèi)容數(shù)智人視頻,并保證音頻與視頻的同步。從而通過(guò)超寫(xiě)實(shí)數(shù)智人進(jìn)行播報(bào),并結(jié)合視頻內(nèi)容理解分析技術(shù)實(shí)現(xiàn)媒體資源管理,利用多維度標(biāo)簽文本-視覺(jué)的語(yǔ)義對(duì)齊,以1:1時(shí)間實(shí)現(xiàn)一鍵視頻生成。
在第一財(cái)經(jīng)新近發(fā)布的《秒懂金融》欄目中,除了豐富的股市點(diǎn)評(píng)和分析內(nèi)容外,節(jié)目的一大亮點(diǎn)就是除了連線嘉賓為真人外,節(jié)目畫(huà)面中的演播室場(chǎng)景、主持人李婷、現(xiàn)場(chǎng)嘉賓應(yīng)有為均通過(guò)華院計(jì)算數(shù)智人技術(shù)合成,通過(guò)文字和語(yǔ)音驅(qū)動(dòng)形成兩個(gè)數(shù)智人對(duì)話的神奇畫(huà)面。
攤薄成本、技術(shù)成熟,商業(yè)模式大變革
華院計(jì)算作為行業(yè)內(nèi)最早布局AI數(shù)智人的企業(yè)之一,已為政府機(jī)構(gòu)、品牌商家、意見(jiàn)領(lǐng)袖等提供一系列AI數(shù)智人產(chǎn)品和解決方案,通過(guò)標(biāo)準(zhǔn)化的價(jià)格、產(chǎn)品和服務(wù)逐步擴(kuò)大當(dāng)前市場(chǎng)份額。
華院計(jì)算專(zhuān)注人工智能算法研究,目前在數(shù)智人領(lǐng)域已與包括金融保險(xiǎn)行業(yè)的中國(guó)人壽、消費(fèi)行業(yè)的聯(lián)合利華以及傳媒領(lǐng)域的第一財(cái)經(jīng)等在內(nèi)的許多頭部企業(yè)開(kāi)啟深度合作。
此次與第一財(cái)經(jīng)節(jié)目組達(dá)成內(nèi)容生成方面的合作,給AI+傳媒這一全新行業(yè)帶來(lái)了新的呈現(xiàn)可能,實(shí)現(xiàn)①響應(yīng)號(hào)召,探索文化和科技融合的有效機(jī)制,加快發(fā)展新型文化業(yè)態(tài),形成更多新的文化產(chǎn)業(yè)增長(zhǎng)點(diǎn);②幫助用戶快速創(chuàng)作和生成視頻內(nèi)容。用戶可以輸入關(guān)鍵詞或簡(jiǎn)要描述,華院計(jì)算數(shù)智人視頻生成平臺(tái)將根據(jù)這些信息生成相關(guān)視頻,為用戶提供快速高效的視頻制作方案;③讓優(yōu)質(zhì)內(nèi)容獲得乘法效應(yīng),加強(qiáng)對(duì)內(nèi)容運(yùn)營(yíng)的重視、或進(jìn)一步擴(kuò)大視頻傳播范圍都是不可或缺的提效工具。
華院計(jì)算數(shù)智人視頻生成平臺(tái)界面截圖
以往,復(fù)雜的訓(xùn)練樣本數(shù)據(jù)采集,導(dǎo)致數(shù)智人定制過(guò)程長(zhǎng)、成本高。如今,隨著生成式人工智能(AIGC)技術(shù)的不斷進(jìn)步,為數(shù)智人提供了強(qiáng)大的技術(shù)支撐,更高效、更逼真、更智能的“數(shù)智人”應(yīng)用正在廣泛落地、適應(yīng)不同的場(chǎng)景和需求,展現(xiàn)出無(wú)限的可能性。越發(fā)擬真的外觀,自然生動(dòng)的表情,再加上大語(yǔ)言模型技術(shù)加持下具備“最強(qiáng)大腦”,推出更高智慧和個(gè)性化定制的的數(shù)智人,并可通過(guò)技術(shù)手段進(jìn)行批量生產(chǎn),同時(shí)在橫向和縱向具強(qiáng)擴(kuò)展性,為企業(yè)在內(nèi)容運(yùn)營(yíng)和傳播方面的降本增效帶來(lái)顯著提升。
華院計(jì)算數(shù)智人開(kāi)發(fā)平臺(tái)體驗(yàn)入口:https://aigc.unidt.com/dolly/base/next/#/login