圖:村上隆首場中國直播,火山同傳提供實時智能同傳字幕

本場直播中,火山引擎旗下的火山同傳產(chǎn)品獨家全程提供了實時智能同傳字幕,通過深厚的技術(shù)實力和穩(wěn)定的產(chǎn)品服務(wù),給中國觀眾帶來了流暢的跨國直播體驗。

火山同傳對外首秀 打造“影院級字幕”

在傳統(tǒng)會議、直播場景中,機器翻譯解決方案提供的字幕通常是“打字級字幕”,觀看這種字幕,觀眾需要投入很大的精力在瀏覽和理解字幕上,觀眾體驗非常差。原因有兩個:一是“打字級字幕”全程會不停跳動,觀眾的視線無法聚焦,容易造成視覺疲勞。另一個,每句字幕的停留時間過短,觀眾往往來不及看完就會跳到下一句。

圖片2.png

圖:火山同傳“影院級字幕”,流暢穩(wěn)定

圖片3.png

圖:傳統(tǒng)“打字級字幕”,頻繁跳動

為了提升用戶體驗,此次村上隆的跨國直播中,火山同傳創(chuàng)新性地推出了“影院級字幕”方案,與視頻流整合后流暢地輸出完整的譯文語句,在屏幕上逐句顯示。觀眾可以清楚看到精準的字幕結(jié)果,免受字幕跳動帶來的視覺干擾。

在本次村上隆的跨國直播中,火山同傳的“影院級字幕”方案就引起了觀眾們的好奇和質(zhì)疑。在彈幕里,就有個別觀眾質(zhì)疑真的是否在直播。

圖片4.png

圖:村上隆直播中的字幕吸引了關(guān)注

火山同傳產(chǎn)品經(jīng)理表示:“這種質(zhì)疑在我們看來,是對我們的肯定。為了實現(xiàn)‘影院級字幕’效果,并在直播中保證‘音畫字同步’,火山同傳準備了一套延時字幕方案。”

該方案中,音頻被推送到主控端完成機器同傳后,人工利用直播的推拉流延時時間,在機器同傳的結(jié)果上進行內(nèi)容校對,以保證投屏字幕的強可讀性。之后,火山同傳的畫面延時功能,能夠保證校對后的字幕在延時結(jié)束后準時送出,與延時后的畫面整合并同步推流到觀眾端,最終呈現(xiàn)出添加了高質(zhì)量字幕的直播畫面。

保證一場專業(yè)直播同傳字幕質(zhì)量的關(guān)鍵是定向的技術(shù)優(yōu)化。字節(jié)跳動杰出科學家、人工智能實驗室總監(jiān)李磊介紹,在村上隆的直播中,火山翻譯團隊除了采用前沿的神經(jīng)網(wǎng)絡(luò)機器翻譯技術(shù)進行模型訓練外,還針對直播場景引入了領(lǐng)域適應(yīng)技術(shù),將村上隆以往的訪談和演講數(shù)據(jù)用于優(yōu)化算法,并對口語規(guī)范化、專業(yè)術(shù)語定制都進行了特殊優(yōu)化處理,確保最終呈現(xiàn)的字幕能夠簡潔、精準。

百項專利、50余篇學術(shù)論文 打造專業(yè)翻譯產(chǎn)品矩陣

火山同傳“影院級字幕”的背后,是火山翻譯團隊超過40位頂尖科學家、工程師打磨出的機器翻譯模型。

火山翻譯由字節(jié)跳動計算機研究科學家、工程師、產(chǎn)品經(jīng)理、產(chǎn)品運營和語言專家組成的專業(yè)團隊研發(fā),擁有包括火山同傳、火山翻譯API、火山翻譯Studio、瀏覽器翻譯助手等在內(nèi)的一系列矩陣產(chǎn)品。

目前,火山翻譯已支持超過50個語種的全語向互譯,應(yīng)用于辦公、娛樂、新聞等各類場景中,每天為來自全球的過億用戶提供優(yōu)質(zhì)的翻譯體驗。

火山翻譯團隊擁有百余項技術(shù)發(fā)明專利,在人工智能頂級國際學術(shù)會議已發(fā)表50余篇學術(shù)論文。其自研的高性能序列推理引擎LightSeq,推理速度業(yè)界領(lǐng)先,比原生系統(tǒng)提高10倍,翻譯速度可達20,000詞/秒。

在近期剛結(jié)束的機器學習頂級賽事——2020國際機器翻譯大賽(WMT2020)中,經(jīng)過全球語言專家充分評估,火山翻譯在「中文-英語」語向翻譯項目上力壓群雄,以顯著優(yōu)勢獲得世界冠軍。

在人工智能領(lǐng)域,“如何讓AI更好地賦能行業(yè)”一直是個值得探索的方向?;鹕椒g的火山同傳在這個方向上對外邁出了堅實的一步,將機器同傳的高效快捷和人工翻譯的精準進行結(jié)合。此次村上隆跨國直播中,火山同傳就為觀眾提供了“影院級字幕”的直播體驗,實現(xiàn)“1+1>2”的效果。

李磊表示:“火山翻譯將致力于打造前沿研究、產(chǎn)品研發(fā)和用戶反饋的閉環(huán),在迭代中快速進步。希望火山翻譯能幫助更多用戶進行國際跨語言交流,為行業(yè)乃至整個社會發(fā)展貢獻一份力量?!?/p>

分享到

zhangnn

相關(guān)推薦