本次競(jìng)賽的視頻語(yǔ)義理解任務(wù)包含分類(lèi)標(biāo)簽預(yù)測(cè)和語(yǔ)義標(biāo)簽預(yù)測(cè)兩個(gè)子任務(wù)。在分類(lèi)標(biāo)簽預(yù)測(cè)任務(wù)中,商湯NLP團(tuán)隊(duì)利用預(yù)訓(xùn)練模型和類(lèi)Transformer結(jié)構(gòu)對(duì)不同模態(tài)的數(shù)據(jù)進(jìn)行編碼和融合,并進(jìn)行了數(shù)據(jù)增強(qiáng)和模型融合,出色地完成了視頻中兩個(gè)級(jí)別的標(biāo)簽分類(lèi)。在語(yǔ)義標(biāo)簽預(yù)測(cè)任務(wù)中,商湯NLP團(tuán)隊(duì)提出了將命名實(shí)體識(shí)別模型和標(biāo)簽分類(lèi)模型結(jié)合的方案,經(jīng)過(guò)創(chuàng)新地?cái)?shù)據(jù)增強(qiáng)和模型融合后,不僅可以發(fā)掘文本中存在的標(biāo)簽,還可以提供額外的標(biāo)簽預(yù)測(cè)。憑借在多模態(tài)和NLP領(lǐng)域的不斷積累和創(chuàng)新能力,商湯NLP團(tuán)隊(duì)在這兩個(gè)子任務(wù)中均摘得桂冠。
隨著人工智能技術(shù)的發(fā)展以及在不同場(chǎng)景的快速落地,NLP領(lǐng)域的需求和應(yīng)用越來(lái)越廣泛,重要性日益突顯。例如在數(shù)字人領(lǐng)域,語(yǔ)音語(yǔ)義理解是數(shù)字人“AI大腦”的重要組成部分。基于語(yǔ)音識(shí)別(ASR)、語(yǔ)音合成(TTS)、自然語(yǔ)言理解(NLP)等技術(shù)組合,結(jié)合商湯所積累的語(yǔ)音語(yǔ)義理解和生成能力,以及知識(shí)庫(kù)自動(dòng)學(xué)習(xí)和模型訓(xùn)練能力,可以根據(jù)不同行業(yè)業(yè)務(wù)需求,快速定制AI數(shù)字人的智能語(yǔ)音對(duì)話(huà)和問(wèn)答系統(tǒng),并可通過(guò)接入后臺(tái)運(yùn)營(yíng)管理平臺(tái),支持知識(shí)庫(kù)的在線(xiàn)更新和維護(hù),實(shí)現(xiàn)AI數(shù)字人的深度學(xué)習(xí)和迭代升級(jí)。依托深厚的技術(shù)積累,商湯數(shù)字人解決方案已覆蓋超過(guò)200款手機(jī)、平板電腦、AR/VR眼鏡、智慧大屏及線(xiàn)下一體機(jī)等多種終端設(shè)備。在不久前知名研究機(jī)構(gòu)沙利文聯(lián)合頭豹研究院發(fā)布的報(bào)告中,商湯被列入數(shù)字人領(lǐng)導(dǎo)者陣營(yíng)。
自成立以來(lái),商湯科技長(zhǎng)期持續(xù)投入引領(lǐng)全球的人工智能技術(shù)研究,不斷斬獲佳績(jī),積累了深厚的技術(shù)基礎(chǔ)與人才優(yōu)勢(shì)。目前,商湯已在各項(xiàng)全球競(jìng)賽中已獲得70多項(xiàng)冠軍,發(fā)表超過(guò)600篇頂級(jí)學(xué)術(shù)論文,擁有8,000多項(xiàng)人工智能專(zhuān)利及專(zhuān)利申請(qǐng)。商湯科技還前瞻打造了行業(yè)領(lǐng)先的人工智能基礎(chǔ)設(shè)施SenseCore商湯AI大裝置,為技術(shù)研發(fā)和落地提供重要支撐,并幫助研究人員快速實(shí)驗(yàn)并驗(yàn)證新的想法,加速創(chuàng)新與迭代。
通過(guò)凝聚頂尖人才,持續(xù)打造更具擴(kuò)展性、更普惠的人工智能軟件平臺(tái),商湯未來(lái)將更加高效地推動(dòng)前沿AI技術(shù)的創(chuàng)新轉(zhuǎn)化和落地應(yīng)用,更好地滿(mǎn)足多領(lǐng)域、多場(chǎng)景的產(chǎn)業(yè)應(yīng)用,為學(xué)術(shù)及產(chǎn)業(yè)界發(fā)展貢獻(xiàn)力量。