當古典詩詞與現(xiàn)代風觸碰到AI技術(shù)后,生成出一首首個性化詩詞,祝福不再千篇一律,乘著拜年的習俗、伴著祝福的味道,讓很多人都體會了“一秒變李白”的神奇,也讓使用AI技術(shù)成為了拜年新風尚。
中國首個智能作詩送祝福應(yīng)用
中國是“禮儀之邦”,春節(jié)拜年是中國優(yōu)秀傳統(tǒng)文化的集中展示。通過使用人工智能技術(shù),由機器作出個性化的詩句,“AI李白”成為了中國首個被大量人群使用的智能作詩拜年送祝福的應(yīng)用。區(qū)別于其他智能作詩應(yīng)用,“AI李白”具有三個特點:
智能化:在研發(fā)階段,考慮到詩詞中有自己的平仄韻律美和組合規(guī)律,傳統(tǒng)的N-Gram語言模型表達能力有限,無法較好的處理長距離的上下文語言依賴問題。因此,百分點NLP團隊利用先進的深度神經(jīng)網(wǎng)絡(luò)技術(shù),訓(xùn)練出以春節(jié)祝福為主題的詩詞自動生成模型。
個性化:
“AI李白”不僅可以支持使用者向親人、朋友、師長、領(lǐng)導(dǎo)、愛人等拜年,還可以提供不同的風格和形式,不僅有唐詩、宋詞,還有祝福語、現(xiàn)代風、Freestyle等風格和形式,來滿足中國人在新春佳節(jié)互相拜年的需求。
趣味性:
為了讓大家在春節(jié)期間玩起來,增加了互動性和趣味性,在唐詩和宋詞中特別地支持用戶輸入個性化的4-8個字的祝福語句,從而生成個性化詩詞,并且在生成頁面用高亮的呈現(xiàn)效果散落在詩詞中。
中國是一個詩的國度,中國人的詩心一直在,“為你寫詩”的AI李白,借AI技術(shù)在春節(jié)期間激活了中國人的詩情。因其兼具祝福的高雅性和趣味性,通過在人民日報平臺、騰訊客戶端廣泛的傳播后,據(jù)人民日報統(tǒng)計,產(chǎn)品上線6天的點擊量就超過了1100萬,成為春節(jié)送祝福產(chǎn)品中被廣泛好評的爆款。
AI技術(shù)與古典文化的碰撞
“AI李白”H5由人民日報和全國黨媒信息公共平臺策劃出品,百分點提供技術(shù)支持,從開始的創(chuàng)意策劃、研發(fā)到優(yōu)化、測試、上線,時間只有短短數(shù)周,在H5上線后百分點和人民日報中央廚房相關(guān)團隊一起全程保障產(chǎn)品運行。
在整體設(shè)計上,“AI李白”產(chǎn)品是百分點卓越的自然語言處理技術(shù)與中國傳統(tǒng)文學(xué)典籍的巧妙結(jié)合,是技術(shù)+藝術(shù)的美好嘗試。 具體表現(xiàn)在:
首先,以深度神經(jīng)網(wǎng)絡(luò)展現(xiàn)詩詞韻律美。
百分點首席算法科學(xué)家蘇海波博士介紹,百分點NLP團隊利用了先進的深度學(xué)習技術(shù),采用長短期記憶網(wǎng)絡(luò)模型LSTM(Long-Short-Term Memory),結(jié)合大規(guī)模的詩詞訓(xùn)練語料,自動學(xué)習發(fā)現(xiàn)詩詞中的特征和規(guī)律,捕獲上下文復(fù)雜的語言依賴關(guān)系,從而訓(xùn)練出智能作詩的模型。尤其是在宋詞中,五十多個詞牌模型全部依靠AI習得。
其次,80余萬首詩詞構(gòu)建為大規(guī)模數(shù)據(jù)集。
為了達到更好的生成效果,在對詩詞上下文建模中,采用的訓(xùn)練語料包括全部的唐詩、宋詞、詩經(jīng)以及經(jīng)典的現(xiàn)代散文和現(xiàn)代詩共計80萬首,構(gòu)建了大規(guī)模的數(shù)據(jù)集。
第三,以詞向量技術(shù)呈現(xiàn)春節(jié)祝福主題。
在相關(guān)詩詞專家團隊的指導(dǎo)下,利用詞向量(Word2Vec)技術(shù)發(fā)現(xiàn)與春節(jié)語義相關(guān)的詞匯,并智能化填入各種風格的詩詞中,呈現(xiàn)出春節(jié)送祝福的美好意境。
第四,個性化祝福。
為了保證用戶插入的祝福語滿足詩詞自身的平仄和諧,百分點NLP團隊運用了啟發(fā)式搜索技術(shù)實現(xiàn)了這種插入邏輯,而且在前端還支持用戶上傳自己的照片,最終讓用戶生成的每一首詩詞都是滿滿的個性化祝福。
最重要的是智能審核環(huán)節(jié)。為保障詩詞中不出現(xiàn)黃色、非法或廣告詞匯,在本項目中所使用的敏感詞審核系統(tǒng)是百分點為主流媒體機構(gòu)開發(fā)并實際使用的一款智能審核系統(tǒng),系統(tǒng)中包括數(shù)萬條的敏感詞庫,結(jié)合先進的機器學(xué)習算法,可以實現(xiàn)各種敏感詞變種識別,并且從訓(xùn)練語料庫、輸入環(huán)節(jié)、生成詩詞的各個階段都有極為嚴苛的技術(shù)保障。
NLP:懂語言者得天下
在春節(jié)之際,“AI李白”讓人們使用人工智能技術(shù)寫詩,傳承了民族文化、弘揚中華經(jīng)典,同時,也是百分點NLP技術(shù)能力的一次對外展示。未來,在深度學(xué)習算法持續(xù)升級換代,以及在大量用戶使用中積累了更多數(shù)據(jù)集后,系統(tǒng)將持續(xù)進行自學(xué)習、自優(yōu)化。可以預(yù)想,“AI李白”會越來越貼近人寫詩的效果。
中國正成為全球人工智能(AI)行業(yè)領(lǐng)軍者,人工智能應(yīng)用逐漸走進各行各業(yè),讓人類生活更加美好。對比人工智能在視覺(圖像)、聽覺(語音)等的感知能力突飛猛進,認知智能應(yīng)用在引入深度學(xué)習方面還需要深化。但因NLP處于認知智能最核心的地位,被比爾·蓋茨形容為“人工智能皇冠上的明珠”,自然語言處理的技術(shù)的發(fā)展將會推動人工智能整體的進展。
實際上,NLP不僅是可以應(yīng)用于詩詞的自動生成,還可應(yīng)用在智能推薦、智能搜索、智能校驗、智能問答、智能商情等眾多的業(yè)務(wù)場景,百分點在這些方面積累了豐富的業(yè)務(wù)實踐經(jīng)驗,覆蓋新零售、媒體出版、公安、教育等行業(yè),未來在“NLP+”方面將會有越來越多的落地項目。