AAAI 2021是人工智能領域的國際頂級學術會議,歷史悠久,由美國美國人工智能協(xié)會主辦(Association for the Advance of Artificial Intelligence),覆蓋了機器學習、視覺、NLP等人工智能多個重點領域。據(jù)悉,AAAI 2021于2月2日到2月9日在線上舉辦,大會一共收到9034篇論文,競爭激烈,其中有效審稿有7911篇,最終錄取1692篇,接收率為21.4%。
阿里巴巴這次共有54篇論文入選大會,是全球入選最多的科技公司之一,在人工智能多個領域均有突破,尤其是NLP領域。在論文《Nested Named Entity Recognition with Partially-Observed TreeCRFs》中,阿里研究人員關注NLP領域中的重要研究任務嵌套命名實體識別(Nested Named Entity Recognition,簡稱Nested NER),提升識別準確率,較原來的業(yè)界最佳模型提升0.3%(ACE04數(shù)據(jù)集)和0.7%(ACE05數(shù)據(jù)集),不斷逼近極限。
據(jù)介紹,所謂NER中的“實體”包括人名、地名、機構名等,嵌套是指多個實體疊加組合,像醫(yī)學名詞“肝癌檢查”就包括多個實體:“肝癌”是一種癌癥,“肝”是一種人體器官,“癌”是一種疾病類型…這種嵌套在醫(yī)療文本中廣泛存,要讓AI讀懂病歷、輔助醫(yī)生診療,必須解決這一難題。阿里研究人員提出了一種新的建模嵌套實體識別任務的方式,并應用新算法提升計算效率,從而突破原有的技術瓶頸。讓AI更懂病歷。
除了54篇大會論文之外,阿里還有多篇論文入選AAAI2021的workshop,希望用科技來解決社會問題。在論文《Transformer-based Language Model Fine-tuning Methods for COVID-19 Fake News Detection》中,阿里研究人員關注新冠疫情中廣泛傳播的謠言和假新聞問題,他們提出了一種新穎的基于transformer編碼器的假新聞分類模型,能夠精準地捕捉到不同新聞之間的文本信息和語義信息差別,從而判別新聞的真假性。這彌補了通用語言模型在假新聞識別方面的缺陷。
據(jù)介紹,以2017年達摩院成立為標志,阿里巴巴在基礎科研和創(chuàng)新技術研究上傾注全力,多次包攬國際頂會的收稿冠軍和最佳論文。其中,29篇論文入選人工智能頂會SIGIR 2020,全球第一;5篇論文入選網(wǎng)絡通信頂會SIGCOMM 2020,刷新中國紀錄。