亚洲欧洲精品成人久久av18,永久不封国产av毛片

圖說：國際頂級會議ECCV2024

此外，在智能對話領(lǐng)域的研究成果也取得突破性進(jìn)展。今年5月入選2024年國際機(jī)器學(xué)習(xí)大會（ICML）的論文《基于強(qiáng)化學(xué)習(xí)的檢索增強(qiáng)大語言模型可信對齊》由中國科技大學(xué)、合肥綜合性國家科學(xué)中心人工智能研究所、螞蟻數(shù)科聯(lián)合申報(bào)。論文針對大語言模型容易遭受幻覺困擾、制造無效內(nèi)容的問題，提出了基于強(qiáng)化學(xué)習(xí)的“可信對齊”策略，該策略的目標(biāo)不只是“滿足用戶偏好”，而希望激勵模型生成更可信的內(nèi)容。相比傳統(tǒng)基于專家標(biāo)注樣本的監(jiān)督訓(xùn)練方式，“可信對齊”訓(xùn)練的模型更注重基于給定的上下文和邏輯給出可信的判斷。實(shí)驗(yàn)結(jié)果表明，該方案比開源基礎(chǔ)模型的準(zhǔn)確率提升55%，與準(zhǔn)確答案的對齊成本降低83%。此外，“可信對齊”在生成文字的流暢度方面比傳統(tǒng)方法提升30%，良好的性能將有利于語言模型在TO B嚴(yán)謹(jǐn)行業(yè)的應(yīng)用落地。

自監(jiān)督學(xué)習(xí)被認(rèn)為是機(jī)器智能達(dá)到人類水平的關(guān)鍵，其最大的特點(diǎn)是不依賴人工標(biāo)注的數(shù)據(jù)標(biāo)簽，可自主觀察和學(xué)習(xí)、提取有用的特征，并應(yīng)用于各種任務(wù)，與人類學(xué)習(xí)的方式相似。自監(jiān)督學(xué)習(xí)在為模型訓(xùn)練降本提效的同時(shí)，具備更好的知識泛化能力和持續(xù)學(xué)習(xí)能力，研究對推動AI發(fā)展有著深遠(yuǎn)意義。

分享到

螞蟻數(shù)科

xiesc

相關(guān)推薦

近期文章

熱門標(biāo)簽