上圖示例展示的是銀行按揭貸款文檔生成的規(guī)則,圖片來自亞馬遜云科技博客

以電商平臺(tái)退換貨規(guī)定為例,系統(tǒng)會(huì)自動(dòng)抽取文檔中的關(guān)鍵變量,如“產(chǎn)品類別”、“退貨天數(shù)”等,并梳理出它們之間的規(guī)則。例如,一份簡(jiǎn)單的退貨文檔,系統(tǒng)就能自動(dòng)提取出78條規(guī)則和81個(gè)變量。

雖然RAG技術(shù)也有助于緩解幻覺問題,但與這里的推理檢查有明顯不同。前者主要負(fù)責(zé)為大模型提供準(zhǔn)確、相關(guān)的背景知識(shí)。而推理檢查負(fù)責(zé)在推理的最后一步,驗(yàn)證大模型基于知識(shí)生成的回答是否嚴(yán)格遵守業(yè)務(wù)邏輯和規(guī)則。

郭韌介紹稱,如果把規(guī)則文檔丟給RAG系統(tǒng),讓RAG系統(tǒng)基于來提供規(guī)則約束力,這種做法不僅會(huì)消耗大量Token,成本會(huì)很高,而且模型能不能從大量?jī)?nèi)容里準(zhǔn)確提取規(guī)則都會(huì)存疑,最后的效果會(huì)大打折扣。

評(píng)估校驗(yàn)和完善邏輯規(guī)則,讓規(guī)則用于業(yè)務(wù)生產(chǎn)環(huán)境

規(guī)則和變量初步創(chuàng)建成功后,還不能直接用于生產(chǎn)環(huán)境。接下來會(huì)對(duì)生成的規(guī)則進(jìn)行評(píng)估、校驗(yàn),過程中,業(yè)務(wù)專家可以對(duì)這些規(guī)則進(jìn)行修改和修訂,從而讓規(guī)則更準(zhǔn)確和完善。評(píng)估、校驗(yàn)大致是這樣的:

系統(tǒng)首先會(huì)用AI自動(dòng)生成各種各樣的測(cè)試場(chǎng)景(省去了手動(dòng)設(shè)計(jì)測(cè)試用例的麻煩),包含客戶可能問的問題和模擬模型給的答案,業(yè)務(wù)專家先對(duì)測(cè)試用例進(jìn)行判斷,把它標(biāo)記為有效(Valid)、無效(Invalid)或部分滿足(Satisfiable)。

上圖展示的測(cè)試用例,用戶填寫期望結(jié)果,然后進(jìn)入驗(yàn)證流程,圖片來自亞馬遜云科技博客

比如,當(dāng)用戶詢問:蘋果產(chǎn)品的退換貨政策是什么?

如果測(cè)試用例中回答,“蘋果產(chǎn)品有15天退貨期,5天內(nèi)商品完好可退貨”,則是完全符合規(guī)則的,人類專家會(huì)標(biāo)記為有效(Valid)示例;

如果測(cè)試用例中回答,“蘋果產(chǎn)品15天內(nèi)可退貨?!暗鄙倭恕吧唐吠旰谩边@個(gè)條件,人類專家就會(huì)把它標(biāo)記為部分滿足(Satisfiable)的示例;

如果測(cè)試用例中回答說,“蘋果產(chǎn)品30天內(nèi)可退貨?!蹦秋@然是違反規(guī)則的,人類專家就會(huì)把它標(biāo)記為無效(Invalid)示例。

測(cè)試驗(yàn)證時(shí),由套上了”緊箍咒“的AI模型對(duì)測(cè)試用例進(jìn)行判斷,如果判斷結(jié)果跟人為判斷是一致的,那這項(xiàng)測(cè)試就是通過了。如果發(fā)現(xiàn)不一致,專家可以通過自然語言反饋或直接編輯的方式,對(duì)規(guī)則進(jìn)行微調(diào),確保其與真實(shí)業(yè)務(wù)邏輯完全吻合。

整個(gè)過程中由于有大模型的輔助,它還可以給出完善規(guī)則的建議。比如,某產(chǎn)品支持七天以內(nèi)退貨,人類專家判斷”退貨天數(shù)為7天“是有效(Valid)示例,而系統(tǒng)會(huì)認(rèn)為規(guī)則不充分,應(yīng)該表述為在七天以內(nèi)可退貨。

通過這種人機(jī)協(xié)同的方式,策略的更新和迭代過程變得更可控、更可靠。把這套規(guī)則上線后,就成了業(yè)務(wù)模型的一套”緊箍咒“,實(shí)時(shí)審查AI在實(shí)際應(yīng)用中的每一次輸出,從而避免因業(yè)務(wù)幻覺帶來的風(fēng)險(xiǎn)。

概率到算出來確定性,AI進(jìn)入可驗(yàn)證階段

當(dāng)一些AI安全工具還在靠不確定的概率和經(jīng)驗(yàn)時(shí),Amazon Bedrock Guardrails的自動(dòng)推理檢查功能提供了可被證明的信任,是具有確定性的安全保障,這對(duì)于金融、能源、醫(yī)療等高度監(jiān)管的行業(yè)至關(guān)重要。

亞馬遜云科技攜手普華永道(PwC)打造了一套面向公用事業(yè)的停電管理優(yōu)化系統(tǒng)。該方案通過自動(dòng)推理檢查技術(shù),對(duì)AI生成的應(yīng)急響應(yīng)流程進(jìn)行邏輯校驗(yàn)和優(yōu)化,確保處理步驟既符合法規(guī),又具備可操作性。

普華永道全球及美國(guó)商業(yè)技術(shù)與創(chuàng)新官M(fèi)att Wood表示:“我們與亞馬遜云科技在自動(dòng)推理檢查方面的合作,堪稱負(fù)責(zé)任的AI領(lǐng)域的重大突破。我們十分榮幸成為亞馬遜云科技該項(xiàng)創(chuàng)新成果的首發(fā)合作伙伴,未來還會(huì)將這一創(chuàng)新成果推廣至制藥、公用事業(yè)、云合規(guī)等各個(gè)領(lǐng)域?!?/p>

郭韌介紹稱,這里用的自動(dòng)推理并非新的技術(shù)概念,它背后的符號(hào)式AI(Symbolic AI)是人工智能最早期的分支之一,其核心思想就是將世界知識(shí)轉(zhuǎn)化為邏輯符號(hào),通過嚴(yán)謹(jǐn)?shù)耐评韥泶_保結(jié)論的正確性。

“過去十多年,亞馬遜云科技早已將自動(dòng)推理技術(shù)大規(guī)模應(yīng)用于Amazon S3、Amazon IAM等核心服務(wù)的權(quán)限校驗(yàn)與安全驗(yàn)證中,”郭韌在技術(shù)分享會(huì)上介紹,“它一直是保障云服務(wù)安全可靠的幕后基石?!?/p>

這些在背后經(jīng)過多年打磨的經(jīng)驗(yàn),現(xiàn)在通過Amazon Bedrock Guardrails直接開放給客戶。這意味著,企業(yè)不再需要從零開始構(gòu)建復(fù)雜的邏輯校驗(yàn)系統(tǒng),而是可以直接將亞馬遜云科技十年打磨的工具,快速構(gòu)建AI安全與合規(guī)能力,讓AI更靠近生產(chǎn)力。

目前,Amazon Bedrock Guardrails 中的自動(dòng)推理檢查現(xiàn)已在以下區(qū)域全面推出:美國(guó)東部(俄亥俄州、弗吉尼亞州北部)、美國(guó)西部(俄勒岡州)和歐洲(法蘭克福、愛爾蘭、巴黎)。

分享到

zhupb

相關(guān)推薦