論文作者:曾冠程、陳雪怡、胡嘉旺、齊少華、毛雅瑄、王展韜、聶一凡、李爽、馮秋陽、邱鵬旭、王鈺佳、韓文強、黃琳琰、李剛、莫晶晶、胡浩文(通訊)

企業(yè)中智能體系統(tǒng)的痛點:

論文指出,當(dāng)前企業(yè)級智能體系統(tǒng)在實際部署中存在顯著瓶頸:

1.知識鴻溝與工具編排混亂: 通用模型缺乏企業(yè)特定場景知識,難以正確編排工具鏈,常忽略關(guān)鍵工具類型。

2.規(guī)劃非標準化導(dǎo)致執(zhí)行偏差: 模型依賴泛化理解遵循非標準規(guī)劃,導(dǎo)致規(guī)劃到執(zhí)行的轉(zhuǎn)化過程不穩(wěn)定。

3.低代碼方案的局限性: 傳統(tǒng)低代碼方式對非技術(shù)人員門檻高,且構(gòu)建的工作流難以跨場景復(fù)用,非AI原生方法效率低下。

為解決這些問題,神州數(shù)碼團隊創(chuàng)新性地提出了“Routine”規(guī)劃范式:

Routine由多個更小、更具體的子任務(wù)執(zhí)行步驟組成,子任務(wù)是獨立的,但之間又相互關(guān)聯(lián)。因此,一條Routine執(zhí)行步驟需要包括足夠信息,讓智能體能夠穩(wěn)定地遵循規(guī)劃步驟,以下是一條完整的Routine子任務(wù)步驟組成:

步驟x. <步驟名稱>:<步驟行為描述>,該步驟輸入<入?yún)⒚枋?gt;,輸出<出參描述>,使用<步驟工具>工具;

類似場景下的Routine可能包含重疊的步驟,僅在某些流程段上有所不同,類似于同一工作流的不同分支。在這種情況下,可以通過創(chuàng)建分支步驟和執(zhí)行條件來合并類似的場景,以在一個Routine中設(shè)置多個相似的工作流。

步驟x. <步驟名稱>: 本步驟進行分支條件判斷:
      分支x-1步驟1. <步驟名稱>:如果<步驟條件>,……,使用<步驟工具>工具;
      分支x-1步驟2. <步驟名稱>:……,使用<步驟工具>工具;
      分支x-2步驟1. <步驟名稱>:如果<步驟條件>,……,使用<步驟工具>工具;

步驟y. <步驟名稱>:……,使用<步驟工具>工具;

步驟z. <步驟名稱>:……,使用<步驟工具>工具,并結(jié)束工作流;

Routine格式作為大語言模型生成規(guī)劃與實際執(zhí)行引擎之間的中間表示層,將每一步工具調(diào)用以標準化格式明確表達,涵蓋工具名稱、參數(shù)、依賴關(guān)系與執(zhí)行狀態(tài)等關(guān)鍵字段,能夠有效提升執(zhí)行模型遵循規(guī)劃的準確性,指導(dǎo)智能體完成多樣化的場景任務(wù)。

Routine智能體系統(tǒng)的核心架構(gòu)

以Routine機制為核心,研究團隊優(yōu)化了智能體系統(tǒng)的設(shè)計,包含四大關(guān)鍵模塊的優(yōu)化:

1.規(guī)劃模塊:

標準化格式: Routine由明確的子任務(wù)步驟組成,包含步驟編號、名稱、行為描述、輸入/輸出參數(shù)描述和調(diào)用的工具名稱,并且支持分支流程表示。

AI生成與優(yōu)化: 業(yè)務(wù)專家提供流程草稿,模型利用專用提示模板進行優(yōu)化,輸出結(jié)構(gòu)化的自然語言Routine。消融實驗證明,AI優(yōu)化的Routine能顯著提升執(zhí)行準確率,接近甚至部分超越人工標注基準。

2.執(zhí)行模塊:

小參數(shù)模型:采用小參數(shù)模型,通過指令微調(diào)與強化學(xué)習(xí)等方法訓(xùn)練,設(shè)置對應(yīng)的多步工具調(diào)用獎勵函數(shù),指導(dǎo)模型適配到場景,增強模型指令遵循能力。

a.上下文工程機制:研究團隊明確了智能體系統(tǒng)解決任務(wù)所需要的信息和配置,并構(gòu)建了對應(yīng)的上下文模板,其中不僅包含角色定義、任務(wù)背景與行為規(guī)范等常規(guī)內(nèi)容,還包含了系統(tǒng)參數(shù)、解決問題對應(yīng)的Routine規(guī)劃、變量記憶字典、工具列表等關(guān)鍵信息;

3.工具模塊:

MCP服務(wù)器:使用MCP服務(wù)器作為標準化工具層,對工具的名稱、參數(shù)、返回格式進行統(tǒng)一定義和管理。

4.記憶模塊:

流程記憶:存儲專家創(chuàng)建或AI優(yōu)化的場景Routine集合,根據(jù)用戶任務(wù)相似度動態(tài)檢索召回最相關(guān)的Routine,避免將所有Routine塞入上下文。

變量記憶: 將長文本參數(shù)等存儲為變量鍵,執(zhí)行時自動替換為實際值,極大減輕模型上下文壓力,減少參數(shù)傳遞中的符號錯誤。

幾個模塊相互協(xié)作,形成了功能完善的智能體系統(tǒng),如圖中所示:

文章中總結(jié)了以下工作:

1.結(jié)構(gòu)化規(guī)劃范式: 設(shè)計了一套結(jié)構(gòu)化的標準規(guī)劃格式“Routine”,顯著提升智能體通過多步工具調(diào)用解決復(fù)雜問題的穩(wěn)定性。在實際企業(yè)場景中的驗證表明,Routine顯著提升了模型工具調(diào)用的執(zhí)行準確性,將GPT-4o的性能從41.1%提高到96.3%,將Qwen3-14B的性能從32.6%提升到83.3%。

2.Routine遵循能力訓(xùn)練: 為進一步驗證Routine框架的有效性,研究團隊構(gòu)建了一個Routine格式的指令遵循訓(xùn)練數(shù)據(jù)集,通過指令微調(diào)和強化學(xué)習(xí),使其場景特定評估的準確性增至88.2%,表明該框架顯著改善了模型在執(zhí)行計劃方面的遵循性。

3.基于Routine的數(shù)據(jù)蒸餾:通過知識蒸餾方法生成了一個場景特定的多步驟工具調(diào)用數(shù)據(jù)集,在此蒸餾數(shù)據(jù)集上進行微調(diào)使模型準確性提高到95.5%,接近GPT-4o的水平。這些結(jié)果充分展示了Routine框架在領(lǐng)域特定工具使用模式優(yōu)化和增強模型適應(yīng)新場景能力方面的有效性。

后續(xù)應(yīng)用:

以AI for Process為核心方向,Routine框架的引入顯著提高了代理系統(tǒng)在企業(yè)場景中的適應(yīng)性,推動了AI for Process的技術(shù)愿景。它不僅優(yōu)化了領(lǐng)域特定工具使用模式,還增強了模型應(yīng)對復(fù)雜任務(wù)的能力,為企業(yè)流程的智能化和自動化提供了穩(wěn)健可靠的解決方案。未來,通過在訓(xùn)練流程中引入強化學(xué)習(xí),能更好地提升模型對多樣化場景的流程泛化能力。通過持續(xù)的研究和優(yōu)化,Routine框架有望在未來進一步提高智能體的自主性和適應(yīng)性,推進企業(yè)智能體在企業(yè)環(huán)境中的廣泛應(yīng)用。

神州問學(xué)將持續(xù)深耕場景化知識引擎與智能體協(xié)同技術(shù),致力于構(gòu)建具備更強流程認知與自適應(yīng)進化能力的企業(yè)級智能體,打通從復(fù)雜業(yè)務(wù)邏輯到敏捷AI落地的關(guān)鍵路徑,為企業(yè)智能化轉(zhuǎn)型提供堅實、靈活且可規(guī)?;募夹g(shù)支撐。

分享到

崔歡歡

相關(guān)推薦