Agent:操作系統(tǒng)級的智能入口
宣善明認為,Agent不再是單一任務工具,而是“操作系統(tǒng)級別的入口”。Agent既是人與AI交互的統(tǒng)一接口,還能進行組織、編排及自我進化??梢韵胂笠幌拢磥砦覀兛梢砸劳蠥gent體系,一個人即可組建公司,通過編排AI員工形成團隊,甚至進一步擴展成復雜的AI組織。
與傳統(tǒng)AI模型不同,Agent的核心挑戰(zhàn)在于其不確定性。我們無法完全預設Agent行為,系統(tǒng)必須具備發(fā)散性評估與自我優(yōu)化能力,在持續(xù)反饋中實現(xiàn)自主進化。
這要求Agent具備四大核心能力:統(tǒng)一入口、可擴展性、自我進化能力和評估體系等。
智能中樞:Agent Infra的底層支撐
2030年,經(jīng)濟體將演變?yōu)橐粋€ Agent 經(jīng)濟體,其中每個 Agent 像神經(jīng)網(wǎng)絡的節(jié)點一樣互聯(lián)協(xié)作,通過統(tǒng)一入口分發(fā)任務并與其他 Agent 交互完成工作。這樣的體系高度復雜、動態(tài)且自組織,無法完全依賴人工手工搭建,因此需要系統(tǒng)化的 Agent Infra 來支撐。
首先,需要構建智能中樞。
商湯大裝置Agent Infra智能中樞體系由公共能力組件、外部工具接入以及自我進化機制共同組成的體系,使agent能通過持續(xù)進化不斷擴展自身能力。

· 公共能力組件是Agent Infra智能中樞體系中支撐Agent高效運行的核心基礎模塊。它通過提供統(tǒng)一的Memory、Agent元數(shù)據(jù)管理、沙盒環(huán)境、規(guī)劃器和摘要器等公共能力,使Agent能夠高效地管理自身知識、跟蹤任務狀態(tài)、進行安全隔離的實驗等,以及在復雜任務中實現(xiàn)智能規(guī)劃與決策。
· 在外部工具接入能力方面,體系引入經(jīng)過遴選與驗證的工具和MCP,確保Agent在面對自身無法解決的問題時能夠調(diào)用外部資源,同時通過開放搜索MCP發(fā)現(xiàn)和評估新的功能資源,從而拓展任務覆蓋范圍并提升問題解決能力。
· 自我進化機制是支撐智能體持續(xù)提升能力的核心環(huán)節(jié)。該機制依托MCP Builder和Agent Builder兩個關鍵組件構建。MCP Builder主要用于快速構建基礎功能。相比之下,Agent Builder面向更復雜的智能體需求,它不僅僅生成一段代碼邏輯,而是賦予生成的智能體自我驗證、自我迭代、自我思考的能力。通過Agent Builder,智能體可以在實際應用中不斷反思與優(yōu)化自身行為,從而實現(xiàn)能力的自主擴展與進化。
除此之外,Agent Infra智能中樞Memory體系承擔著智能體感知、決策與自我迭代的功能。我們基于多模態(tài)解析構建了統(tǒng)一的Knowledge Graph,將文本、圖像、視頻等多源信息進行結構化存儲與索引,以實現(xiàn)高效檢索與使用。此外,Memory還用于智能體的自我迭代,每次執(zhí)行任務后,成功與失敗路徑都會被記錄于Knowledge Graph,供下一次Planning參考,使Agent能夠低成本、高效地沿用成功經(jīng)驗、規(guī)避失敗路徑,實現(xiàn)自主進化。
Agent Infra端到端實踐:閉環(huán)驗證與產(chǎn)業(yè)落地
在商湯大裝置的Agent Infra實踐中,端到端構建流程涵蓋從Agent生成、離線驗證到灰度上線的完整閉環(huán)。
· SRE-Agent:商湯作為業(yè)內(nèi)領先的AI基礎設施廠商,SRE-Agent是保障其大規(guī)模算力集群穩(wěn)定運行的重要工具。宣善明現(xiàn)場演示了SRE-Agent進行故障排查的過程。當一個2000P集群中的任務無法啟動時,SRE-Agent能自主完成故障排查。它對接日志與監(jiān)控系統(tǒng),結合知識庫生成排查計劃,并在執(zhí)行中動態(tài)調(diào)用檢索工具,最終產(chǎn)出根因分析與解決方案。與人工數(shù)小時的排查相比,分鐘級即可完成,大幅提升運維效率并減少人力投入。
· 具身智能Agent:另外在具身智能領域,商湯大裝置開發(fā)了具身仿真數(shù)據(jù)生成Agent,來為客戶提供高效的數(shù)據(jù)生成能力。該Agent基于已有的仿真平臺(如NVIDIA仿真環(huán)境),通過Agent系統(tǒng)進行全流程規(guī)劃與任務拆解,進行場景素模構建和場景集成,并能夠進行光影調(diào)整與參數(shù)優(yōu)化等來形成大量高質量數(shù)據(jù)集。可以看到,Agent在數(shù)據(jù)生成環(huán)節(jié)的自主規(guī)劃與智能執(zhí)行能力,能夠從數(shù)據(jù)多樣性與場景覆蓋等角度,幫助客戶快速獲取可用于訓練和驗證的具身智能數(shù)據(jù)。
· 行業(yè)性Agent:商湯大裝置在某大型項目中,實現(xiàn)了以唯一業(yè)務入口統(tǒng)一管理和調(diào)度超過100個Agent,大部分由頂層Agent自主生成,系統(tǒng)覆蓋30余內(nèi)部業(yè)務系統(tǒng)、4000余工具及十多個垂類模型,實現(xiàn)了AI自主定位與任務執(zhí)行,成功驗證了Agent Infra在行業(yè)級項目落地中的可擴展性和高效性。
“我們正在見證一個完整閉環(huán)的逐步成型。商湯大裝置的AI Agent Infra實踐,正通過基礎設施與智能體模板、開放生態(tài)社區(qū)以及Marketplace等層層推進,支撐起繁榮的Agent經(jīng)濟生態(tài)。這不僅實現(xiàn)了從技術落地到產(chǎn)業(yè)化的閉環(huán),更展現(xiàn)了商湯在AI Agent時代的戰(zhàn)略遠見?!?宣善明總結道。