騰訊云副總裁、騰訊云智能負(fù)責(zé)人、騰訊優(yōu)圖實(shí)驗(yàn)室負(fù)責(zé)人吳運(yùn)聲

在技術(shù)演進(jìn)層面,吳運(yùn)聲指出,當(dāng)前大多數(shù)AI系統(tǒng)仍處于“短期記憶”階段,尚難支撐復(fù)雜、高維的業(yè)務(wù)場(chǎng)景。要實(shí)現(xiàn)AI的實(shí)用性躍遷,需突破三個(gè)關(guān)鍵方向:

第一,具備“長(zhǎng)期記憶”能力,能夠處理長(zhǎng)鏈任務(wù)、跨對(duì)話記憶關(guān)鍵信息,并根據(jù)上下文動(dòng)態(tài)進(jìn)化,打通任務(wù)鏈條,實(shí)現(xiàn)真正意義上的任務(wù)執(zhí)行閉環(huán);

第二,邁向“全模態(tài)交互”,融合語(yǔ)言、圖像等多模態(tài)輸入輸出,推動(dòng)AI從理解語(yǔ)言走向理解世界,從“能答”躍升為“能動(dòng)”;

第三,構(gòu)建“多智能體協(xié)同”架構(gòu),通過(guò)任務(wù)拆解、容錯(cuò)補(bǔ)位等機(jī)制,構(gòu)成自組織、自進(jìn)化的“AI團(tuán)隊(duì)”,全面提升系統(tǒng)的魯棒性與可靠性。

在模型迭代方面,騰訊混元大模型持續(xù)“小步快跑”,推進(jìn)技術(shù)性能與工程能力雙重突破。騰訊最新發(fā)布的TurboS,是業(yè)界首個(gè)落地的超大規(guī)?;旌暇€性MoE模型,以“性能強(qiáng)、推理快、成本低”的優(yōu)勢(shì)穩(wěn)居全球權(quán)威榜單前列。在生成領(lǐng)域,混元模型不僅能極速生成高清圖像,更具備領(lǐng)先的3D建模能力,已廣泛應(yīng)用于AI設(shè)計(jì)智能體Lovart、3D打印平臺(tái)MakerWorld,模型社區(qū)下載量已超過(guò)230萬(wàn)次。

在平臺(tái)工具與生態(tài)建設(shè)上,騰訊形成了覆蓋B端與C端的“雙平臺(tái)”智能體體系。面向企業(yè)用戶,騰訊云智能體開(kāi)發(fā)平臺(tái)支持多Agent協(xié)同、任務(wù)流編排和多形態(tài)部署,具備強(qiáng)大的系統(tǒng)集成與業(yè)務(wù)適配能力。本次升級(jí)新增了零代碼多Agent協(xié)同機(jī)制、千萬(wàn)行級(jí)表格問(wèn)答支持以及智能工作流動(dòng)態(tài)調(diào)整功能,已應(yīng)用于如QQ瀏覽器QBot的全自動(dòng)任務(wù)執(zhí)行系統(tǒng),以及與邯鄲公積金中心共建的“數(shù)字柜臺(tái)”,后者已實(shí)現(xiàn)政務(wù)處理效率提升80%。

面向個(gè)人創(chuàng)作者,騰訊元器平臺(tái)聚焦公眾號(hào)智能體的構(gòu)建與生態(tài)拓展,打通騰訊文檔、微信支付MCP等資源,支持一鍵同步知識(shí)庫(kù)、自動(dòng)分發(fā)等功能。育兒類(lèi)賬號(hào)“童爸育兒”通過(guò)元器平臺(tái)構(gòu)建AI分身,7×24小時(shí)自動(dòng)答疑,準(zhǔn)確率超過(guò)95%,已累計(jì)服務(wù)6萬(wàn)多個(gè)家庭。

“AI不僅服務(wù)產(chǎn)業(yè),更承載著科技向善的信念?!眳沁\(yùn)聲表示,騰訊也正持續(xù)拓展AI在科研與文化等領(lǐng)域的邊界探索。

在科技領(lǐng)域,騰訊聯(lián)合科研團(tuán)隊(duì)打造了全球首個(gè)甲骨文多模態(tài)數(shù)據(jù)集,并應(yīng)用AI能力輔助文物修復(fù)。在天文科研中,AI探星計(jì)劃已協(xié)助發(fā)現(xiàn)45顆新脈沖星,推動(dòng)AI與基礎(chǔ)科學(xué)研究的深入結(jié)合,努力實(shí)現(xiàn)技術(shù)與文明的良性互動(dòng),為可持續(xù)未來(lái)打開(kāi)更多可能。

面向未來(lái),騰訊也在推動(dòng)智能體技術(shù)的人才培育與應(yīng)用創(chuàng)新。7月27日,騰訊云正式啟動(dòng)首屆黑客松Agent應(yīng)用創(chuàng)新挑戰(zhàn)賽,面向?qū)W生、企業(yè)與個(gè)人開(kāi)發(fā)者,鼓勵(lì)通過(guò)零代碼或低代碼方式,探索多元智能體應(yīng)用場(chǎng)景,激發(fā)更廣泛的AI創(chuàng)新力。

以下為演講全文:

各位嘉賓、媒體朋友們,大家好,歡迎來(lái)到騰訊論壇!

我是騰訊的吳運(yùn)聲。今天,我想和大家聊一聊大模型等核心技術(shù)的發(fā)展趨勢(shì),分享我們?cè)诖蛟臁案糜玫腁I”方面的一些思考與實(shí)踐。

我將從技術(shù)演進(jìn)、模型迭代、平臺(tái)工具和場(chǎng)景落地四個(gè)維度展開(kāi)。

過(guò)去幾年,大模型技術(shù)突飛猛進(jìn),但今天的大多數(shù)AI仍停留在“短期記憶”階段——對(duì)話一長(zhǎng)就斷,換話題就忘,系統(tǒng)提示詞一旦寫(xiě)死,能力就被鎖死。

我們認(rèn)為,真正能落地復(fù)雜業(yè)務(wù)的AI,必須具備“長(zhǎng)期記憶”:它要能處理長(zhǎng)鏈任務(wù),跑得穩(wěn)、記得住;要能跨對(duì)話,記住用戶關(guān)鍵信息;還要能根據(jù)任務(wù)動(dòng)態(tài)加載、替換、甚至自創(chuàng)工具,實(shí)現(xiàn)自我進(jìn)化。

同時(shí),傳統(tǒng)的“圖文問(wèn)答”已難以滿足用戶日益增長(zhǎng)的真實(shí)需求。

目前來(lái)看,我們正在邁向全模態(tài)交互系統(tǒng),它能融合語(yǔ)言、圖像、語(yǔ)音、動(dòng)作等多模態(tài)輸入輸出,讓用戶所見(jiàn)即所得,所說(shuō)即所動(dòng)。

更重要的是,它還得感知變化、執(zhí)行動(dòng)作,把自然語(yǔ)言轉(zhuǎn)化為數(shù)字人演示或機(jī)器人操作,真正打通AI與現(xiàn)實(shí)世界的最后一公里。

這是從“能答”到“能動(dòng)”的關(guān)鍵躍遷。

另外,我們也發(fā)現(xiàn),在面對(duì)復(fù)雜任務(wù)場(chǎng)景,單一智能體的能力也越來(lái)越難以支撐。

我們正逐步走向“多智能體協(xié)同”架構(gòu):不同Agent分工協(xié)作、并行執(zhí)行,構(gòu)建一個(gè)自組織、自進(jìn)化的“AI團(tuán)隊(duì)”。

平臺(tái)需要具備任務(wù)拆解、執(zhí)行重排、Agent容錯(cuò)補(bǔ)位等機(jī)制,真正實(shí)現(xiàn)系統(tǒng)級(jí)協(xié)同,支撐企業(yè)級(jí)復(fù)雜任務(wù),提升穩(wěn)定性、可解釋性和可靠性。

在這樣的技術(shù)趨勢(shì)下,今年以來(lái),騰訊混元大模型持續(xù)迭代、小步快跑。年初發(fā)布的旗艦?zāi)P蚑urboS,率先實(shí)現(xiàn)混合線性注意力機(jī)制與MoE架構(gòu)的融合,是業(yè)內(nèi)首個(gè)落地的超大規(guī)?;旌暇€性MoE模型,性能強(qiáng)、推理快、成本低,長(zhǎng)期穩(wěn)居全球權(quán)威榜單前列。

基于TurboS,混元T1進(jìn)一步提升推理與代碼生成能力,已在多個(gè)高難任務(wù)中展現(xiàn)國(guó)內(nèi)領(lǐng)先水平。以此為基座,混元家族不斷拓展:比如端到端語(yǔ)音模型Voice、多模態(tài)理解模型Vision相繼推出。尤其在多模態(tài)理解上,今年連續(xù)發(fā)布多款模型,在LMArena Vision全球大模型權(quán)威榜單中獲得國(guó)內(nèi)榜首,在中文能力上穩(wěn)居全球第一梯隊(duì)。

混元在多模態(tài)生成方面同樣領(lǐng)先,不僅能極速生成高清圖像,還具備人物一致性可控的視頻生成和全球領(lǐng)先的3D建模能力。其3D模型已被AI設(shè)計(jì)智能體Lovart、3D打印平臺(tái)MakerWorld廣泛調(diào)用,展現(xiàn)出強(qiáng)大的產(chǎn)品價(jià)值與技術(shù)潛力。

目前,混元模型已在騰訊內(nèi)部大規(guī)模落地,為響應(yīng)產(chǎn)業(yè)和開(kāi)發(fā)者需求,今年我們將全系中小規(guī)模模型全面開(kāi)源。相較于千億級(jí)模型,這些輕量模型更適合在算力受限環(huán)境下部署,能提供高性能、低成本的推理體驗(yàn)。比如剛剛開(kāi)源的混元A13B,僅百億參數(shù),就實(shí)現(xiàn)媲美千億模型的能力,開(kāi)源三天登上Hugging Face趨勢(shì)榜第二。

在多模態(tài)生成方面,混元也持續(xù)開(kāi)放文生圖、視頻、3D等領(lǐng)先能力,提供接近商用水平的開(kāi)源模型,圖像和視頻衍生模型超千個(gè),3D模型社區(qū)下載量超過(guò)230萬(wàn)。

今天,我們正式發(fā)布并開(kāi)源業(yè)界首個(gè)3D世界生成模型——混元3D世界模型1.0。用戶只需要輸入一句話或一張圖,幾分鐘內(nèi)即能生成可360°漫游、可編輯的虛擬世界,輸出標(biāo)準(zhǔn)化3D資產(chǎn),兼容主流引擎,大幅縮短內(nèi)容生產(chǎn)周期。

此外,面向端側(cè)的0.5B到7B系列小模型、混元Large-Vision、GameCraft等,也將在近期陸續(xù)開(kāi)源,助力開(kāi)發(fā)者高效構(gòu)建AI原生應(yīng)用。

基于混元大模型強(qiáng)大的通用能力,并結(jié)合騰訊云智能體開(kāi)發(fā)平臺(tái)、騰訊元器以及具身智能開(kāi)放平臺(tái)等多元化平臺(tái)能力,目前我們已經(jīng)構(gòu)建了覆蓋豐富場(chǎng)景的應(yīng)用生態(tài),持續(xù)推動(dòng)AI從“能用”向“好用”邁進(jìn)。

例如,我們推出了以元寶為代表的一系列AI原生產(chǎn)品,真正實(shí)現(xiàn)了AI與用戶生活和工作場(chǎng)景的深度融合。同時(shí),微信、QQ瀏覽器等超級(jí)應(yīng)用借助AI賦能,全面提升了用戶體驗(yàn)與工作效率。

此外,我們還針對(duì)辦公、教育、生活等多樣化場(chǎng)景,推出了CodeBuddy、旅游規(guī)劃Agent等智能體產(chǎn)品,深度嵌入生產(chǎn)生活流程,成為用戶貼身的智能助手與可靠伙伴。

在平臺(tái)工具支撐方面,目前我們已經(jīng)構(gòu)建了一套統(tǒng)一的智能體平臺(tái)底座,支持ToB和ToC兩個(gè)方向的智能體開(kāi)發(fā),實(shí)現(xiàn)能力共享、協(xié)同演進(jìn)。

ToB側(cè),我們依托騰訊云智能體開(kāi)發(fā)平臺(tái),服務(wù)企業(yè)級(jí)復(fù)雜場(chǎng)景。平臺(tái)支持多Agent協(xié)同、任務(wù)流編排,同時(shí)提供企業(yè)所需的云資源連接、安全運(yùn)維和專(zhuān)屬技術(shù)服務(wù),適配公有云、私有云和混合云的多形態(tài)部署需求。

ToC側(cè),我們基于“騰訊元器”,面向普通開(kāi)發(fā)者,提供簡(jiǎn)單易用的AI應(yīng)用構(gòu)建工具。開(kāi)發(fā)者可以在熟悉的生態(tài)中,結(jié)合公眾號(hào)、微信支付MCP、C端渠道分發(fā)等能力,快速上線專(zhuān)屬智能體。

這兩套產(chǎn)品雖面向不同人群,但底層共享同一個(gè)平臺(tái)能力棧,實(shí)現(xiàn)了開(kāi)發(fā)、運(yùn)行、分發(fā)的一體化協(xié)同。同時(shí),我們構(gòu)建了覆蓋全平臺(tái)的流量支持機(jī)制。無(wú)論是企業(yè)打造SaaS級(jí)AI助手,還是開(kāi)發(fā)者推出C端爆款應(yīng)用,都能在騰訊獲得可持續(xù)的流量與運(yùn)營(yíng)支持。

近期,工信部國(guó)家工業(yè)信息安全發(fā)展研究中心、及旗下賽昇實(shí)驗(yàn)室也對(duì)市面上的智能體平臺(tái)進(jìn)行了比較全面的技術(shù)評(píng)測(cè)。

結(jié)果顯示,騰訊云智能體開(kāi)發(fā)平臺(tái)在多項(xiàng)核心能力上都比較領(lǐng)先。例如,在構(gòu)建自規(guī)劃自決策的Agent領(lǐng)域,核心能力全面領(lǐng)先;在工作流搭建中“端到端、意圖識(shí)別、參數(shù)提取”等準(zhǔn)確率領(lǐng)先;企業(yè)通過(guò)RAG為大模型接入知識(shí)庫(kù)時(shí)很關(guān)注的“無(wú)關(guān)知識(shí)拒答準(zhǔn)確率”,也處于領(lǐng)先位置。

今天,騰訊云智能體開(kāi)發(fā)平臺(tái)也迎來(lái)了全新升級(jí),重點(diǎn)體現(xiàn)在三大核心能力的提升:

在Multi-Agent能力方面,我們首創(chuàng)了零代碼配置的多Agent協(xié)同機(jī)制,用戶只需通過(guò)簡(jiǎn)單的轉(zhuǎn)交關(guān)系配置,即可實(shí)現(xiàn)模型驅(qū)動(dòng)的自動(dòng)協(xié)作,構(gòu)建“多專(zhuān)家”智能體體系,顯著減輕單體Agent的負(fù)擔(dān)。

針對(duì)知識(shí)問(wèn)答場(chǎng)景,我們提供了知識(shí)庫(kù)Agent的最佳實(shí)踐。平臺(tái)支持多步檢索、多智能體協(xié)作處理復(fù)雜問(wèn)題,實(shí)現(xiàn)“易用性”和“復(fù)雜適配能力”的高度統(tǒng)一,幫助企業(yè)快速部署高質(zhì)量的知識(shí)問(wèn)答系統(tǒng)。

在RAG能力上,平臺(tái)經(jīng)過(guò)大量企業(yè)實(shí)戰(zhàn)場(chǎng)景的打磨,具備扎實(shí)領(lǐng)先的產(chǎn)品能力。企業(yè)可用極小投入,快速完成知識(shí)更新和問(wèn)答系統(tǒng)落地。

此次升級(jí)還進(jìn)一步擴(kuò)展了知識(shí)源對(duì)接能力,支持連接主流數(shù)據(jù)庫(kù),實(shí)現(xiàn)千萬(wàn)行級(jí)表格問(wèn)答;也支持接入騰訊文檔,直接導(dǎo)入在線文檔進(jìn)行知識(shí)問(wèn)答。

在工作流方面,我們引入具備全局視角的智能Agent,不僅能動(dòng)態(tài)感知用戶意圖,還能實(shí)現(xiàn)智能的節(jié)點(diǎn)回退與路徑調(diào)整,使多輪交互更加自然、靈活、智能。

在騰訊內(nèi)部,目前騰訊云智能體開(kāi)發(fā)平臺(tái)已經(jīng)應(yīng)用于問(wèn)答系統(tǒng)、辦公提效、知識(shí)管理、客服輔助等多個(gè)業(yè)務(wù)場(chǎng)景。

比如,QQ瀏覽器基于該平臺(tái)打造的QBot,能夠幫助用戶自動(dòng)執(zhí)行任務(wù),從檢索、驗(yàn)證到整理,全程無(wú)需人工干預(yù),真正做到“所想即所得”。

對(duì)外服務(wù)方面,我們與邯鄲公積金中心合作打造的“數(shù)字柜臺(tái)”,是AI政務(wù)落地的標(biāo)桿案例之一。

客戶通過(guò)智能體自動(dòng)解析政策、串聯(lián)流程、進(jìn)行身份核驗(yàn)與審批,整個(gè)業(yè)務(wù)效率提升80%,AI答復(fù)準(zhǔn)確率超82%,實(shí)現(xiàn)無(wú)紙化、自動(dòng)化、高準(zhǔn)確的政務(wù)服務(wù)體驗(yàn)。

介紹完騰訊云智能體開(kāi)發(fā)平臺(tái),我也和大家再分享下騰訊元器帶來(lái)的關(guān)鍵升級(jí),這次產(chǎn)品升級(jí)主要聚焦三個(gè)方向:

第一,全面提升公眾號(hào)智能體的生產(chǎn)力。通過(guò)Multi-Agent協(xié)同、MCP接入和矩陣號(hào)一鍵發(fā)布,智能體將更高效地完成復(fù)雜任務(wù),從創(chuàng)作到管理全面提效。

第二,深入打通騰訊生態(tài)能力。用戶可一鍵將公眾號(hào)內(nèi)容轉(zhuǎn)為知識(shí)庫(kù),騰訊文檔作為“內(nèi)容外腦”自然接入,同時(shí)基于微信支付MCP能力,幫助開(kāi)發(fā)者真正跑通“創(chuàng)作—服務(wù)—變現(xiàn)”的商業(yè)閉環(huán)。

第三,拓展C端流量分發(fā)新通道。除即將上線的應(yīng)用寶AI專(zhuān)區(qū)外,我們也將開(kāi)放更多場(chǎng)景化入口,為優(yōu)質(zhì)智能體提供精準(zhǔn)流量扶持。

自騰訊元器推出公眾號(hào)智能體以來(lái),我們見(jiàn)證了知識(shí)創(chuàng)作者從內(nèi)容輸出邁向智能服務(wù)的跨越。其中,兒童健康科普博主「童爸育兒」的故事非常典型。

這個(gè)博主擁有百萬(wàn)粉絲和70多個(gè)社群,過(guò)去每天花4小時(shí)回復(fù)私信、評(píng)論,創(chuàng)作時(shí)間被嚴(yán)重壓縮。直到他嘗試使用騰訊元器——完全不懂技術(shù)的他,僅用10分鐘,就將5年積累的2000多篇文章一鍵導(dǎo)入知識(shí)庫(kù),構(gòu)建了屬于自己的「數(shù)字分身」。

這個(gè)智能體被接入公眾號(hào)后臺(tái)、菜單欄和文章入口,7×24小時(shí)自動(dòng)答疑,回答準(zhǔn)確率超過(guò)95%,比他自己翻找資料還高效。如今已累計(jì)服務(wù)6萬(wàn)家庭,解答超40萬(wàn)個(gè)育兒?jiǎn)栴}。

更重要的是,借助微信支付MCP能力,讀者還能為專(zhuān)業(yè)內(nèi)容打賞,實(shí)現(xiàn)從“免費(fèi)輸出”到“價(jià)值閉環(huán)”的突破。

從面向B端用戶的騰訊云智能體開(kāi)發(fā)平臺(tái),到面向C端的騰訊元器,目前我們的雙智能體平臺(tái)已經(jīng)廣泛落地,助力更多客戶、用戶完成業(yè)務(wù)升級(jí)、需求實(shí)現(xiàn)。

AI不僅僅服務(wù)產(chǎn)業(yè),也承載著我們對(duì)科技向善的信念。一直以來(lái),騰訊也在基于AI能力,去做一些包括科學(xué)、文化等相關(guān)領(lǐng)域的探索。

比如,我們構(gòu)建了全球首個(gè)甲骨文多模態(tài)數(shù)據(jù)集,即將推出具備文字補(bǔ)全和形體還原能力的甲骨文智能體,助力中華文明的數(shù)字化保護(hù);我們還在用AI輔助文物修復(fù),相關(guān)API已開(kāi)放,幫助考古更高效、更精細(xì)。

在AI探星項(xiàng)目中,我們協(xié)助科研團(tuán)隊(duì)發(fā)現(xiàn)45顆新脈沖星,效率是全球平均的兩倍,并觀測(cè)到多個(gè)快速射電脈沖事件,為探索宇宙打開(kāi)新窗口。

最后,為了推動(dòng)智能體技術(shù)的應(yīng)用創(chuàng)新與人才培養(yǎng),騰訊云今天也正式啟動(dòng)黑客松·Agent應(yīng)用創(chuàng)新挑戰(zhàn)賽。

本次大賽將依托騰訊云智能體開(kāi)發(fā)平臺(tái)與騰訊元器,鼓勵(lì)開(kāi)發(fā)者以零代碼或低代碼方式,結(jié)合RAG、多Agent協(xié)同、Workflow等技術(shù),探索多元智能體應(yīng)用場(chǎng)景。

大賽面向?qū)W生、企業(yè)和個(gè)人開(kāi)發(fā)者,獎(jiǎng)勵(lì)豐厚,歡迎大家掃碼參與,一起激發(fā)智能體的更多可能。

以上就是我今天分享的全部?jī)?nèi)容。

我們希望,通過(guò)扎實(shí)的底層模型、好用的平臺(tái)工具、廣泛的應(yīng)用生態(tài),讓AI真正建得起、跑得穩(wěn)、用得好,讓每個(gè)人、每個(gè)企業(yè),都能用上好用的AI。

謝謝大家。

來(lái)源:北國(guó)網(wǎng)

分享到

zhupb

相關(guān)推薦