報(bào)告系統(tǒng)梳理了AI技術(shù)正如何從“從推理到行動(dòng)”,并聚焦基礎(chǔ)模型演進(jìn)、智能體崛起、AI走向物理世界三大關(guān)鍵領(lǐng)域,展現(xiàn)AI從“智能工具”走向“共生伙伴”的演化路徑,描繪出人與AI協(xié)作共生、共創(chuàng)未來的全新圖景。
騰訊研究院資深研究員徐思彥在現(xiàn)場指出:“2025年是AI從推理智能邁向行動(dòng)智能的關(guān)鍵拐點(diǎn)。AI不再只是一個(gè)可調(diào)用的工具,而是正在成長為人類的生產(chǎn)力伙伴與決策合伙人。這一變革將深刻重塑社會(huì)結(jié)構(gòu)與協(xié)作模式?!?/p>
模型躍遷:強(qiáng)化學(xué)習(xí)推動(dòng)模型自進(jìn)化,多模態(tài)原生融合正成主流
報(bào)告指出,AI基礎(chǔ)模型正在經(jīng)歷深層次演進(jìn),其核心競爭力正從“數(shù)據(jù)+規(guī)模”轉(zhuǎn)向“自我優(yōu)化+多模態(tài)原生融合”。
強(qiáng)化學(xué)習(xí)正在成為大模型后訓(xùn)練的關(guān)鍵技術(shù),推動(dòng)AI從“語言生成器”向“任務(wù)執(zhí)行者”演進(jìn),實(shí)現(xiàn)自主工具使用與復(fù)雜任務(wù)執(zhí)行。特別是在金融、政務(wù)等垂直場景中,強(qiáng)化學(xué)習(xí)有望突破數(shù)據(jù)稀缺與安全壁壘,加速專業(yè)化模型落地。
原生多模態(tài)能力的提升,也標(biāo)志著AI感知與交互方式的革命性升級。報(bào)告指出,通過構(gòu)建統(tǒng)一的跨模態(tài)表示空間,并引入端到端學(xué)習(xí)架構(gòu),原生多模態(tài)模型實(shí)現(xiàn)了感知、理解與生成的高效協(xié)同。其“所見即所得”的閉環(huán)體驗(yàn),將成為推動(dòng)下一輪AI應(yīng)用創(chuàng)新的核心動(dòng)力。
在聲音智能方面,語音合成已突破機(jī)械感表達(dá),進(jìn)入具備情緒理解與擬人化表達(dá)的新階段;音樂生成從實(shí)驗(yàn)工具成長為高可控的創(chuàng)作平臺(tái),聲音AI正從輔助工具邁向擁有情感表達(dá)能力的“智能共創(chuàng)者”。
Agent生態(tài):AI正成為“共生伙伴”
報(bào)告認(rèn)為,AI Agent正成為AI產(chǎn)業(yè)的重要拐點(diǎn)。從2023年的探索實(shí)踐,到如今加速落地,智能體技術(shù)已進(jìn)入大規(guī)模生產(chǎn)應(yīng)用階段,形成編排類+端到端模型雙軌并進(jìn)的生態(tài)格局。
在企業(yè)場景中,Agent正深度嵌入政務(wù)、金融、工業(yè)、醫(yī)療等流程,承擔(dān)起分析、執(zhí)行、優(yōu)化等關(guān)鍵職能,從“工具”演進(jìn)為真正的“數(shù)字員工”,與人類員工互補(bǔ)協(xié)作。
在個(gè)人生活中,AI正演化為LifeOS——一個(gè)具備長期記憶、具身感知、多角色協(xié)同的“終身智能系統(tǒng)”。報(bào)告指出,這種AI不僅能陪伴用戶,更能協(xié)助其完成復(fù)雜決策,實(shí)現(xiàn)真正意義上的個(gè)性化生活協(xié)同。正如騰訊研究院徐思彥所說:“從零散對話,到‘認(rèn)識你是誰’,未來的AI不只是會(huì)回答問題的聊天工具,而是一位了解過去、陪伴當(dāng)下、引領(lǐng)未來的‘共生伙伴’?!?/p>
在虛擬世界中,游戲智能體也正由“NPC”進(jìn)化為具備情感反應(yīng)和持續(xù)學(xué)習(xí)能力的“共創(chuàng)者”,將深刻改變虛擬互動(dòng)體驗(yàn),并且可以成為社會(huì)模擬的虛擬實(shí)驗(yàn)場。
從比特到原子:AI正走向物理世界的深度融合
報(bào)告強(qiáng)調(diào),AI的能力邊界正在從比特世界快速延伸至物理世界,進(jìn)入“從虛擬到現(xiàn)實(shí)”的躍遷期??臻g智能讓AI初步具備了理解和處理三維世界的核心能力,能夠像預(yù)測下一個(gè)詞元(Token)一樣去預(yù)測下一個(gè)體素(Voxel),使AI具備感知、理解乃至操控三維空間的能力,賦能自動(dòng)駕駛、智慧制造、XR等新一代空間智能場景。
尤其值得關(guān)注的是,“具身智能”正迎來類GPT-2的關(guān)鍵突破。以VLA(視覺-語言-動(dòng)作)多模態(tài)大模型為代表的創(chuàng)新,使得機(jī)器人具備從感知到執(zhí)行的閉環(huán)智能鏈路。AI不再局限于算法演示,而是在真實(shí)物理環(huán)境中具備自主學(xué)習(xí)與適應(yīng)能力,開始邁入從實(shí)驗(yàn)室走向商業(yè)落地的量產(chǎn)階段。
騰訊研究院資深研究員徐思彥指出,具身智能已被上升至國家戰(zhàn)略高度,伴隨技術(shù)突破與應(yīng)用拓展,機(jī)器人正成為下一個(gè)“超級終端”,隨著機(jī)器人向工業(yè)、物流、服務(wù)等多場景滲透,具身智能正逐步承擔(dān)起重復(fù)性、高風(fēng)險(xiǎn)、低技能崗位的工作。
報(bào)告提到,AI正在從“通用工具”向“專屬助手”演進(jìn),成為每個(gè)人的數(shù)字搭檔、每家企業(yè)的智能勞動(dòng)力、每個(gè)行業(yè)的增長引擎。隨著AI從“可用”邁向“好用”,它不僅提升效率,更將重塑組織結(jié)構(gòu)、優(yōu)化社會(huì)協(xié)作、拓展人類認(rèn)知邊界,成為推動(dòng)社會(huì)變革的核心動(dòng)力。