大模型七連發(fā),Qwen3-Max性能躋身全球前三,超過(guò)GPT5

圍繞大模型和AI云,2025云棲大會(huì)現(xiàn)場(chǎng),阿里云智能首席技術(shù)官周靖人發(fā)布了多項(xiàng)重磅技術(shù)更新。通義大模型7連發(fā),在模型智能水平、Agent工具調(diào)用和Coding能力、深度推理、多模態(tài)等方面實(shí)現(xiàn)多項(xiàng)突破。

2025云棲大會(huì),阿里云CTO周靖人發(fā)布多項(xiàng)重磅技術(shù)更新

在大語(yǔ)言模型中,阿里通義旗艦?zāi)P蚎wen3-Max全新亮相,性能超過(guò)GPT5、Claude Opus 4等,躋身全球前三。Qwen3-Max包括指令(Instruct)和推理(Thinking)兩大版本,其預(yù)覽版已在 Chatbot Arena 排行榜上位列第三,正式版性能可望再度實(shí)現(xiàn)突破。

Qwen3-Max是通義千問(wèn)家族中最大、最強(qiáng)的基礎(chǔ)模型,預(yù)訓(xùn)練數(shù)據(jù)量達(dá)36T tokens,總參數(shù)超過(guò)萬(wàn)億,擁有極強(qiáng)的Coding編程能力和Agent工具調(diào)用能力。在大模型用Coding解決真實(shí)世界問(wèn)題的SWE-Bench Verified測(cè)試中,Instruct版本斬獲69.6分,位列全球第一梯隊(duì);在聚焦Agent工具調(diào)用能力的Tau2-Bench測(cè)試中,Qwen3-Max取得突破性的74.8分,超過(guò)Claude Opus4和DeepSeek-V3.1。Qwen3-Max推理模型也展現(xiàn)出非凡性能,結(jié)合工具調(diào)用和并行推理技術(shù),其推理能力創(chuàng)下新高,尤其在聚焦數(shù)學(xué)推理的AIME 25和HMMT測(cè)試中,均達(dá)到突破性的滿(mǎn)分100分,為國(guó)內(nèi)首次。

下一代基礎(chǔ)模型架構(gòu)Qwen3-Next及系列模型正式發(fā)布,模型總參數(shù)80B僅激活 3B ,性能即可媲美千問(wèn)3旗艦版235B模型,實(shí)現(xiàn)模型計(jì)算效率的重大突破。Qwen3-Next針對(duì)大模型在上下文長(zhǎng)度和總參數(shù)兩方面不斷擴(kuò)展(Scaling)的未來(lái)趨勢(shì)而設(shè)計(jì),創(chuàng)新改進(jìn)采用了混合注意力機(jī)制、高稀疏度 MoE 結(jié)構(gòu)、多 token 預(yù)測(cè)(MTP)機(jī)制等核心技術(shù),模型訓(xùn)練成本較密集模型Qwen3-32B大降超90%,長(zhǎng)文本推理吞吐量提升10倍以上,為未來(lái)大模型的訓(xùn)練和推理的效率設(shè)立了全新標(biāo)準(zhǔn)。

在專(zhuān)項(xiàng)模型方面,千問(wèn)編程模型Qwen3-Coder重磅升級(jí)。新的Qwen3-Coder與Qwen Code、Claude Code系統(tǒng)聯(lián)合訓(xùn)練,應(yīng)用效果顯著提升,推理速度更快,代碼安全性也顯著提升。Qwen3-Coder此前就廣受開(kāi)發(fā)者和企業(yè)好評(píng),代碼生成和補(bǔ)全能力極強(qiáng),可一鍵完成完整項(xiàng)目的部署和問(wèn)題修復(fù),開(kāi)源后調(diào)用量曾在知名API調(diào)用平臺(tái)OpenRouter上激增1474%,位列全球第二。

通義千問(wèn)Qwen模型家族

在多模態(tài)模型中,千問(wèn)備受期待的視覺(jué)理解模型Qwen3-VL重磅開(kāi)源,在視覺(jué)感知和多模態(tài)推理方面實(shí)現(xiàn)重大突破,在32項(xiàng)核心能力測(cè)評(píng)中超過(guò)Gemini-2.5-Pro和GPT-5。Qwen3-VL擁有極強(qiáng)的視覺(jué)智能體和視覺(jué)Coding能力,不僅能看懂圖片,還能像人一樣操作手機(jī)和電腦,自動(dòng)完成許多日常任務(wù)。輸入一張圖片,Qwen3-VL可自行調(diào)用agent工具放大圖片細(xì)節(jié),通過(guò)更仔細(xì)的觀察分析,推理出更好的答案;看到一張?jiān)O(shè)計(jì)圖,Qwen3-VL 就能生成Draw.io/HTML/CSS/JS 代碼,“所見(jiàn)即所得”地完成視覺(jué)編程。此外,Qwen3-VL還升級(jí)了3D  Grounding(3D檢測(cè))能力,為具身智能夯實(shí)基礎(chǔ);擴(kuò)展支持百萬(wàn)tokens上下文,視頻理解時(shí)長(zhǎng)擴(kuò)展到2小時(shí)以上。

全模態(tài)模型Qwen3-Omni驚喜亮相,音視頻能力狂攬32項(xiàng)開(kāi)源最佳性能SOTA,可像人類(lèi)一樣聽(tīng)說(shuō)寫(xiě),應(yīng)用場(chǎng)景廣泛,未來(lái)可部署于車(chē)載、智能眼鏡和手機(jī)等。用戶(hù)還可設(shè)定個(gè)性化角色、調(diào)整對(duì)話風(fēng)格,打造專(zhuān)屬的個(gè)人IP。類(lèi)似于人類(lèi)嬰兒一出生就全方位感知世界,Qwen3-Omni一開(kāi)始就加入了“聽(tīng)”、“說(shuō)”、“寫(xiě)”多模態(tài)混合訓(xùn)練。在預(yù)訓(xùn)練過(guò)程中,Qwen3-Omni采用了混合單模態(tài)和跨模態(tài)數(shù)據(jù)。此前,模型在混合訓(xùn)練后,各個(gè)功能會(huì)相互掣肘甚至降智,比如音頻理解能力提升,文字理解能力反而降低了。但Qwen3-Omni在實(shí)現(xiàn)強(qiáng)勁音頻與音視頻能力的同時(shí),單模態(tài)文本與圖像性能均保持穩(wěn)定,這是業(yè)內(nèi)首次實(shí)現(xiàn)這一訓(xùn)練效果。

通義萬(wàn)相Wan模型家族

通義大模型家族中的視覺(jué)基礎(chǔ)模型通義萬(wàn)相,推出Wan2.5-preview系列模型,涵蓋文生視頻、圖生視頻、文生圖和圖像編輯四大模型。通義萬(wàn)相2.5視頻生成模型能生成和畫(huà)面匹配的人聲、音效和音樂(lè)BGM,首次實(shí)現(xiàn)音畫(huà)同步的視頻生成能力,進(jìn)一步降低電影級(jí)視頻創(chuàng)作的門(mén)檻。通義萬(wàn)相2.5視頻生成時(shí)長(zhǎng)從5秒提升至10秒,支持24幀每秒的1080P高清視頻生成,并進(jìn)一步提升模型指令遵循能力。此次,通義萬(wàn)相2.5還全面升級(jí)了圖像生成能力,可生成中英文文字和圖表,支持圖像編輯功能,輸入一句話即可完成P圖。

通義百聆發(fā)布

2025杭州云棲大會(huì)上,通義大模型家族還迎來(lái)了全新的成員——語(yǔ)音大模型通義百聆,包括語(yǔ)音識(shí)別大模型Fun-ASR、語(yǔ)音合成大模型Fun-CosyVoice。Fun-ASR基于數(shù)千萬(wàn)小時(shí)真實(shí)語(yǔ)音數(shù)據(jù)訓(xùn)練而成,具備強(qiáng)大的上下文理解能力與行業(yè)適應(yīng)性;Fun-CosyVoice可提供上百種預(yù)制音色,可以用于客服、銷(xiāo)售、直播電商、消費(fèi)電子、有聲書(shū)、兒童娛樂(lè)等場(chǎng)景。

通義大模型已成為全球第一開(kāi)源模型,也是中國(guó)企業(yè)選擇最多的模型。截至目前,阿里通義開(kāi)源300余個(gè)模型,覆蓋不同大小的“全尺寸”及LLM、編程、圖像、語(yǔ)音、視頻等“全模態(tài)”,全球下載量突破6億次,全球衍生模型17萬(wàn)個(gè),穩(wěn)居全球第一。超100萬(wàn)家客戶(hù)接入通義大模型,權(quán)威調(diào)研機(jī)構(gòu)沙利文2025上半年報(bào)告顯示,在中國(guó)企業(yè)級(jí)大模型調(diào)用市場(chǎng)中,阿里通義占比第一。

模型日均調(diào)用量增長(zhǎng)15倍,阿里云百煉發(fā)布全新Agent開(kāi)發(fā)框架

作為一站式模型服務(wù)和Agent開(kāi)發(fā)平臺(tái),阿里云百煉也來(lái)了重磅升級(jí)。大會(huì)現(xiàn)場(chǎng),阿里云發(fā)布全新Agent開(kāi)發(fā)框架ModelStudio-ADK,該框架突破以預(yù)定義編排方式開(kāi)發(fā)Agent的局限,可幫助企業(yè)高效開(kāi)發(fā)具備自主決策、多輪反思和循環(huán)執(zhí)行能力的Agent。使用ModelStudio-ADK,1個(gè)小時(shí)就能輕松開(kāi)發(fā)一個(gè)能生成深度報(bào)告的Deep Research項(xiàng)目。隨著模型能力的不斷提升以及Agent應(yīng)用的爆發(fā),過(guò)去一年,阿里云百煉平臺(tái)的模型日均調(diào)用量增長(zhǎng)了15倍。

在框架層面,阿里云ModelStudio-ADK基于通義開(kāi)源的AgentScope打造,可開(kāi)發(fā)深度研究、硬件代理智能體、復(fù)雜檢索智能體等應(yīng)用。該框架還全面支持云端部署和云端組件調(diào)用,提供企業(yè)級(jí)、服務(wù)穩(wěn)定、靈活部署和運(yùn)行的高代碼開(kāi)發(fā)模式,幫助企業(yè)和開(kāi)發(fā)者快速實(shí)現(xiàn)復(fù)雜場(chǎng)景Agent的開(kāi)發(fā)和落地。

在模型層面,阿里云百煉持續(xù)上線全新通義千問(wèn)家族旗艦?zāi)P?,基于Qwen3系列模型強(qiáng)大的推理能力,可驅(qū)動(dòng)Agent實(shí)現(xiàn)更高效的自主規(guī)劃與決策,推理性能提高50%,決策成功率達(dá)到90%。目前,用戶(hù)可一鍵調(diào)用Qwen、Wan、DeepSeek等200多款業(yè)界領(lǐng)先的模型。

在組件層面,面向Agent開(kāi)發(fā)和部署所需的各類(lèi)組件,阿里云百煉集成了工具連接MCP Server、多模數(shù)據(jù)融合RAG Server、沙箱工具Sandbox  Server、智能記憶存取Memory Server以及支付訂閱服務(wù) Pay Server等7大企業(yè)級(jí)能力。以Pay Server為例,該服務(wù)由阿里云百煉和支付寶聯(lián)合首發(fā)推出,是業(yè)界首個(gè)為企業(yè)級(jí)Agent提供專(zhuān)業(yè)商業(yè)化支付通道的服務(wù)。目前,阿里云百煉首批上線了基于ModelStudio-ADK開(kāi)發(fā)的DeepResearch、Agentic-RAG、Computer-Use Agent等Agent應(yīng)用,用戶(hù)可免費(fèi)在線體驗(yàn)或下載代碼進(jìn)行二次開(kāi)發(fā)。

大會(huì)現(xiàn)場(chǎng),阿里云百煉還升級(jí)了低代碼Agent開(kāi)發(fā)平臺(tái)ModelStudio-ADP,該平臺(tái)已廣泛應(yīng)用于金融、教育和電商等領(lǐng)域企業(yè),目前,阿里云百煉平臺(tái)已有超20萬(wàn)開(kāi)發(fā)者開(kāi)發(fā)了80多萬(wàn)個(gè)Agent。據(jù)介紹,網(wǎng)商銀行基于ModelStudio-ADP開(kāi)發(fā)了貸款審核應(yīng)用,支持合同、發(fā)票、營(yíng)業(yè)執(zhí)照等26種憑證,以及店面門(mén)頭、餐飲廚房、就餐區(qū)、貨架商品等超過(guò)400種細(xì)粒度物體的精準(zhǔn)識(shí)別,準(zhǔn)確率超95%,其任務(wù)處理時(shí)間從原來(lái)的3小時(shí)優(yōu)化至5分鐘內(nèi)。

同時(shí),阿里云Agent Infra重要組件的無(wú)影AgentBay迎來(lái)重大升級(jí)。無(wú)影AgentBay是阿里云為Agent量身打造的“超級(jí)大腦” ,可動(dòng)態(tài)調(diào)用云上算力、存儲(chǔ)及工具鏈資源,大大突破了Agent在本地設(shè)備上的算力限制。本次云棲大會(huì),無(wú)影AgentBay還全新推出了自進(jìn)化引擎、自定義鏡像、安全圍欄、內(nèi)存狀態(tài)管理等新能力,并首次展示全新的個(gè)人計(jì)算產(chǎn)品——無(wú)影Agentic Computer,擁有全新的人機(jī)交互方式,革命性的“記憶”能力和近乎無(wú)窮的云上算力。

AI算力一年增長(zhǎng)超5倍,阿里云AI基礎(chǔ)設(shè)施全面升級(jí)

阿里云圍繞AI進(jìn)行了軟硬全棧的協(xié)同優(yōu)化和系統(tǒng)創(chuàng)新,已初步形成以通義為核心的操作系統(tǒng)和以AI云為核心的下一代計(jì)算機(jī)。過(guò)去一年,阿里云AI算力增長(zhǎng)超5倍,AI存力增長(zhǎng)4倍多。

2025年云棲大會(huì)現(xiàn)場(chǎng),全面升級(jí)的阿里云AI基礎(chǔ)設(shè)施重磅亮相,全面展示了阿里云從底層芯片、超節(jié)點(diǎn)服務(wù)器、高性能網(wǎng)絡(luò)、分布式存儲(chǔ)、智算集群到人工智能平臺(tái)、模型訓(xùn)練推理服務(wù)的全棧AI技術(shù)能力。

在服務(wù)器層面,阿里云發(fā)布全新一代磐久128超節(jié)點(diǎn)AI服務(wù)器。新一代磐久超節(jié)點(diǎn)服務(wù)器由阿里云自主研發(fā)設(shè)計(jì),具備高密度、高性能和高可用的核心優(yōu)勢(shì),可高效支持多種AI芯片,單柜支持128個(gè)AI計(jì)算芯片,密度刷新業(yè)界紀(jì)錄。磐久超節(jié)點(diǎn)集成阿里自研CIPU 2.0芯片和EIC/MOC高性能網(wǎng)卡,采用開(kāi)放架構(gòu),擴(kuò)展能力極強(qiáng),可實(shí)現(xiàn)高達(dá)Pb/s級(jí)別Scale-Up帶寬和百ns極低延遲,相對(duì)于傳統(tǒng)架構(gòu),同等AI算力下推理性能還可提升50%。

磐久AI Infra2.0 128超節(jié)點(diǎn)服務(wù)器

在網(wǎng)絡(luò)層面,阿里云新一代高性能網(wǎng)絡(luò)HPN 8.0全新亮相。為應(yīng)對(duì)大模型時(shí)代對(duì)海量數(shù)據(jù)傳輸?shù)男枨螅琀PN8.0采用訓(xùn)推一體化架構(gòu),存儲(chǔ)網(wǎng)絡(luò)帶寬拉升至800Gbps,GPU互聯(lián)網(wǎng)絡(luò)帶寬達(dá)到6.4Tbps,可支持單集群10萬(wàn)卡GPU高效互聯(lián),為萬(wàn)卡大集群提供高性能、確定性的云上基礎(chǔ)網(wǎng)絡(luò),助力AI訓(xùn)推提效。

在存儲(chǔ)層面,阿里云分布式存儲(chǔ)面向AI需求全面升級(jí)。高性能并行文件存儲(chǔ)CPFS單客戶(hù)端吞吐提升至40GB/s, 可滿(mǎn)足AI訓(xùn)練對(duì)快速讀取數(shù)據(jù)的極致需求;表格存儲(chǔ)Tablestore為Agent提供高性能記憶庫(kù)和知識(shí)庫(kù);對(duì)象存儲(chǔ)OSS推出 Vector Bucket,為向量數(shù)據(jù)提供高性?xún)r(jià)比的海量存儲(chǔ),相比自建開(kāi)源向量數(shù)據(jù)庫(kù),成本驟降95%,結(jié)合OSS MetaQuery 語(yǔ)義檢索和內(nèi)容感知能力,可快速構(gòu)建RAG等AI應(yīng)用。

在AI智算集群層面,智能計(jì)算靈駿集群通過(guò)多級(jí)親和性與拓?fù)涓兄{(diào)度設(shè)計(jì),基于HPN 網(wǎng)絡(luò)支持10萬(wàn)卡穩(wěn)定互聯(lián),多級(jí)可擴(kuò)展的架構(gòu)讓每張卡間互聯(lián)路徑更短、帶寬更優(yōu)。靈駿集群面向任務(wù)的穩(wěn)定性設(shè)計(jì)、故障分鐘級(jí)恢復(fù)能力,有效提高了模型訓(xùn)練任務(wù)的集群穩(wěn)定性。

AI需求爆發(fā)也帶動(dòng)了通用算力需求上升,阿里云通用計(jì)算全面升級(jí)。依托自研的“飛天+CIPU”架構(gòu)體系,阿里云第九代企業(yè)級(jí)實(shí)例采用英特爾、AMD的最新芯片,在大幅提升算力水平的同時(shí),可為Agent提供穩(wěn)定、安全、高性能的通用CPU算力。其中,九代AMD實(shí)例g9ae提供物理核的規(guī)格,性能最高提升67%,尤其適合企業(yè)離線數(shù)據(jù)分析處理、視頻轉(zhuǎn)碼等高并發(fā)場(chǎng)景。

為AI負(fù)載提供彈性、調(diào)度優(yōu)化和規(guī)?;\(yùn)行的容器計(jì)算,也迎來(lái)重磅升級(jí)。容器服務(wù)ACK新增靈駿節(jié)點(diǎn)池,引入模型感知智能路由、多角色推理負(fù)載管理、故障自愈等核心功能,自動(dòng)處理恢復(fù)時(shí)長(zhǎng)縮短了 85% ,模型推理冷啟動(dòng)提速10倍。容器計(jì)算服務(wù)ACS強(qiáng)化網(wǎng)絡(luò)拓?fù)涓兄{(diào)度,任務(wù)通信性能整體提升30%,并針對(duì)AI Agent場(chǎng)景深度優(yōu)化,Serverless GPU算?開(kāi)箱即用,支持每分鐘15000沙箱的大規(guī)模并發(fā)彈性,結(jié)合安全沙箱、智能休眠與喚醒,實(shí)現(xiàn)Agent隨需啟用、高效響應(yīng)。

阿里云人工智能平臺(tái)PAI與通義大模型聯(lián)合優(yōu)化,印證了全棧AI的“1+1>2”的效果。在訓(xùn)練層,針對(duì)MoE模型,采用統(tǒng)一調(diào)度機(jī)制、自適應(yīng)計(jì)算通信掩蓋、EP計(jì)算負(fù)載均衡和計(jì)算顯存分離式并行等優(yōu)化手段,使得通義千問(wèn)模型訓(xùn)練端到端加速比提升3倍以上;升級(jí)DiT模型訓(xùn)練引擎,通義萬(wàn)相單樣本訓(xùn)練耗時(shí)降低28.1%;在推理層,通過(guò)大規(guī)模EP、PD/AF分離、權(quán)重優(yōu)化、LLM智能路由在內(nèi)的全鏈路優(yōu)化,實(shí)現(xiàn)推理效率顯著提升:推理吞吐TPS增加71%,時(shí)延TPOT降低70.6%,擴(kuò)容時(shí)長(zhǎng)降低97.6%。

“阿里云正在全力打造一臺(tái)全新的AI超級(jí)計(jì)算機(jī),它同時(shí)擁有最領(lǐng)先的AI基礎(chǔ)設(shè)施和最領(lǐng)先的模型,兩者可以在產(chǎn)品設(shè)計(jì)和運(yùn)行架構(gòu)上高度協(xié)同,從而確保在阿里云上調(diào)用和訓(xùn)練通義千問(wèn)模型時(shí),能達(dá)到最高效率?!眳怯俱懕硎?。

截至目前,阿里云運(yùn)營(yíng)著中國(guó)第一、全球領(lǐng)先的AI基礎(chǔ)設(shè)施和云計(jì)算網(wǎng)絡(luò),在全球29個(gè)地域設(shè)有90個(gè)可用區(qū)。三方機(jī)構(gòu)Omdia2025年上半年數(shù)據(jù)顯示,中國(guó)AI云市場(chǎng)阿里云占比35.8%,超過(guò)2到4名總和;在已采用生成式AI的財(cái)富中國(guó)500強(qiáng)中,超53%企業(yè)選擇阿里云,滲透率位列第一。未來(lái)3年,阿里巴巴將投入3800億用于建設(shè)云和AI基礎(chǔ)設(shè)施,總額超過(guò)過(guò)去十年的總和。

分享到

xiesc

相關(guān)推薦