本月刊是精心策劃的專欄,為您緩緩展開2025年8月份以來算力世界以及人工智能領域的精彩篇章,涵蓋公司新聞、產(chǎn)品動態(tài)、政策發(fā)布與會議活動四大板塊。

文字編輯|李祥敬

01

公司新聞

華為宣布CANN全面開源開放,共建昇騰生態(tài)

近日,昇騰計算產(chǎn)業(yè)發(fā)展峰會在北京召開。來自AI領軍企業(yè)、伙伴、高校與科研機構(gòu)的代表共同探討了如何更好地構(gòu)建開源開放的昇騰生態(tài),加速AI創(chuàng)新和發(fā)展。

華為輪值董事長徐直軍在主題演講中強調(diào):華為AI戰(zhàn)略的核心是算力,并堅持昇騰硬件變現(xiàn)。徐直軍在會上宣布華為昇騰硬件使能CANN全面開源開放,Mind系列應用使能套件及工具鏈全面開源,支持用戶自主的深度挖潛和自定義開發(fā),加速廣大開發(fā)者的創(chuàng)新步伐,讓昇騰更好用、更易用。

與會代表和華為共同發(fā)起了《CANN開源開放生態(tài)共建倡議》,以凝聚產(chǎn)業(yè)力量,共探AI邊界,共建昇騰生態(tài)。

ChatGPT用戶數(shù)暴漲至7億創(chuàng)紀錄新高,OpenAI年化收入飆升至120億美元

OpenAI正在經(jīng)歷前所未有的爆炸式增長。該公司周一宣布,其旗艦產(chǎn)品ChatGPT的周活躍用戶數(shù)已達到7億,同比增長超過四倍,這一數(shù)字標志著AI應用領域的又一個重要里程碑。

ChatGPT的用戶增長呈現(xiàn)出驚人的加速趨勢。除了周活躍用戶數(shù)的大幅攀升,其日均用戶消息量也突破了30億條大關。相比去年同期2.5倍的增長率,這一數(shù)據(jù)顯示出用戶活躍度的持續(xù)提升和對AI工具依賴程度的加深。

在商業(yè)化層面,OpenAI同樣交出了亮眼的成績單。其付費商業(yè)用戶數(shù)量從今年6月的300萬激增至500萬,增長幅度超過66%。這一數(shù)據(jù)反映出企業(yè)和教育機構(gòu)對AI工具的接受度正在快速提升,商業(yè)市場對于AI應用的需求呈現(xiàn)出強勁的增長態(tài)勢。

谷歌DeepMind發(fā)布Genie 3:一句話生成可玩的3D世界!實時交互世界模型開啟AGI新紀元

2025年8月6日,谷歌DeepMind正式發(fā)布Genie 3世界模型,首個支持實時交互的生成式環(huán)境引擎。它基于文本、圖像或視頻輸入,以每秒24幀的速率創(chuàng)建長達數(shù)分鐘的高保真動態(tài)世界。

相比前代Genie 2僅能維持10-20秒的360P畫面,此次升級被英偉達科學家Jim Fan譽為 “游戲引擎2.0時代”的降臨。

谷歌DeepMind Genie 3與Genie 2、由神經(jīng)模型驅(qū)動的游戲引擎GameNGen、視頻生成模型Veo對比,最突出的特點是其生成時長翻倍增長,且能做到針對已生成的環(huán)境修改。

百度智能云宣布推出全球首批AI數(shù)字員工

百度AI Day開放日上,百度智能云推出全球首批AI數(shù)字員工,覆蓋營銷經(jīng)理、還款助理等核心業(yè)務職能。它們依托百度智能云AI全棧能力,融合大模型、數(shù)字人技術及行業(yè)經(jīng)驗,具備“懂業(yè)務、給結(jié)果、可進化”特性,能精準賦能垂直業(yè)務場景,成為企業(yè)可信賴的數(shù)字業(yè)務伙伴。

百度副總裁阮瑜稱,大模型能力快速迭代,推動AI從Copilot向Agent形態(tài)躍遷,未來智能體將以“數(shù)字員工”形態(tài)參與企業(yè)運行,推動組織生產(chǎn)力變革。石崢表示,企業(yè)需要能扛KPI的Agent,百度智能云融合客悅智能客服與曦靈數(shù)字人技術,基于大模型Agent架構(gòu)打造出國內(nèi)首批AI數(shù)字員工,實現(xiàn)從功能執(zhí)行到業(yè)務決策的質(zhì)變。

在招聘行業(yè),招聘顧問能實現(xiàn)外呼邀約等全流程閉環(huán),面試參加率提升40%;教培行業(yè),課程顧問可承接招生咨詢等重復勞動,讓教育顧問專注高價值轉(zhuǎn)化,員工效率提升40%。目前,數(shù)字員工已應用于百度客服中心,實現(xiàn)7×24小時高效處理咨詢,用戶申保成功率提升60%、服務時效提升18h。石崢認為,人機協(xié)同是主流趨勢,未來或?qū)崿F(xiàn)多數(shù)字員工協(xié)同解決復雜任務。

從閉源到開源,OpenAI重磅推出gpt-oss-120b與20b,開發(fā)者狂歡!

OpenAI宣布推出兩款開源權(quán)重語言模型——gpt-oss-120b和gpt-oss-20b,這是自2019年GPT-2發(fā)布以來,OpenAI首次回歸開源領域。此舉不僅標志著OpenAI戰(zhàn)略的重大轉(zhuǎn)向,也為全球AI開發(fā)者提供了強大的推理工具,加速AI技術的普及與創(chuàng)新。

根據(jù)OpenAI官方公告,gpt-oss-120b和gpt-oss-20b采用Apache2.0許可證發(fā)布,允許開發(fā)者自由下載、修改和用于商業(yè)用途。這兩款模型分別是1170億參數(shù)和210億參數(shù)的混合專家(MoE)架構(gòu),分別激活51億和36億參數(shù),兼顧高效推理與低資源消耗。

特斯拉解散Dojo超級計算機團隊,放棄自研芯片轉(zhuǎn)向英偉達合作

特斯拉正式解散其Dojo超級計算機項目團隊,結(jié)束了這家電動汽車制造商在自動駕駛技術領域自主研發(fā)芯片的努力。據(jù)報道,這一決定標志著特斯拉AI戰(zhàn)略的重大轉(zhuǎn)向。

Dojo項目負責人Peter Bannon已經(jīng)離開公司,剩余團隊成員將被重新分配到特斯拉內(nèi)部其他數(shù)據(jù)中心和計算項目中。這一變化是在約20名員工離職創(chuàng)立AI公司DensityAI之后發(fā)生的。

新成立的DensityAI由前Dojo負責人Ganesh Venkataramanan以及前特斯拉員工Bill Chang和Ben Floering共同創(chuàng)立,該公司正在開發(fā)面向機器人、AI代理和汽車應用的數(shù)據(jù)中心芯片、硬件和軟件解決方案。

亞馬遜推出全球最大AI模型平臺Amazon Bedrock

在2023年AI行業(yè)激戰(zhàn)正酣、各大公司競相爭奪“最強模型”稱號之際,亞馬遜云科技(AWS)卻獨辟蹊徑,提出了“選擇大于一切”的戰(zhàn)略理念。該戰(zhàn)略強調(diào),在AI應用中,適合的模型才是至關重要的。為實現(xiàn)這一目標,亞馬遜推出了AmazonBedrock平臺,旨在為企業(yè)打造一個如同超市般便捷的AI模型選擇環(huán)境。

這一新平臺被業(yè)界譽為“模型超市”,它集成了多種AI模型,企業(yè)可根據(jù)自身需求和場景,靈活挑選最合適的解決方案。亞馬遜深刻認識到,企業(yè)所追求的并非單一的最強大模型,而是能夠適應不同場景的多元化模型組合。

風雪壓“我”兩三年,“我”比HBM還值錢

當AI模型參數(shù)突破萬億級,HBM已從“配件”升級為“算力核心”。華為8月12日發(fā)布的UCM技術以顛覆性架構(gòu)撕開一道裂縫。

該成果聚焦通過算法優(yōu)化、架構(gòu)創(chuàng)新及軟硬件協(xié)同,減少對HBM的依賴。HBM作為AI計算核心組件,長期受海外技術壟斷和產(chǎn)能限制,華為的技術突破或緩解國內(nèi)AI產(chǎn)業(yè)供應鏈壓力,降低算力成本。

英偉達發(fā)布Cosmos Reason推動機器人智能化發(fā)展

在最近舉行的SIGGRAPH國際計算機圖形學和交互技術會議上英偉達展示了一系列針對機器人開發(fā)者的新技術,其中最引人注目的是其推出的開源物理AI模型——Cosmos Reason。該模型參數(shù)量達到70億,旨在為機器人提供更高效的視覺推理能力。

英偉達指出,自從OpenAI推出CLIP模型以來,視覺語言模型在計算機視覺領域取得了顯著進展,尤其是在物體識別和模式識別等任務中。然而,傳統(tǒng)模型在面對復雜的多步驟任務時往往力不從心,特別是在處理模糊或新穎的現(xiàn)實情境時。Cosmos Reason憑借其卓越的記憶和理解能力,使機器人能夠像人類一樣進行推理,從而在現(xiàn)實世界中做出更加合理的行動決策。

馬斯克與阿爾特曼的愛恨情仇開辟新戰(zhàn)場,OpenAI殺入腦機接口大戰(zhàn)!

隨著GPT-5的發(fā)布,OpenAI在技術開發(fā)上面也陷入了瓶頸之中,但是阿爾特曼的動作從未停止,據(jù)《金融時報》報道,OpenAI及其聯(lián)合創(chuàng)始人阿爾特曼正準備投資一家名為Merge Labs的創(chuàng)業(yè)公司,該公司的目標與伊隆?馬斯克的Neuralink一致,都是連接人腦與計算機。

此外馬斯克在社交平臺發(fā)文稱,蘋果公司涉嫌通過限制措施,使除美國開放人工智能研究中心(OpenAI)外的任何人工智能公司都無法在其應用商店排行榜中登頂,稱此為“明確的反壟斷違規(guī)行為”。馬斯克表示,其旗下xAI公司將立即采取法律行動。

兩人的恩怨情仇因這兩件事再度引爆!展開了一場技術空窗期下,“樸實無華的商業(yè)斗爭”。

智譜視覺推理模型GLM-4.5V開源,全球100B級最佳視覺推理模型

智譜AI正式發(fā)布并開源新一代視覺推理模型GLM-4.5V,官方數(shù)據(jù)顯示,其在41個公開視覺多模態(tài)基準測試中達到同級別開源模型SOTA性能。該模型已同步在GitHub、Hugging Face和魔搭社區(qū)開源,采用MIT開源協(xié)議,支持商業(yè)使用(項目地址:https://github.com/zai-org/GLM-V/)。

從技術架構(gòu)上看,GLM-4.5V由視覺編碼器、MLP適配器和語言解碼器三部分構(gòu)成。模型通過引入三維旋轉(zhuǎn)位置編碼(3D-RoPE),顯著增強了對多模態(tài)信息中三維空間關系的感知和推理能力。同時,它支持64K tokens的多模態(tài)長上下文輸入,并采用三維卷積來提升視頻處理的效率。這些設計使得模型不僅能處理圖像,也能理解視頻內(nèi)容,并對高分辨率以及極端寬高比的圖像具有更強的處理能力和穩(wěn)健性。

阿里達摩院宣布開源具身智能“三大件” 開源機器人上下文協(xié)議RynnRCP

在世界機器人大會上,阿里達摩院宣布開源三項自研核心技術:VLA模型RynnVLA-001-7B、世界理解模型RynnEC及機器人上下文協(xié)議RynnRCP,旨在推動數(shù)據(jù)、模型與機器人本體的兼容適配,打通具身智能開發(fā)流程。

具身智能領域發(fā)展迅速,但面臨開發(fā)碎片化、適配困難等挑戰(zhàn)。達摩院引入MCP理念,提出并開源RCP,推動不同數(shù)據(jù)、模型與本體無縫對接。其打造的RynnRCP是完整機器人服務協(xié)議和框架,已支持多款熱門模型和機械臂,支持范圍持續(xù)擴展。

昇騰+SGLang強強聯(lián)手!大模型推理“狂飆”低延遲時代

2025年8月,經(jīng)過SGLang社區(qū)與昇騰的共同努力,將SGLang的靈活編程框架與昇騰強大的異構(gòu)算力深度融合,使能SGLang在昇騰上無縫運行大模型推理,并正式面向用戶推出基于SGLang的大EP集群推理解決方案。當前用戶可獲取最新release版本的SGLang以體驗低延遲、高吞吐的推理系統(tǒng)。

IDC報告:2024年中國AI公有云服務市場規(guī)模激增,阿里云蟬聯(lián)中國市場第一

根據(jù)IDC最新發(fā)布的《中國AIP公有云服務市場份額,2024:全面向生成式AI演進》報告,2024年中國AIP公有云服務市場規(guī)模預計將達到195.9億元人民幣,較2023年增長55.3%。這一增長主要得益于生成式AI應用的不斷拓展以及機器學習需求的顯著提升,推動了云服務市場的迅猛發(fā)展。

在各個細分市場中,計算機視覺公有云服務市場表現(xiàn)尤為突出,2024年市場規(guī)模預計達到81.0億元,同比增長33.7%。在這一領域,騰訊云和百度智能云分別占據(jù)市場第一和第二的位置,充分展現(xiàn)了它們在技術和應用方面的優(yōu)勢。

與此同時,對話式AI公有云服務市場也呈現(xiàn)出強勁的增長態(tài)勢,2024年市場規(guī)模預計為20.9億元,較2023年增長39.5%。在這一市場中,阿里云和百度智能云同樣位列前兩名,彰顯了它們在智能交互領域的強大競爭力。

《黑神話:鐘馗》即將來襲:國產(chǎn)3A巨制如何再次挑戰(zhàn)算力極限?

2025年8月20日,游戲科學(Game Science)創(chuàng)始人馮驥與美術總監(jiān)楊奇通過社交媒體宣布,團隊將暫時延緩《黑神話:悟空》的DLC開發(fā),轉(zhuǎn)而將精力投入到一款名為《黑神話:鐘馗》的新作中 。這一消息迅速引爆了游戲圈。

《黑神話:鐘馗》的曝光預示著國產(chǎn)3A游戲?qū)⒃俅翁魬?zhàn)計算機算力的極限?;谇白鳌逗谏裨挘何蚩铡匪鶚淞⒌母呒夹g壁壘,新作有望在圖形渲染、物理模擬和世界構(gòu)建等多個維度實現(xiàn)技術飛躍。這不僅意味著更精細的光線追蹤、更復雜的物理算法(如物質(zhì)點法MPM)和更龐大的無縫開放世界,也預示著對玩家PC硬件,特別是GPU的并行計算能力、CPU的邏輯處理能力和高速存儲設備,將提出前所未有的嚴苛要求。這場由軟件創(chuàng)新驅(qū)動的硬件“軍備競賽”,將推動游戲產(chǎn)業(yè)與硬件廠商進行更深度的協(xié)同,共同定義下一代游戲的技術標準。

拿Money“鋪出一條AI路”:軟銀豪賭AI全產(chǎn)業(yè)鏈,孫正義的“人工超級智能”野心

2025年,軟銀集團以資本為杠桿,在全球AI算力產(chǎn)業(yè)鏈掀起了一場前所未有的投資風暴。其創(chuàng)始人孫正義以“人工超級智能(ASI)”為終極目標,通過一系列橫跨芯片設計、制造、數(shù)據(jù)中心和AI應用的垂直整合投資,構(gòu)建一個由軟銀主導的AI全產(chǎn)業(yè)鏈生態(tài)。這場豪賭的核心在于,軟銀不再滿足于作為財務投資者,而是要成為AI時代的“行業(yè)組織者”,通過控制從底層硬件到頂層應用的全鏈條,在未來的技術競爭中占據(jù)絕對主導地位。

智元機器人以全鏈條布局加速具身智能商用落地

2025年8月21日,智元機器人首屆合作伙伴大會在上海舉行,主題為“與智同行 共啟新元”。大會通過戰(zhàn)略發(fā)布、場景化解決方案展示和機器人體驗,展現(xiàn)了智元在“產(chǎn)品、技術、商業(yè)、生態(tài)、資本、團隊”的全鏈條布局。依托“一體三智”架構(gòu)與全系列產(chǎn)品矩陣,智元與合作伙伴攜手,加快具身智能商業(yè)化進程,推動產(chǎn)業(yè)從“技術探索”邁向“規(guī)模商用”。

“先進存力AI推理工作組”成立,共同推進AI普惠千行百業(yè)

2025中國算力大會上,由中國信息通信研究院聯(lián)合華為數(shù)據(jù)存儲、科大訊飛、浪潮、曙光、沐曦、清微智能、中國移動、中國電信、中國聯(lián)通等企業(yè)共同成立的“先進存力AI推理工作組”。該工作組旨在推動AI推理領域的“存算協(xié)同、生態(tài)共建”,標志著我國AI推理產(chǎn)業(yè)進入新階段。華為數(shù)據(jù)存儲產(chǎn)品線戰(zhàn)略與業(yè)務發(fā)展部總裁王旭東參與了成立儀式。

在代理AI和物理AI推動下,全球芯片市場預計將突破1萬億美元大關

根據(jù)分析公司Counterpoint Research發(fā)布的一份新報告,人工智能的迅速發(fā)展正推動全球半導體市場迎來前所未有的增長。該報告預測,隨著代理AI和物理AI的興起,全球芯片市場的收入預計將在未來數(shù)年內(nèi)突破1萬億美元。這一數(shù)字幾乎是當前市場規(guī)模的兩倍,預計到2024年,市場收入將達到6560億美元。

連續(xù)虧損近十年!營收今年增長43倍,“中國小英偉達” 寒武紀的逆襲之路

一家連續(xù)虧損八年、累計虧損近50億元的企業(yè),卻在2025年夏季創(chuàng)下股價千元、市值5500億的神話,寒武紀的狂飆突進堪稱中國AI芯片領域最具爭議性的現(xiàn)象。

2025年8月26日,寒武紀交出了一份令人瞠目的半年報:營收28.81億元,同比增長4347.82%;凈利潤10.38億元,成功扭虧為盈。這份財報背后,是這家被譽為“中國英偉達”的AI芯片公司從瀕臨絕境到絕地重生的瘋狂逆轉(zhuǎn)。

IBM與AMD“聯(lián)姻”沖刺量子計算,重新定義計算的未來,打造AI新生態(tài)

全球科技產(chǎn)業(yè)正面臨一道日益擴大的“算力鴻溝”,一邊是暴漲的人工智能與數(shù)字化轉(zhuǎn)型需求,另一邊是傳統(tǒng)計算架構(gòu)性能增長的放緩。在這場算力競賽中,IBM與AMD的強強聯(lián)合試圖開辟一條全新路徑。

老牌美國科技巨頭IBM與AI算力芯片全球排名第二的AMD發(fā)布公告,宣布將共同開發(fā)被稱為“量子中心超級計算”(quantum-centric supercomputing)的下一代計算架構(gòu),并豪言此舉或?qū)ⅰ爸匦露x計算的未來”。

這一被稱為“量子中心化超級計算”的新型架構(gòu),旨在突破傳統(tǒng)計算的性能極限,為復雜AI工作負載提供前所未有的處理能力。

馬斯克從不缺席AI趨勢!xAI入局AI編程,主打“快速且經(jīng)濟”,還限時7天免費薅羊毛!

埃隆·馬斯克旗下人工智能公司xAI正式進軍AI編程領域,推出全新智能代碼生成模型Grok Code Fast 1。這款主打“快速且經(jīng)濟”的編程模型,正在掀起AI輔助編程的效率革命。

據(jù)悉,Grok Code Fast 1將在包括Cursor、GitHub Copilot、Cline、opencode、Windsurf、Roo Code和Kilo Code在內(nèi)的主流智能編程平臺上限時免費開放。

另據(jù)xAI方面表示,該模型的“核心優(yōu)勢在于以經(jīng)濟實惠的精簡架構(gòu)實現(xiàn)強勁性能,使其成為快速、低成本處理常見編碼任務的靈活之選”。

百度未來五年計劃培養(yǎng)1000萬AI人才

近日,國務院常務會議審議通過了《關于深入實施 “人工智能 +” 行動的意見》,為中國人工智能技術與產(chǎn)業(yè)的深度融合以及規(guī)?;虡I(yè)應用指明了方向。百度副總裁石清華表示,《意見》的出臺標志著中國在人工智能領域邁入全面融合、深化應用的新階段。

作為國內(nèi)領先的人工智能公司,百度在過去十年中已累計投入超過1800億元人民幣用于研發(fā)。此前,百度已經(jīng)提前完成了培養(yǎng)500萬AI人才的目標,并在此基礎上,宣布未來五年將再培養(yǎng)1000萬AI人才。這個計劃不僅體現(xiàn)了百度對人工智能人才培養(yǎng)的重視,也顯示出其推動行業(yè)發(fā)展的決心。

02

產(chǎn)品動態(tài)

Qwen3卷王名正實歸,又又又開源新模型了!Qwen3-Coder-Flash,33GB內(nèi)存跑出GPT-4級生產(chǎn)力

2025年8月1日,阿里巴巴通義千問團隊正式開源Qwen3-Coder-Flash(全稱Qwen3-Coder-30B-A3B-Instruct),這款被開發(fā)者社區(qū)稱為“甜品級”的編程模型在性能與效率的平衡木上完成了一次漂亮的后空翻。

它采用30.5億參數(shù)MoE架構(gòu),卻只需激活其中3.3億參數(shù),如同一個精密的神經(jīng)網(wǎng)絡開關系統(tǒng),在保證強大智能的同時實現(xiàn)了驚人的運行效率。

階躍星辰最新一代基礎大模型Step3正式開源

階躍星辰團隊推出新一代開源基礎大模型Step3,專為企業(yè)和開發(fā)者平衡性能與成本設計,適配推理時代應用場景,可在Github等平臺下載。

該模型采用MoE架構(gòu),參數(shù)規(guī)模龐大,具備出色的視覺感知與復雜推理能力,能處理跨領域知識理解等任務。經(jīng)MFA和AFD優(yōu)化,推理效率顯著提升,同時開源的StepMesh通信庫提供跨硬件部署支持。

核心結(jié)構(gòu)上,Step3運用自研MFA注意力機制,降低資源消耗,實現(xiàn)高效推理,可在特定顯卡配置下完成大吞吐量任務。多模態(tài)處理通過優(yōu)化視覺編碼器減少計算量,提升效率。訓練過程分階段進行,結(jié)合多樣語料與清洗策略,增強模型性能。

系統(tǒng)架構(gòu)方面,Step3重構(gòu)解碼流程,采用高性能AFD方案與多級流水線調(diào)度,提升吞吐效率。StepMesh通信庫保障跨卡高效傳輸,適配多種硬件。實測性能優(yōu)于同類模型,特定場景下增益顯著。

中文亂碼成歷史!阿里通義千問開源Qwen-Image,AI生圖迎來文本精準時代

8月5日凌晨,阿里巴巴通義千問團隊宣布開源其首個圖像生成基礎模型Qwen-Image,這一基于20億參數(shù)的多模態(tài)擴散變換器(MMDiT)模型在復雜文本渲染和精確圖像編輯領域?qū)崿F(xiàn)重大突破。

重磅升級!Claude Opus4.1橫空出世,編程能力直沖74.5%新高

人工智能公司Anthropic正式發(fā)布其旗艦模型Claude Opus4的升級版——Claude Opus4.1。此次更新旨在全面提升模型的agentic任務、真實世界編程和推理能力,尤其是在編程和數(shù)據(jù)分析方面的表現(xiàn)引人注目。

根據(jù)官方信息,Claude Opus4.1的最大亮點在于其驚人的編程性能提升。在SWE-bench Verified編程評測中,其表現(xiàn)高達74.5%,這一成績顯示了其在處理復雜代碼問題上的強大實力。GitHub的反饋也印證了這一點,開發(fā)者們普遍認為Opus4.1在多文件代碼重構(gòu)等任務上表現(xiàn)優(yōu)于其前身。此外,日本電商巨頭Rakuten Group也指出,新模型能夠更精準地定位大型代碼庫中的錯誤,有效減少不必要的更改和潛在bug。

小紅書發(fā)布開源多模態(tài)大模型dots.vlm1,以NaViT視覺編碼器領跑行業(yè)

小紅書Hi Lab近日發(fā)布并開源首個自研多模態(tài)大模型dots.vlm1。該模型以12億參數(shù)的NaViT視覺編碼器和DeepSeek V3大語言模型為基礎,從零開始完整訓練,在多模態(tài)視覺理解與推理能力上表現(xiàn)卓越,性能已接近當前領先的閉源模型Gemini2.5Pro和Seed-VL1.5,標志著開源多模態(tài)模型性能邁上新臺階。

dots.vlm1的核心優(yōu)勢在于其原生自研的NaViT視覺編碼器。不同于傳統(tǒng)基于成熟模型微調(diào)的方式,NaViT從零訓練且支持動態(tài)分辨率,能更好地適應多樣化的真實圖像場景。該模型結(jié)合純視覺與文本視覺雙重監(jiān)督,極大提升了泛化能力,處理表格、圖表、公式、文檔等非典型結(jié)構(gòu)化圖片時表現(xiàn)尤為出色。

阿里新發(fā)布Qwen3-4B模型:小巧強勁,手機也能跑AI!

阿里巴巴通義千問團隊推出全新Qwen3-4B系列模型,包括Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507兩個版本。這一發(fā)布標志著小型語言模型(SLM)技術的重要突破,為移動端AI應用開辟了新的發(fā)展路徑。

新發(fā)布的模型最大特色在于實現(xiàn)了性能與體積的平衡優(yōu)化。盡管參數(shù)規(guī)模相對較小,但這些模型能夠高效運行在智能手機等移動設備上,有效解決了傳統(tǒng)大模型對硬件資源的高依賴問題。

在技術規(guī)格方面,Qwen3-4B-Instruct-2507在通用能力上取得顯著進展。該模型具備更強的指令理解和執(zhí)行能力,響應速度明顯提升,特別適用于內(nèi)容創(chuàng)作和工具調(diào)用等實際應用場景。值得注意的是,模型的上下文處理能力已擴展至256K,使其能夠處理長文本任務,這在同規(guī)模模型中表現(xiàn)突出。

MiniMax Speech 2.5語音生成模型上線:多語種表現(xiàn)力更強

MiniMax宣布推出新一代語音生成模型Speech2.5,這一升級版模型在全球語音技術領域再次樹立了新的標桿,進一步鞏固了其作為全球最強語音模型的地位。Speech2.5在多語種表現(xiàn)力、音色復刻以及語種覆蓋范圍等方面均實現(xiàn)了顯著提升。

與今年5月發(fā)布的Speech02相比,Speech2.5在多語種表現(xiàn)力上取得了飛躍性進步,尤其在中文方面繼續(xù)保持全球最強水平,同時英文及其他多語種的表現(xiàn)也得到了全面提升。該模型在字錯率、相似度和自然韻律度等方面均超越了前代產(chǎn)品,用戶可以在40種語言之間輕松切換,無論是商務會議、日常對話還是英文播客,都能提供更加自然流暢的語音體驗,徹底擺脫了以往語音合成中常見的“機械感”。

一文帶您了解GPT-5,OpenAI數(shù)據(jù)狂飆背后,卻揭露了AI腳步放緩的殘酷現(xiàn)實

今年,OpenAI備受大眾矚目的重磅產(chǎn)品終于登場。北京時間8月8日凌晨一點,OpenAI正式對外宣布,推出新一代旗艦級人工智能(AI)模型——GPT-5。這款模型堪稱OpenAI首個“一體化”的AI系統(tǒng),它創(chuàng)新性地將o系列模型的強大推理能力與GPT系列模型的快速響應特性完美融合。

但萬眾矚目下GPT-5的升級遠遠沒達到大眾的預期,盡管奧特曼宣稱GPT-5是“邁向AGI的關鍵一步”,實際卻沒有什么顛覆性的改變。其改進幅度無法媲美GPT-3到GPT-4的飛躍。而這恰恰折射出數(shù)據(jù)狂飆背后,本質(zhì)問題漸漸浮現(xiàn)。

馬斯克旗下xAI宣布Grok 4 AI模型永久免費開放

xAI公司宣布了一個震驚全球的消息:Grok4人工智能模型將對全球所有用戶永久免費開放。這一決定標志著xAI在人工智能領域邁出了重要一步,為全球用戶提供了一個無需支付費用即可使用的先進AI工具。

Grok4的免費開放不是試用,也不是限時優(yōu)惠,而是真正的永久免費。xAI為用戶提供了兩種使用模式:Auto模式和Expert模式。在Auto模式下,系統(tǒng)會根據(jù)用戶問題的復雜度自動判斷是否需要使用Grok4進行高級推理。如果用戶想要更多的控制權(quán),可以隨時切換到Expert模式,讓每個查詢都通過Grok4處理。

智元機器人發(fā)布機器人世界模型開源平臺——Genie Envisioner

智元機器人在上海宣布推出面向真實世界機器人操控的統(tǒng)一世界模型平臺——Genie Envisioner(GE)。這一創(chuàng)新平臺突破了傳統(tǒng)機器人學習系統(tǒng)分階段開發(fā)的模式,將未來幀預測、策略學習與仿真評估整合進以視頻生成為核心的閉環(huán)架構(gòu),實現(xiàn)了機器人從“看”到“想”再到“動”的端到端推理與執(zhí)行?;诩s3000小時的真實機器人操控視頻數(shù)據(jù),GE在跨平臺泛化和長時序任務執(zhí)行上展現(xiàn)出顯著優(yōu)勢,為具身智能發(fā)展開辟了從視覺理解到動作執(zhí)行的全新技術路徑。

GE的核心突破在于構(gòu)建了基于世界模型的視覺中心建模范式。與主流的視覺-語言-行動(VLA)方法不同,GE直接在視覺空間中建模機器人與環(huán)境的交互動態(tài),完整保留了操控過程中的空間結(jié)構(gòu)和時序演化信息。這種建模范式不僅賦予了GE高效的跨本體泛化能力,使其能夠在極少量數(shù)據(jù)下實現(xiàn)跨平臺遷移,還在長時序任務的精確執(zhí)行能力上展現(xiàn)出巨大優(yōu)勢。例如,在折疊紙盒等超長步驟任務中,GE-Act的成功率遠超現(xiàn)有頂尖方法。

PS技術哪家強?阿里通義來幫忙,Qwen-Image-Edit,AI圖像編輯神器!

中文海報中的細小文字精準替換、書法作品逐字修正、品牌IP角色多風格轉(zhuǎn)換,這些曾讓專業(yè)設計師耗費數(shù)小時的操作,如今通過一句指令即可完成。

8月19日凌晨,阿里通義千問團隊開源了其最新圖像編輯模型Qwen-Image-Edit,這是繼月初發(fā)布Qwen-Image后,在多模態(tài)AI領域的又一重磅突破。該模型基于200億參數(shù)的Qwen-Image進一步訓練,首次實現(xiàn)了語義控制與外觀編輯的雙重能力。

在數(shù)字內(nèi)容爆發(fā)式增長的時代,Qwen-Image-Edit的誕生標志著AI圖像處理從生成向精準編輯演進的關鍵轉(zhuǎn)折。它不僅繼承了Qwen-Image在中文文本渲染上的優(yōu)勢,更將這一能力擴展至編輯領域。

DeepSeek V3.1正式發(fā)布:長文檔分析、代碼理解能力大幅增強

8月19日晚間DeepSeek官方宣布線上模型版本已升級至V3.1,其最顯著的改進是上下文長度拓展至128K,相當于可處理10萬至13萬漢字的超長文本,這一特性使其適用于長文檔分析、代碼庫理解及多輪對話場景。

智譜AutoGLM上線:給每個手機都裝上通用Agent

8月20日,智譜宣布發(fā)布全球首個手機Agent——AutoGLM 2.0,由國產(chǎn)模型GLM-4.5與GLM-4.5V驅(qū)動,具備推理、代碼和多模態(tài)處理能力,能夠在多種設備和場景中運行,幫助用戶執(zhí)行操作。

DeepSeek安利的“UE8M0 FP8”:下一代國產(chǎn)算力標準?

“UE8M0 FP8是針對即將發(fā)布的下一代國產(chǎn)芯片設計?!痹贒eepSeek-V3.1發(fā)布文章的置頂評論中,這句簡短的技術說明迅速在AI圈引發(fā)熱議。

這不僅僅是一次模型升級,更是中國AI算力自主化道路上的重要里程碑。DeepSeek此次的技術選擇,首次從軟件層面反向定義國產(chǎn)芯片標準,為擺脫對外部算力的依賴提供了關鍵支撐。

如果把AI產(chǎn)業(yè)比作一條高速公路,過去三十年我們擅長把路修寬(擴大算力規(guī)模),卻一直在用別國設計的“車道寬度”(FP32/FP16/BF16 等國際標準)。DeepSeek這一次把車道縮到8bit,卻通過UE8M0把動態(tài)范圍放大32倍,等于在原有路基上憑空多修了兩條應急車道——不增加制造成本,卻讓國產(chǎn)芯片第一次能把大模型“開”得又快又穩(wěn)。

馬斯克xAI開源Grok 2.5:Grok 3將于半年后開源

近日,埃隆·馬斯克在社交平臺X上宣布,其人工智能公司xAI已正式開源Grok2.5模型,向公眾開放了該模型的源代碼。這一舉措是馬斯克推動技術開放理念的又一具體實踐,也為人工智能領域的發(fā)展開辟了新的路徑。

黃仁勛給機器人送“禮物”了!英偉達Jetson Thor掀起物理AI的浪潮

英偉達為機器人打造的“新大腦”Jetson Thor正式發(fā)售,性能飆升7.5倍,能耗卻僅為130瓦,宇樹、優(yōu)必選等中國廠商已搶先采用,2萬多元的售價背后是中國市場對高性能AI芯片的迫切需求。

北京時間8月25日晚,英偉達宣布其專為機器人及自動駕駛計算平臺設計的系統(tǒng)級芯片Thor正式量產(chǎn)上市。

這款基于Blackwell架構(gòu)的芯片,被譽為“機器人的新大腦”,單顆AI算力在FP8標準下達到1035TFLOPS,在FP4標準下更是高達2070TFLOPS,性能是上一代Orin的7.5倍,能效比提升3.5倍。

03

政策發(fā)布

宇樹科技王興興獲聘首席科學家,杭州布局具身智能新高地

8月4日,杭州高新區(qū)(濱江)舉辦人工智能產(chǎn)業(yè)創(chuàng)新高地建設推進大會,正式啟動了杭州具身智能應用中試基地。在此次大會上,備受矚目的機器人公司宇樹科技的CEO王興興被授予首席科學家聘書,將主導該基地的技術與科研方向。

該中試基地旨在打通科研成果與產(chǎn)業(yè)化之間的“最后一公里”,它將建設包括能力供給中心、模型訓練中心、場景驗證中心和測試認證中心在內(nèi)的四大核心功能區(qū)。通過這一系列布局,杭州高新區(qū)希望形成“算力+數(shù)據(jù)+模型+場景應用”的完整鏈條,培育新質(zhì)生產(chǎn)力,最終打造一個具有全國示范效應的具身智能全體系高地。

為確保具身智能產(chǎn)業(yè)的快速發(fā)展,杭州高新區(qū)推出了多項強有力的支持政策。

在數(shù)據(jù)要素方面,政府將提供每年高達5000萬元的“語料券”,并為企業(yè)年度基礎設施使用費用提供最高50% 的補助,以鼓勵企業(yè)在人工智能大模型研發(fā)和應用中利用數(shù)據(jù)資源。

在算力要素方面,高新區(qū)每年將安排最高1億元的“算力券”,為企業(yè)的算力使用費用提供最高60% 的補助,旨在緩解企業(yè)在AI研發(fā)中對高算力的需求壓力。

此外,大會還發(fā)布了涵蓋生產(chǎn)制造、金融貿(mào)易、醫(yī)療健康等五大領域的人工智能典型場景需求,并啟動了杭州數(shù)谷數(shù)據(jù)創(chuàng)新中心和浙江省人形機器人未來產(chǎn)業(yè)先導區(qū)的建設,進一步完善了杭州在人工智能領域的產(chǎn)業(yè)布局。

04

會議活動

2025世界機器人大會,千款機器人“打工”火出圈,其幕后英雄算力功不可沒

北京亦莊,立秋后的雨水未能澆滅科技熱情。2025世界機器人大會在雨中開幕。200余家企業(yè)、1500件展品、100多款全球首發(fā)新品匯聚于此,規(guī)模創(chuàng)歷屆之最。

與往屆不同,今年展館內(nèi)少了些“花拳繡腿”,多了真實工作場景的轟鳴:優(yōu)必選Walker S2在流水線上自主完成3分鐘換電后立即重返工位;宇樹R1機器人流暢完成咖啡拉花全套動作;星海圖機器人正為觀眾現(xiàn)場鋪床疊被。

隨著2025年世界機器人大會正如火如荼地開展。其中,人形機器人的場景化應用落地進程顯著加快——它們不再局限于“站樁”式的靜態(tài)展示,而是積極投身于探索能夠替代人類執(zhí)行任務的實際場景與解決方案,其核心競爭力集中體現(xiàn)在“能否迅速勝任工作”上,目前工廠搬運等模擬應用場景已大量涌現(xiàn)。在探尋合適落地場景的過程中,“先上崗實踐、再進入家庭服務”已成為推動機器人廣泛普及的現(xiàn)實路徑。

當鋼鐵之軀踏上運動賽道,具身智能“元年”還會帶給我們哪些驚喜?

8月14日夜晚,全球范圍內(nèi)首個以人形機器人作為參賽核心的綜合性體育盛事——“2025世界人形機器人運動會”,在北京的國家速滑館“冰絲帶”盛大啟幕。此次盛會吸引了來自16個國家的280支精英參賽隊伍匯聚京城。

在8月15日至17日這短短三天內(nèi),他們將圍繞競技賽、表演賽、場景賽及外圍賽四大類共計26個精彩賽項,展開多達487場的激烈角逐,全方位展示了人形機器人在智能決策、運動協(xié)作等尖端科技領域的最新突破與成就。

此番盛會,是北京在成功舉辦“世界機器人大會”“人形機器人半程馬拉松”等科技盛宴之后,再次以科技之名,向世界發(fā)出的璀璨邀請,讓全球的目光再次聚焦于這座古老而又現(xiàn)代的城市,共同見證人形機器人時代的輝煌啟航。

2025開放計算技術大會落幕 百度與浪潮信息榮膺開放計算最佳實踐標桿

8月7日,2025開放計算技術大會在北京圓滿落幕。這場由開放計算社區(qū)OCP及開放標準組織OCTC聯(lián)合主辦,以“開放變革:筑基、擴展、進化”為主題的行業(yè)盛會,匯聚了中國移動、字節(jié)跳動、阿里云、三星、浪潮信息、清華大學、百度等超千位知名學者、技術專家及企業(yè)代表,圍繞計算、存儲、網(wǎng)絡、液冷等基礎設施底層架構(gòu)的技術創(chuàng)新,算法與算力系統(tǒng)、硬件和軟件的協(xié)同創(chuàng)新,以及開放計算技術賦能人工智能熱門應用等議題開放分享,成為全球AI數(shù)據(jù)中心領域的重要風向標。

大會期間,OCP Foundation特別公布了2025開放計算最佳創(chuàng)新代表、最佳實踐標桿、最佳生態(tài)貢獻企業(yè)名單,以激勵在開放計算領域做出杰出貢獻的企業(yè)。其中,浪潮信息與百度榮膺最佳實踐標桿,憑借其在技術創(chuàng)新、標準構(gòu)建及實踐落地等方面的卓越表現(xiàn),成為開放計算創(chuàng)新實踐的典范。

鄂爾多斯聚“算”成勢:WEC2025世界算力博覽會成功舉行

8月13日—16日,WEC2025世界算力博覽會在鄂爾多斯國際會展中心成功舉行,本屆博覽會由中國計算機學會、全國信標委算力標準工作組、北京并行科技股份有限公司、鄂爾多斯市高新技術產(chǎn)業(yè)投資有限責任公司聯(lián)合發(fā)起,匯集71家廠商參展,創(chuàng)歷年新高。

今年展會落地“東數(shù)西算” 工程關鍵節(jié)點城市——鄂爾多斯,首次實現(xiàn) “算力技術” 與 “綠色能源” 的深度融合,吸引來自產(chǎn)學研用等業(yè)界人士及各行各業(yè)的技術愛好者的積極參與,集中展示算力產(chǎn)業(yè)前沿技術和創(chuàng)新成果,涵蓋人工智能、算力、網(wǎng)絡等重點領域。

看2025中國算力大會如何為算力產(chǎn)業(yè)鏈注入“新鮮血液”!這些關鍵信息,不要錯過

8月23日,山西大同召開的2025中國算力大會主論壇上,工信部副部長熊繼軍宣布了一系列令人矚目的數(shù)據(jù):截至2025年6月底,我國在用算力中心標準機架達1085萬架,智能算力規(guī)模達788 EFLOPS(每秒百億億次浮點運算),存力總規(guī)模超過1680EB。

這些數(shù)字背后是中國算力產(chǎn)業(yè)每年約30%的快速增長,尤其是智能算力需求呈現(xiàn)爆發(fā)式增長。2025中國算力大會的召開,明確了算力作為數(shù)字經(jīng)濟時代核心生產(chǎn)力的戰(zhàn)略地位,并從政策、技術、生態(tài)等多方面深刻影響了算力產(chǎn)業(yè)鏈的各個環(huán)節(jié)。

分享到

lixiangjing

算力豹主編

相關推薦