7月10日,馬斯克掌舵的人工智能公司xAI正式推出了其最新一代大語(yǔ)言模型——Grok 4,并同時(shí)發(fā)布了具備多智能體協(xié)作能力的Grok 4 Heavy版本。xAI將Grok 4定位為“當(dāng)前全球最先進(jìn)的人工智能模型”。馬斯克公開(kāi)表示,Grok 4的智能表現(xiàn)已“全面超越博士水平”,尤其在處理學(xué)術(shù)問(wèn)題時(shí),其能力在所有學(xué)科領(lǐng)域均達(dá)到或超越了博士級(jí)別的標(biāo)準(zhǔn)。馬斯克還滿懷信心地預(yù)測(cè),Grok 4有望在今年內(nèi)助力人類實(shí)現(xiàn)“技術(shù)新發(fā)現(xiàn)”的突破,并可能在明年揭示新的物理現(xiàn)象。

據(jù)xAI介紹,Grok 4在訓(xùn)練所需的計(jì)算資源上實(shí)現(xiàn)了質(zhì)的飛躍,與上一代Grok 2相比,其訓(xùn)練計(jì)算量激增了100倍。特別是在推理和強(qiáng)化學(xué)習(xí)(RL)領(lǐng)域,Grok 4投入了前所未有的計(jì)算資源,其RL計(jì)算量超過(guò)其他任何模型的10倍。這一成就得益于xAI打造的擁有10萬(wàn)塊H100 GPU的“超級(jí)計(jì)算集群”。值得一提的是,僅在12個(gè)月前,Grok 2還只是一個(gè)初步構(gòu)想,而按照如今的標(biāo)準(zhǔn)來(lái)評(píng)估,其模型智能水平已與高中生相當(dāng)。

文字編輯|宋雨涵

1

博士級(jí)智力的AI助手

刷新紀(jì)錄的基準(zhǔn)測(cè)試

從理論數(shù)據(jù)層面來(lái)看,Grok 4已然在綜合性能上實(shí)現(xiàn)了對(duì)所有競(jìng)爭(zhēng)對(duì)手的全方位超越。其對(duì)手陣營(yíng)涵蓋了當(dāng)下備受矚目的頂級(jí)大模型,像OpenAI的o3、谷歌的Gemini 2.5 Pro,還有Anthropic的Claude 4等。在傳統(tǒng)基準(zhǔn)測(cè)試,以及美國(guó)高考SAT考試、各學(xué)科GRE水平測(cè)試等眾多考核場(chǎng)景中,Grok 4均展現(xiàn)出了卓越的性能優(yōu)勢(shì)。

不過(guò),相較于這些略顯常規(guī)的傳統(tǒng)基準(zhǔn)測(cè)試,Grok 4還有一項(xiàng)更為亮眼的表現(xiàn)。它挑戰(zhàn)了素有“人類最后一場(chǎng)閉卷考試”之稱的Humanity’s Last Exam(簡(jiǎn)稱HLE測(cè)試),并成功超越此前眾多模型,取得了最高達(dá)44.4%的準(zhǔn)確率。

在xAI的直播活動(dòng)中,馬斯克也著重強(qiáng)調(diào)了Grok 4的強(qiáng)大實(shí)力。他表示,Grok 4在知識(shí)儲(chǔ)備和解題能力上,比幾乎所有學(xué)科的研究生都要出色。而且,至少在學(xué)術(shù)領(lǐng)域的問(wèn)題探討與解決上,其水平優(yōu)于所有學(xué)科的博士,“不存在任何例外情況”。

美國(guó)數(shù)學(xué)邀請(qǐng)賽(AIME25):100% 滿分

數(shù)學(xué)推理測(cè)試(HMMT25):96.7%

研究生水平問(wèn)答(GPQA):88.9%

美國(guó)數(shù)學(xué)奧林匹克競(jìng)賽(USAMO25):61.9%

2

Grok 4和其未來(lái)藍(lán)圖

用工具來(lái)理解世界

與其他AI模型不同,Grok 4在訓(xùn)練階段就深度整合了工具使用能力。這一設(shè)計(jì)選擇成為其性能飛躍的關(guān)鍵。

“在訓(xùn)練中融入工具,不僅比不使用工具能取得更高分?jǐn)?shù),而且Scaling提升效率也更高?!眡AI研究員在發(fā)布會(huì)上解釋。增加同樣的計(jì)算資源,工具融入訓(xùn)練能換來(lái)更顯著的智能提升。

在直播演示中,團(tuán)隊(duì)展示了Grok 4的多樣化能力:

基于預(yù)測(cè)市場(chǎng)數(shù)據(jù),成功預(yù)測(cè)MLB世界大賽勝率,給出道奇隊(duì)21.6%的勝率

通過(guò)后牛頓近似模型,模擬兩個(gè)黑洞碰撞并生成真實(shí)的引力波可視化動(dòng)畫(huà)

在自動(dòng)零售基準(zhǔn)測(cè)試中,Grok 4創(chuàng)造的凈資產(chǎn)達(dá)到4684美元,是第二名Claude 4的兩倍。

xAI此次推出兩個(gè)版本:基礎(chǔ)版Grok 4和多智能體協(xié)作版Grok 4 Heavy。后者支持四個(gè)代理同時(shí)工作,上下文窗口最高支持256K token。

定價(jià)策略引起廣泛關(guān)注?;A(chǔ)版Grok 4訂閱費(fèi)為30美元/月,而Grok 4 Heavy的費(fèi)用高達(dá)300美元/月,是目前市場(chǎng)上最昂貴的AI訂閱服務(wù)之一。

免費(fèi)用戶只能繼續(xù)使用Grok 3,Grok 4僅對(duì)付費(fèi)用戶開(kāi)放。

xAI同時(shí)公布了明確的路線圖:8月將推出編程模型,9月上線多模態(tài)智能代理,10月推出視頻生成模型。

馬斯克還透露,特斯拉最新固件已嵌入Grok全功能版本,預(yù)計(jì)下周將激活。未來(lái)Grok還將成為特斯拉汽車的語(yǔ)音助手,支持英語(yǔ)和漢語(yǔ),徹底改變?nèi)塑嚱换シ绞健?/p>

Grok 4背后:

十萬(wàn)GPU驅(qū)動(dòng)Grok 4登頂全球最強(qiáng)AI

當(dāng)馬斯克在聚光燈下宣布“Grok 4在所有學(xué)科上超越人類博士”時(shí),很少有人意識(shí)到,這場(chǎng)AI革命真正的戰(zhàn)場(chǎng)不在發(fā)布會(huì)現(xiàn)場(chǎng),而在孟菲斯這座不起眼的工業(yè)城市里。

xAI正式確認(rèn)其第四代大模型基于10倍于前代(Grok 3)的訓(xùn)練算力開(kāi)發(fā)完成。這一跨越式提升的核心,在于位于美國(guó)田納西州孟菲斯的超算中心「Colossus」——這座被馬斯克稱為”AI算力珠峰”的超級(jí)計(jì)算機(jī),初期部署即包含10萬(wàn)張英偉達(dá)H100 GPU,并預(yù)留了全球首個(gè)GB200計(jì)算節(jié)點(diǎn)的部署空間。

創(chuàng)紀(jì)錄的算力工程

Colossus的建設(shè)速度本身就是一個(gè)科技奇跡。傳統(tǒng)數(shù)據(jù)中心建設(shè)周期通常需要18個(gè)月,而xAI團(tuán)隊(duì)僅用122天就完成了首期10萬(wàn)塊H100 GPU的部署,二期擴(kuò)容更是壓縮至92天,整個(gè)20萬(wàn)卡集群在214天內(nèi)建成。

算力巨獸催生AI大腦

當(dāng)馬斯克宣布“Grok 4在所有學(xué)科超越人類博士”時(shí),其底氣源于Colossus創(chuàng)造的工程奇跡。這座算力要塞以革命性液冷技術(shù)突破散熱極限,單機(jī)柜功率密度高達(dá)行業(yè)均值的160%;用400GbE網(wǎng)絡(luò)架構(gòu)編織出相當(dāng)于“400條并行高速公路”的數(shù)據(jù)通道;更以14臺(tái)超級(jí)發(fā)電機(jī)與特斯拉儲(chǔ)能系統(tǒng)構(gòu)建能源網(wǎng)絡(luò),將能耗效率優(yōu)化23%。

通向AGI的硬件之路

Colossus的意義遠(yuǎn)不止于訓(xùn)練一個(gè)大語(yǔ)言模型。它代表著AI發(fā)展模式的根本轉(zhuǎn)變——從算法優(yōu)先轉(zhuǎn)向算力優(yōu)先。

當(dāng)OpenAI的工程師還在優(yōu)化transformer架構(gòu)的細(xì)微參數(shù)時(shí),xAI選擇了另一條路徑:用前所未有的算力規(guī)?!氨┝ζ平狻敝悄艿倪吔?。Colossus的建設(shè)證明,在足夠的計(jì)算資源面前,許多模型瓶頸可以通過(guò)規(guī)模效應(yīng)自然解決。

這種模式帶來(lái)了驚人的成果,但也伴隨著巨大挑戰(zhàn)。Colossus的建設(shè)和運(yùn)營(yíng)成本高達(dá)數(shù)十億美元,而xAI每月“燒錢”速度據(jù)稱高達(dá)10億美元。

如此高昂的成本直接也反映在Grok 4的定價(jià)策略上:基礎(chǔ)版訂閱費(fèi)30美元/月,而多智能體協(xié)作版Grok 4 Heavy的費(fèi)用高達(dá)300美元/月,成為市場(chǎng)上最昂貴的AI訂閱服務(wù)。

結(jié)語(yǔ):

當(dāng)全球科技公司還在為萬(wàn)卡集群的建設(shè)周期以“年”計(jì)算時(shí),Colossus已用“天”作為時(shí)間單位。122天部署十萬(wàn)GPU的奇跡背后,是模塊化設(shè)計(jì)、液冷技術(shù)、網(wǎng)絡(luò)架構(gòu)和電力系統(tǒng)的全面創(chuàng)新。

這座位于孟菲斯的算力巨獸不僅是Grok 4的誕生地,更重新定義了AI基礎(chǔ)設(shè)施的建設(shè)標(biāo)準(zhǔn)。當(dāng)馬斯克宣稱“Grok 4比所有領(lǐng)域博士都聰明”時(shí),他同時(shí)也在宣告:在通向AGI的競(jìng)賽中,算力規(guī)模已成為決定性變量。

分享到

lixiangjing

算力豹主編

相關(guān)推薦