“如果看上層智算的發(fā)展速度,你就知道我們基礎設施層面臨多大壓力?!比A為中國數(shù)字能源數(shù)據(jù)中心能源拓展部部長石憶開門見山地說。
生成式AI的增速驚人,可能是移動互聯(lián)網的“三倍速”。根據(jù)國家數(shù)據(jù)局的信息,2024年初全國日均token使用量為1000億,到2025年6月底已飆升至日均30萬億,18個月增長約300倍。有業(yè)內人士感嘆,如果勢頭持續(xù)下去,“token”這個單位恐怕都要換了,否則難以計量這場爆發(fā)式增長。
這場由AI驅動的智能化浪潮,正在把智算基礎設施推向前所未有的挑戰(zhàn)與拐點。
01 AI在狂飆,“地基”在冒煙?
今年以來,國內token用量呈現(xiàn)“六路并進”大潮:互聯(lián)網大廠都在大力投資,全力改寫自身產品矩陣;金融行業(yè)從“單點試水”進入“全棧滲透”;制造業(yè)用智能體重構更柔性的業(yè)務流,超越日企“精益制造”;創(chuàng)業(yè)公司中“下一個黑馬企業(yè)”已誕生;具身智能、視頻生成有望成長為新一代萬億級產業(yè);全國生成式AI用戶今年6月已達5.15億人。
“我們處在一個最好的時代?!笔瘧浾f,無論是工業(yè)變革,還是信息變革,AI帶來了前所未有的機遇。在這樣的背景之下,2025 年中國智算中心建設繼續(xù)“高歌猛進”,智算中心年復合增長率在40%~46%之間。
但在高速擴張的同時,智算中心的結構性矛盾與運營痛點也集中暴露。石憶最近與很多客戶交流發(fā)現(xiàn),大家還有幾個共同的焦慮。比如對智算中心的安全擔憂,高能耗、高功率引發(fā)的一系列問題,以及對“建成即過時”的擔憂。
“這也是一個很焦慮的時代?!笔瘧浾f。具體來說,當下基礎設施面臨幾大核心挑戰(zhàn):
首先是安全性挑戰(zhàn)。智算中心正迅速高密化,一個10MW智算中心承載的算力,是通算中心的100多倍,其上運行的大模型訓練與推理極多,一旦斷電宕機,將造成巨大經濟損失。
其次是快速交付挑戰(zhàn)。為更快上線業(yè)務,OTT客戶普遍要求數(shù)據(jù)中心在6–12個月內投運,而傳統(tǒng)數(shù)據(jù)中心通常需18–24個月以上。
再次是數(shù)據(jù)中心彈性挑戰(zhàn)。客戶最焦慮的是“建成即過時”。隨著摩爾定律失效,“后摩爾時代”接棒,芯片一年一迭代,但數(shù)據(jù)中心壽命動輒十年,如何不被技術浪潮“反噬”?
第四是運營變現(xiàn)壓力。隨著數(shù)據(jù)中心高密化,供配電系統(tǒng)侵占白空間,導致可運營面積縮水,“這種狀況必須改變。”石憶說。
最后是資源挑戰(zhàn)。大型智算中心能耗堪比中小城市,能耗、土地、水資源消耗激增,運營商OPEX壓力、資源供需矛盾正成為行業(yè)的最大瓶頸。
為應對上述挑戰(zhàn),石憶談及,華為提出AIDC建設理念“RAS”,即要打造安全可靠(Reliable),彈性敏捷(Agile),綠色低碳(Sustainable)的智算底座。
02 安全、彈性與每一瓦電的較量
在“RAS”建設理念中,安全可靠是智算底座的基石?!八拖袢说慕】狄粯樱乔懊娴摹?’,其他都是后面的‘0’?!笔瘧浾f。圍繞這一核心,華為從架構、產品到運維,重構了數(shù)據(jù)中心的全生命周期體系。
在架構層面,通過分布式設計降低故障波及范圍,并將儲能系統(tǒng)隔離部署,規(guī)避潛在連鎖災害;在產品層面,以全流程質量管控確??煽啃?,華為UPS可靠性達業(yè)界2倍;在智能化層面,數(shù)據(jù)中心“服務AI”也“由AI驅動”,過去一年,華為投入海量資源進行算法開發(fā),實現(xiàn)鋰電“上電即上云”的主動預警。
面對AI高速演進,彈性敏捷成為新的競爭點??蛻糇畲髶鷳n是“建成即過時”,“彈性數(shù)據(jù)中心是唯一選擇?!?/strong>石憶說。華為通過系統(tǒng)解耦、模塊化和標準化,使供電、制冷、IT子系統(tǒng)相互獨立,靈活部署。預制化交付讓大量工序前置工廠,現(xiàn)場施工周期縮短超六成。例如華為云(蕪湖)數(shù)據(jù)中心項目,僅用三個月完成交付,為行業(yè)樹立新標桿。
在高密度時代,綠色低碳成為可持續(xù)發(fā)展的底線?!半娏褪撬懔Φ纳舷蕖币殉尚袠I(yè)共識,石憶強調,關鍵是高效用電,來解決算和電的根源性矛盾。華為UPS在S-ECO模式下效率高達99.1%;通過AI協(xié)同制冷,讓能源與算力設施“聯(lián)合作戰(zhàn)”,顯著降低PUE。以500MW數(shù)據(jù)中心為例,PUE每降低0.1,一年可節(jié)省電費約2億元。
同時,越來越多智算中心建設在風光電富集區(qū),實現(xiàn)“綠電直供、就地消納”。在儲能環(huán)節(jié),傳統(tǒng)鉛酸電池正在被高效、占地更小、可智能管理的鋰電池替代。華為推動鋰電標準化,并推出“鋰電池管理安全衛(wèi)士”系統(tǒng)。目前,鋰電方案已在多個項目中落地。
石憶強調,安全靠的是高質量,而高質量不是低成本的產物。從數(shù)據(jù)中心10至15年的生命周期看,一次中斷造成的損失遠超在可靠與綠色基礎設施上的投入。真正的矛盾,不在安全與低碳之間,而在短期成本與長期價值之間。
03 “軟著陸”與“快起飛”
在數(shù)據(jù)中心建設中,新建與改造并重。全國在網機架已達千萬級,不少設備服役超過8年,逐步進入改造期。許多客戶擔心改造意味著“大動干戈”,石憶表示,通過場景化解決方案,企業(yè)可實現(xiàn)“軟著陸”。而對需從通算邁向高密智算的場景,新建過程中需要“快起飛”。
在金融等對可靠性要求極高的行業(yè),核心是不影響現(xiàn)有業(yè)務連續(xù)性。在實踐案例中,中金數(shù)據(jù)昆山中心通過部署華為高質量UPS實現(xiàn)系統(tǒng)無感升級;上交所金橋數(shù)據(jù)中心通過部署iCooling@AI能效解決方案,年均PUE降低0.25,年省電累計240 萬度。
對缺乏專業(yè)運維團隊或希望“開箱即用”的政務、教育、制造等用戶,華為提供一體化微模塊數(shù)據(jù)中心,東莞濱海灣新區(qū)快速上線DeepSeek政務應用,國家氣象局構建風云三號數(shù)據(jù)中心,實現(xiàn)業(yè)務快速上線,備電系統(tǒng)采用智能鋰電柜,節(jié)省70%占地并支持預測性維護。
對于從通算邁向高密智算的場景,華為通過全預制化、模塊化方案,將原本需要1-2年的建設周期,壓縮至半年甚至更短。
中國移動呼和浩特數(shù)據(jù)中心采用華為EHU間接蒸發(fā)冷卻、電力模塊和iCooling@AI能效調優(yōu)解決方案,降低制冷能耗10%,節(jié)省配電面積40%,PUE低至1.15。博大數(shù)據(jù)前海智算中心通過采用華為電力模塊3.0,打造省地、省電、省時、省心的供配電系統(tǒng),節(jié)省占地40%,全鏈效率提升至97.8%,成為智算建設的新標桿。
這些能力背后,是華為覆蓋從硬件到云的全棧體系。通過計算產品與基礎設施協(xié)同設計,每代產品均在華為云大規(guī)模驗證,實現(xiàn)性能與能效雙優(yōu)。
在這個既澎湃又焦慮的時代,誰能在安全、彈性與綠色中取得平衡,誰就能在下一場智能浪潮中贏得先機。