超云發(fā)布“東數(shù)西算數(shù)據(jù)中心基礎(chǔ)架構(gòu)設(shè)計(jì)方案白皮書”

東數(shù)西算工程甫一啟動(dòng),超云就積極響應(yīng)并對(duì)相關(guān)重點(diǎn)策略進(jìn)行了深度的解讀和洞察,在編寫“東數(shù)西算數(shù)據(jù)中心基礎(chǔ)架構(gòu)設(shè)計(jì)方案白皮書”的同時(shí),還不斷踐行投入到西部數(shù)據(jù)中心建設(shè)當(dāng)中,西云作為超云的重要客戶和戰(zhàn)略合作伙伴,雙方在數(shù)據(jù)中心基礎(chǔ)架構(gòu)部署,AI算力、分布式存儲(chǔ)、高速網(wǎng)絡(luò)、AI運(yùn)維以及云租賃等上層應(yīng)用,進(jìn)行了全方位合作,除了部署大量服務(wù)器,還在積極聯(lián)合研發(fā)新一代節(jié)能技術(shù),其中液冷整機(jī)柜就是其中的一款明星產(chǎn)品。

今年2月19日,國(guó)資委召開中央企業(yè)AI專題推進(jìn)會(huì),明確提出兩大核心目標(biāo):一是加快建設(shè)一批智算中心,二是開展AI+專項(xiàng)行動(dòng),構(gòu)建一批產(chǎn)業(yè)多模態(tài)優(yōu)質(zhì)數(shù)據(jù)集,打造從基礎(chǔ)設(shè)施、算法工具、智能平臺(tái)到解決方案的大模型賦能產(chǎn)業(yè)生態(tài);3月份政府工作報(bào)告提出“適度超前建設(shè)數(shù)字基礎(chǔ)設(shè)施,加快形成全國(guó)一體化算力體系”,這一決策體現(xiàn)了國(guó)家層面對(duì)于數(shù)字經(jīng)濟(jì)長(zhǎng)遠(yuǎn)發(fā)展的高度重視和戰(zhàn)略前瞻性。

“被稱為第四次技術(shù)革命的AI技術(shù),決定了未來社會(huì)的好壞甚至國(guó)家之間發(fā)展的差距。這個(gè)政策將引導(dǎo)我國(guó)在AI領(lǐng)域居于世界領(lǐng)先地位,堪稱高瞻遠(yuǎn)矚?!?月16日,新華三集團(tuán)聯(lián)席總裁、首席技術(shù)官兼技術(shù)委員會(huì)主席尤學(xué)軍在杭州召開的2024新華三媒體及分析師溝通會(huì)上表示:“對(duì)新華三來說,就要用最好的算力和聯(lián)接的技術(shù)來支持這個(gè)領(lǐng)域的快速部署,用最少的投入和最高的效率來貢獻(xiàn)自身的力量。”

新華三集團(tuán)聯(lián)席總裁、首席技術(shù)官兼技術(shù)委員會(huì)主席尤學(xué)軍

由廠商自發(fā)建設(shè)或牽頭的智算中心也陸續(xù)投入使用。

3月底,集成了寧暢在AI計(jì)算領(lǐng)域能力,以底層硬件到頂層應(yīng)用平臺(tái)系統(tǒng)化方案的“AI算力?!盢EX AI Lab(Nettrix AI Open Lab),滿足大模型落地所需的計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、建設(shè)、管理、應(yīng)用及液冷等全方位需求也在桐鄉(xiāng)落成。

寧暢“AI算力?!盢EX AI Lab

紫光股份4月3日透露,其圖靈小鎮(zhèn)AIGC智算中心已于今年1月啟用,以裸金屬智算服務(wù)器租用、云智算服務(wù)租用、大模型服務(wù)等多種能力,為企業(yè)、研究機(jī)構(gòu)、高校院所提供定制、先進(jìn)、普惠、全面的端到端的智能算力服務(wù)。

紫光股份圖靈小鎮(zhèn)AIGC智算中心啟用儀式

智算中心背后的建設(shè)者們

智算中心建設(shè),離不開廠商的綜合性解決方案。

1)超云:高性能、彈性化的AIGC數(shù)據(jù)基礎(chǔ)架構(gòu)

超云作為國(guó)內(nèi)專業(yè)的數(shù)據(jù)中心產(chǎn)品及服務(wù)提供商,同時(shí)也是國(guó)內(nèi)較早布局?jǐn)?shù)據(jù)中心解決方案的企業(yè)之一,多年來一直持續(xù)加大在產(chǎn)品研發(fā)方向的投入,通過技術(shù)創(chuàng)新與升級(jí),數(shù)據(jù)中心解決方案已經(jīng)達(dá)到業(yè)界領(lǐng)先水平。

借助于多芯架構(gòu)、雙“云”共進(jìn)的發(fā)展戰(zhàn)略,旗下產(chǎn)品線得到不斷豐富和壯大,隨著業(yè)務(wù)的發(fā)展,超云在數(shù)據(jù)中心領(lǐng)域的突破成為必然,也有義務(wù)和責(zé)任推動(dòng)行業(yè)技術(shù)的發(fā)展與進(jìn)步。超云為智算中心提供了高性能存儲(chǔ)產(chǎn)品及解決方案。

AIGC存儲(chǔ)可以為訓(xùn)練數(shù)據(jù)、模型參數(shù)、中間結(jié)果和實(shí)時(shí)/近實(shí)時(shí)數(shù)據(jù)處理提供存儲(chǔ)能力;超云為AIGC智算中心提供NS5000V、CS13000、CS13000-G和AI存儲(chǔ)信創(chuàng)版等多個(gè)版本的全閃存陣列,滿足現(xiàn)有AIGC智算中心的高帶寬、低延遲、高可用的存儲(chǔ)需求;同時(shí),為了解決更高性價(jià)比的長(zhǎng)期海量存儲(chǔ),采用分層存儲(chǔ)技術(shù),形成多副本、糾刪碼按照文件的使用頻率和創(chuàng)建時(shí)間,實(shí)現(xiàn)文件的自動(dòng)分層,同時(shí)支持外部的對(duì)象存儲(chǔ)、文件系統(tǒng)、藍(lán)光存儲(chǔ)和帶庫歸檔能力,分層存儲(chǔ)解決方案大大提升了效率,降低了成本,同時(shí)能滿足數(shù)據(jù)的長(zhǎng)期存儲(chǔ)需求。

除了能夠?yàn)锳IGC智算提供海量、高效、低延遲的存儲(chǔ)外,同時(shí)還提供超融合計(jì)算能力的云化能力;超云在云部分的產(chǎn)品布局分為四部分:超融合產(chǎn)品、云操作系統(tǒng)、集中式存儲(chǔ)和分布式存儲(chǔ),可以為AIGC基礎(chǔ)架構(gòu)提供高效、低延遲、海量的存儲(chǔ)和彈性擴(kuò)展的計(jì)算能力。

2)寧暢:六“全”特點(diǎn)構(gòu)筑“全局智算”戰(zhàn)略

寧暢CEO秦曉寧在2024年度“全局智算”戰(zhàn)略新品及方案發(fā)布會(huì)上介紹了其六“全”特點(diǎn):分別是全體系、全液冷、全服務(wù)、全場(chǎng)景、全行業(yè)、全階段。

寧暢CEO秦曉寧

全體系,是指從通用、A1、邊緣計(jì)算、整機(jī)柜、AI工作站、AI算力棧等硬件軟件、平臺(tái)、應(yīng)用、開發(fā)工具支撐與適配整體的軟硬件棧全部具備,并且把服務(wù)器和數(shù)據(jù)中心級(jí)別的AI算力帶到了桌面。

全場(chǎng)景,寧暢AI全棧能力,全面支持大模型開發(fā)適配、部署場(chǎng)景。

全液冷覆蓋服務(wù)器、機(jī)柜、數(shù)據(jù)中心多形態(tài),支持風(fēng)冷、冷板式液冷、浸沒液冷多方式,秉承“冷靜“計(jì)算策略,有效化解額外能耗以及成本居高不下的問題。

全行業(yè),滿足互聯(lián)網(wǎng)、金融、科研、自動(dòng)駕駛等幾乎所有重要行業(yè)業(yè)務(wù)需求。

全服務(wù),提供從前期咨詢、設(shè)計(jì)到制造、咨詢及后續(xù)運(yùn)維、售后等全時(shí)算力服務(wù),一個(gè)明顯的特征是不只交付硬件,如今有更多的軟件交付。

全階段,滿足客戶從大模型的開發(fā)、適配、部署、全場(chǎng)景不同業(yè)務(wù)發(fā)展階段關(guān)鍵需求,提供最具價(jià)比的定制化智算中心方案。

基于“全局智算”戰(zhàn)略,寧暢綜合某車企客戶的各種需求,最終選擇預(yù)制模塊化機(jī)房,成功搭建了一個(gè)面向自動(dòng)駕駛領(lǐng)域的算力系統(tǒng)。

在機(jī)柜方面,液冷覆蓋率超過95%、功率高達(dá)100KW每柜的整機(jī)柜,電液盲插方式非常便于運(yùn)維和部署,同時(shí)還為特定的硬件平臺(tái)推薦最優(yōu)能耗比配置,PUE最低可至1.09。

為滿足自動(dòng)駕駛對(duì)實(shí)時(shí)性和延遲性要求,寧暢基于AI軟件棧提供優(yōu)化的深度學(xué)習(xí)框架和加速庫,充分平衡訓(xùn)練,提升了推理效率;數(shù)據(jù)預(yù)處理自動(dòng)標(biāo)注方式,提高了數(shù)據(jù)的利用效率。

自動(dòng)駕駛對(duì)安全性有更高的要求,車企需要進(jìn)行大量的模擬測(cè)試。寧暢AI智駕中臺(tái)提供強(qiáng)大的模擬和測(cè)試工具,支持虛擬環(huán)境的創(chuàng)建與場(chǎng)景的重現(xiàn),測(cè)試運(yùn)率的自動(dòng)生成和執(zhí)行,加速了模型的訓(xùn)練過程,實(shí)現(xiàn)模型訓(xùn)練閉環(huán)。

通過種種舉措,寧暢以覆蓋數(shù)據(jù)收集、數(shù)據(jù)處理、模型訓(xùn)練、參數(shù)調(diào)優(yōu)、模型評(píng)估、模型發(fā)布全流程的技術(shù)支持,幫助客戶專注業(yè)務(wù),提升計(jì)算和測(cè)試效率,縮短了新產(chǎn)品上市的進(jìn)程。

3)新華三:“算力×聯(lián)接”應(yīng)對(duì)AIGC時(shí)代新挑戰(zhàn)

新華三應(yīng)對(duì)AIGC時(shí)代新挑戰(zhàn)的舉措是“算力×聯(lián)接”六大能力。這六大能力分別是高效多元算力供給、高品質(zhì)網(wǎng)絡(luò)聯(lián)接、海量數(shù)據(jù)并行處理、智能能耗治理、主動(dòng)安全、智能運(yùn)維。

以高效多元算力供給為例,新華三以高效的算力調(diào)度和管理使能平臺(tái)琢作為展現(xiàn):傲飛算力平臺(tái)3.0已全面擁抱“算力即服務(wù)”,G7系列模塊化異構(gòu)算力服務(wù)器則以多元開放、擁抱OAI、存算分離三大優(yōu)勢(shì)提供澎湃算力支持,并以豐富的生態(tài)及模型適配減少產(chǎn)品開發(fā)周期、提升業(yè)務(wù)效率。

而在存儲(chǔ)領(lǐng)域,新華三推出的下一代AI存儲(chǔ)——Polaris系列則將Storage For AI和AI In Storage兩大思路融合為一。通過全閃介質(zhì)、數(shù)據(jù)池化和AI智能管理設(shè)計(jì),Polaris能夠滿足AI業(yè)務(wù)負(fù)載對(duì)存儲(chǔ)設(shè)備的性能和功能需求,助力海量數(shù)據(jù)的加載和存儲(chǔ),提升AI智算集群的整體運(yùn)行效率,做到Storage For AI。而融合了AI技術(shù)的智能運(yùn)維、智能加速、智能助手等工具則大幅降低了存儲(chǔ)設(shè)備在運(yùn)維、管理、排障、規(guī)劃、配置、優(yōu)化等方面的工作量和成本,讓Polaris更加好用、易用。

新華三集團(tuán)高級(jí)副總裁、云與計(jì)算存儲(chǔ)產(chǎn)品線總裁徐潤(rùn)安

“兩種AI思路在同一款產(chǎn)品中的融合使Polaris既能滿足用戶的新型業(yè)務(wù)負(fù)載需求,也能創(chuàng)造更優(yōu)異的應(yīng)用體驗(yàn),這也是企業(yè)級(jí)存儲(chǔ)的必然發(fā)展方向?!毙氯A三集團(tuán)高級(jí)副總裁、云與計(jì)算存儲(chǔ)產(chǎn)品線總裁徐潤(rùn)安如是說。

在提供算力與聯(lián)接的基礎(chǔ)上,新華三也承擔(dān)和參與了一些大型智算中心的建設(shè)工作,力爭(zhēng)在今年ICT領(lǐng)域這一最大市場(chǎng)贏得商機(jī),同時(shí)也為未來AI領(lǐng)域的創(chuàng)新打下基礎(chǔ)。

加強(qiáng)國(guó)產(chǎn)化替代,提升安全可控能力

智算中心的國(guó)產(chǎn)化替代,是指在建設(shè)智算中心的過程中,從硬件設(shè)備、軟件系統(tǒng)到核心算法等關(guān)鍵環(huán)節(jié)采用國(guó)產(chǎn)技術(shù)和產(chǎn)品,減少對(duì)外部技術(shù)的依賴,確保數(shù)據(jù)安全和國(guó)家安全。

剛剛投用的韶關(guān)數(shù)據(jù)中心集群落地后首個(gè)投入運(yùn)營(yíng)的智算中心——華南數(shù)谷智算中心是粵港澳大灣區(qū)國(guó)家算力樞紐節(jié)點(diǎn)首批投入運(yùn)營(yíng)的智算中心之一,也是中國(guó)電子PKS體系國(guó)內(nèi)首個(gè)信創(chuàng)數(shù)據(jù)中心示范項(xiàng)目,該智算中心采用了飛騰信息技術(shù)有限公司的處理器,旨在為“東數(shù)西算”工程打造一個(gè)安全可信的算力基礎(chǔ)設(shè)施。

阿里巴巴張北智算中心

阿里巴巴云啟動(dòng)了全球最大的智算中心,總算力達(dá)到12 EFLOPS,展示了其在人工智能基礎(chǔ)設(shè)施領(lǐng)域的領(lǐng)導(dǎo)地位。這些智算中心不僅提供強(qiáng)大的計(jì)算能力,還旨在通過人工智能技術(shù)為客戶提供解決方案,提升其競(jìng)爭(zhēng)力和創(chuàng)新能力。同時(shí),阿里巴巴在智算中心建設(shè)中還積極引入國(guó)產(chǎn)算力芯片,如平頭哥含光800、倚天710以及自主研發(fā)設(shè)計(jì)、基于RISC-V指令集架構(gòu)的處理器玄鐵910,通過一云多芯架構(gòu)透明接入計(jì)算集群,提升了系統(tǒng)的性能與效率,增強(qiáng)了算力的自主可控性,促進(jìn)了國(guó)產(chǎn)芯片技術(shù)的發(fā)展與應(yīng)用。

眾所周知,阿里巴巴在多年前就已開始推行“去IOE化”策略,旨在減少對(duì)外部技術(shù)的依賴,特別是在IT基礎(chǔ)設(shè)施層面。近年來,這一策略進(jìn)一步擴(kuò)展到更廣泛的國(guó)產(chǎn)軟硬件替代,包括操作系統(tǒng)、數(shù)據(jù)庫、服務(wù)器等,推動(dòng)了整個(gè)產(chǎn)業(yè)鏈的國(guó)產(chǎn)化進(jìn)程。

在全面自主可控大趨勢(shì)下,隨著技術(shù)的不斷成熟和生態(tài)的完善,智算中心的國(guó)產(chǎn)化進(jìn)程將持續(xù)加速,國(guó)產(chǎn)硬件、操作系統(tǒng)和基礎(chǔ)軟件、云計(jì)算平臺(tái)和AI框架、算法和應(yīng)用、安全可控的數(shù)據(jù)管理體系的份額持續(xù)提升。國(guó)產(chǎn)化的推進(jìn)有助于降低技術(shù)被封鎖或限制的風(fēng)險(xiǎn),增強(qiáng)供應(yīng)鏈的安全性,同時(shí)也是推動(dòng)國(guó)內(nèi)科技創(chuàng)新、促進(jìn)產(chǎn)業(yè)自主發(fā)展的重要舉措。(未完待續(xù))

分享到

xiesc

相關(guān)推薦