“云邊端”全棧AI產(chǎn)品與解決方案
摩爾線程全功能GPU芯片采用自主研發(fā)的MUSA架構(gòu),率先實現(xiàn)了單芯片架構(gòu)同時支持 AI 計算加速、圖形渲染、物理仿真和科學計算、超高清視頻編解碼的技術(shù)突破。自2020年成立至今,摩爾線程已成功推出四代GPU架構(gòu)和智能SoC產(chǎn)品,拓展出覆蓋AI智算、專業(yè)圖形加速、桌面級圖形加速等領(lǐng)域豐富完整的計算加速產(chǎn)品矩陣,全面支持云計算、邊緣計算及終端設(shè)備市場,滿足從政務、企業(yè)智能計算到個人消費場景的多層次需求。
——夸娥(KUAE):夸娥是以全功能GPU為硬件核心,軟硬一體化、完整的系統(tǒng)級算力解決方案,旨在為大規(guī)模GPU算力的建設(shè)和運營管理提供系統(tǒng)級支持。KUAE為智算中心提供端到端解決方案,支持萬卡級規(guī)模擴展能力,單集群可部署超1,000個計算節(jié)點,每節(jié)點集成8顆自研OAM模組化GPU,通過3D全互聯(lián)拓撲實現(xiàn)亞微秒級通信延遲,為大模型預訓練提供穩(wěn)定高效的算力支撐。其中,KUAE1是支持千卡互聯(lián)的第一代智算融合中心產(chǎn)品;KUAE2是2024年底推出的第二代大規(guī)模智算融合中心產(chǎn)品,支持萬卡互聯(lián)。
——全功能GPU OAM模組:摩爾線程自研全功能GPU高性能計算模塊,專為大規(guī)模智算集群設(shè)計,可支持萬億級參數(shù)大模型訓練與推理。摩爾線程全功能GPU在國內(nèi)率先支持FP8等全計算精度,滿足DeepSeek V3/R1等原生FP8計算需求,同時配備FP64算力,滿足科學應用需求并加速AI for Science等場景。
——AI大模型一體機MCCX D800 X2:摩爾線程旗艦級GPU加速服務器MCCX D800 X2,專為大語言及多模態(tài)大模型、科學計算和物理仿真等前沿領(lǐng)域打造。該服務器基于摩爾線程全功能GPU模組與高速全互聯(lián)架構(gòu),全面釋放計算性能,為高性能計算集群的構(gòu)建提供強大支持,賦能企業(yè)在復雜AI場景中實現(xiàn)極致算力突破。
——大模型智算加速卡MTT S4000:訓推兼顧,單卡支持 48GB 顯存和 768GB/s 的顯存帶寬?;谀柧€程自研MTLink技術(shù),MTT S4000 可以支持多卡互聯(lián),支持千卡集群基礎(chǔ)設(shè)施建設(shè),加速千億參數(shù)大語言模型計算。
——云端渲染卡MTT S3000:基于其多樣算力,借助覆蓋圖形渲染、視頻處理、深度學習的完整MUSA軟件棧,MTT S3000可為AI推理、云游戲、云渲染、視頻云、數(shù)字孿生、數(shù)字內(nèi)容創(chuàng)作等場景提供通用智算能力支持。
——桌面級圖形顯卡MTT S80:首款國產(chǎn)GPU游戲顯卡,支持多種主流圖形API,擁有14.7TFLOPS 的FP32算力,并搭配16GB GDDR6 高速顯存及PCIe Gen5 x16 接口,可支持 8K 超高清與4K 144Hz高刷新率顯示輸出。
——邊緣AI計算模組:摩爾線程基于邊緣AI計算模組打造了高性能、低延遲、強可靠的國產(chǎn)邊緣AI解決方案。該方案憑借50TOPS的高算力、全棧AI工具鏈以及端云協(xié)同架構(gòu),可廣泛應用于工業(yè)、能源、教育、交通、醫(yī)療等行業(yè)。
摩爾線程還對以下內(nèi)容進行了展示和介紹。
1)智能計算
大模型訓練:實現(xiàn)高效AI訓練,F(xiàn)P8算力與容錯技術(shù)引領(lǐng)行業(yè)突破。摩爾線程KUAE2智算集群解決方案面向大規(guī)模智算中心,集成計算、存儲、網(wǎng)絡(luò)硬件及分布式計算軟件,最高支持10,240個全功能GPU部署。KUAE2兼顧AI與科學計算,覆蓋FP64至FP8全精度計算,支持AI、圖形、科學計算等全場景加速。
KUAE2具備高效的AI大模型訓練能力,訓練性能表現(xiàn)優(yōu)異,領(lǐng)先行業(yè)水平。同時,依托于在FP8混合精度計算方面的原生優(yōu)勢,KUAE2與BF16相比精度幾乎無損,F(xiàn)P8 GEMM利用率達到行業(yè)領(lǐng)先水平。
大模型推理:國產(chǎn)GPU推理解決方案,打造極速DeepSeek體驗。摩爾線程基于全新GPU的計算、通信、訪存等強大基礎(chǔ)能力,為國產(chǎn)GPU推理性能帶來了全新的極速體驗?;趫D優(yōu)化、算子優(yōu)化、FP8精度計算等軟硬件深度優(yōu)化,打造集高性能、最佳全量體驗和高精度模型等優(yōu)勢于一身的國產(chǎn)化推理解決方案。
運行DeepSeek R1 671B 全量模型的單路解碼速度約100 token/s,處于行業(yè)領(lǐng)先水平。
2)科學計算
生命科學:以全功能GPU強大算力,推動生命科學研究實現(xiàn)國產(chǎn)突破。智能計算與科學計算的融合正推動生命科學研究的變革。分子動力學模擬和分子對接技術(shù)能在原子層面解析生物分子相互作用,極大提升藥物研發(fā)效率,但也帶來巨大算力需求。 摩爾線程聯(lián)合北京大學、昌平實驗室高毅勤課題組,基于國產(chǎn)SPONGE和DSDP軟件,打造了軟硬件協(xié)同的生命科學解決方案。
全功能GPU憑借全精度計算、強大兼容性和高性能優(yōu)勢,可高效運行分子動力學、分子對接等科學計算軟件。同時還能夠加速AlphaFold等AI模型的訓練推理,實現(xiàn)計算與AI的深度融合。該方案不僅突破傳統(tǒng)研究瓶頸,更在性能上達到行業(yè)領(lǐng)先水平,推動生命科學研究的國產(chǎn)化突破。
物理仿真:攜手硒鉬科技,開啟AI for Science科研新范式。硒鉬·秋月白AI是硒鉬科技研發(fā)的打造的AI for Science(AI4S)大模型平臺。該平臺深度融合AI與科學研究,通過智能任務規(guī)劃、多模態(tài)數(shù)據(jù)分析、動態(tài)數(shù)學建模和PhysicsAI物理反演等核心功能,為電氣工程、航天科技、流體力學等領(lǐng)域提供智能化的科研解決方案。
相比傳統(tǒng)CPU方案,平臺依托摩爾線程全功能GPU的強大算力與均衡的訓推能力,在保持計算精度的同時,可實現(xiàn)百倍以上的仿真效率提升,顯著加速科研進程。其專有智能體系統(tǒng)能夠自動化處理科研中的重復性工作,推動科學研究向工程化、精準化的新范式演進。
3)圖形計算
空間智能:依托全功能GPU,補齊遙感智能解譯方案全國產(chǎn)關(guān)鍵一環(huán)。遙感大模型正成為處理海量地球觀測數(shù)據(jù)的關(guān)鍵技術(shù),可高效完成場景分類、目標檢測等智能解譯任務。面對日均PB級數(shù)據(jù)增長,傳統(tǒng)算力已無法滿足實時分析需求,遙感的AI升級迫在眉睫。同時遙感數(shù)據(jù)多為國家重要數(shù)據(jù)資產(chǎn),構(gòu)建完全自主可控的全國產(chǎn)化解決方案亦成為當務之急。
超圖遙感大模型通過智能化技術(shù)實現(xiàn)了從數(shù)據(jù)處理到分析解譯的全流程覆蓋,可高效完成場景分類、變化檢測、目標識別等在內(nèi)的多類遙感影像解譯任務。依托全功能GPU,摩爾線程聯(lián)合超圖共同構(gòu)建了覆蓋訓練、推理到可視化的完整國產(chǎn)化鏈條,支持億級參數(shù)模型開發(fā),并實現(xiàn)快速解譯和高清影像實時渲染,成為國內(nèi)極少數(shù)的可滿足遙感大模型全流程需求的國產(chǎn)GPU解決方案。
視頻超分:摩爾線程MTVSR,實時超分喚醒畫質(zhì)新生。實時視頻超分技術(shù)不僅能夠提升用戶的觀看體驗,更能有效節(jié)省視頻文件的存儲空間,降低存儲和網(wǎng)絡(luò)傳輸成本。
摩爾線程開發(fā)的端側(cè)實時視頻超分技術(shù)MTVSR,可提供2倍-4倍的實時視頻超分,并提供多檔質(zhì)量設(shè)定,能夠顯著提升低分辨率視頻在高分辨率屏幕下的播放清晰度。MTVSR還將以SDK形式支持播放器、瀏覽器等App集成調(diào)用,可為終端用戶提供無縫的實時視頻超分體驗。
4)全功能GPU加速行業(yè)應用。
全功能GPU+創(chuàng)娛教育:全功能GPU賦能創(chuàng)娛教育,用AI激發(fā)兒童無限創(chuàng)意?!癆I智繪童畫”是由摩爾線程與運動加加聯(lián)合推出的創(chuàng)新教育應用,基于摩爾線程AIGC技術(shù)及全功能GPU的強大算力,為用戶提供一站式、多模態(tài)的智能繪本創(chuàng)作體驗。孩子只需簡單言語表達,即可自由改編童話故事、生成專屬插畫,輕松完成個性化繪本創(chuàng)作。
目前,該應用已登陸海信平臺,憑借強大的AI生成能力和友好的交互設(shè)計,累計服務數(shù)十萬用戶。在趣味互動中培養(yǎng)孩子的表達力與創(chuàng)造力,讓學習與娛樂完美融合,開啟寓教于樂的全新體驗。
全功能GPU+智能制造:攜手雪浪云,為制造業(yè)高質(zhì)量發(fā)展注入新動能。人工智能技術(shù)為高端裝備制造產(chǎn)業(yè)升級提供了巨大歷史機遇。摩爾線程工業(yè)領(lǐng)域合作伙伴雪浪云依托全功能GPU,打造了圖零大模型、工藝生成智能體和裝備運維智能體等一系列產(chǎn)品,構(gòu)建了涵蓋工藝、生產(chǎn)與設(shè)備全流程的工業(yè)智能解決方案,實現(xiàn)了制造核心技術(shù)從底層到應用的國產(chǎn)化閉環(huán)。
該解決方案以“國產(chǎn)GPU算力+國產(chǎn)模型+國產(chǎn)應用”的全國產(chǎn)架構(gòu),將裝備制造業(yè)的海量經(jīng)驗、數(shù)據(jù)和產(chǎn)業(yè)鏈優(yōu)勢轉(zhuǎn)換為產(chǎn)業(yè)發(fā)展的創(chuàng)新動力,為我國智能智造高質(zhì)量發(fā)展釋放生產(chǎn)力、打造競爭力。
全功能GPU+智慧醫(yī)療:攜手推想醫(yī)療,加速開啟智能醫(yī)療新時代。摩爾線程全功能GPU內(nèi)置圖形渲染、視頻編解碼、物理仿真、人工智能四大計算引擎,其自研的MUSA架構(gòu)能夠良好兼容CUDA生態(tài),在現(xiàn)今多模態(tài)發(fā)展趨勢下具備廣泛的兼容性與易用性。
依托全功能GPU 的強大優(yōu)勢,摩爾線程攜手合作伙伴推想醫(yī)療,成功完成冠脈CT造影圖像血管狹窄輔助評估軟件的國產(chǎn)化適配及遷移,突破AI算法開發(fā)環(huán)境、軟件運行環(huán)境和基礎(chǔ)算力匹配的多重技術(shù)瓶頸,解決我國AI醫(yī)療軟件產(chǎn)品自主發(fā)展的重大難題,助力AI醫(yī)療領(lǐng)域?qū)崿F(xiàn)從芯片到軟件全面國產(chǎn)化的跨越。
全功能GPU+智能駕駛:構(gòu)建虛擬訓練場,助力自動駕駛領(lǐng)域突破數(shù)據(jù)邊界。在自動駕駛領(lǐng)域,”世界模型”正在成為訓練系統(tǒng)的核心工具。它通過模擬真實駕駛環(huán)境,為AI提供了高效、安全的學習平臺。就像人類通過觀察和實踐掌握駕駛技能一樣,AI依賴世界模型來理解和適應復雜道路場景。
摩爾線程全功能GPU憑借其卓越的圖形渲染、AI計算和視頻編解碼能力,為極佳科技的世界模型平臺提供了強大的算力基座。通過媲美行業(yè)標桿的視覺精度與穩(wěn)定算力輸出,不僅可以滿足自動駕駛對高精度數(shù)據(jù)的嚴苛需求,還能持續(xù)為世界模型提供優(yōu)質(zhì)的訓練素材,推動自動駕駛技術(shù)快速迭代,加速自動駕駛領(lǐng)域突破數(shù)據(jù)瓶頸。
全功能GPU+數(shù)字服務:摩爾線程數(shù)字人全棧解決方案,全鏈路定制服務賦能企業(yè)智能升級。摩爾線程數(shù)字人解決方案基于全功能GPU強大算力,深度融合圖形渲染、AI計算與視頻編解碼技術(shù),打造軟硬一體化的交互方案。新一代聲像模型驅(qū)動高清數(shù)字人,呈現(xiàn)逼真自然的音色與畫面;界面設(shè)計簡潔,支持一鍵切換形象與音色;全雙工交互技術(shù)實現(xiàn)毫秒級響應,支持實時語音打斷,讓對話流暢自然。
依托端云協(xié)同架構(gòu),方案在確保數(shù)據(jù)安全的同時,為政務、銀行、企業(yè)等服務場景提供定制化智能交互服務。通過從硬件到終端的全鏈路國產(chǎn)化技術(shù),助力企業(yè)構(gòu)建自主可控的數(shù)字化服務體系,實現(xiàn)服務體驗與運營效率的雙重提升。
全功能GPU+智能座艙:國產(chǎn)智能座艙域控方案,重塑高端駕乘新體驗。摩爾線程與合作伙伴紫光計算機共同打造的全國產(chǎn)高端智能座艙域控方案,集成了高性能顯示、強大AI計算能力于一體。該方案最高支持8塊4K屏幕同時輸出,并具備8K硬件編解碼能力,配合媲美獨立顯卡的3D渲染性能,能夠流暢呈現(xiàn)各類復雜場景。
平臺提供高達50TOPS的本地AI算力,支持大語言模型和圖像識別算法在終端側(cè)部署運行,結(jié)合預裝的數(shù)字人穆莎等AI應用,在兼容Linux和Android系統(tǒng)的同時,實現(xiàn)了從硬件底層到軟件交互的完整智能座艙解決方案。