昆侖芯率先完成訓(xùn)練推理DeepSeek全版本適配
在模型適配方面,昆侖芯領(lǐng)先業(yè)界。在DeepSeek-V3/R1上線不久,昆侖芯便率先完成全版本模型適配,這其中包括DeepSeek MoE 模型及其蒸餾的Llama/Qwen等小規(guī)模dense模型。
昆侖芯P800在性能上表現(xiàn)卓越,這使得昆侖芯在部署上更加輕松,運(yùn)行成本顯著降低,還能輕松完成DeepSeek-V3/R1全版本推理任務(wù)。不僅如此,昆侖芯P800在DeepSeek系列MoE模型大規(guī)模訓(xùn)練任務(wù)中也表現(xiàn)出色,全面支持MLA、多專(zhuān)家并行等特性,僅需32臺(tái)即可支持模型全參訓(xùn)練,高效助力模型的持續(xù)訓(xùn)練和微調(diào)。
同時(shí),為了滿足企業(yè)客戶(hù)私有化部署的需求,百度智能云分別發(fā)布了百舸DeepSeek一體機(jī)、千帆DeepSeek一體機(jī),均支持昆侖芯 P800 單機(jī) 8 卡部署滿血版 DeepSeek R1/V3。百舸DeepSeek一體機(jī)可滿足高性能訓(xùn)練與推理需求,從開(kāi)箱上電到服務(wù)上線最快僅需半天。而千帆DeepSeek一體機(jī)除了滿足訓(xùn)推需求之外,還為企業(yè)提供了一站式的模型應(yīng)用解決方案,能夠滿足企業(yè)全鏈路模型開(kāi)發(fā)應(yīng)用工具鏈需求,具備更強(qiáng)、更全面的應(yīng)用開(kāi)發(fā)能力。
百舸4.0助力昆侖芯萬(wàn)卡集群建設(shè),打造“多快穩(wěn)省”AI基礎(chǔ)設(shè)施
目前,百度智能云已成功點(diǎn)亮昆侖芯P800萬(wàn)卡集群,這也是國(guó)內(nèi)首個(gè)正式點(diǎn)亮的自研萬(wàn)卡集群。百度智能云將進(jìn)一步點(diǎn)亮3萬(wàn)卡集群。國(guó)產(chǎn)昆侖芯萬(wàn)卡集群以及未來(lái)三萬(wàn)卡集群的建設(shè),從硬件到軟件,技術(shù)挑戰(zhàn)是全方位的。而24年9月升級(jí)的百度百舸AI異構(gòu)計(jì)算平臺(tái)4.0,圍繞落地大模型全旅程的算力需求,在集群創(chuàng)建、開(kāi)發(fā)實(shí)驗(yàn)、模型訓(xùn)練、模型推理四大方面,能為企業(yè)提供“多芯、快、穩(wěn)、省”的AI基礎(chǔ)設(shè)施,在萬(wàn)卡集群的建設(shè)中發(fā)揮了至關(guān)重要的作用。
在DeepSeek最擅長(zhǎng)的推理能力方面,百度百舸還提供了針對(duì)在線推理服務(wù)的全生命周期管理、彈性擴(kuò)縮容、自研框架推理加速、完備的運(yùn)維監(jiān)控體系等優(yōu)勢(shì)能力,結(jié)合昆侖芯P800的強(qiáng)大算力,為用戶(hù)提供服務(wù)穩(wěn)定性的聯(lián)合保障,同時(shí)有效降低推理成本并提升推理性能。