問(wèn):從您的研究視角看,目前哪些場(chǎng)景的數(shù)字化轉(zhuǎn)型已初見(jiàn)成效?還有哪些領(lǐng)域的數(shù)據(jù)價(jià)值尚未被充分挖掘?

  張向宏:國(guó)家數(shù)據(jù)局成立以來(lái),通過(guò)實(shí)施“數(shù)據(jù)要素×”行動(dòng)計(jì)劃、國(guó)家數(shù)據(jù)要素綜合示范區(qū)、國(guó)家數(shù)字經(jīng)濟(jì)創(chuàng)新發(fā)展試驗(yàn)區(qū)、公共數(shù)據(jù)“跑起來(lái)”、國(guó)家數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)、國(guó)家數(shù)據(jù)標(biāo)注基地建設(shè)、城市全域數(shù)字化轉(zhuǎn)型、數(shù)據(jù)產(chǎn)業(yè)集聚區(qū)、高質(zhì)量數(shù)據(jù)集建設(shè)、可信數(shù)據(jù)空間建設(shè)等一系列試點(diǎn)示范工程,逐步探索出了一條行之有效的數(shù)據(jù)資源“供得出、流的動(dòng)、用的好、保安全”路徑,有效促進(jìn)了各行各業(yè)的數(shù)據(jù)資源開(kāi)發(fā)利用和數(shù)字化轉(zhuǎn)型。總體來(lái)看,各領(lǐng)域數(shù)字化轉(zhuǎn)型可以分為四個(gè)梯隊(duì):

  第一梯隊(duì)是互聯(lián)網(wǎng)、金融、商貿(mào)流通等行業(yè),數(shù)字化轉(zhuǎn)型深度和廣度不斷拓展,面向數(shù)據(jù)的生產(chǎn)經(jīng)營(yíng)、管理決策、供應(yīng)鏈管理、客戶管理等垂直大模型、智能體等數(shù)據(jù)系統(tǒng)應(yīng)用越來(lái)越廣泛,正在快速替代面向流程和業(yè)務(wù)的信息化系統(tǒng)。

  第二梯隊(duì)是氣象、時(shí)空、醫(yī)療、交通等行業(yè),數(shù)據(jù)采集匯聚規(guī)模大、質(zhì)量高,數(shù)據(jù)在本行業(yè)和跨領(lǐng)域的應(yīng)用越來(lái)越普遍,人工智能垂直大模型和智能體等應(yīng)用不斷增多。

  第三梯隊(duì)是政務(wù)服務(wù)、社會(huì)管理、高端制造業(yè)等領(lǐng)域,大多數(shù)處于信息系統(tǒng)建設(shè)運(yùn)營(yíng)階段,數(shù)據(jù)資源采集匯聚不斷增強(qiáng),但數(shù)據(jù)資源加工處理仍然滯后,數(shù)據(jù)應(yīng)用還處于初級(jí)階段。

  第四梯隊(duì)是中小企業(yè)、農(nóng)業(yè)等領(lǐng)域,大多數(shù)還處于信息化初級(jí)階段,信息系統(tǒng)還沒(méi)有建設(shè)應(yīng)用,數(shù)據(jù)資源還未得到充分重視,數(shù)據(jù)還沒(méi)有得到應(yīng)用。

  問(wèn):數(shù)據(jù)要素市場(chǎng)化是當(dāng)前的熱點(diǎn),您認(rèn)為不同行業(yè)在數(shù)據(jù)確權(quán)、定價(jià)、交易等環(huán)節(jié)存在哪些共性難題?結(jié)合您的研究,有哪些針對(duì)性的解決思路?

  張向宏:數(shù)據(jù)是一種新型生產(chǎn)要素,具有與土地、勞動(dòng)力、技術(shù)、資本等傳統(tǒng)生產(chǎn)要素迵然不同的新特點(diǎn),如數(shù)據(jù)的多環(huán)節(jié)性和低成本易復(fù)制性特點(diǎn),決定了數(shù)據(jù)要素很難確權(quán)或者確權(quán)成本很高;數(shù)據(jù)的阿羅信息悖論效應(yīng)特征,決定了數(shù)據(jù)很難實(shí)現(xiàn)場(chǎng)內(nèi)規(guī)模交易;數(shù)據(jù)價(jià)值不確定性特征,決定了數(shù)據(jù)價(jià)值易變、很難定價(jià)。

  面向人工智能的行業(yè)高質(zhì)量數(shù)據(jù)集構(gòu)建是解決數(shù)據(jù)要素化價(jià)值化的一條可行路徑。從數(shù)據(jù)要素化的具體實(shí)踐來(lái)看,數(shù)據(jù)要素化價(jià)值化絕不能陷入傳統(tǒng)要素的慣性路線中,或者說(shuō),簡(jiǎn)單地將傳統(tǒng)要素的做法移植到數(shù)據(jù)要素中,是行不通的。當(dāng)前,一方面是人工智能應(yīng)用普及對(duì)數(shù)據(jù)資源需求日益迫切,另一方面是國(guó)家層面對(duì)數(shù)據(jù)資源開(kāi)發(fā)利用制度供給不斷加大,兩端相向而行,已形成一條清晰的面向人工智能的數(shù)據(jù)產(chǎn)業(yè)鏈條。

  數(shù)據(jù)產(chǎn)業(yè)鏈條的下游是垂域大模型在千行百業(yè)的應(yīng)用;中下游是在基礎(chǔ)大模型上加上大規(guī)模的行業(yè)高質(zhì)量數(shù)據(jù)集,訓(xùn)練和調(diào)優(yōu)而成的各種垂域大模型;中上游是在各行業(yè)采集匯聚的海量數(shù)據(jù)資源基礎(chǔ)上,加工生產(chǎn)出的規(guī)?;?biāo)準(zhǔn)化、體系化高質(zhì)量數(shù)據(jù)集;上游是各行各業(yè)的數(shù)據(jù)資源供給。而這條“數(shù)據(jù)資源—高質(zhì)量數(shù)據(jù)集—垂域大模型—千行百業(yè)應(yīng)用”數(shù)據(jù)產(chǎn)業(yè)鏈,都需要在數(shù)據(jù)基礎(chǔ)設(shè)施中實(shí)現(xiàn)。

  問(wèn):隨著各行業(yè)數(shù)據(jù)量爆發(fā)式增長(zhǎng),數(shù)據(jù)存儲(chǔ)、算力支撐、算法優(yōu)化等基礎(chǔ)設(shè)施層面面臨哪些新挑戰(zhàn)?您覺(jué)得技術(shù)突破的關(guān)鍵方向在哪里?

  張向宏:算力和模型對(duì)人工智能應(yīng)用的制約已大大緩解。算力、算法和數(shù)據(jù)是人工智能的三個(gè)關(guān)鍵要素,長(zhǎng)期以來(lái),高耗算力、模型閉源和數(shù)據(jù)短缺一直制約著人工智能大模型的應(yīng)用普及。以DeepSeek為代表的人工智能企業(yè),實(shí)現(xiàn)了MOE等關(guān)鍵技術(shù)重大突破,并采取了模型開(kāi)源策略,實(shí)現(xiàn)了“算力平權(quán)”和“算法平權(quán)”,突破了人工智能三要素中的兩大要素制約,促進(jìn)人工智能大模型向通信、互聯(lián)網(wǎng)、汽車、能源、金融、醫(yī)療、科技等各行各業(yè)加速滲透,顯著降低了成本,提高了效率,并優(yōu)化了用戶體驗(yàn),人工智能大模型廣泛應(yīng)用的時(shí)代已經(jīng)到來(lái)。

  高質(zhì)量數(shù)據(jù)集是成為決定大模型質(zhì)量的關(guān)鍵因素。DeepSeek實(shí)現(xiàn)“算力平權(quán)”和“算法平權(quán)”后,“數(shù)據(jù)平權(quán)”已成為人工智能大模型發(fā)展的最后一個(gè)堡壘,高質(zhì)量數(shù)據(jù)集的供給規(guī)模和質(zhì)量已成為決定人工智能大模型在各行業(yè)領(lǐng)域滲透速度和應(yīng)用水平的最關(guān)鍵因素。在同等計(jì)算資源下,決定生成模型的因素中,高質(zhì)量數(shù)據(jù)集的規(guī)模大小遠(yuǎn)比算法模型規(guī)模大小更加重要。而在使用醫(yī)學(xué)數(shù)據(jù)訓(xùn)練大模型過(guò)程中,即使醫(yī)療數(shù)據(jù)集中含有0.001%的錯(cuò)誤信息,也可能導(dǎo)致模型輸出不準(zhǔn)確的醫(yī)學(xué)答案。

  垂域大模型正廣泛應(yīng)用于企業(yè)的生產(chǎn)、管理、經(jīng)營(yíng),企業(yè)的核心競(jìng)爭(zhēng)力取決于其垂域大模型的“聰明”程度和“熟練”程度等大模型能力。垂域大模型的訓(xùn)練和推理高度依賴高質(zhì)量數(shù)據(jù)集的供給。高質(zhì)量數(shù)據(jù)集的規(guī)模和質(zhì)量直接影響人工智能大模型的“智商”水平,高質(zhì)量數(shù)據(jù)集已成為企業(yè)的核心競(jìng)爭(zhēng)力和真正的“護(hù)城河”。

  私域數(shù)據(jù)安全流通成為制約高質(zhì)量數(shù)據(jù)集建設(shè)的關(guān)鍵瓶頸。全球數(shù)據(jù)資源中20%是公域數(shù)據(jù),也稱作可流通數(shù)據(jù),80%是私域數(shù)據(jù),或稱不可流通數(shù)據(jù)。在20%的公域數(shù)據(jù)中,只有4%的數(shù)據(jù)是能在互聯(lián)網(wǎng)上流通的格式化數(shù)據(jù),其他16%的多模態(tài)數(shù)據(jù)不能在互聯(lián)網(wǎng)上直接流通。當(dāng)前,人工智能大模型對(duì)數(shù)據(jù)的消耗量越來(lái)越大,預(yù)計(jì)2028年互聯(lián)網(wǎng)上流通的數(shù)據(jù)將全部耗盡。

  在互聯(lián)網(wǎng)上可流通數(shù)據(jù)將全部耗盡的背景下,人工智能大模型的聰明程度、智商水平和應(yīng)用普及程度,將越來(lái)越多地取決于多模態(tài)數(shù)據(jù)和私域數(shù)據(jù)的安全高效流通程度,特別是私域數(shù)據(jù)的安全流通已成為世界各國(guó)必須解決的一個(gè)普遍性問(wèn)題。這就需要從思想觀念和管理體制機(jī)制方面,從傳統(tǒng)數(shù)據(jù)靜態(tài)安全轉(zhuǎn)變到數(shù)據(jù)動(dòng)態(tài)安全上來(lái)。建設(shè)一個(gè)既能促進(jìn)私域數(shù)據(jù)大規(guī)模、高效流通,又能確保流通過(guò)程中安全的數(shù)據(jù)流通利用基礎(chǔ)設(shè)施,成為私域數(shù)據(jù)安全高效流通的基礎(chǔ)和前提。

  問(wèn):數(shù)博會(huì)作為數(shù)據(jù)領(lǐng)域的重要平臺(tái),您有什么樣的參會(huì)經(jīng)歷或印象?您認(rèn)為它在推動(dòng)數(shù)據(jù)技術(shù)創(chuàng)新、促進(jìn)產(chǎn)學(xué)研合作方面,起到了哪些關(guān)鍵作用?

  張向宏:數(shù)博會(huì)是全球首個(gè)以大數(shù)據(jù)為主題的博覽會(huì),也是我國(guó)數(shù)據(jù)領(lǐng)域的兩大國(guó)家級(jí)平臺(tái)之一,得到了黨中央、國(guó)務(wù)院的高度肯定和支持,傾注了國(guó)家數(shù)據(jù)局和貴州省、貴陽(yáng)市的大量心血,吸引了全國(guó)乃至世界各地?cái)?shù)據(jù)領(lǐng)域政府、企業(yè)、大學(xué)、科研機(jī)構(gòu)等參與,不僅已成為數(shù)據(jù)成果展示、技術(shù)交流、應(yīng)用合作的一個(gè)全球性平臺(tái),更是推動(dòng)產(chǎn)學(xué)研深度融合、促進(jìn)數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展的重要引擎。在推動(dòng)數(shù)據(jù)技術(shù)創(chuàng)新和產(chǎn)學(xué)研合作方面發(fā)揮了重要作用,主要體現(xiàn)在以下幾個(gè)方面:

  一是引領(lǐng)行業(yè)技術(shù)方向,促進(jìn)前沿技術(shù)應(yīng)用。數(shù)博會(huì)聚焦大數(shù)據(jù)、人工智能、云計(jì)算等前沿技術(shù),為職業(yè)教育和技術(shù)研發(fā)提供了清晰的行業(yè)風(fēng)向標(biāo)。

  二是搭建校企合作平臺(tái),深化產(chǎn)教融合。數(shù)博會(huì)聚集了華為、騰訊、螞蟻等科技企業(yè),為高校和企業(yè)搭建合作平臺(tái),促進(jìn)訂單班、實(shí)訓(xùn)基地共建等深度合作。2025數(shù)博會(huì)還通過(guò)“數(shù)字人才培養(yǎng)”活動(dòng),匯聚政府、高校、企業(yè)、研究機(jī)構(gòu)等多方力量,探討產(chǎn)學(xué)研用協(xié)同育人模式。

  三是促進(jìn)跨區(qū)域、跨領(lǐng)域協(xié)同創(chuàng)新。數(shù)博會(huì)連接了全國(guó)甚至世界各地在數(shù)據(jù)領(lǐng)域的合作。如深圳市大數(shù)據(jù)研究院與香港中文大學(xué)(深圳)合作,在貴陽(yáng)大數(shù)據(jù)科創(chuàng)城開(kāi)展人工智能研究,賦能區(qū)域數(shù)字化轉(zhuǎn)型。

  問(wèn):您認(rèn)為未來(lái)數(shù)博會(huì)在聚焦數(shù)據(jù)領(lǐng)域的深度、推動(dòng)產(chǎn)業(yè)落地等方面,還有哪些可以優(yōu)化或加強(qiáng)的地方?

  張向宏:未來(lái)的數(shù)博會(huì),應(yīng)在三個(gè)維度上更加突出應(yīng)用、突出產(chǎn)業(yè)。

  一是更加重視面向人工智能應(yīng)用的高質(zhì)量數(shù)據(jù)集建設(shè)。建議設(shè)立人工智能+專場(chǎng)和高質(zhì)量數(shù)據(jù)集建設(shè)專場(chǎng),展示和交流各行各業(yè)人工智能最新應(yīng)用和行業(yè)高質(zhì)量數(shù)據(jù)集建設(shè)最佳實(shí)踐。

  二是更加重視傳統(tǒng)產(chǎn)業(yè)的數(shù)字化轉(zhuǎn)型。建議設(shè)立傳統(tǒng)產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型專場(chǎng),引導(dǎo)和示范不同領(lǐng)域不同階段的傳統(tǒng)產(chǎn)業(yè),梯度開(kāi)展信息系統(tǒng)(IT)、商業(yè)智能(BI)、人工智能(AI)應(yīng)用。

  三是更加重視數(shù)據(jù)要素的普惠化應(yīng)用。建議設(shè)立國(guó)家數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)專場(chǎng),引導(dǎo)各級(jí)政府和技術(shù)服務(wù)企業(yè),一方面不斷突破數(shù)據(jù)安全流通技術(shù),另一方面加大數(shù)據(jù)安全流通技術(shù)的應(yīng)用范圍,建設(shè)普惠互聯(lián)、協(xié)調(diào)有力的全國(guó)一體化數(shù)據(jù)基礎(chǔ)設(shè)施,為數(shù)據(jù)大規(guī)模流通提供可信安全環(huán)境,實(shí)現(xiàn)“數(shù)據(jù)自由”。

  問(wèn):站在數(shù)據(jù)領(lǐng)域發(fā)展的角度,您對(duì)數(shù)博會(huì)舉辦地貴州的長(zhǎng)遠(yuǎn)發(fā)展有什么寄語(yǔ)或期待?

  張向宏:數(shù)博會(huì)已走過(guò)了11年的不平凡歷程,面向下一個(gè)10年,以至將來(lái)50年,希望貴州打造成為全國(guó)乃至全球的“兩地四區(qū)”,“兩地”即數(shù)據(jù)技術(shù)策源地和數(shù)據(jù)制度新高地;“四區(qū)”即數(shù)據(jù)應(yīng)用引領(lǐng)區(qū)、數(shù)據(jù)安全先行區(qū)、數(shù)據(jù)資源匯聚區(qū)和數(shù)據(jù)流通示范區(qū)。

分享到

lixiangjing

算力豹主編

相關(guān)推薦