?轉(zhuǎn)型有數(shù),發(fā)展才能夠有底。數(shù)字化轉(zhuǎn)型的今天,這已經(jīng)成為一種普遍共識(shí)。
讓我們聚焦到教育科研領(lǐng)域,這里的轉(zhuǎn)型有數(shù)到了什么程度?有哪些經(jīng)驗(yàn)可以分享呢?
數(shù)據(jù)超越想象 應(yīng)用異彩紛呈
中國(guó)農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)技術(shù)中心副主任兼總工程師勞鳳丹分享了一個(gè)農(nóng)學(xué)方面的案例。
“目前的農(nóng)業(yè)和我們傳統(tǒng)理解農(nóng)村農(nóng)業(yè)已經(jīng)不是一個(gè)概念了?,F(xiàn)在的農(nóng)業(yè)已經(jīng)實(shí)現(xiàn)了機(jī)械化轉(zhuǎn)型,并結(jié)合大量信息化技術(shù)。以中國(guó)農(nóng)業(yè)大學(xué)農(nóng)機(jī)大數(shù)據(jù)平臺(tái)應(yīng)用項(xiàng)目為例,它將全國(guó)30多萬(wàn)輛農(nóng)機(jī)數(shù)據(jù)通過(guò)物聯(lián)網(wǎng)平臺(tái),全部收集起來(lái),進(jìn)行數(shù)據(jù)分析,從中了解農(nóng)機(jī)分布規(guī)律、作業(yè)情況,分析它們的工作效率,了解農(nóng)田分布、作物種植等數(shù)據(jù)信息。相關(guān)管理部門(mén),可以以此數(shù)據(jù)作為依據(jù),作為各種農(nóng)機(jī)補(bǔ)貼的參考指標(biāo),從而提高農(nóng)機(jī)補(bǔ)貼的精準(zhǔn)和有效?!?勞鳳丹介紹說(shuō)。
據(jù)了解,如今大量的農(nóng)業(yè)機(jī)械都裝上北斗GPS定位,相關(guān)數(shù)據(jù)會(huì)實(shí)時(shí)返回到生產(chǎn)制造的企業(yè),農(nóng)大農(nóng)機(jī)大數(shù)據(jù)平臺(tái)與之進(jìn)行數(shù)據(jù)對(duì)接,然后通過(guò)智能算法對(duì)數(shù)據(jù)進(jìn)行分析,了解農(nóng)機(jī)是在道路上運(yùn)行還是在田間作業(yè)等,大數(shù)據(jù)平臺(tái)會(huì)展示農(nóng)機(jī)熱力圖,輔助主管部門(mén)決策。
蘇州大學(xué)基礎(chǔ)醫(yī)學(xué)與生物科學(xué)學(xué)院特聘教授、博士生導(dǎo)師李玉梅博士分享了生物醫(yī)學(xué)領(lǐng)域的案例。
李玉梅表示:基因測(cè)序經(jīng)過(guò)十多年發(fā)展,如今已經(jīng)迎來(lái)了第二代測(cè)序技術(shù),也就是高通量基因測(cè)序數(shù)據(jù),其主要特點(diǎn)是速度非??欤瑤讉€(gè)小時(shí)基因組就可以測(cè)完,價(jià)格也非常低。以新冠病毒測(cè)序?yàn)槔稍?0分鐘內(nèi)輸出新冠病毒變異位點(diǎn)的基因注釋、變異支系鑒別、全長(zhǎng)序列等。
高通量基因測(cè)序數(shù)據(jù)量非常大,24小時(shí)就能產(chǎn)生20TB以上的數(shù)據(jù),這些數(shù)據(jù)需要被完整保存,用于臨床檢測(cè)和醫(yī)藥科學(xué)研究使用。
“我們不希望數(shù)據(jù)出現(xiàn)問(wèn)題,如果數(shù)據(jù)有什么問(wèn)題,也希望能夠通過(guò)技術(shù)手段能夠進(jìn)行恢復(fù)?!?李玉梅說(shuō)。
浪潮信息存儲(chǔ)產(chǎn)品線分布式存儲(chǔ)總經(jīng)理姜樂(lè)果也分享了清華大學(xué)小鼠實(shí)驗(yàn)的案例。
“清華大學(xué)某個(gè)項(xiàng)目涉及到小鼠大腦的實(shí)驗(yàn)分析,透過(guò)28個(gè)1200萬(wàn)像素?cái)z像頭高速捕捉小鼠大腦的神經(jīng)元映射信號(hào),每1秒鐘拍攝30幀,連續(xù)拍攝48個(gè)小時(shí),不能丟失任何一幀信號(hào)的圖片?,F(xiàn)在國(guó)內(nèi)設(shè)備很難達(dá)到這樣的要求,為此,浪潮信息搭建了一個(gè)存儲(chǔ)鏡像系統(tǒng),完全一比一模擬實(shí)驗(yàn)環(huán)境,系統(tǒng)持續(xù)運(yùn)行了3個(gè)月,最終獲得了清華大學(xué)課題組的認(rèn)可。與此類似,復(fù)旦大學(xué)的內(nèi)腦研究、華中科大的機(jī)器研究項(xiàng)目,都采用了類似的存儲(chǔ)方法,滿足了科研的需求?!彼f(shuō)。
人工智能推高數(shù)據(jù)存儲(chǔ)需求
當(dāng)今時(shí)代是一個(gè)人工智能的時(shí)代,也是一個(gè)大模型算法流行的時(shí)代。作為科研創(chuàng)新的主導(dǎo)力量,高校在人工智能的研究和使用上始終走在行業(yè)的前列。
勞鳳丹在此分享了人工智能在畜禽養(yǎng)殖方面的應(yīng)用案例。
“我們透過(guò)人工智能豬臉識(shí)別技術(shù),對(duì)個(gè)體進(jìn)行識(shí)別;結(jié)合音視頻,結(jié)合豬的具體情況,采取區(qū)別對(duì)待的策略,例如我們能夠知道哪些豬是偏弱小的,我們通過(guò)一些方法提供額外的飼喂等。此外,透過(guò)人工智能數(shù)據(jù)分析,可以掌握豬的瘦肉率?!?勞鳳丹介紹說(shuō)。
她表示:“以往測(cè)豬的脂肪含量,需要把豬屠宰了,這樣你沒(méi)有辦法選擇適合的豬進(jìn)行育種。但如今不同了,借助人工智能等額外技術(shù)手段,就可以活體獲得這些數(shù)據(jù),從而賦予了行業(yè)更加廣闊的市場(chǎng)空間?!?/p>
人工智能技術(shù)的廣泛應(yīng)用,必然加劇對(duì)算力、低成本存儲(chǔ)的迫切需求,高校業(yè)不例外。那么,有哪些有效技術(shù)手段可以緩解這些矛盾呢?
“采用大容量的單盤(pán),這是一個(gè)最簡(jiǎn)單的辦法。” 姜樂(lè)果肯定地說(shuō)。
姜樂(lè)果表示:“我們可能用20TB單盤(pán),這是目前磁盤(pán)單盤(pán)的極限容量。此外,還可以考慮融合架構(gòu),比如某些課題數(shù)據(jù)總量有50GB,但會(huì)有很多人會(huì)使用這個(gè)數(shù)據(jù),很多時(shí)候,他們會(huì)把這50GB拷貝出來(lái)自己用,從而帶來(lái)了數(shù)據(jù)10、100倍速的增長(zhǎng),造成存儲(chǔ)資源的浪費(fèi)。如今,融合架構(gòu)的方式,用戶就可以共享底層同一份數(shù)據(jù),可以用文件去讀,也可以用對(duì)象、用大數(shù)據(jù)去讀,一份文件多種用途,數(shù)據(jù)操作產(chǎn)生的新數(shù)據(jù),僅僅保留增量的部分,從而把整個(gè)實(shí)際的采購(gòu)成本大大降下來(lái)?!?/p>
對(duì)于高校而言,降本增效的關(guān)鍵是存儲(chǔ)。
如果存儲(chǔ)配備不合理,性能調(diào)整不到位,計(jì)算就會(huì)出現(xiàn)卡脖子的問(wèn)題。堪稱一招不慎,則全盤(pán)都處于被動(dòng),應(yīng)該引起足夠的重視。
小結(jié)
有數(shù),有底,原本以為只有互聯(lián)網(wǎng),可以把持。沒(méi)有想到,教科研領(lǐng)域超越想象,數(shù)據(jù)創(chuàng)新應(yīng)用異彩紛呈。沒(méi)有最好,只有更好,展望未來(lái),從農(nóng)業(yè)、到健康;從飲食,到養(yǎng)生,超越學(xué)科的數(shù)據(jù)創(chuàng)新,會(huì)帶來(lái)怎樣的美好世界。有數(shù),有底,精彩超越想象。
(受篇幅限制,文字所能夠呈現(xiàn)的內(nèi)容,也只是冰山的一角,更多精彩內(nèi)容,請(qǐng)收看“有數(shù)、有底,讓教育科技創(chuàng)新綻放”視頻專題欄目。)