如今高性能計算幾乎出現(xiàn)在各個領(lǐng)域,早已不僅限于科學(xué)計算等傳統(tǒng)領(lǐng)域,自動駕駛,能源勘探、天氣預(yù)報、基因檢測、機械設(shè)計、芯片設(shè)計、新藥研發(fā)、電影特效等等,背后都有高性能計算的身影。
未來,高性能計算將向云計算、AI、行業(yè)等方向跨界融合,面對日益復(fù)雜的應(yīng)用場景,將挑戰(zhàn)多元的算力供給能力。
本次大會上,天云軟件發(fā)布了天紡應(yīng)用管理平臺2.0,天紡應(yīng)用管理平臺的產(chǎn)品經(jīng)理在現(xiàn)場接受了采訪。
本次天紡應(yīng)用平臺發(fā)布了最新的2.0版本,能介紹一下新版本都帶來了哪些變化嗎?(產(chǎn)品發(fā)布的歷史和版本功能、設(shè)計理念、核心價值等)
正如今年天云軟件的slogan——“納百云,算未來”,我們的目標(biāo)是幫助客戶上云以及用好云,這些云包含資源云和計算云,天云有兩條核心產(chǎn)品線去支撐這些業(yè)務(wù),而天紡應(yīng)用平臺就是支撐客戶超算及超算云的產(chǎn)品線。
天紡應(yīng)用平臺在2018年就開始規(guī)劃建設(shè),主要包含調(diào)度系統(tǒng)和應(yīng)用門戶兩個軟件,在2020年我們完成了平臺V1.0的發(fā)布,形成了可以銷售的核心軟件包,近一年來我們根據(jù)現(xiàn)場的需求不斷的迭代完善,同時快速跟進市場的變化,在第三季度完成了產(chǎn)品的更新?lián)Q代。
這次產(chǎn)品的變化主要集中在以下幾個方面:
產(chǎn)品架構(gòu)的演進:我們對1.0的架構(gòu)進行了優(yōu)化,讓系統(tǒng)更輕量,只要非常小的資源就能運行系統(tǒng),同時我們新版本采用了更科學(xué)的高可用模式,提供負載均衡和橫向擴展性,可以支持大規(guī)模的互聯(lián)網(wǎng)用戶訪問,系統(tǒng)在設(shè)計時考慮到與其他系統(tǒng)的集成,提供基于OpenAPI3.0標(biāo)準(zhǔn)接口,保證系統(tǒng)擴展性和生態(tài)。
產(chǎn)品能力的增強:現(xiàn)在產(chǎn)品支持多資源池多調(diào)度器的管理,可以更好的幫助用戶利舊集群,應(yīng)用門戶和調(diào)度器解耦可以為用戶提供更靈活的方案組合,產(chǎn)品從專一的小而美軟件變成開放式的計算平臺,站在平臺角度來解決客戶的實際問題,同時為了更好的用戶體驗,在新版本中增加了動態(tài)應(yīng)用集成、圖形可視化方式選擇以及多種文件傳輸方式支持等功能。
產(chǎn)品方向的擴展:以前的版本主要面向高端制造業(yè),現(xiàn)在新版本不但可以支持高端制造業(yè),而且可以對公有云進行支撐,根據(jù)用戶的實際需求可以快速響應(yīng)云資源彈性伸縮、桌面云集成及管理等等。
以上概括了產(chǎn)品的重大變化,具體功能上的變化就不一一說明了。
目前天紡應(yīng)用平臺主要面對哪些客戶群體?為他們提供哪些服務(wù)呢?(產(chǎn)品服務(wù)、目標(biāo)客戶)
在上面的回答中其實應(yīng)該也看到我們產(chǎn)品的定位,下面再做詳細的說明,天紡應(yīng)用平臺是一個面向多個行業(yè)和領(lǐng)域的國產(chǎn)自主可控、且國際領(lǐng)先水平的高性能計算平臺,最終目標(biāo)是提高用戶和組織的生產(chǎn)效率,幫助客戶用好計算云。
按照我們的產(chǎn)品定位,天紡應(yīng)用平臺可以應(yīng)用于高端制造、汽車制造、醫(yī)療、水利、氣象、生物等各個領(lǐng)域,只要這些行業(yè)使用數(shù)字化仿真或遠程圖形可視化軟件,天紡應(yīng)用平臺都能提供支撐,在我們產(chǎn)品中已經(jīng)集成了CAD、CAE、CFD、生命科學(xué)和氣象環(huán)境等領(lǐng)域常見軟件,用戶可以通過產(chǎn)品快速搭建自己的私有計算集群,在自建的集群內(nèi)可以實現(xiàn)遠程設(shè)計桌面,類似于云桌面的效果,同時可以為用戶提供了可視化的仿真計算功能,用戶可以通過工業(yè)應(yīng)用內(nèi)部直接提交計算作業(yè)或者通過WEB頁面提交作業(yè),降低使用復(fù)雜度和集群推廣難度。
對于部分需要使用公有云或超算資源的客戶,我們的產(chǎn)品同樣可以滿足需求,天紡平臺在研發(fā)過程中一直和各大超算中心有緊密合作,產(chǎn)品在設(shè)計之初就考慮了超算資源或公有云資源的彈性利用,產(chǎn)品在自建集群資源不足或某些條件下會自動動態(tài)開通公有云計時資源,利用開通的資源完成計算任務(wù),一定程度中幫助客戶節(jié)省成本、削峰填谷。
天紡應(yīng)用平臺在幾個超算中心都已部署實施,平臺本身包含租戶管理和計費、報表功能,對于一些有云資源且想租轉(zhuǎn)售的客戶來說,天紡是最適合的產(chǎn)品,原因在于它在各超算中心完成了超算公有云的運營試煉,無需試錯就可以直接進入到資源轉(zhuǎn)化為利潤的階段。
經(jīng)過近幾年的不斷耕耘,我們產(chǎn)品目前已經(jīng)在航空、航天、教育、醫(yī)療、汽車制造、芯片制造等行業(yè)得到應(yīng)用,同時我們產(chǎn)品也在各大超算中心已經(jīng)部署上線,幫助我們的客戶管理近萬臺計算節(jié)點,提供超算云服務(wù),這也證明天紡應(yīng)用平臺是一個穩(wěn)定、成熟的產(chǎn)品。
能介紹一個比較典型的項目嗎?
這幾年天紡應(yīng)用平臺在不少客戶那邊已經(jīng)實施應(yīng)用,也得到了客戶的一些積極反饋,我下面就講一個對我們和客戶實現(xiàn)雙贏的案例。
無錫超算中心由科技部、江蘇省和無錫市共同投資建設(shè),是江蘇省首個重大科技基礎(chǔ)設(shè)施,在中心不但部署了神威·太湖之光超級計算機,也有一部分x86的超算資源,無錫超算中心希望能夠?qū)⑦@些計算資源面向社會開放,尤其為長三角的制造業(yè)提供工業(yè)仿真算力,超算中心和天云就這個任務(wù)目標(biāo)形成了一個合作協(xié)議,希望天云能夠充分利用既有資源建立面向工業(yè)仿真的超算云平臺“神工坊”。
我們根據(jù)這個任務(wù)目標(biāo)組織了兩個團隊,一個團隊專門負責(zé)方案設(shè)計、實施,由長期奮戰(zhàn)在HPC一線20余年的專家團隊根據(jù)客戶的需求重新設(shè)計集群架構(gòu),另外一個研發(fā)團隊主要負責(zé)天紡應(yīng)用平臺的集成和移植,在此過程中和客戶不斷的溝通改進,為產(chǎn)品增加了非常多的超算公有云功能,比如租戶計費、科學(xué)計算應(yīng)用集成等,最終幫助客戶發(fā)布了神工坊超算云,在試運行期間就有3000多個用戶進行了測試使用,反饋良好。
這個項目對于無錫超算來說,他們有效的使資源為社會提供服務(wù),擴展了中心的影響力和品牌力,走在超算中心技術(shù)探索和應(yīng)用的前列。對于天云來說,不但鍛煉了團隊、完善了產(chǎn)品,而且讓我們?yōu)闈铣憧蛻舫阍坡涞靥峁┝藚⒖?,這就是我說的雙贏,我們希望和未來的客戶一直是合作雙贏。
相對于其他同類產(chǎn)品來說優(yōu)勢是什么?
我從以下幾個方面來回答下這個問題:
首先是云+HPC的優(yōu)勢:眾所周知我們公司不但有天紡應(yīng)用平臺產(chǎn)品,還在云計算領(lǐng)域深耕了近十年,我們公司有云基因和云產(chǎn)品,天紡平臺和我們的多云平臺可以實現(xiàn)其他競品沒有的云資源+HPC模式,對于客戶來說選擇天云不但可以實現(xiàn)公有云資源彈性利用,而且可以將天紡平臺發(fā)布成園區(qū)云或公有云,最大化資源利用的同時形成規(guī)模效應(yīng)。
其二是產(chǎn)品能力優(yōu)勢:天紡平臺不但包含市場上常用的設(shè)計、仿真計算功能,我們還有其他解決方案不具備的多租戶計費、密級控制、團隊協(xié)作管理功能,同時我們產(chǎn)品可以看作一個應(yīng)用集成中臺,提供應(yīng)用表單和集成腳本的動態(tài)管理。最后我們產(chǎn)品和工業(yè)應(yīng)用實現(xiàn)了兼容,在工業(yè)應(yīng)用內(nèi)部直接就可以啟動作業(yè)任務(wù),這是一般解決方案無法做到的,這個功能可以幫助用戶不改變現(xiàn)有習(xí)慣的情況使用計算集群,有助于降低企業(yè)HPC計算平臺的推廣難度。
再次是產(chǎn)品的自研能力和國產(chǎn)化集成優(yōu)勢:目前國內(nèi)很多廠商的調(diào)度軟件都不是自研的,他們要么直接使用國外產(chǎn)品,比如LSF、PBS,要么就直接找開源社區(qū)的產(chǎn)品進行封裝售賣,基本沒有二次研發(fā)能力,我們公司的調(diào)度軟件是由10余年HPC經(jīng)驗的核心開發(fā)團隊研發(fā),在濟南超算的8500節(jié)點的單集群超算系統(tǒng)中得到驗證,無論是產(chǎn)品性能以及二次開發(fā)能力都不是其他廠商可比擬的,另外我們產(chǎn)品目前已經(jīng)和國內(nèi)常見的國產(chǎn)化服務(wù)器進行了兼容認證,比如申威、長城飛騰、天津飛騰、鯤鵬、兆芯等,而目前其他廠商的產(chǎn)品還沒有完成這些認證,在這方面我們有國產(chǎn)化先發(fā)優(yōu)勢。
最后是團隊優(yōu)勢和方案能力:我們的產(chǎn)品不是盲目研發(fā)出來的,我們有一個20余年HPC方案和實施經(jīng)驗團隊進行把關(guān),我們的研發(fā)團隊來自全球領(lǐng)先產(chǎn)品的核心研發(fā)組,二次研發(fā)和支持能力有保障;另外天云與其他廠商的巨大區(qū)別是我們是方案提供方、實施方,而不是單純產(chǎn)品原廠商,我們有其他廠商沒有的人才優(yōu)勢,作為中立的廠商我們?yōu)橛脩籼峁┳顑?yōu)化、最合理、最平衡的落地方案,每一個項目都是交鑰匙工程,這就是我們給客戶的核心價值。
如何看待當(dāng)前國內(nèi)HPC市場的發(fā)展?天云軟件未來有哪些規(guī)劃呢?
這些年隨著硬件設(shè)備的不斷更新?lián)Q代,HPC市場發(fā)展很快,以前由于基礎(chǔ)硬件造成的問題也得到了解決,加上近幾年國產(chǎn)化進程的不斷推進,我認為國內(nèi)的HPC市場會迎來一個爆發(fā)期,一方面是國產(chǎn)化推進時原來國外的一些調(diào)度軟件受限,國產(chǎn)HPC產(chǎn)品迎來了機會;另外一方面是因為越來越多的企業(yè)對仿真技術(shù)越發(fā)重視,甚至一些中小企業(yè)也開始使用超算云和公有云的HPC資源,這在十年前是無法想象的,隨著社會的發(fā)展,各行各業(yè)的社會職能不斷細分,企業(yè)產(chǎn)品的競爭越來越激烈,這些社會進步和競爭將推動企業(yè)使用提高競爭力的技術(shù)和產(chǎn)品,而HPC就是快速提高產(chǎn)品競爭力的一項技術(shù)。
天云針對可能面臨的市場也做了一些規(guī)劃,一方面我們將繼續(xù)深耕既有的市場,不斷的提升產(chǎn)品競爭力,未來將針對行業(yè)發(fā)布專用的版本;另外我們也將嘗試與一些計算資源提供商合作,一起推動超算云的落地,為更多更小的企業(yè)用好計算云,最終實現(xiàn)“納百云、算未來”的初衷,希望能為國家的制造業(yè)盡一份力。