來源:特斯拉
投身專用超級(jí)計(jì)算機(jī) 只為實(shí)現(xiàn)最佳計(jì)算效率
全球超算競(jìng)賽持續(xù)白熱化,從不斷刷新的全球超算Top500排行榜中可見一斑,尤其在短短六年間,最強(qiáng)超算的性能增速超過了十倍。然而,除了圍繞運(yùn)算速度的激烈角逐,專用超級(jí)計(jì)算機(jī)領(lǐng)域逐漸嶄露頭角,成為一個(gè)不可忽視的焦點(diǎn)。這類超算在特定應(yīng)用場(chǎng)景下追求計(jì)算效率的極致優(yōu)化,通過犧牲一定的通用性,實(shí)現(xiàn)針對(duì)特定問題的最高性能表現(xiàn)和計(jì)算效率,從而在各專業(yè)細(xì)分領(lǐng)域展現(xiàn)無可比擬的競(jìng)爭(zhēng)優(yōu)勢(shì)。不過,這類專用超算由于往往不會(huì)參選諸如超算Top500的榜單,一直以來都鮮少受到關(guān)注。
科技巨頭們紛紛研發(fā)專用超算,是因?yàn)樗鼈円庾R(shí)到只有針對(duì)特定領(lǐng)域或任務(wù)進(jìn)行深度定制化設(shè)計(jì),才能有效克服通用超級(jí)計(jì)算機(jī)在處理復(fù)雜計(jì)算密集型問題時(shí)可能出現(xiàn)的數(shù)據(jù)傳輸慢、內(nèi)存訪問效率低等瓶頸。通過定制硬件、軟件架構(gòu)和算法優(yōu)化,專用超算不僅在科學(xué)研究、工程技術(shù)等領(lǐng)域?qū)崿F(xiàn)重大突破,搶占技術(shù)高地,而且在保證高性能計(jì)算需求的同時(shí),降低了成本和能耗,滿足了企業(yè)和研究機(jī)構(gòu)追求科研創(chuàng)新與經(jīng)濟(jì)效益的雙重訴求。
近期,隨著AI大模型的興起,針對(duì)算力需求的AI超算也開始嶄露頭角,專門解決大規(guī)模密集AI訓(xùn)練和推理等計(jì)算難題,再次證實(shí)了專用超算在特定領(lǐng)域內(nèi)的巨大價(jià)值和潛力。
如果要談?wù)搶S贸?,那么在生物?jì)算領(lǐng)域最為知名的安騰(Anton)超級(jí)計(jì)算機(jī)無疑極具代表性。它在執(zhí)行分子動(dòng)力學(xué)模擬任務(wù)時(shí)展現(xiàn)出了驚人的計(jì)算效率,甚至比通用超算Top500榜首的最強(qiáng)超算 Frontier還要高出50 倍以上。自 2007 年首次發(fā)布以來,安騰超算迭代升級(jí)了三次, 每一代在執(zhí)行分子動(dòng)力學(xué)模擬時(shí)的計(jì)算效率都要比同一時(shí)期最強(qiáng)大的通用超算快約100倍。憑借其在高性能計(jì)算領(lǐng)域的出色表現(xiàn),安騰超級(jí)計(jì)算機(jī)曾兩度榮膺高性能計(jì)算領(lǐng)域的最高榮譽(yù)——“ACM戈登貝爾獎(jiǎng)”。
安騰超級(jí)計(jì)算機(jī)
安騰超級(jí)計(jì)算機(jī)憑什么能降維打擊通用超算?
在 1683 年的荷蘭,生物學(xué)家安東尼·范·列文虎克(Antonie van Leeuwenhoek)自制顯微鏡,為人類打開了認(rèn)識(shí)微觀生物結(jié)構(gòu)和生命現(xiàn)象的窗口。
三百多年后,一臺(tái)以他的名字命名的計(jì)算顯微鏡——專用超級(jí)計(jì)算機(jī)「安騰」(Anton),在美國(guó)的 D. E. Shaw 研究所橫空出世,極大地加速了分子運(yùn)動(dòng)模擬的計(jì)算過程,使得我們能在微秒級(jí)別上看到蛋白質(zhì)運(yùn)動(dòng)的「影片」,更進(jìn)一步打開了微觀世界的“視界”。而在超算安騰出現(xiàn)之前,我們只能看到蛋白質(zhì)運(yùn)動(dòng)的「照片」。
分子動(dòng)力學(xué)模擬(Molecular Dynamics Simulation, 簡(jiǎn)稱MD)旨在揭示生物分子在原子級(jí)別上的運(yùn)動(dòng)規(guī)律和相互作用機(jī)制,為科研人員提供一個(gè)觀察藥物靶標(biāo)分子行為的超高分辨率窗口,進(jìn)而助力設(shè)計(jì)出更為精準(zhǔn)的藥物療法來應(yīng)對(duì)各種疾病。自上世紀(jì)80年代以來,計(jì)算效率一直是制約分子動(dòng)力學(xué)模擬技術(shù)在生物計(jì)算領(lǐng)域取得重大突破的關(guān)鍵瓶頸。由于分子行為模擬涉及海量的計(jì)算需求,在計(jì)算速度受限的情況下,能夠模擬的實(shí)際生物時(shí)間尺度相對(duì)較短。而安騰超級(jí)計(jì)算機(jī)(Anton)通過優(yōu)化計(jì)算能耗和提升計(jì)算效率,成功地延長(zhǎng)了此類分子模擬的可持續(xù)時(shí)長(zhǎng),為科學(xué)研究開辟了新的途徑。
在安騰超級(jí)計(jì)算機(jī)的助力下,美國(guó)在基礎(chǔ)生命科學(xué)研究和生物制藥領(lǐng)域取得了顯著優(yōu)勢(shì),許多基于安騰超算進(jìn)行的蛋白質(zhì)折疊和分子動(dòng)力學(xué)模擬的重要研究成果,已在Nature、Science、Cell等權(quán)威學(xué)術(shù)期刊上陸續(xù)發(fā)表,其科研成果的數(shù)量和質(zhì)量上的突出表現(xiàn),使得全球科研工作者都為之震撼。
不僅如此,在科研成果轉(zhuǎn)化為實(shí)際應(yīng)用的過程中,安騰超級(jí)計(jì)算機(jī)同樣發(fā)揮了關(guān)鍵作用。它極大地推動(dòng)了美國(guó)生物制藥領(lǐng)域的技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展,創(chuàng)造出可觀的市場(chǎng)價(jià)值,為新藥研發(fā)、疾病治療和醫(yī)療健康科技進(jìn)步注入了強(qiáng)大動(dòng)力。
Relay Therapeutics 這家美國(guó)公司成為藥物研發(fā)行業(yè)龍頭的背后,就離不開安騰超算。
新藥研發(fā)是個(gè)黃金賽道,但它回報(bào)周期長(zhǎng)、成本高,在以往的經(jīng)驗(yàn)和認(rèn)知中,要研發(fā)一款新藥起碼要花上 10 年、10 億美金。而且這個(gè)領(lǐng)域充滿了失敗,據(jù)一項(xiàng)來自麻省理工學(xué)院的研究統(tǒng)計(jì),2000 年至 2015 年間開發(fā)的候選藥物中,有 86% 以失敗告終。而 Relay 這家于 2016 年才創(chuàng)立的年輕公司,竟僅用了 18 個(gè)月、不到 1 億美金的投入,就確認(rèn)了一款膽管癌治療藥物 RLY-40089(一種高度選擇性的 FGFR2 不可逆和口服小分子抑制劑)的結(jié)構(gòu),在藥物發(fā)現(xiàn)行業(yè)一鳴驚人。
Relay成為行業(yè)新星的背后,離不開安騰超算。從技術(shù)路徑上來說,Relay成功的關(guān)鍵,在于其創(chuàng)造性地提出了基于運(yùn)動(dòng)的藥物設(shè)計(jì)(Motion Based Drug Design(TM),MBDD)的方法,這種方法將以往的蛋白質(zhì)靜視圖轉(zhuǎn)變?yōu)榈鞍踪|(zhì)運(yùn)動(dòng)的動(dòng)態(tài)視圖,這有助于在突變蛋白中發(fā)現(xiàn)新的變構(gòu)袋,從而開展對(duì)難成藥靶點(diǎn)的研發(fā)。
而讓蛋白質(zhì)動(dòng)起來的,就是第二代安騰超級(jí)計(jì)算機(jī)(Anton2)。Relay 在公司成立伊始,就跟 D.E.Shaw 研究所建立了合作關(guān)系,他們的研發(fā)人員利用超算安騰對(duì)藥物靶點(diǎn)和成藥小分子的結(jié)構(gòu)進(jìn)行分子動(dòng)力學(xué)模擬和篩選設(shè)計(jì),從而突破了長(zhǎng)時(shí)間大尺度分子動(dòng)力學(xué)模擬的計(jì)算瓶頸。
圖片來源:hpcwire
如果沒有安騰超算,恐怕 Relay 就不會(huì)那么快在 2020 年就登陸納斯達(dá)克,成為全球第二家上市的 AI 制藥公司。
另一個(gè)值得一提的案例,是在 2020 年 3 月 27 日,D. E. Shaw 研究所發(fā)布了由安騰超算模擬的、100 微秒新冠病毒 3CL 蛋白酶 MD 模擬動(dòng)畫及數(shù)據(jù)。這種蛋白酶是新冠藥物開發(fā)的一個(gè)熱門靶點(diǎn),安騰超算以最短的時(shí)間,當(dāng)時(shí)針對(duì) 3CL 蛋白酶研發(fā)抑制劑提供了非常寶貴的數(shù)據(jù)。這長(zhǎng)達(dá) 100 微秒的模擬結(jié)果,安騰這臺(tái)分子動(dòng)力學(xué)模擬專用超算只用了十幾天的時(shí)間完成計(jì)算,這是當(dāng)今全球最強(qiáng)超算也難以企及的。
那么,為什么安騰超級(jí)計(jì)算機(jī)能算這么快?
顯而易見的原因就是它在設(shè)計(jì)之初就只瞄準(zhǔn)了一種計(jì)算問題,即加速分子動(dòng)力學(xué)模擬計(jì)算。從最初的規(guī)劃階段開始,安騰超級(jí)計(jì)算機(jī)就被定向設(shè)計(jì)為專注于解決單一但計(jì)算密集型的分子動(dòng)力學(xué)模擬問題,區(qū)別于通用型超級(jí)計(jì)算機(jī)需要應(yīng)對(duì)多種不同類型計(jì)算任務(wù)的特點(diǎn)。正是這種對(duì)特定計(jì)算領(lǐng)域的深度聚焦,使安騰在分子動(dòng)力學(xué)模擬方面突破了通用超級(jí)計(jì)算機(jī)的傳統(tǒng)性能極限。
安騰超級(jí)計(jì)算機(jī)在進(jìn)行分子動(dòng)力學(xué)模擬時(shí),尤其注重優(yōu)化針對(duì)通訊密集型并行計(jì)算問題的解決方案。不同于普遍服務(wù)于訪存密集型任務(wù)的GPU和通用超級(jí)計(jì)算機(jī),安騰采取了集成定制化ASIC專用芯片的方式,以最大限度地減少無效數(shù)據(jù)傳輸,優(yōu)化數(shù)據(jù)存儲(chǔ)布局與本地計(jì)算操作,并簡(jiǎn)化指令集以規(guī)避非必要的計(jì)算步驟。此外,超算安騰通過細(xì)粒度劃分芯片內(nèi)部的計(jì)算任務(wù),并根據(jù)不同精度需求進(jìn)行差異化調(diào)度和分配,使得在模擬分子間復(fù)雜相互作用時(shí),能夠?qū)崿F(xiàn)遠(yuǎn)高于一般計(jì)算平臺(tái)的高效計(jì)算性能。
同時(shí),安騰超級(jí)計(jì)算機(jī)的設(shè)計(jì)理念嚴(yán)格遵循了阿姆達(dá)爾定律。這一定律由計(jì)算機(jī)科學(xué)家Gene Amdahl于1967年提出,描述了在系統(tǒng)性能優(yōu)化過程中,某一組件的改進(jìn)對(duì)其整體性能提升的影響。D.E.Shaw研究所運(yùn)用這一原理,找準(zhǔn)了系統(tǒng)性能提升的關(guān)鍵瓶頸,有針對(duì)性地對(duì)軟硬件資源進(jìn)行集中優(yōu)化,以犧牲一定程度的通用性為代價(jià),換取在分子動(dòng)力學(xué)模擬計(jì)算領(lǐng)域的巨大性能提升。
中國(guó)超算之路:專用化大有可為
在世界超算的競(jìng)技場(chǎng)中,中國(guó)顯然也是其中一支實(shí)力強(qiáng)大的隊(duì)伍。在 2023 年底的超算 Top500 榜單統(tǒng)計(jì)中,中國(guó)最強(qiáng)超算「神威·太湖之光」已經(jīng)達(dá)到了 93.01 PFlop/s(接近每秒十億億次浮點(diǎn)運(yùn)算)的速度。2014-2017 年期間,「天河二號(hào)”和「神威·太湖之光」和「天河二號(hào)」還曾連續(xù) 4 年問鼎 Top500 的榜首。這些閃亮的數(shù)字和名次都顯示了我國(guó)通用超級(jí)計(jì)算機(jī)沖擊科學(xué)研究頂峰的勢(shì)頭,但在特定科學(xué)領(lǐng)域的應(yīng)用上,國(guó)內(nèi)的整體步伐則顯得沒有那么快,而且應(yīng)用領(lǐng)域較單一,目前主要還是集中在量子計(jì)算或者人工智能方面,大規(guī)模產(chǎn)業(yè)化落地的成果也不是十分突出。
通用型超算固然算力驚人,但在特定的計(jì)算問題上,未必比得上規(guī)模更小的專用超算。對(duì)中國(guó)超算的未來發(fā)展而言,應(yīng)用于特定領(lǐng)域的專用超算無疑是一片藍(lán)海,這也是安騰超級(jí)計(jì)算機(jī)帶給我們的啟示。
不過,在專用超算這條賽道上,無論是從 0 到 1 還是跟跑世界頂尖水平,都不是簡(jiǎn)單之事。就以安騰超級(jí)計(jì)算機(jī)為例,目前全球僅有的幾臺(tái)機(jī)器分別位于美國(guó)紐約市 D. E. Shaw 研究所和匹茲堡超算中心,其他機(jī)構(gòu)需要提交美國(guó)國(guó)家科學(xué)院獨(dú)立專家委員會(huì)一份研究提案,可以排隊(duì)免費(fèi)使用,但并不接受其他國(guó)家學(xué)術(shù)機(jī)構(gòu)的申請(qǐng),這已然形成了一種技術(shù)壟斷。
不僅是美國(guó),其他有實(shí)力的國(guó)家也都在競(jìng)相打造專用超算,比如英偉達(dá) CEO 黃仁勛最近大力鼓吹生物計(jì)算,開始和制造商諾和諾德(Novo Nordisk Foundation)聯(lián)手,在丹麥建立世界上最強(qiáng)大的 AI 超算「Gefion」。在去年年底《自然》發(fā)布的“2024 年值得關(guān)注的科學(xué)事件”中,專用超級(jí)計(jì)算機(jī)也有上榜:文章預(yù)測(cè) 2024 年研究人員啟動(dòng)歐洲首個(gè)百億億次的超級(jí)計(jì)算機(jī)「Jupiter」,它每秒能執(zhí)行一千萬億次計(jì)算,后續(xù)將被應(yīng)用于構(gòu)建醫(yī)療目的的人類心臟和大腦數(shù)字孿生模型,以及進(jìn)行地球氣候的高分辨率模擬。美國(guó)也會(huì)安裝兩臺(tái)百億億次級(jí)別的超級(jí)計(jì)算機(jī),一臺(tái)是位于伊利諾伊州勒蒙的阿貢國(guó)家實(shí)驗(yàn)室的「Aurora」,用來繪制大腦神經(jīng)回路地圖;另一臺(tái)是位于加利福尼亞州勞倫斯利弗莫爾國(guó)家實(shí)驗(yàn)室的「El Capitan」,它將被用于模擬核武器爆炸效果。
總之,專用超算擺在我們面前的機(jī)遇是巨大的,同時(shí)這場(chǎng)科技的角逐顯然是激烈的,而研發(fā)之路必然道阻且長(zhǎng),我們可能會(huì)走得慢,但方向要走對(duì),我們需要突出重圍,打造一臺(tái)屬于中國(guó)自己的「安騰」。