一、AI驅(qū)動(dòng)下的半導(dǎo)體產(chǎn)業(yè)轉(zhuǎn)型
半導(dǎo)體產(chǎn)業(yè)正處于關(guān)鍵轉(zhuǎn)型期,這一轉(zhuǎn)型由人工智能崛起和傳統(tǒng)摩爾定律放緩共同驅(qū)動(dòng)。正如報(bào)告中所指出,“半導(dǎo)體產(chǎn)業(yè)正經(jīng)歷一場(chǎng)由人工智能(AI)崛起以及傳統(tǒng)摩爾定律放緩所驅(qū)動(dòng)的關(guān)鍵轉(zhuǎn)型”,該報(bào)告聚焦于芯片技術(shù)如何演進(jìn),以滿(mǎn)足AI對(duì)算力的巨大需求,同時(shí)解決能效、安全性與可靠性等關(guān)鍵問(wèn)題。在AI算力需求的強(qiáng)勁推動(dòng)下,芯片技術(shù)正積極尋求創(chuàng)新方向,努力應(yīng)對(duì)這些復(fù)雜挑戰(zhàn)。
技術(shù)創(chuàng)新替代傳統(tǒng)縮放:傳統(tǒng)的摩爾定律縮放方法已觸及極限,產(chǎn)業(yè)開(kāi)始轉(zhuǎn)向定制芯片、計(jì)算子系統(tǒng)(CSS)和芯粒等創(chuàng)新方案,以此提升性能與能效。
能效成為AI計(jì)算核心考量:隨著AI工作負(fù)載對(duì)計(jì)算需求的不斷攀升,能效成為關(guān)鍵因素。芯片設(shè)計(jì)通過(guò)整合優(yōu)化內(nèi)存層次結(jié)構(gòu)、采用先進(jìn)封裝技術(shù)和成熟的電源管理技術(shù),在維持高性能的同時(shí)降低能源消耗。
安全威脅促使防護(hù)體系升級(jí):AI技術(shù)的發(fā)展帶來(lái)了新的安全威脅,半導(dǎo)體產(chǎn)業(yè)構(gòu)建多層次的軟硬件防護(hù)體系。從芯片加密技術(shù)到AI強(qiáng)化的安全監(jiān)測(cè)系統(tǒng),全方位應(yīng)對(duì)新興安全威脅。
芯片設(shè)計(jì)制造關(guān)聯(lián)更緊密:新的制程工藝節(jié)點(diǎn)要求整個(gè)生態(tài)系統(tǒng)更深入合作,芯片設(shè)計(jì)與制造之間的界限逐漸模糊。先進(jìn)封裝技術(shù)和芯粒設(shè)計(jì)的發(fā)展,成為推動(dòng)未來(lái)創(chuàng)新的關(guān)鍵動(dòng)力。
軟件生態(tài)系統(tǒng)至關(guān)重要:軟件生態(tài)系統(tǒng)是釋放新芯片架構(gòu)潛力的關(guān)鍵。確保與AI框架無(wú)縫兼容,并為定制芯片提供優(yōu)化支持,是新型芯片架構(gòu)普及的關(guān)鍵。
二、洞察行業(yè)發(fā)展關(guān)鍵議題
在定制芯片設(shè)計(jì)中,平衡定制化與通用性至關(guān)重要。Arm解決方案工程部執(zhí)行副總裁Kevork Kechichian表示:“定制芯片設(shè)計(jì)的關(guān)鍵在于確保芯片與軟件具備高度的可復(fù)用性。雖然每顆芯片都是根據(jù)特定需求定制而成,但底層平臺(tái)必須具備一定的通用性,這正是平臺(tái)真正的價(jià)值所在。這些底層平臺(tái)需要能夠確保不同定制芯片之間實(shí)現(xiàn)一定程度的相互復(fù)用,唯有如此,才能有效應(yīng)對(duì)成本與產(chǎn)品上市時(shí)間所帶來(lái)的挑戰(zhàn)?!?/p>
Arm通過(guò)識(shí)別可復(fù)用模塊與資源,與SoC及IP提供商合作,為合作伙伴提供定制化解決方案,縮短產(chǎn)品上市周期。
為在降低能耗的同時(shí)平衡算力和能效,需從多個(gè)層面入手。Kevork Kechichian提到:“要實(shí)現(xiàn)這一目標(biāo),首先從最底層出發(fā),從晶體管層開(kāi)始,與晶圓代工廠緊密合作,確保晶體管在功耗和性能方面實(shí)現(xiàn)優(yōu)化,無(wú)論是動(dòng)態(tài)功耗還是漏電功耗;再來(lái)是架構(gòu)層面,對(duì)CPU以及各類(lèi)處理引擎的指令集進(jìn)行針對(duì)性?xún)?yōu)化;然后向上進(jìn)入整個(gè)結(jié)構(gòu)中的更高層級(jí),從系統(tǒng)級(jí)芯片(SoC)設(shè)計(jì)、封裝到數(shù)據(jù)中心等方面進(jìn)行優(yōu)化。在此過(guò)程中,關(guān)鍵要點(diǎn)在于對(duì)數(shù)據(jù)及其傳輸過(guò)程的保護(hù),降低在內(nèi)存之間傳輸數(shù)據(jù)所消耗的電力;最后,在支撐大型數(shù)據(jù)中心運(yùn)行的軟件層,實(shí)現(xiàn)智能負(fù)載均衡,即針對(duì)人工智能(AI)的不同方面進(jìn)行處理上的優(yōu)化,并合理分配工作負(fù)載,盡可能減少不同節(jié)點(diǎn)之間的數(shù)據(jù)傳輸?!?/p>
定制芯片面臨開(kāi)發(fā)成本高、資源需求大的問(wèn)題,包括人力和計(jì)算資源。Kevork Kechichian指出:“定制芯片的開(kāi)發(fā)成本非常高,所需的資源也非常大——這既體現(xiàn)在投入開(kāi)發(fā)的人力上,也體現(xiàn)在為開(kāi)發(fā)定制芯片所需的大量計(jì)算資源上?!?/p>
為此,Arm已探索出多種能夠有效降低開(kāi)發(fā)投入的方法。從加快產(chǎn)品上市的角度出發(fā),Arm的定制化解決方案能夠讓合作伙伴顯著縮短其產(chǎn)品上市周期。最基礎(chǔ)的方法是從平臺(tái)的角度出發(fā),識(shí)別可復(fù)用的模塊與資源,并確保定制工作是在已有基礎(chǔ)上進(jìn)行,無(wú)需一切從零開(kāi)始。在生態(tài)構(gòu)建方面,需充分激發(fā)各方核心專(zhuān)長(zhǎng),整合產(chǎn)業(yè)聯(lián)盟力量,通過(guò)軟件復(fù)用推動(dòng)生態(tài)系統(tǒng)繁榮。
AI推理運(yùn)算需要獨(dú)特的技術(shù)開(kāi)發(fā)路徑,涉及計(jì)算子系統(tǒng)、SoC框架和軟件體系。Kevork Kechichian認(rèn)為:“AI推理運(yùn)算需要獨(dú)特的技術(shù)開(kāi)發(fā)路徑——從計(jì)算子系統(tǒng)到SoC框架的專(zhuān)用架構(gòu)設(shè)計(jì),再到實(shí)現(xiàn)這一切的軟件體系。主要的架構(gòu)差異在于對(duì)帶寬和數(shù)據(jù)傳輸?shù)年P(guān)注,這些系統(tǒng)需要針對(duì)推理工作負(fù)載和高帶寬進(jìn)行優(yōu)化,以滿(mǎn)足不斷增長(zhǎng)的需求。隨著模型訓(xùn)練與推理的發(fā)展,云端訓(xùn)練后的模型可在邊緣設(shè)備運(yùn)行,提升數(shù)據(jù)傳輸效率和整體性能?!?/p>
AI推理工作負(fù)載與傳統(tǒng)計(jì)算不同,Arm探索新的底層模型方法提升推理復(fù)雜度。Kevork Kechichian介紹道:“AI推理工作負(fù)載與傳統(tǒng)的純計(jì)算處理有很大不同。顯而易見(jiàn)的是,端側(cè)仍需承擔(dān)一定程度的處理任務(wù),但Arm正在探索一種全新的底層模型方法——該方法能根據(jù)用戶(hù)反饋提升AI推理的復(fù)雜度。與此同時(shí),Arm聚焦于異構(gòu)計(jì)算,該范式中的CPU、GPU和TPU能夠支持不同的工作負(fù)載。上述所有處理器都可以作為AI推理的處理引擎,部署到Arm合作伙伴所開(kāi)發(fā)的SoC中?!?/p>
打造可持續(xù)的生態(tài)系統(tǒng),關(guān)鍵在于激發(fā)和整合各方核心專(zhuān)長(zhǎng)。Kevork Kechichian提到:“構(gòu)建和維護(hù)這一生態(tài)系統(tǒng)至關(guān)重要,實(shí)現(xiàn)這一目標(biāo)的關(guān)鍵在于,我們必須充分激發(fā)并整合各方在不同領(lǐng)域的核心專(zhuān)長(zhǎng)。”
當(dāng)前,各類(lèi)產(chǎn)業(yè)聯(lián)盟正在蓬勃發(fā)展,成為推動(dòng)行業(yè)創(chuàng)新發(fā)展的重要力量。商業(yè)上的收益是參與各方的驅(qū)動(dòng)力。例如,晶圓代工廠關(guān)注晶圓銷(xiāo)售帶來(lái)的收入增長(zhǎng),各類(lèi)IP提供商則聚焦于權(quán)利金的增長(zhǎng),這一清晰的商業(yè)邏輯貫穿于整個(gè)產(chǎn)業(yè)鏈,一直延展到服務(wù)提供商,再到仿真平臺(tái)領(lǐng)域。而在此生態(tài)系統(tǒng)中,軟件的復(fù)用會(huì)讓參與的各方都能從中獲益,共同推動(dòng)生態(tài)系統(tǒng)的繁榮與發(fā)展。
芯粒技術(shù)發(fā)展的關(guān)鍵挑戰(zhàn)是設(shè)計(jì)與接口方式的標(biāo)準(zhǔn)化,涉及封裝和系統(tǒng)通信全過(guò)程。Kevork Kechichian表示:“在我們當(dāng)前所處的技術(shù)范式中,最關(guān)鍵的是如何對(duì)芯粒(chiplet)的設(shè)計(jì)與接口方式進(jìn)行標(biāo)準(zhǔn)化。這涉及從封裝廠如何集成這些芯粒,一直到在系統(tǒng)中不同芯粒之間進(jìn)行通信的全過(guò)程。因此,與合作伙伴就標(biāo)準(zhǔn)化問(wèn)題達(dá)成共識(shí)至關(guān)重要。”
在此背景下,Arm推出的芯粒系統(tǒng)架構(gòu)(Chiplet System Architecture,CSA),旨在對(duì)各個(gè)芯粒之間及在整個(gè)系統(tǒng)內(nèi)的通信方式等多個(gè)方面實(shí)現(xiàn)標(biāo)準(zhǔn)化。此外,Arm攜手合作伙伴共同推動(dòng)AMBA CHI芯片到芯片互連協(xié)議等倡議的落地實(shí)施,確保來(lái)自不同供應(yīng)商的不同芯粒通過(guò)一個(gè)統(tǒng)一的接口協(xié)議來(lái)確保芯粒之間的互操作性。
面對(duì)AI驅(qū)動(dòng)的網(wǎng)絡(luò)攻擊,Arm構(gòu)建多層級(jí)軟硬件防護(hù)體系,在芯片中集成加密技術(shù),結(jié)合AI強(qiáng)化的安全監(jiān)測(cè)系統(tǒng)抵御威脅。Kevork Kechichian介紹:“當(dāng)前行業(yè)正在加速演進(jìn),針對(duì)SoC平臺(tái)IP的攻擊手段日趨復(fù)雜。Arm正在通過(guò)構(gòu)建多層級(jí)的軟硬件防護(hù)體系,提升防御能力?!?/p>
Arm在芯片中直接集成加密技術(shù),并結(jié)合經(jīng)AI強(qiáng)化的安全監(jiān)測(cè)系統(tǒng),使現(xiàn)代SoC架構(gòu)能夠抵御傳統(tǒng)攻擊與新興的威脅。此外,AI本身也正日益成為抵御安全攻擊的有力助手。通過(guò)基于網(wǎng)絡(luò)的監(jiān)測(cè)與先進(jìn)的代碼分析,AI驅(qū)動(dòng)的技術(shù)能夠以人類(lèi)難以企及的速度和規(guī)模識(shí)別可疑行為,并發(fā)現(xiàn)潛在漏洞。Arm正在最大限度地發(fā)揮這一優(yōu)勢(shì)。
芯粒設(shè)計(jì)、先進(jìn)封裝與Arm異構(gòu)計(jì)算架構(gòu)是未來(lái)AI計(jì)算的主流路徑。Kevork Kechichian談到:“對(duì)海量AI計(jì)算的需求正在推動(dòng)多種技術(shù)加速融合。從芯粒技術(shù)角度來(lái)看,鑒于先進(jìn)工藝節(jié)點(diǎn)所能產(chǎn)出的實(shí)際可用晶粒(die)數(shù)量有限,行業(yè)正轉(zhuǎn)向采用尺寸更便于管控的芯粒技術(shù)。同時(shí),將芯片中的不同功能模塊進(jìn)行隔離設(shè)計(jì),大大提升了整體的成本效益。一些先進(jìn)的封裝范式實(shí)際上正在提升這些芯粒的性能與能效。”
以3D封裝為例,當(dāng)不同的晶粒垂直堆疊在一起,無(wú)論是計(jì)算晶粒、基底晶粒還是內(nèi)存晶粒,從處理單元到內(nèi)存的接口距離都會(huì)變得非常短,這不僅顯著減少了數(shù)據(jù)的傳輸路徑,還降低了功耗,并提高了整體性能。最為關(guān)鍵的是,先進(jìn)封裝與芯粒技術(shù)的真正價(jià)值在于實(shí)現(xiàn)真正的標(biāo)準(zhǔn)化。通過(guò)標(biāo)準(zhǔn)化,企業(yè)可以根據(jù)不同的性能需求,快速地組合和配置這些芯粒,從而打造出具有不同性能定位的芯片。這不僅大大縮短了產(chǎn)品上市周期,也能確保在快速迭代的市場(chǎng)競(jìng)爭(zhēng)中占據(jù)先機(jī)。
三、行業(yè)展望:迎接挑戰(zhàn),擁抱變革
半導(dǎo)體產(chǎn)業(yè)正處于關(guān)鍵轉(zhuǎn)折點(diǎn),AI的發(fā)展為芯片技術(shù)帶來(lái)了前所未有的機(jī)遇與挑戰(zhàn)。行業(yè)各方需要緊密合作,IP提供商、晶圓代工廠、系統(tǒng)集成商等應(yīng)攜手應(yīng)對(duì)技術(shù)難題。在技術(shù)創(chuàng)新方面,持續(xù)探索新的架構(gòu)、材料和集成技術(shù),提升芯片的性能、能效和安全性。同時(shí),注重軟件生態(tài)系統(tǒng)的建設(shè),確保軟件與硬件的協(xié)同發(fā)展,以釋放芯片的最大潛力。
未來(lái),芯片技術(shù)將在AI的驅(qū)動(dòng)下不斷演進(jìn),滿(mǎn)足日益增長(zhǎng)的計(jì)算需求。面對(duì)電源供給、熱管理、內(nèi)存帶寬和安全等諸多挑戰(zhàn),整個(gè)生態(tài)系統(tǒng)需積極創(chuàng)新,采用新的工具和方法論,加強(qiáng)協(xié)作。正如報(bào)告結(jié)論所述,“計(jì)算的未來(lái),尤其是AI的未來(lái),取決于我們能否持續(xù)突破芯片技術(shù)的極限”,只有這樣,才能在AI時(shí)代構(gòu)建起強(qiáng)大的芯片技術(shù)基石,推動(dòng)計(jì)算領(lǐng)域的持續(xù)發(fā)展,釋放AI的變革潛力,同時(shí)有效管控計(jì)算成本與復(fù)雜度,實(shí)現(xiàn)半導(dǎo)體產(chǎn)業(yè)的可持續(xù)發(fā)展。