即將于9月3日舉行的英特爾酷睿Ultra發(fā)布會(huì)將公布有關(guān)Lunar Lake的更多細(xì)節(jié)。
英特爾? Gaudi 3 AI加速器:針對(duì)生成式AI的訓(xùn)練和推理而設(shè)計(jì)
AI加速器首席架構(gòu)師Roman Kaplan指出,生成式AI模型的訓(xùn)練與部署對(duì)算力提出了極為嚴(yán)苛的要求。隨著系統(tǒng)規(guī)模從單節(jié)點(diǎn)擴(kuò)展至數(shù)千節(jié)點(diǎn)的龐大集群,這使得成本與能效也迎來巨大挑戰(zhàn)。
英特爾? Gaudi 3 AI加速器能夠有效應(yīng)對(duì)上述挑戰(zhàn)。該加速器通過創(chuàng)新的架構(gòu)——優(yōu)化的計(jì)算、內(nèi)存和網(wǎng)絡(luò)架構(gòu),高能效矩陣乘法引擎、兩級(jí)緩存集成,以及廣泛的RoCE網(wǎng)絡(luò)(以太網(wǎng)融合RDMA技術(shù))等策略,使得Gaudi 3 AI加速器能夠?qū)崿F(xiàn)卓越的性能與能效,助力AI數(shù)據(jù)中心以低成本、可持續(xù)的方式運(yùn)行,并解決了部署生成式AI工作負(fù)載時(shí)的擴(kuò)展性問題。
英特爾將在今年9月分享Gaudi 3 AI加速器和未來英特爾至強(qiáng)6產(chǎn)品的更多信息。
傳輸速度高達(dá)4 Tbps的光學(xué)計(jì)算互連(OCI)芯粒,用于XPU之間的連接
英特爾硅光集成解決方案(IPS)團(tuán)隊(duì)展示了業(yè)界領(lǐng)先、完全集成的OCI芯粒與英特爾CPU封裝在一起時(shí),運(yùn)行真實(shí)數(shù)據(jù)的情況。
硅光集成解決方案事業(yè)部光子芯片架構(gòu)師Saeed Fathololoumi介紹了這一OCI芯粒及其設(shè)計(jì)。該芯??稍谧铋L(zhǎng)可達(dá)100米的光纖上,單向支持64個(gè)32 Gbps通道。Fathololoumi還討論了該芯粒如何滿足AI基礎(chǔ)設(shè)施對(duì)更高帶寬、更低功耗和更長(zhǎng)傳輸距離日益增長(zhǎng)的需求。英特爾的OCI芯粒推動(dòng)了高帶寬互連技術(shù)的進(jìn)步,將有助于實(shí)現(xiàn)可擴(kuò)展的CPU和GPU集群連接以及新型計(jì)算架構(gòu),包括新興AI基礎(chǔ)設(shè)施中的一致性內(nèi)存擴(kuò)展及資源解耦,適用于數(shù)據(jù)中心和HPC(高性能計(jì)算)應(yīng)用。
AI讓企業(yè)和消費(fèi)者有機(jī)會(huì)更快地推進(jìn)創(chuàng)新。例如,消費(fèi)者現(xiàn)在可以選擇AI PC,通過智能化功能提高效率、創(chuàng)造力、游戲和娛樂體驗(yàn)以及安全性,而企業(yè)則可以利用強(qiáng)大的邊緣計(jì)算和AI來改善決策,提高自動(dòng)化水平,并從專有數(shù)據(jù)中獲取價(jià)值。
在Hot Chips 2024的深度技術(shù)研討會(huì)上,英特爾的不同產(chǎn)品團(tuán)隊(duì)還展現(xiàn)了獨(dú)到的技術(shù)洞見,以共同推動(dòng)下一代AI技術(shù)的市場(chǎng)化進(jìn)程。