亞馬遜云科技涉足自研芯片始于2013年與以色列芯片公司Annapurna Labs合作開發(fā)的Amazon Nitro芯片,2015年亞馬遜云科技收購了該公司,Nitro芯片主要用于網(wǎng)卡,也可以用于連接和控制硬盤,控制EBS塊存儲;還可以用于卸載(Offload)Hypervisior等CPU工作負載,當然也可以用于硬件安全檢查等。有了Nitro,亞馬遜云科技也推出了多種EC2計算應用實例供用戶選擇。
順應AI、ML計算應用的需要,亞馬遜云科技推出了Amazon Trainium芯片,發(fā)布了基于Trainium的Trn1n AI服務器,與上一代P4d產品相比,通過Trn1實例訓練深度學習模型的成本降低多達40%。
Trn1實例可提供800Gbps EFA(Elastic Fabric Adapter)網(wǎng)絡帶寬(比最新基于GPU的EC2實例高兩倍),并與Amazon FSx for Lustre高性能存儲集成,讓客戶可以啟動具有EC2 UltraClusters功能的Trn1實例。
通過EC2 UltraClusters,開發(fā)人員可以將機器學習訓練擴展到一萬多個與 PB 級網(wǎng)絡互連的 Trainium 加速器,讓客戶按需訪問超算級性能,即便是最大型和最復雜的模型,訓練時間也可以從幾個月縮短到幾天。
如果說網(wǎng)絡芯片、機器訓練芯片僅僅是亞馬遜云科技芯片試水的產品,亞馬遜云科技基于Arm架構的Amazon Graviton3自研CPU處理器就是一個具有里程碑意義的產品,也宣告了亞馬遜云科技芯片版圖的完整。
從C7g服務器到SSD
由Amazon Graviton3處理器支持的C7g實例可將計算密集型工作負載性能提高多達25%。與Graviton2相比,Amazon Graviton3處理器為科學計算、機器學習和媒體編碼工作負載提供高達2倍的浮點運算性能,為加密工作負載速度提升高達2倍,為機器學習工作負載提供高達3倍的性能。Amazon Graviton3處理器的能效也更高,在相同性能下,與同類型EC2實例對比,可節(jié)省高達60%的能源消耗。
C7g實例是云中第一個采用最新DDR5內存的實例,它提高了50%的內存帶寬,從而提高了科學計算等內存密集型應用的性能。C7g實例的網(wǎng)絡帶寬也高出20%。C7g 實例支持 Elastic Fabric Adapter (EFA),允許應用程序直接與網(wǎng)絡接口卡通信,提供更低且更一致的延遲。
除了C7g服務器之外,SSD盤是亞馬遜云科技硬件協(xié)同的另外一個發(fā)力點。
全新發(fā)布的Amazon Nitro SSD固態(tài)硬盤的Im4gn/Is4gen/ I4i實例,可為I/O密集型工作負載提供超高存儲性能。
通過自研的 Amazon Nitro SSD,Im4gn/Is4gen/I4i實例提供高達 30 TB 的 NVMe 存儲,與上一代產品相比,I/O 延遲降低了 60%,延遲可變性降低了 75%,通過優(yōu)化存儲堆棧、虛擬化管理程序和硬件與Amazon Nitro 系統(tǒng)緊密集成,可使SSD更新交付速度更快,讓客戶可以從改進的功能中獲益。
Im4gn 實例(現(xiàn)已可用)采用 Amazon Graviton2 處理器,與 I3 實例相比,性價比提高多達 40%,每 TB存儲成本降低多達 44%。Is4gen 實例(現(xiàn)已可用)也采用 Amazon Graviton2 處理器,與 I3en 實例相比,每 TB 存儲成本降低多達 15%,計算性能提高多達 48%。
無論是新的ARM芯片服務器,還是新的SSD,軟件與硬件結合是一種趨勢,以Open Chanel為例,更是將SSD盤的控制,上交由服務器CPU來完成,從而最大程度降低功耗、提高效率。云計算本質是對資源效率的追逐,因此當現(xiàn)有硬件資源得到充分挖潛之后,未來發(fā)展的空間就在創(chuàng)新硬件,GPU、AI芯片如此,新的Gravtion 3也是如此。
通過硬件的創(chuàng)新,亞馬遜云科技也躋身ARM服務器、SSD盤硬件供應商。實際上不僅如此,阿里云、騰訊云都有相應的服務器、存儲硬件產品。但在商業(yè)模式上,云服務商更多以云服務方式出現(xiàn),并沒有單純以硬件產品供應商方式示人,他們對外可以提供硬件產品,但并不定位在專業(yè)硬件廠商,
云服務商的硬件與云服務相輔相成,這也為上次SaaS應用提供了新的IaaS層硬件支撐,以SAP HANA為例,亞馬遜云科技Gravtion所提供的新特性就得到SAP HANA的認可,實現(xiàn)逐步運營和性能的提升。
超越產品服務的創(chuàng)新
如今,亞馬遜云科技在25個地理區(qū)域建立了81個可用區(qū),并計劃新建9個區(qū)域和27個可用區(qū),有14個本地擴展區(qū)域、17個Wavelength區(qū)域,有108個Direct Connect光纖直連站點,有310個邊緣站點和13個區(qū)域緩存站點。這些區(qū)域將包括數(shù)據(jù)中心、Amazon Outposts、IoT 服務、Snow 家族服務、Amazon Ground Station在內的數(shù)千種云服務,用于提供AI、ML、大數(shù)據(jù)、IoT、5G等應用,可以說,現(xiàn)實中的有的IT應用都可以在亞馬遜云科技找到相應的服務,顆粒度更細,效率更高,這是一個高度整合、靈活自由選取的平臺。
但是從應用創(chuàng)新的角度來看,這些服務所扮演的實際是一個集成開發(fā)環(huán)境 (Integrated Development Environment ,IDE)或者說是 “工具庫”角色?!熬拖裆w房子一樣,這些云服務提供不是一個預制好的房子,而是給用戶一個巨大的工具箱,可以挑選你們需要的工具,開發(fā)自己的軟件?!薄霸趤嗰R遜云科技的信念中,我們認為客戶是創(chuàng)造者,最懂自己業(yè)務,也是真正知道軟件應該如何開發(fā)的人,就是用戶自己?!?
但是要用好這些工具或者服務,對人的能力和知識都有一定的要求,有人能夠DIY,制造自己需要的產品,但是更多的人還是希望跨越DIY的過程。
為了幫助客戶最大限度實現(xiàn)數(shù)據(jù)價值,除了千方百計降低云服務的使用的門檻。亞馬遜云科技與行業(yè)領導者的結合,也在不斷推動行業(yè)的進步,如亞馬遜云科技與高盛合作推出的面向數(shù)據(jù)的金融云(Financial Cloud for Data)服務,與汽車制造商合作推出的數(shù)字孿生方案、Amazon IoT FleetWise數(shù)據(jù)管理方案。
小結
都說“變是永遠的不變”,這很好印證了re:Invent十年發(fā)展,從產品技術到服務,在從云服務到硬件產品創(chuàng)新;從IT產品云服務提交,到行業(yè)應用創(chuàng)新交付,這是一個螺旋式上升的過程,需要我們能夠跟上云計算發(fā)展的進程變化。