基于浪潮K1 Power的極速交易系統采用了超低延時的RDMA IB網卡設備加速,相比于傳統的以太網卡,延時更低。傳統以太網模式下,兩臺服務器之間傳輸數據時,須先把數據從應用緩存拷貝到Kernel中的TCP協議棧緩存,然后再拷貝到驅動層,最后拷貝到網卡緩存,多次內存拷貝需要CPU多次介入,導致處理延時高達數十微秒,整個過程中CPU過多參與也大量消耗了CPU性能,影響正常的數據計算。而在RDMA模式下,應用數據可以繞過Kernel協議棧而直接向網卡寫數據,即網卡可以直接讀取用戶態(tài)的數據。由于浪潮K1 Power服務器支持PCIe Gen4,從而使得處理延時由數十微秒降低到1微秒內,且整個過程幾乎不需要CPU參與,節(jié)省了性能。
浪潮K1 Power采用RDMA IB卡加速效果相比x86方案延時更低,實測數據顯示,浪潮K1 Power搭配Gen4 RDMA IB卡,32字節(jié)延遲為0.80微秒,在1K字節(jié)時浪潮K1 Power/x86延遲比約為54%,即延時降低46%。浪潮K1 Power支持PCIe 4.0,又進一步降低了延時水平,在32K字節(jié)以下時,隨著數據包增大,Gen4低延遲優(yōu)勢越明顯,Gen4/Gen3延遲比最大約為85%;在512字節(jié)時,Gen4/Gen3延遲比約為92%。
為提高IB卡的易用性,浪潮商用機器封裝了IB傳輸必須的建立連接和讀寫調用接口,用戶無需了解IB API復雜的編程模型及細節(jié),即可使用IB接口通信,體驗IB RDMA的低延遲特性。
未來將集合處理器和CAPI特性優(yōu)勢 系統延時有望進一步降低
浪潮K1 Power服務器搭載的全新POWER9處理器,相比x86服務器,在降低系統延時方面擁有諸多優(yōu)勢。多核多線程、CPU單核4線程的優(yōu)勢,能夠輕松應對高并發(fā)狀況,且主頻高達3.8GHz,擁有更快的時鐘周期;支持PCIe 4.0,將IO帶寬提高了2倍,延時降低了1/2;高達110M的L3緩存,大幅提高了數據命中率;支持CAPI,將FPGA獲取數據的延時降低至傳統I/O架構的1/36。
根據未來發(fā)展規(guī)劃,基于浪潮K1 Power的極速交易系統將探索基于CAPI的FPGA加速方案,在該方案中,CAPI將能夠使異構設備使用虛擬地址直接訪問系統內存。眾所周知,NVLink技術使得CPU和GPU之間可以共享內存并可互相直接訪問對方內存,從而極大地提高了CPU和GPU之間的協同工作效率,與此類似,CAPI作為FPGA和處理器的接口,將允許設備內存成為系統內存映射的一部分,從而使FPGA和CPU上運行的軟件可以看到相同的虛擬內存地址,即內存共享。這些鏈路及帶寬優(yōu)勢,結合數據傳輸路徑上的優(yōu)勢,使得浪潮K1 Power的傳輸速率高而IO路徑更短,從而使數據獲取的延時降低至300納秒級別。
傳統的IO Flow需要驅動程序,需要內存搬移,需要從用戶態(tài)切到內核態(tài)做設備驅動,要累計運行一萬多條指令,而通過CAPI技術,一次IO Flow運行指令數量降低至500條以內,指令的大量精簡進一步降低了延時。
數字經濟時代,隨著資本市場改革的加速,衍生品業(yè)務政策創(chuàng)新、新產品品種不斷豐富,期貨市場成交量和客戶權益屢創(chuàng)新高,投資者結構和交易方式正在發(fā)生著結構性調整,機構化大勢方興未艾。快速增長的機構投資者對券商提出了更高要求,以極限降低時延為目標的極速交易系統為代表的金融科技迭代創(chuàng)新勢在必行?;诶顺盞1 Power的低延時網卡方案,以更低的延時,結合浪潮K1 Power服務器高可靠、高安全及性能優(yōu)勢,將引領新一輪交易基礎設施建設創(chuàng)新浪潮,加速行業(yè)數字化轉型步伐。