從至強5500系列開始,英特爾將集成功率門限作為處理器重要的技術(shù)應(yīng)用到處理器當(dāng)中。集成功率門限運行的原理是這樣的——當(dāng)處理器需求非常頻繁的時候,處理器的每個核心都會緊張忙碌的工作;而當(dāng)需求下降到一定程度時,某些內(nèi)核可能并沒有需要處理器的線程內(nèi)容,在發(fā)現(xiàn)不活躍的處理器內(nèi)核之后,系統(tǒng)可以智能將這些內(nèi)核的功耗降低到接近于0的狀態(tài),進而降低處理器的功耗。
智能電源管理——英特爾智能節(jié)能技術(shù)(Intel Intelligent Power Technology)
自動低功耗狀態(tài)(Automated Low Power States)可以自動將處理器和內(nèi)存置入最低功耗狀態(tài),從而在不影響性能的情況下滿足當(dāng)前工作負載的運行需求。相比最初的英特爾四核處理器,英特爾至強5500系列處理器使電源管理能力提高了5倍:運行狀態(tài)增加5倍,閑置功耗降低5倍,從低功耗狀態(tài)來回切換的速度提高了5倍。
當(dāng)服務(wù)器工作負載較輕的時候,依靠自動低功耗狀態(tài)技術(shù),通過監(jiān)控I/O、內(nèi)存、處理器的工作負載要求,可在負載需求降低的時候?qū)⑦@些組件自動降低到最低的可用功耗狀態(tài),這樣可以在不影響整體性能的情況下顯著的降低能耗,進而降低成本。
如果要用更易懂的語言來形容智能節(jié)能技術(shù)的話,那么它就相當(dāng)于一個非常高級的汽車用自動變速箱,它的厲害之處,就是可以感應(yīng)到駕駛者對車速的要求,自動在十多個檔位之間自動、平滑的切換,從而保證汽車時時都能在滿足這些速度要求的同時維持最佳燃油利用率。
總體說來,英特爾功率門限(Integrated Power Gates)和英特爾智能節(jié)能技術(shù)(Intel Intelligent Power Technology)——這對組合可是今天英特爾服務(wù)器處理器能夠?qū)崿F(xiàn)最優(yōu)化節(jié)能效果的功臣。前者是基于英特爾領(lǐng)先的制造工藝和晶體管技術(shù),可以將處理器閑置時的功耗大幅降低,并允許其每個內(nèi)核單獨降低功耗;后者則更為智能,可判斷出處理器正在運行的工作負載壓力和數(shù)據(jù)吞吐量,并根據(jù)其變化讓處理器在多達15種運行狀態(tài)(每種狀態(tài)對應(yīng)不同的功耗水平)間切換,從而實現(xiàn)自適應(yīng)的、迅捷的功耗調(diào)節(jié)功能,這種功能能夠讓處理器在輸出足以滿足應(yīng)用需求的性能的同時,實現(xiàn)最大程度的節(jié)能。
免費主頻提升——Intel Turbo Boost Technology
眾所周知,核心數(shù)量在一定程度上決定了處理器的功耗。處理器的核心數(shù)量越多,其功耗也會不可避免的會增加。然而,針對于多核心處理器高功耗的問題,除了剛剛我們介紹的功率門限和智能節(jié)能技術(shù)之外,Intel Turbo Boost Technology也為能效管理起到了重要的作用。
Turbo Boost,顧名思義,就是加速技術(shù),它最初來源于Nehalem架構(gòu)的至強5500處理器當(dāng)中。借助電源管理技術(shù),通過分析當(dāng)前處理器的負載情況,智能地完全關(guān)閉一些用不上的核心,把能源留給使用中的核心,并使它們運行在更高的頻率,進一步提升性能;相反,需要多個核心時,動態(tài)開啟相應(yīng)的核心,智能調(diào)整頻率。這樣,在不影響處理器的TDP情況下,能把核心工作頻率調(diào)得更高。
舉個簡單的例子,如果某個游戲或軟件只用到一個核心,Turbo Boost技術(shù)就會自動關(guān)閉其他三個核心,把運行游戲或軟件的那個核心的頻率提高,也就是自動超頻,在不浪費能源的情況下獲得更好的性能。
Nehalem架構(gòu)的CPU每一個核心都有自己的PLL(Phase Locked Loop,相位鎖定回路)電路,這樣每個核心的電壓和頻率都可以獨立控制,為此Intel專門在CPU內(nèi)部設(shè)計了PCU(Power Control Unit,功耗控制)單元,PCU會以1ms(每秒1000次)的速度實時監(jiān)測這四個核心的溫度、電流及功耗等參數(shù)。獨立控制的狀態(tài)參數(shù)也是Turbo Boost加速的物理基礎(chǔ)。
除獨立的物理電路之外,Turbo Boost還需要Deep Power Down Technology技術(shù)(深度電源管理模式)的輔助,它將CPU內(nèi)核按照不同的活動狀態(tài)分類,歷經(jīng)多代技術(shù)之后目前有C0、C1、C3、C4和C6等幾種狀態(tài),其中C1為工作模式表示當(dāng)前正在執(zhí)行指令,C1到C6則為不同的省電模式。其中值得注意是C6狀態(tài),此狀態(tài)下處理器可實時清除L1 Cache內(nèi)所有數(shù)據(jù),在保存處理器微架構(gòu)狀態(tài)下,關(guān)掉內(nèi)核(Core Clock與PLL將停止)及L2 Cache,雖然芯片組會繼續(xù)為I/O提供內(nèi)存交換動作,但卻不會喚醒相關(guān)內(nèi)核。只有需要內(nèi)核時,電壓才會攀升,開啟Core Clock與PLL,處理器將進行重置,把Cache數(shù)據(jù)從內(nèi)存中回傳,微架構(gòu)狀態(tài)將完全恢復(fù),繼續(xù)執(zhí)行指令。
而當(dāng)英特爾推出Sandy Bridge處理器的時候,Intel Turbo Boost Technology技術(shù)也隨之升級到了2.0版本,它在原有的基礎(chǔ)上改進了算法,增強了自動提速的彈性,甚至可以動態(tài)調(diào)控集成的GPU的頻率。
Turbo Boost 2.0可以短時間突破TDP功耗限制
在Turbo Boost 2.0中,TDP方面的限制有所放松,PCU單元可以控制active core在較短時間內(nèi)突破TDP上限之后才會逐漸降至穩(wěn)定狀態(tài),IDF會議上的資料顯示最高峰階段長達25秒,不要小看這一點時間,這只是一個加速周期循環(huán),等到CPU的發(fā)熱被帶走之后,TurboBoost 2.0也會進入下一個25秒的加速循環(huán),這樣累積下來的提速效果將比目前1-2 bins的提升更為明顯。最重要的是,用戶也不必擔(dān)心這樣做會損壞處理器,因為短時間超越TDP功耗依然處于安全設(shè)計內(nèi)。
另外值得一提的是Turbo Boost 2.0中不僅能調(diào)節(jié)CPU頻率,也會對集成GPU同樣也會起到加速作用,并隨著系統(tǒng)負載的不同協(xié)調(diào)二者的頻率升降。
云計算時代的數(shù)據(jù)中心, 一方面要求數(shù)據(jù)中心保持高可用性,能高效、安全地運營;另一方面,用戶會盡可能要求數(shù)據(jù)中心降低能源消耗和運行成本;而且數(shù)據(jù)中心必須具備靈活的擴展能力,以應(yīng)對多變的業(yè)務(wù)需求及未來的不確定因素。借助于英特爾處理器的集成功率門限及智能電源管理技術(shù),可以幫助企業(yè)更好的實現(xiàn)節(jié)能與高效,從而在競爭中獲得充分的靈活性與強大的實力。