就像一個人要提升工作效率就必須采用更為先進的工作方法一樣,從處理器的設(shè)計角度來說,要想提升其效率,主要途徑就是必須采用新的、在IPC上表現(xiàn)更佳的微架構(gòu)(Microarchitecture,或稱微體系架構(gòu))。

從理論上來說,處理器微架構(gòu)就是對處理器所采用的指令集體系結(jié)構(gòu),如x86、PowerPC的一種邏輯實現(xiàn)。處理器微架構(gòu)的設(shè)計,實際上涵蓋了對處理器中所有模塊,如控制單元、指令預(yù)取單元、高速緩存單元、分支預(yù)測單元、運算單元、總線接口單元及這些模塊的連接和協(xié)作方式的設(shè)計,其目標(biāo)則是一方面要使指令集體系結(jié)構(gòu)定義的功能能夠得以實現(xiàn),另一方面就是要不斷提升整個處理器的工作效率。

與發(fā)展緩慢、甚至是許多年穩(wěn)固不變的指令集體系結(jié)構(gòu)不同,處理器微架構(gòu)幾乎每隔幾年就會有升級換代。如人們所熟悉的英特爾奔騰處理器家族,從奔騰、奔騰2、奔騰3再到奔騰4,他們的換代就主要是源于微架構(gòu)的改進。而去年英特爾推出的酷睿2與之前的奔騰4及奔騰D的差別,也在于它使用了效率更高、耗能更低的酷睿(Core)微架構(gòu),而不是后者所用的NetBrust微架構(gòu)。

我們或許可以通過對比酷睿與NetBrust微架構(gòu)的一些差異來理解微架構(gòu)的改進對處理器效率提升帶來的有益作用。實際上,在酷睿微架構(gòu)采用的五大創(chuàng)新技術(shù)中,多數(shù)均與處理器效率提升有直接或間接的關(guān)系,例如其寬位動態(tài)執(zhí)行技術(shù),就是通過將解碼器從前一代微架構(gòu)的3個增加到4個,來提升處理器的IPC值;又如它采用的高級數(shù)字媒體增強技術(shù),就將前一代產(chǎn)品必須用兩個時鐘周期才能處理完的SSE指令改為在一個時鐘周期內(nèi)完成,這也有助于處理器效率的提升。此外,酷睿微架構(gòu)還采用了宏融合(Macro-Fusion)技術(shù),在解碼時可將同類指令融合為單一的指令,以減少待處理的指令總數(shù),這與處理器性能公式強調(diào)減少待執(zhí)行程序指令數(shù)目的要求相合,也能夠起到提升性能的作用。

選芯須兼顧架構(gòu)與速度
 
所上文所述,評估處理器性能的高下,較為科學(xué)的方法應(yīng)是綜合考察微架構(gòu)和時鐘頻率兩個方面的差異,這種方法尤其適用于采用不同微架構(gòu)的處理器產(chǎn)品。而要在基于同一微架構(gòu)的處理器產(chǎn)品中進行性能評估時,以時鐘頻率作為衡量標(biāo)準(zhǔn)的方法事實上并未過時,當(dāng)然,在時鐘頻率之外,消費者也需要了解它們在系統(tǒng)總線頻率、緩存容量上是否還有差異。

以英特爾現(xiàn)有的PC處理器產(chǎn)品為例,不論是它定位于高端的四核酷睿2(Core 2 Quad)、定位于中高端的雙核酷睿2(Core 2 Duo)、還是它主攻低端市場的雙核奔騰和單核賽揚主力產(chǎn)品,現(xiàn)在都采用了目前業(yè)界效率最為出色的酷睿微架構(gòu),當(dāng)消費者需要將它們與其他廠商或微架構(gòu)的產(chǎn)品進行對比時,消費者就不能只看時鐘頻率上的差異,但如果消費者只需在這四款酷睿微架構(gòu)的產(chǎn)品中進行選擇,那么就只需考慮它們在核心數(shù)量、時鐘頻率、緩存容量及前端總線頻率上的差別即可。
或許有人還會追問:既然時鐘頻率一直以來就不是衡量處理器性能的惟一標(biāo)準(zhǔn),那為什么在過去很多年中,這種"速度即性能"的觀點卻一直能夠大行于道呢?為什么現(xiàn)在人們在選擇PC處理器時還要多考慮微架構(gòu)的差異呢?

其實,造成這一情況的原因在于過去三十多年間,處理器在時鐘頻率上的增長幅度要遠遠超過了其效率的提升幅度。從上世紀(jì)70年代初英特爾推出全球首款處理器4004以來,處理器的時鐘頻率增長幅度已經(jīng)達到了近30000倍,而IPC提升幅度只有幾十倍,處理器性能的提升很大程度上要歸功于時鐘頻率的飛速增長,而今,時鐘頻率的提升因為處理器功耗的不斷增加已經(jīng)遇到瓶頸,而其在效率上的改進,即微架構(gòu)的改進對性能提升的作用開始變得越來越重要,實際上,處理器從單核走向多核,也是微架構(gòu)上的革新,也是為了大幅提升處理器的效率。因此,在多核時代,評估PC處理器性能要兼顧微架構(gòu)與時鐘頻率已經(jīng)成為必然趨勢。

軟件優(yōu)化情況不可忽視

PC處理器多核時代的來臨,不但讓消費者們在選購處理器及PC時不再以時鐘頻率作為衡量其性能的惟一標(biāo)準(zhǔn),還在逐漸引導(dǎo)他們關(guān)注軟件優(yōu)化的問題,即操作系統(tǒng)和應(yīng)用軟件是否能夠針對多核PC處理器進行調(diào)優(yōu),以充分發(fā)揮或發(fā)掘其性能優(yōu)勢,尤其是其出色的并行處理能力。

軟件優(yōu)化問題的出現(xiàn),與PC處理器從單核過渡到多核的"突然性"不無關(guān)系。同早就導(dǎo)入對稱多處理器技術(shù)、在軟件上也偏重多線程化的服務(wù)器相比,而以往的PC,不論是家用產(chǎn)品還是商用產(chǎn)品,多是基于單顆處理器,其多數(shù)軟件也一直缺乏對多核處理器并行處理能力的支持,雖然在基于多核處理器的平臺上,它們的運行性能也能獲得一定的提升,但它們還沒有做到真正的物盡其用。

要讓更多的PC軟件針對全新的多核處理器平臺進行優(yōu)化,就需要它們的編程方式從傳統(tǒng)的串行編程革新為并行編程,不過,如果沒有合適的工具提供輔助,并行編程的難度和成本較高、開發(fā)效率也較低,這將使許多軟件開發(fā)商不太愿意為針對多核處理器重新編譯自己已經(jīng)在市場上獲得成功的軟件,而這種多核PC應(yīng)用軟件的缺失對于多核處理器及相應(yīng)PC產(chǎn)品的推廣必然會有不利影響。

面對多核PC軟件優(yōu)化中存在的這些問題,英特爾的準(zhǔn)備較為充分,它旗下的軟件與解決方案事業(yè)部在最近兩年陸續(xù)推出用于多核軟件開發(fā)和優(yōu)化的各種工具,包括相應(yīng)的分析器、編譯器和檢查器,它們可以幫助軟件開發(fā)商快速、低成本地實現(xiàn)其產(chǎn)品對于多核處理器的優(yōu)化和支持,讓多核處理器的性能優(yōu)勢能夠真正落到實地。

據(jù)了解,英特爾推出的這些多核軟件開發(fā)和調(diào)優(yōu)工具,已經(jīng)獲得了眾多軟件開發(fā)商的青睞,就國內(nèi)來說,許多商用及商用PC軟件商都利用它們對自己的產(chǎn)品進行了優(yōu)化。例如廣州圓方計算機軟件工程有限公司開發(fā)的個人家居室內(nèi)設(shè)計軟件通過優(yōu)化,可以在基于酷睿2的PC上獲得相當(dāng)于奔騰4系統(tǒng)3.18倍的運行速度,東軟的醫(yī)療影像系統(tǒng)利用英特爾相應(yīng)工具優(yōu)化后也能在基于英特爾酷睿2的PC的獲得1.5倍的性能提升,而金山的3D網(wǎng)絡(luò)游戲引擎在進行同樣的優(yōu)化后,不但運行速度在酷睿2 PC有了1.5倍的增長,其流暢性和交互性也得到了增強。

需要說明的是,由于英特爾的競爭對手還比較欠缺對于多核軟件開發(fā)和調(diào)優(yōu)的支持,這實際上也就意味著在多核時代選擇基于英特爾處理器的PC,用戶也就無須為多核應(yīng)用軟件的缺失而擔(dān)憂。

對于廣大消費者來說,要盡享多核PC的快感,僅僅以科學(xué)的性能評估方法對其處理器進行選型還是遠遠不夠的。畢竟,處理器早已不是PC性能的瓶頸,I/O和存儲子系統(tǒng)的性能表現(xiàn)才是影響PC整體性能優(yōu)劣的關(guān)鍵環(huán)節(jié),而它們也成為了業(yè)內(nèi)廠商技術(shù)攻關(guān)的重點。值得一提的是,英特爾在這些領(lǐng)域的技術(shù)開發(fā)或推廣上也起到了至關(guān)重要的作用–它不但在業(yè)界率先支持最新的內(nèi)存技術(shù),如過去的DDR2和即將普遍使用的DDR3內(nèi)存,還領(lǐng)導(dǎo)了新一代PCI-E總線技術(shù)和USB等技術(shù)的研發(fā)和應(yīng)用,此外,它與業(yè)內(nèi)合作伙伴對于固態(tài)硬盤和混合硬盤技術(shù)的推動也加快了這兩種高性能存儲設(shè)備走入PC的步伐。

分享到

多易

相關(guān)推薦