真四核 不能做2+2
AMD皓龍(Opteron)最大的技術(shù)革新,在于摒棄了x86架構(gòu)一貫追求更高主頻的做法,而借鑒了RISC處理器的CMP設(shè)計(jì)思路,將對(duì)更高帶寬的支持引入到x86架構(gòu)中。同時(shí)通過獨(dú)創(chuàng)的直連架構(gòu)和超傳輸總線技術(shù),將CPU直接連接到內(nèi)存、I/O,同時(shí)消除了傳統(tǒng)的前端總線瓶頸,降低內(nèi)存訪問的延遲?;蛘哒f,正由于架構(gòu)創(chuàng)新上的前瞻性,AMD在做單核的時(shí)候就考慮到了未來多核發(fā)展趨勢(shì),因而在從單核到多核的過渡中比競爭對(duì)手顯得更自然順暢。這也是AMD始終強(qiáng)調(diào)自己的多核是“原生”的根源。
推出兩年后,雙核處理器的設(shè)計(jì)已經(jīng)比較成熟,顯然實(shí)現(xiàn)四核處理器最簡單的辦法就是做加法:2+2,將兩個(gè)雙核處理器集成到一個(gè)封裝上就可以直接實(shí)現(xiàn)四核處理器,在這種實(shí)現(xiàn)方法中兩個(gè)雙核處理器幾乎是獨(dú)立運(yùn)行甚少均衡負(fù)載的,在系統(tǒng)請(qǐng)求送達(dá)的時(shí)候CPU只需要簡單的安排向左走還是向右走即可。但顯然,這樣的四核架構(gòu)并不能令四個(gè)核心達(dá)到最高運(yùn)行效率和負(fù)載均衡。
AMD計(jì)劃年中推出的Barcelona四核設(shè)計(jì),仍然采用CMP(單芯片多核心處理器)設(shè)計(jì)思路,不用2+2,而是采用1+1+1+1來實(shí)現(xiàn)四核:每個(gè)核心具備自己單獨(dú)的64KB的L1數(shù)據(jù)Cache、512KB的L2 Cache,然后四個(gè)核心共享2MB(或者更大)的L3 Cache。
從晶體管數(shù)目上看,四核Barcelona核心包含4.63億個(gè)晶體管,而雙核Brisbane核心只有1.54億個(gè)晶體管,2MB的L3緩存大約會(huì)占用1億左右的晶體管數(shù)目。簡單計(jì)算就可以知道Barcelona比兩個(gè)Brisbane核心加2MB的L3緩存還多出5500萬個(gè)晶體管。由此也可以看出,AMD的四核架構(gòu)絕不是簡單疊加,在CMP架構(gòu)中非常重要的仲裁/分配、I/O控制等部分都經(jīng)過了強(qiáng)化設(shè)計(jì)。
當(dāng)然,采用簡單的2+2模式來設(shè)計(jì)多核處理器,這是縮短產(chǎn)品研發(fā)周期的好辦法,但性能就會(huì)存在瓶頸――一旦共享的FSB帶寬吃緊,整個(gè)處理器性能將受到限制。我們看到,在有關(guān)CPU浮點(diǎn)性能的基準(zhǔn)測試中,Barcelona的性能可以超過競爭產(chǎn)品50%以上。
電源管理 從齊步走到按需走
除了架構(gòu)上的創(chuàng)新,Barcelona還有一系列領(lǐng)先的技術(shù)特性。
Barcelona的緩存部分新增了32路的2MB三級(jí)緩存,這是競爭對(duì)手所不具備的。在內(nèi)存控制部分,過去K8架構(gòu)的內(nèi)存控制器是1個(gè)128位的界面,而K10h系列核心的內(nèi)存控制器被拆分為2個(gè)64位的界面,且可以同時(shí)讀寫。這個(gè)拆分有利于多核心工作時(shí)更加靈活。在Barcelona上,內(nèi)存控制器中除了有更多的緩沖區(qū)設(shè)計(jì)以外,還配置了新的預(yù)取器,這個(gè)預(yù)取器擁有自己的緩沖并不需要占用二級(jí)緩存或者三級(jí)緩存的空間,這很像主板北橋上的預(yù)取器,可以提升系統(tǒng)的性能。
Barcelona最受歡迎的或許是在能源管理上的創(chuàng)新,這將為用戶節(jié)省大量開支。首先發(fā)揮作用的是增強(qiáng)的Power Now!技術(shù)?,F(xiàn)階段的多核心處理器的每個(gè)核心基本都是在相同的電壓下工作,就好像多個(gè)核心做著“齊步走”的操練;而10h系列核心的每個(gè)核心都能獨(dú)立進(jìn)行5級(jí)P-State調(diào)節(jié),也就是說可以針對(duì)性地、獨(dú)立地設(shè)定每個(gè)物理核心的工作電壓和頻率,這對(duì)節(jié)能是非常有幫助的。
Barcelona電源管理的另一個(gè)領(lǐng)先特性是分隔電源層技術(shù)(Split Power Plane),使其內(nèi)存控制器即使在全速運(yùn)行時(shí),也可以和處理器核心采用不同的電壓,這一特性不僅令超頻變得更加容易,還可以進(jìn)行更多p-state 狀態(tài)的轉(zhuǎn)換,從而降低能耗。
Barcelona還提高了“時(shí)鐘門控”的數(shù)量,支持自動(dòng)關(guān)閉邏輯電路中的非工作區(qū)域,以進(jìn)一步節(jié)約能耗。其中“粗放門控”可以將閑置的整個(gè)邏輯電路塊關(guān)閉,而“精微門控”則可以在適當(dāng)?shù)臅r(shí)候關(guān)閉某些邏輯電路片段。
在普通用戶喜聞樂見的應(yīng)用層面上,巴塞羅那已經(jīng)準(zhǔn)備好隨時(shí)支持DDR3、HT3.0等新一代技術(shù),而對(duì)8核心處理器的支持也即將隨著4 HT通道技術(shù)的成熟而就緒。
根據(jù)AMD的計(jì)劃,Barcelona將于今年第三季度發(fā)布,而最近,AMD也在臺(tái)北的Computex展上確認(rèn)了這一消息,那就讓我們拭目以待吧!