圖示一

內(nèi)存控制器中的探聽(tīng)過(guò)濾器"snoop filter"為了獲取更佳的性能也進(jìn)行了擴(kuò)展。探聽(tīng)過(guò)濾器為了適應(yīng)24GB的雙路Harpertown處理器中較大的高速緩沖存儲(chǔ)器,也進(jìn)行了擴(kuò)充。作為一種特別的緩沖器,探聽(tīng)過(guò)濾器Snoop Filter中儲(chǔ)存了緩存Tag結(jié)構(gòu)。由于使用了MESI協(xié)議,為確保多核平臺(tái)中緩存的一致性,每一個(gè)處理器必須時(shí)刻注意另一顆處理器的總線情況,而使用探聽(tīng)過(guò)濾器Snoop Filter將有助于減少處理器總線發(fā)生數(shù)據(jù)堵塞情況的發(fā)生。

當(dāng)出現(xiàn)高速緩存未中時(shí),探聽(tīng)過(guò)濾器Snoop Filter將增加到發(fā)起的CPU總線上。隨后,探聽(tīng)過(guò)濾器攔截探聽(tīng),并確定是否必須將探聽(tīng)傳遞到四核中的另一個(gè)總線線段上。如果讀取請(qǐng)求同一總線上的另一個(gè)處理器得到滿足,則取消探聽(tīng)過(guò)濾器訪問(wèn);如果沒(méi)有得到滿足,探聽(tīng)過(guò)濾器訪問(wèn)的結(jié)果將確定是否進(jìn)行下一個(gè)操作。當(dāng)然,也有可能在讀取請(qǐng)求過(guò)程中丟失探聽(tīng)過(guò)濾器,此時(shí)就直接從內(nèi)存返回?cái)?shù)據(jù),進(jìn)入下一個(gè)循環(huán)。

從終端用戶透視圖上可以看到最顯著的變化來(lái)自于輸入/輸出I/O系統(tǒng)。Seaburg芯片集采用兩塊x86 PCI-Express Gen2顯卡,對(duì)圖形圖像處理和視頻編輯有較大幫助。上一代工作站芯片集Greencreek還不夠完善,只能用于單圖形顯卡。這些通道可以支持4×8 PCI-E Gen1或者8×4插槽來(lái)連接不同種類的存儲(chǔ)子系統(tǒng)或者高性能網(wǎng)絡(luò),諸如10GB以太網(wǎng)。

系統(tǒng)配置情況

讓我們對(duì)基于Stoakley服務(wù)器平臺(tái)的超微2U系統(tǒng)和的基于Bensley平臺(tái)(使用過(guò)時(shí)的65納米四核Clovertown處理器)的英特爾系統(tǒng)做一個(gè)比較。在一種理想狀態(tài)下,我們使用相同頻率的MPU能更直觀的看到Harpertown處理器和Seaburg芯片組的進(jìn)步,但不幸的是這根本是不可能做到的。仔細(xì)的分析和推論或許能彌補(bǔ)頻率上的差異。但是卻會(huì)引發(fā)更多不確定的因素。

Stoakley服務(wù)器平臺(tái)采用雙獨(dú)立前端總線,8個(gè)雙列直插內(nèi)存模組,16GB內(nèi)存。但是我們只選取了一半的內(nèi)存用于測(cè)試,這顯然無(wú)法充分發(fā)揮Stoakley服務(wù)器平臺(tái)的優(yōu)勢(shì)而使得測(cè)試結(jié)果顯得有失公允。SPECjbb2005也能受益于額外的容量。多數(shù)的測(cè)試由于每個(gè)信道增加了多重雙列直插內(nèi)存模組,也能充分利用額外的帶寬。FB-DIMM信道能同時(shí)對(duì)獨(dú)立的雙列直插內(nèi)存模組進(jìn)行讀寫,因此每個(gè)信道使用兩組雙列直插內(nèi)存模組就能提升可使用的帶寬容量。

 

下面所有基準(zhǔn)性能測(cè)試我們都運(yùn)行了3次,最后結(jié)果取3次結(jié)果的平均值。初始循環(huán)數(shù)據(jù)通常會(huì)棄置不用來(lái)保證循環(huán)運(yùn)算的準(zhǔn)確性。我們特意擴(kuò)大了基準(zhǔn)測(cè)試的數(shù)量和范圍。在此先特別感謝技術(shù)支持部門的斯科特.沃森與我們分享多線程程序MyriMatch和循環(huán)運(yùn)算測(cè)試軟件Euler3D。全套基準(zhǔn)測(cè)試的軟件包括:

POV-Ray3.7測(cè)試版22 (64位)

FlamMap(64位)

Valve VRAD地圖生成測(cè)試(秒)

Sungard金融風(fēng)險(xiǎn)分析軟件(62位)

Euler3D循環(huán)運(yùn)算測(cè)試軟件

MyriMatch多線程程序

SPECjbb2005 BEA JRockit 6 R27.4(Java服務(wù)器商業(yè)測(cè)算基準(zhǔn))

XMLMark數(shù)據(jù)結(jié)構(gòu)

這些基準(zhǔn)涵蓋了多類應(yīng)用軟件領(lǐng)域:有三個(gè)主要用于傳統(tǒng)的高性能計(jì)算領(lǐng)域,兩個(gè)是JAVA服務(wù)器基準(zhǔn),還有兩個(gè)是內(nèi)容創(chuàng)建基準(zhǔn)。

POV Ray

POV-Ray 3.7測(cè)試版作為我們的標(biāo)準(zhǔn)透視圖基準(zhǔn)已經(jīng)最新升級(jí)到版本22.根據(jù)每秒的像素(Pixels/Sec)來(lái)反映在基準(zhǔn)場(chǎng)景中的性能。

 

圖示二:POV Ray性能

對(duì)于POV Ray圖形軟件來(lái)說(shuō),Harpertown處理器在單時(shí)鐘基礎(chǔ)上比Clovertown處理器速度提高了大約2.3%。這并不讓人驚訝,因?yàn)镻OV Ray圖形軟件能夠?qū)Χ嗑€程技術(shù)提供原生支持。但芯片組額外的帶寬和高速緩存對(duì)微體系架構(gòu)的改變沒(méi)什么幫助。

大體來(lái)說(shuō),在2.33兆赫茲和3兆赫茲的芯片之間對(duì)IPC進(jìn)行比較并不完全準(zhǔn)確。只有在POV Ray性能測(cè)試考慮到頻率,內(nèi)核數(shù)量等因素才能提供更準(zhǔn)確的線性測(cè)量。這種比較關(guān)系就是有效的。

關(guān)注:45納米四核Harpertown處理器性能預(yù)覽(2)

關(guān)注:45納米四核Harpertown處理器性能預(yù)覽(3)

分享到

多易

相關(guān)推薦