Global Sources
電子工程專輯
 
電子工程專輯 > EDA/IP
 
 
EDA/IP  

IBM以Power6微處理器為頻率地位正名

上網時間: 2006年04月15日     打印版  Bookmark and Share  字型大小:  

關鍵字:multithreaded  多執行緒  multicore  多核心  frequency 

多執行緒多核心的時代,頻率是否無關緊要?五年前,當英特爾宣佈其有關架構的思維將產生轉變時,似乎就給予了肯定的答覆。然而,IBM卻在採用Power微處理器的系列伺服器中,展現透過頻率增加可以改善性能的實力。

英特爾公司集團副總裁Pat Gelsinger早在2001年的國際固態電路大會(ISSCC)上就曾透露,英特爾將不再透過刻意追求頻率的方式來保持功耗穩定,而將轉向多執行緒雙核心設計。昇陽電腦公司(Sun Microsystems)也採取了類似行動。

但在今年的ISSCC上,IBM卻反其道而行,重新拿起頻率作為競爭的武器。IBM設計工程師提交了三份文件指出即將推出專為該公司的pSeries伺服器所開發的Power6微處理器。目前銷售的雙核心Power5+是運作頻率在1.9GHz的範圍(不久將有更高頻率的版本),並採用90nm製程製造的一種設計。IBM的技術研發副總裁Mark Papermaster還說,採用65nm製程的Power6則是首款運作於4∼5GHz頻率範圍的處理器,將用於明年推出的伺服器上。

“我們不想對頻率視而不見,”Papermaster表示,“否則,資料中心的熱封包失控,將一發不可收拾。但頻率與性能之間仍有關係。”

“就在英特爾從勝負未卜的局面中抽身而退之際,IBM卻突然著手推動頻率(百萬GHz),”The Envisioneering Group的總監Rick Doherty表示,“英特爾拱手認輸,他們不再嘗試跨越3.5GHz頻率。”

當昇陽電腦擁抱多執行緒時,也冷落了頻率。IBM的Power6將有單核心和多核心版本,每核心包含2個執行緒;而在Sun現已出貨的Niagara微處理器中,每處理器核心有4個執行緒,共計32個執行緒,可運作在1.2GHz。Sun的技術總監Ana-Sonia Leon表示:“Niagara有一條非常淺的管線,是一款單發送、順序執行的處理器,其總功耗為63W,每執行緒平均不到2W。”

“頻率並沒為我們帶來性能,”Leon表示。“我們透過增加執行緒來改進性能。我們深具信心,這是正確的道路。”

Sun公司的Niagara微處理器擁有32個執行緒,總功耗為63W,圖為其功耗分佈。

《微處理器報告》的總編輯Kevin Krewell強調:“當有大量執行緒閒置等待任務時,Sun的多執行緒運作得可圈可點。Sun能平行利用Niagara內的處理器核心。但IBM擁有需要極強數據處理能力的客戶,這也是它們將與昇陽Ultrasparc新一代設計版本─Rock伺服器相互競爭的領域。”

IBM Power6的首席工程師Brad McCredie表示,IBM採用了1條13級的管線──7級用於浮點運算單元、6級用於整數運算,與Power5的相同。但Power5中需要22個‘4路扇出’(FO4)邏輯級(其中,一個反相器驅動其它4個)完成的任務,現在,在Power6中,用13個FO4邏輯級就能實現(每級管線一個)。

“啟動邏輯可以提升性能,”McCredie表示,“我們將頻率加倍,並保持管線深度不變,因而使每個邏輯級能發揮更大功用。目標是從每個電晶體中獲得更多邏輯功能。如我們不採取這種作法,將使管線級崩潰。某些公司採用20、30和40個管線級,實是命懸一線。”

IBM對於更高頻率意味著更大功耗這一點並不置可否。“降低功耗的實用方法是監測電晶體數量,”McCredie表示。他還補充說所有電晶體都不相同。例如,快取記憶體是非常有規則的結構,所以其閾值電壓可以更高。就功耗而言,對快取記憶體進行作業比邏輯部份所需的功耗低。

雙核心Power6有7.5億個電晶體,比英特爾的Montecito版(Itanium)還少約1百萬個,IBM的技術評估專案經理Joel Tendler表示。

McCredie表示,Power6有第二個晶片記憶體控制器,以使記憶體頻寬加倍。“我們費盡心機確保頻寬能符合處理器比例,”他說。

Tendler拒絕透露快取記憶體大小、工作電壓或功耗。他說,對IBM客戶重要的是伺服器級功耗,而非晶片級功耗。IBM單講頻率但不談因應晶片級功耗的作法,使得ISSCC的與會工程師頗有微詞,一位英特爾的工程師就稱這毫無意義。

在ISSCC上,並沒透露Power6的某些技術細節。Power6的電路主管Brian Curran表示,二進制的浮點單元(BFU)採用高閾值電壓電晶體以降低漏電流。BFU執行在4GHz、運作於1.1V時的功耗為310mW。在採用相同管線和每週期指令數和鎖存週期開銷的條件下,Power6的BFU採用54個FO4邏輯級,而Power5是91個。整數執行單元需要78個FO4邏輯級,在執行於4GHz、1.1V時,功耗為160mW。

Curran表示,IBM將動態單元的使用降至最少,以降低功耗。另外,‘我們設計電路執行不止一項功能,每個電路都擔負更多任務。我們將上述功能與低鎖存延遲結合起來;一個更低的延遲設計便有助於更高頻率的實現。"他說。

IBM的工程師在實驗室中,展示了一款執行於5.1GHz、工作在1.3V的Power6,Curran表示。

英特爾Itanium電路和技術總監Sam Naffziger表示,IBM‘借用’了首先發軔於英特爾的理念,例如,大量採用脈衝控制的鎖存器而不是主/從型的翻轉觸發器。據他說,早先IBM和英特爾的設計使用的是主/從翻轉觸發器。“脈衝控制鎖存器的開銷只有主/從鎖存器的一半,這樣就能在每個邏輯級中節省1到2個FO4,”他說。

“對電路進行調整以從相同的管線中得到更高頻率,IBM功力十足。”他接著說,“頻率的確有其作用。如能保持相同的管線深度和功耗,更高的頻率當然能提升性能。”

“英特爾工程師仍在進行提高頻率的工作,”Naffziger聲稱,“在Itanium系列中,繼Montecito後的Tukwila版將有更多的高頻核心。"

英特爾的微處理器研究總監Shekhar Borkar表示:“英特爾早在1999年就認定高頻下的低FO4不省電。我們從1.6GHz的Centrino處理器開始,將重點從高頻和功耗方面轉移開來。而IBM卻反其道而行。”

在ISSCC上,英特爾的工程師Stefan Rusu描述了英特爾的雙核心Tulsa。Tulsa是一款65 nm的Xeon伺服器處理器,執行於3.4GHz,功耗為150W。Rusu介紹,Tulsa有一個16MB的L3快取記憶體,共計13.28億個電晶體。該電晶體數量在目前報導過衍生於X86架構的設計中是最多的。

Rusu說,英特爾在快取記憶體中並未採用多個電晶體閾值電壓(在Tulsa內,採用多個電晶體閾值電壓是降低功耗的通用技術);相反地,快取記憶體中大量使用更長通道長度的電晶體。這種電晶體以較慢的頻率執行,但漏電流降低了3倍,他說。

McCredie介紹,IBM採用了3個閾值電壓,並對Power6的通道長度進行調節以在漏電流和性能之間取得平衡。

作者:來大偉




投票數:   加入我的最愛
我來評論 - IBM以Power6微處理器為頻率地位正名
評論:  
*  您還能輸入[0]個字
*驗證碼:
 
論壇熱門主題 熱門下載
 •   將邁入40歲的你...存款多少了  •  深入電容觸控技術就從這個問題開始
 •  我有一個數位電源的專利...  •  磷酸鋰鐵電池一問
 •   關於設備商公司的工程師(廠商)薪資前景  •  計算諧振轉換器的同步整流MOSFET功耗損失
 •   Touch sensor & MEMS controller  •  針對智慧電表PLC通訊應用的線路驅動器
 •   下週 深圳 llC 2012 關於PCB免費工具的研討會  •  邏輯閘的應用


EE人生人氣排行
 
返回頁首