Global Sources
電子工程專輯
 
電子工程專輯 > 記憶體/儲存
 
 
記憶體/儲存  

用於10Gbps的高性能內容可尋址記憶體

上網時間: 2001年10月28日     打印版  Bookmark and Share  字型大小:  

關鍵字:CAM  內容可尋址記憶體  Terabit routers  高速交換機  乙太網路 

新興的兆位元路由器和高速交換機需要資訊包傳遞速度滿足萬兆位乙太網路、OC-192甚至更高要求,資訊包傳輸引擎必須以線速對每個資訊包執行多種搜尋功能,以提供多層多協議支援。具有單周期最長匹配搜尋能力的高性能三態內容可尋址記憶體(CAM)是實現第三代資訊包傳輸引擎的最佳方案,它可適應不同的地址類型和寬度,並與地址搜尋表的維護及更新保持同步。本文將介紹一種完全符合這一要求的三埠結構。

隨著用戶迅速增多以及應用日益複雜,網路正面臨著‘頻寬爆炸’的問題。上世紀90年代中期,對桌面應用而言每秒10兆位元傳輸速度就完全足夠,而今天每秒100兆位元速度早已是司空見慣,在不遠的將來,每秒1千兆位元速度也將成為現實。企業內部骨幹網路運行速度如此之高,以致千兆位元乙太網路已經是最低要求,萬兆位元乙太網路產品也開始逐漸增多。與此同時,廣域網(WAN)正以同樣惊人的速度成長,已經達到了OC-192的速度甚至更高。如今的網路包括高速WAN內核、都會網(MAN)設施以及企業中的區域網路,圖1顯示了這幾個大塊及其組件。核心路由器、中樞交換機、儲存區域網路(SAN)和安全網路閘道的運行均要求支援高速搜尋,高性能三態CAM正是這些設備的理想方案。

內容可尋址記憶體CAM

CAM是一種專用記憶體件,可進行快速大量平行搜尋。搜尋的時候,記憶體中所有的數據同時與搜尋關鍵字比較,搜尋結果就是匹配項的物理地址。它可以在硬體中完成數據表查詢,需要使用專用比較電路,對每個儲存位進行比較。

為了保証快速搜尋,CAM通常採用管線結構,每個時鐘周期都能啟動搜尋,運行速度可以維持在每時鐘周期搜尋一次。CAM完成搜尋需要多個周期,這些周期即是設備延遲。為了使搜尋速度達到最快,晶片上必須要有足夠多的引腳,以便每個周期都能輸入一個比較字。如果引腳的數目是比較字寬度的一半並同時支援雙數率(DDR)輸入,就可達到最大搜尋速度。DDR在時鐘的上升和下降沿都能將輸入鎖定。

以前CAM一直是單純的二進制元件,在每個位中只能儲存0或1,近年來出現了在每個儲存位置可以儲存0、1或X三種值的三態CAM。X是一種‘無關’態,可以是0或1,這種功能可用於基於無級域間路由(CIDR)的最長詞首比較,IPv4 CIDR地址的詞首長度可長達32位元,超過詞首的位就由X填補(見RFC 1519)。當最長詞首比較完成後(X均代表比較成功),可能會有多個條目與比較字匹配,帶多個匹配的搜尋結果即是與最長詞首相匹配的所有結果。三態儲存及搜尋的其它用途還有濾波、流程控制、分類及範圍匹配等。

硬體系統環境

圖2是一個典型的路由和交換子系統,基本功能單元仍與大型網路設備類似,如企業邊緣交換機和兆位元核心路由器等。

子系統的主要功能單元包括物理(PHY)和媒體存取控制(MAC)介面、資訊包處理器或ASIC、傳輸引擎和語境記憶體、傳輸管理器、交換結構介面、微處理器及序列緩衝器。資訊包處理器的功能包括:對收到的資訊包頭文件進行管理,解析要搜尋的相關頭文件並將這一資訊提供給傳輸引擎。需要注意的是如今這些功能都可由定製的ASIC或標準網路處理器產品完成。基於CAM的傳輸引擎根據這一輸入搜尋資訊傳輸查詢表,以確定對該數據合適的傳輸入口,然後將其從CAM輸出到語境記憶體,確定對該資訊包要採取的路由、交換或其它方案。

資訊包傳輸方案的發展經歷了幾個階段。早期迭代是基於軟體的方法,速度較慢。第二代設備中,資訊包傳輸通常採用基於ASIC的專用非確定算法(如哈希函數)進行,用RAM陣列儲存數據。由於非確定算法非常複雜,而基於ASIC的方案又難於開發和升級,所以第三代方案就向著採用高準確度、高容量三態CAM技術的專用標準產品(ASSP)發展,該方案能夠滿足不斷成長的傳輸量要求,同時又縮短了面市時間,因此極具吸引力。

資訊包傳輸性能要求

網路核心和企業中不同類型的設備對性能有不同的要求,例如路由表大小會根據必須儲存的路徑情況而變化,同樣,搜尋速度隨介面速度而改變,另外查表的複雜性相差也很大,從簡單的第二層MAC精確匹配到複雜的多層多協議分類及安全性功能等等。因此在這些不同的應用所採用的方案中,性能和靈活性都必須要能滿足各種要求。

對搜尋速度的要求

在考慮不同類型設備所要求的搜尋性能時,必須要看幾個因素,如傳輸引擎所要驅動的埠數量和速度等,要知道許多新興的複雜處理規範要求對每個資訊包都進行多重搜尋。表1列出了不同LAN和WAN介面速度和三重資訊包查詢所要求的搜尋性能,這些要求大大超出傳統查找技術的能力範圍,從而也推動了基於三態CAM的傳輸引擎的發展。

高性能三態CAM

本節我們將介紹高性能三態CAM的主要特性,包括搜尋速度、結構、深度和對高級應用的適用性等幾個方面,並已針對資訊包管理功能進行了最佳化。

1. 搜尋速度

目前CAM的最高搜尋速度為每秒1億次,該速度可在OC-768中對每個資訊包進行一次搜尋或在OC-192中對每個資訊包進行四次搜尋。也就是說,對於萬兆位元乙太網路單個設備可以支援每個資訊包六次搜尋,或每個資訊包在兩個合計起來1萬兆位元的乙太網路埠進行三次搜尋。

由於有72個引腳輸入搜尋數據並具有DDR功能,因此對任何搜尋類型(精確匹配、最長匹配或任何掩碼)只要字寬小於144位元都可達到全速搜尋。288位元字的搜尋需要多個周期才能輸入比較字(如DDR介面需要兩個周期),所以處理速度也會隨之減小。

與搜尋速度密切相關的是功耗。完善設計的CAM消耗的功率與搜尋速度成正比,所以功率管理特性對於減小元件的功耗很關鍵。功率管理必須在不需要的時候禁用搜尋功能,以降低功耗。

2. 列表維護

除查表功能外,CAM還必須可以定時存取以對表進行維護,包括增加新條目、更新現有條目、重新排序、學習、刪除和診斷。控制這些作業的硬體通常與控制查表的硬體(微處理器、單獨的ASIC/FPGA或資訊包處理器單獨的邏輯部份)不同。

三埠三態CAM結構完全可以實現這些功能。圖3顯示了三埠CAM如何整合在子系統的數據和控制路徑中,以及與語境記憶體的連接。表維護和數據通路信號不同,在邏輯上可將其區分開。分開後可允許在頻帶外進行表維護作業,在搜尋作業的同時不會降低或妨礙搜尋速度。SiberCAM Ultra-2M就是一個能滿足這些要求的系統,可以在搜尋路徑中達到每秒1億次搜尋,同時進行每秒一千萬次維護,無需排隊或衝突探測。由於它們在晶片邊界與查詢作業完全非同步進行,所以不必專為維護預留時鐘周期。

在晶片內部使用了一些新方法使記憶體內核的兩個時鐘域同步,如圖4方框圖所示。同樣,記憶體內核的設計保証了兩種作業之間作用明確並且不會互相影響。

3. 深度

每個千兆位元埠的列表條目數量視設備是否連接到WAN而有所不同。企業專用的交換機和路由器要求路徑列表的深度為每埠8K到32K個條目,而邊緣路由器每埠可能有256K個條目。

目前投入生產的三態CAM在一個晶片上有超過2M個三態位,可設置成儲存32K×72位元條目(足夠用於MAC地址)或64K×36位元條目(足夠用於IPv4地址),只要網路支援這些寬度即可。因此四個帶8K×72列表的千兆位元埠可以整合到一個晶片上,或者將晶片專用於一個帶32K×72列表的千兆位元埠。還可以做出144位元或288位元列表條目,以用於多域分類器、流程識別或IPv6等應用。9M三態CAM最近剛開始試生產,而更高密度的CAM還在開發當中。

目前WAN邊緣應用中要求的更深列表可以藉由將多個晶片級聯實現。例如可將四個SiberCAM Ultra-2M晶片級聯,它不會對搜尋速度或延遲產生任何影響,而容量對256K×36 IPv4列表來說完全足夠。也可應用雛菊鏈技術將5到16個晶片級聯,但要增加一到三個周期的額外延遲,這對於超過100萬個IPv4條目的路由列表、512K×72 MAC列表或混合型256K×72 MAC、256K×36 IPv4和64K×144也是足夠的。可變寬度表結構概念對於高級應用是非常重要的。

對高級應用的支援

企業設備多種多樣,有低級的工作組交換機,也有複雜的多層邊緣交換機和路由器。隨著設備複雜程度提高,數據處理複雜性和交換?路由的數據量大大增加。工作組交換機通常是第二層或第三層設備,而邊緣設備通常包括第2/3/4層交換,因此必須根據其它自帶尋址資訊、資訊包或訊框域將通訊區分開來。

這些域允許一些高級網路特性,如服務品質、流程控制、虛擬個人網路、安全和存取控制表、伺服器負載平衡和基於方案的網路通訊等。儘管IPv4查找可以用32位元字完成,但分類或流程ID可能要求多達144位元(IPv4原始?目的地址、協議、ToS、TCP/UDP原始?目的埠和其它各種數據),IPv6可能還要求288位元。

要把這些不同功能整合在一個傳輸引擎中,就要求在同一晶片上同時且動態支援不同寬度的列表條目,這一要求並不是每種方案都可以滿足的。圖5表明這種系統中不同寬度的條目如何以高效密集的方式儲存。在288位元以內,36、72、144和288位元字的所有組合都可以儲存,並類似地可擴展到144和72位元條目。注意不同字寬度的分配可以動態修改,這樣圖5中第5到第8個IPv4框可以由一個流程ID或其它144位元應用代替,只要不超出位限制即可。

自我學習是企業應用中另一項很有用的功能,當交換機埠遇到橋列表中沒有儲存的原始MAC地址時,它就會啟動自我學習功能,使這一條目成為以後第二層幀可能的目的MAC地址。自動學習模式下的CAM利用原始MAC查找遺漏功能,自動指示在列表中寫入MAC地址。

SiberCAM Ultra-2M等高性能CAM的其它實用功能還有:由IEEE標準測試接取埠(TAP)控制的內置自檢(BIST)、語境記憶體存取線程控制以及用於搜尋、條目和脈衝作業的多種暫存器等。

本文結論

如今LAN和WAN都面臨著‘頻寬爆炸’的問題,新興的網路設備不再完全依賴傳統用硬體或軟體算法技術的資訊包傳遞方案。第三代方案建立在高性能三態CAM的基礎上,必須支援OC-192和萬兆位元乙太網路介面,並以低廉的價格和小巧的體積提供所需的功能和特性。

單周期查找是高性能三態CAM的關鍵,但只有在將查找和維護分離進行的三埠結構中才能真正得以實現。要想對應用提供最佳支援還要求對不同字寬(36、72或144位元)及搜尋類型(精確匹配、最長匹配和任意掩碼匹配)都保持單周期特性。此外,對可變寬度的支援可以使儲存密度和多層路由表搜尋的效率都達到最高。

作者:P. Curtin, K. Schultz, A. Sorowka




投票數:   加入我的最愛
我來評論 - 用於10Gbps的高性能內容可尋址記憶體
評論:  
*  您還能輸入[0]個字
*驗證碼:
 
論壇熱門主題 熱門下載
 •   將邁入40歲的你...存款多少了  •  深入電容觸控技術就從這個問題開始
 •  我有一個數位電源的專利...  •  磷酸鋰鐵電池一問
 •   關於設備商公司的工程師(廠商)薪資前景  •  計算諧振轉換器的同步整流MOSFET功耗損失
 •   Touch sensor & MEMS controller  •  針對智慧電表PLC通訊應用的線路驅動器
 •   下週 深圳 llC 2012 關於PCB免費工具的研討會  •  邏輯閘的應用


EE人生人氣排行
 
返回頁首