Global Sources
電子工程專輯
 
電子工程專輯 > 控制技術/MCU
 
 
控制技術/MCU  

應用在OC-768的分類和轉發技術

上網時間: 2002年07月28日     打印版  Bookmark and Share  字型大小:  

關鍵字:OC-768  ASIC  SDRAM  OC-48  network search engine(NSE) 

傳統的資料庫搜索解決方案不能滿足不斷成長的速率要求,必須採用基於大規模平行搜索和管線搜索的方法。尤其對於OC-768的網路分類和轉發,採用平行搜索技術的網路搜索引擎和具有靈活管理功能的分類轉發處理器顯示了獨特的性能優勢,有效地提高了網路分類和轉發處理效率,並具有高度的靈活性和動態擴展能力。

人們對數據傳輸頻寬的需求促進了光傳輸速率的提高。10Gbps(OC-192)系統是當前發展的重點,同時,設計工程師正在積極開發40Gbps(OC-768)系統。頻寬的提升將影響到網路的光收發器、FEC/PLL及訊框器、數據包解析及調整、數據包分類?轉發、數據包分割與重組、序列和調度設計。

所有這些設計都很重要,但數據包的分類和轉發無論就處理規則(rule)的數量,還是就處理速率而言都是最複雜而又最重要的。此外,隨著基於規則的路由服務和服務品質(QoS)管理的應用不斷拓寬,也促使設計工程師將複雜的分類處理和網路資料庫搜索融入到涵蓋從核心網路到邊緣網路的路由和交換應用中。在當前的系統設計中,僅數據包分類和轉發功能就可能佔據線路卡70%的處理任務。在40Gbps速率中意味著每秒1.25億個數據包處理,要進行高達200萬個的記錄分類和轉發。

從互連網骨幹網使用的光路由器和電訊級交換機,到邊緣匯集點和複雜的都會網路(MAN)環境,線路速率的分類和不同數據流的轉發需求已成為現實。隨著對整體頻寬(每秒傳輸的數據包)需求的提高,更為複雜的數據包搜索以及不斷增大的網路資料庫要求未來的系統設計能以比當前系統快數百倍的速率進行數據包包頭比較並進行決策。圖1;分類和轉發工作流程。

如上所述,當前資料庫搜索解決方案運用的演算法或hash方案都無法適用於不斷成長的速率,必須改進設計方法,設計出基於大規模平行搜索和管線搜索的方法。

分類和轉發

圖1顯示了從分類搜索包頭的組合到調度包頭的產生的分類和轉發流程。

網路處理單元(NPU)接收來自訊框器(framer)的數據包並對L3層分類進行數據包包頭處理。NPU處理TCP包頭,並解析出數據包中用於TCP會話(L4層)的SYN和FIN(數據流的起始和結束)。對於L4到L7層的分類,NPU校驗URL、文件類型及數據包中的其它資訊,然後,NPU將分類表的查尋鍵值(lookup key)及數據包類型資訊傳送至分類處理器。NPU還將轉發表的查尋鍵值傳送至轉發處理器,進行最長詞頭匹配(LPM)搜索。

分類處理器接收分類查尋鍵值並搜索整個規則(或記錄)資料庫,以識別出數據流。該數據流中儲存了特定分組數據流的流量、QoS和統計參數,而相關記憶體則將這些參數返回至NPU。

分類資料庫以不同的權值或優先級儲存了多個規則。對於每個搜索,具有最高優先級的規則將用來返回規則和流量參數。分類流程的複雜度取決於分類資料庫的大小、每個數據流記錄的規則數目以及分類速率。

轉發處理器接收轉發查尋鍵值,該鍵值通常具有比分類查尋鍵值更少的字段。然後,轉發處理器搜索轉發規則資料庫,以找到下一跳轉(hop)地址的位置,相關記憶體返回該地址和輸出端介面到NPU。

NPU收到QoS參數後,將數據結構同數據包儲存鏈接、數據包長度、數據包類型和流量工程參數進行組合。之後,數據流的資訊鍵值發送至流量管理器或調度器,然後根據數據流的資訊數據結構,對接收的數據流進行流量管理和流量調整。藉由流量調整,每個數據流將進入調度控制部份,在這?採用加權公平排隊(WFQ)規則,這樣每個數據包將根據埠的有效性和WFQ規則進行調度,以發送到對應的輸出端介面。

在入口路徑上,NPU對來自儲存區的數據包進行組合併發送至系統交換機。對於出口路徑,NPU直接從交換介面接收數據並儲存到緩衝記憶體中,然後再發送至用於數據傳輸的訊框器。

40Gbps系統設計

對於40Gbps設計,理想的分類和轉發元件能支援兩百萬個記錄,並能以每秒1.25億次搜索(MSPS)的速度對所有數據包字段的組合進行分類,這種分類是在8個或更多字段基礎上進行的。此外,該元件還應支援建立在多個規則表基礎上的平行搜索和專有功能,如用於TCP對話的URL對話檢測、HTTP請求和回覆檢測、目標伺服器選擇和伺服器?客戶端會話,以保持負載平衡。

從硬體的角度看,資料庫搜索、分類和轉發功能必須靈活地與NPU、流量管理器和訊框器進行整合,以將設計複雜度和功耗降至最低的同時,使數據吞吐量達到最大。此外,還需要高效的介面來支援多個元件的數據處理和控制功能的整合。

另一個問題是需要對硬體結構進行分割,以使資料庫搜索要求與其它處理任務相比,具有自主的靈活性,而單晶片元件將影響硬體的性能和靈活度。圖2:不同的分類和轉發方法。

為了滿足電訊級QoS服務級協議(SLA),分類器必須能在L3層、L4層及以上各層處理多種規則,並支援OC-768確定的速率。為了在複雜的都會網路中支援上百萬用戶以及用戶間數千萬的會話層,分類器必須能對具有2百萬條規則的大型資料庫進行作業。

以前的很多應用均採用大型、快速的轉發設備與小型、複雜的分類設備相結合。但是更多的案例顯示,使用從事分類和轉發作業的增強型搜索子系統效率更高,也更有效,尤其是在新型高密度單晶片分類和轉發引擎中更為明顯。

為了在動態變化的網路中進行有效配置,分類和轉發功能還必須快速簡單地更新資料庫。新一代搜索、分類和轉發引擎必須保証網路管理人員維護詳盡的表結構更方便,同時還必須保証資料庫具有最高的效率和靈活度。

隨著性能要求及資料庫複雜度的增加,資料庫搜索、分類和轉發功能也由傳統的使用基於演算法的搜索方法轉向使用專用元件。圖2顯示了不同的分類和轉發方法。

ASIC/SDRAM搜索或者SRAM搜索

ASIC和SDRAM或者SRAM方法採用hash和樹型結構實現多種記憶體搜索,這能滿足OC-12或1G的線路速率。但是這些基於演算法的方法具有非確定性,每個搜索所需的時間取決於地址表的大小、表中的特定地址以及採用的hash函數。

不同的hash函數需要不同的計算量來從一個記錄中產生一個hash鍵值,並且衝突(某種條件下,多個記錄產生了相同的hash鍵值)是不確定的。儘管演算法不斷得到改進,但其固有的不確定性使其難以滿足網路設備不斷增強的性能要求。

基於演算法的實現還限制了搜索的靈活度,附加列表記錄雖然可以減少搜索次數,但必須添加至每一個附屬的千兆位元乙太網路埠的地址列表中。當大型表記錄,如那些用在基於規則的路由和IPv6路由應用中的記錄的可能組合不斷增加時,衝突產生的機率也相對增大。

設計工程師已成功地使用ASIC和SDRAM或SRAM方法滿足OC-12或者1Gbps線路速率,並致力於將該方法應用於OC-48。但是,這些方法對於更多的規則以及更為複雜的分類(包括L4層)卻顯得力不從心。

例如在OC-48中,表的大小必須嚴格限制以保証性能,並避免產生過多的數據包丟失。此外,開發基於軟體的搜索演算法還將佔用大量的系統資源,並延長設計進度,產生更多的不確定因素。

網路搜索引擎

與軟體或hash方法不一樣,網路搜索引擎(NSE)代表了先進的平行搜索技術,該技術專門用於大量數據的高速搜索。在性能上,這些元件可有效地降低網路處理設備的網路搜索負擔,使其能以比傳統軟體演算法快數百倍的速率進行資料庫搜索。NSE還能在單個周期內執行搜索作業,使搜索時間可以預測,即搜索時間是確定的。

目前最先進NSE的大型資料庫可以在單個設備中容納超過25萬個路由記錄,還允許用戶定義大量的字段,用於QoS增強、IPv4/6分類和基於內容的分類功能。

每秒1.25億次的搜索速率允許對複雜的L4~7層分類的每個數據包進行多項搜索,並使快速分層搜索具有極短的等待時間。不像那些在L3層分類實現OC-48的基於演算法的搜索,NSE可以以穩定的OC-768速率支援L4至7層分類搜索。

此外,由於NSE架構對複雜的搜索進行了最佳化,具有最大的靈活性,因此設計工程師具有很高的配置靈活度,如串聯多個元件以支援更大的數據表。每個搜索引擎還必須能將記錄配置成多個搜索寬度以適應各種各樣的搜索要求,如36、72、144、288或576位元寬。

這些設備可以以144位元字執行125MSPS的搜索,這些144位元字由5或6個典型的元組(tuple)分類規則組成。可支援規則的實際數目是規定搜索寬度的函數,例如當使用32位元字寬結構時,當前的NSE最多可支援256K個獨立的規則,而新一代NSE則有望支援512K個規則。

從維護資料庫角度看,搜索引擎需要對記錄進行分類和排序,以建立並維護分類優先級。表中較高優先級的記錄放置在較高的位置,而較低優先級的記錄則放置在較低的位置。通常,軟體設計工程師對分類和轉發表進行歸類,以在不同的表分區中保持足夠的空間。表分區可以基於LPM詞頭的長度或分類優先級之上,對於LPM,較長的詞頭出現在表的頂端,這樣長詞頭匹配將比短詞頭匹配具有更高的優先級。為了支援快速更新以及較大的更新規模,用戶需要在表中留出很大的空間。或者如下所述,設計工程師可選擇帶有能自動管理資料庫優先級的內置功能的專用處理器。

分類和轉發處理器

最新開發的用於分類和轉發的專用處理器解決方案包含表管理功能,該功能允許用戶靈活地為每個記錄設置優先級,從而無須考慮表的分類和排序。分類和轉發處理器(CFP)這一獨特的功能可減少設計工程師軟體和硬體配置時間,加速了網路設備的上市。

藉由在整個資料庫中嵌入記錄的優先級權值資訊,分類和轉發處理器無須考慮所有的表管理開銷,如分類、行動或預留空間。因此這些處理器幾乎能以任意速率或大小動態地支援快速更新,這在不斷變化的網路環境中很有用,如為終端用戶服務進行動態供應的複雜邊緣環境或帶有基於規則的通訊服務的匯集點。表1:NSE和CFP可無膠合地串聯以在相同的分類速率下實現更大的資料庫容量。

目前,每個分類和轉發處理器通常可支援128K個規則,並且搜索性能可達到100MSPS。與那些只支援普通NPU的早期分類器相比,CFP可處理整個範圍內的分類和轉發等資料庫管理功能。此外,CFP還可實現可靈活配置的緊湊的多業務OC-768線路卡。

綜合考慮

由於分類和轉發在提供SLA保障及支援新一代網路應用(如VoIP、視頻和音頻流)中發揮著日益重要的作用,設計工程師需要理解不同方法之間的性能差異。表1總結了傳統ASIC和記憶體設計方法與網路搜索引擎和專用處理器的期望特性的差異。

網路搜索引擎及分類和轉發處理器設計採用了傳統的電路設計和高度平行管線作業。搜索引擎開發商可在NSE和CFP中增加記錄的密度,並保持最低的功耗。在未來兩年中,分類和轉發領域中的設備有望在單塊晶片上不斷增加分類和轉發密度。

為了有效利用NSE和CFP的性能,設計工程師必須考慮整體整合問題,使設備能在網路處理管線中與其它組件協同工作。在現有NPU中使用標準管腳引出線和無膠合介面能以最簡單的支援電路,有效地整合這些專用搜索及分類和轉發引擎。

為此,支援其它新興的業界標準也非常重要。大多數主要的NPU製造商已開始設計NPU與NSE及CFP之間的專用介面,以提供OC-192一致的性能,並積極尋求擴展到OC-768的解決方案。

總之,這些新一代專用元件可降低日益複雜的網路搜索要求的設計負擔,並使整個分類和轉發規則表效率更高,也更有效。因此,系統設計工程師可以更高的系統級靈活性為自己和用戶提供新服務,實現基於規則的網路管理,並確保網路底層架構的動態擴展。

作者:

Jose Pereira


開發部經理


email: jpereira@netlogicmicro.com


NetLogic Microsystems公司





投票數:   加入我的最愛
我來評論 - 應用在OC-768的分類和轉發技術
評論:  
*  您還能輸入[0]個字
*驗證碼:
 
論壇熱門主題 熱門下載
 •   將邁入40歲的你...存款多少了  •  深入電容觸控技術就從這個問題開始
 •  我有一個數位電源的專利...  •  磷酸鋰鐵電池一問
 •   關於設備商公司的工程師(廠商)薪資前景  •  計算諧振轉換器的同步整流MOSFET功耗損失
 •   Touch sensor & MEMS controller  •  針對智慧電表PLC通訊應用的線路驅動器
 •   下週 深圳 llC 2012 關於PCB免費工具的研討會  •  邏輯閘的應用


EE人生人氣排行
 
返回頁首