透過OCP介面為手機傳送3D節目
隨著越來越多的手持設備內建3D繪圖功能,像開放核心協議(OCP)這類標準介面也變得愈來愈重要。
過去幾年中,手機視訊功能歷經了巨大變化。利用手機來拍照和傳送視訊是消費者期望的關鍵功能。隨著高解析度彩色顯示器的平價化,高品質繪圖功能的重要性也與日俱增。現在,繪圖處理已被視為手機產業中最重要的成長領域之一。
隨著具備3D繪圖加速器的手持設備日漸在消費市場普及,行動設備中真正的3D繪圖功能很快就會浮上檯面。透過採用一個專用繪圖處理器,將能大幅改善手持設備的繪圖功能。相關應用還包含增強型用戶介面、手機3D遊戲、行動地圖和導航功能等。
在未來的手機上支援先進繪圖功能,意味著設計人員將面臨在應用和多媒體處理器等SoC中整合3D繪圖處理器方面的挑戰。這些挑戰將包括許多方面,因為3D繪圖是非常耗費記憶體頻寬的應用,這有可能提升記憶體系統和系統匯流排的極限,以及整體系統複雜度。
具備3D功能的SoC
在分析系統架構時,必須仔細考慮三個因素:記憶體可用頻寬、系統匯流排、繪圖處理器性能。記憶體頻寬決定了對記憶體要求較高的應用場景性能上限。延遲補償能使繪圖核心的配置位於系統匯流排所允許的極限範圍內。而對運算要求較高的應用場景性能則受限於繪圖處理器的管線效率和時脈頻率。
3D繪圖非常很耗費記憶體資源,如果在應用時不加以限制,它將會耗盡所有的記憶體頻寬(見表)。
表:不同條件下記憶體頻寬的耗費情況統計。
在複雜的應用場景中,為了提交每訊框的繪圖資料,彩色和Z緩衝器必須讀寫許多次。此外,繪圖處理器必須存取紋理和幾何數據。所期望的每秒30訊框意味著所有這些記憶體存取必須每秒連續出現30次。實際上,這意味著每秒有接近幾百MB的數據必須在系統記憶體和繪圖處理器之間進行傳輸。在減少繪圖處理器和外部手機SDRAM間的記憶體頻寬利用方面,已有許多獨創性的技術問世。但儘管如此,記憶體頻寬仍然是一個限制因素。
圖1:採用繪圖加速器的簡單系統結構圖。
系統匯流排架構
當規劃一個繪圖處理器架構時,瞭解系統匯流排的限制和利用時機非常重要。為了實現最佳繪圖性能,必須充分瞭解諸如最大突發數據大小和管線請求的可用性等限制。這對廣泛採用和完全定義像OCP這類SoC匯流排插座標準而言,具有特殊的意義,因為這種標準可被元件供應商及整合商充分及正確地瞭解(見圖)。
由於主記憶體存取會被發送到外部SDRAM,系統匯流排上將出現較長的突發存取數據串流。匯流排規模的上限決定了返回數據的有效利用率。舊數據會浪費系統的記憶體頻寬,而頻寬對這些應用來說是極為珍貴的資源。目前已經有多種靈巧的快取記憶體方案被採用,以確保不會浪費系統頻寬。此外,優異的快取記憶體也減少了共同轉移的數據量。繪圖處理器中的位元組可選功能(byteenables)可實現突發數據長度的最大化,因為沒有必要將潛在的長突發數據分解成若干個較小的數據長度,而且這樣做將降低性能。而OCP2.0就支援位元組可選擇功能。
系統的記憶體延遲包含從繪圖處理器到外部記憶體並返回的總延遲。該延遲很容易達到50~100個系統匯流排時脈週期。補償這種延遲的有效方法之一是向匯流排介面發送多個未完成的請求(outstandingrequests)。透過使用管線作業方式來處理這些請求,可將連續的數據串流饋送到耗費記憶體的繪圖處理器中。舊的匯流排介面如AMBAAHB2.0並不支援這種管線作業。而OCP2.0介面提供了這種可能性,故能補償非常大的記憶體延遲,且沒有任何性能損失。伴隨著預測性的智慧預取機制,還能進一步提升性能。
OCP匯流排插座提供的另一項有用功能是執行緒,該功能允許在繪圖處理器的外部識別不同的記憶體存取。如此將能對存取進行重新排序,並獲得改善性能的新機會。專用記憶體存取可瞄準快速記憶體,從而提升性能。當存取外部SDRAM時也可以使用重新排序方法,以確保對同一SDRAM組的存取是連續的,這將增加SDRAM的效率。通常,記憶體存取的透明度將允許在繪圖處理器中建構更多的記憶體最佳化演算法。
未來手機顯示器的解析度將進一步提升,且顯示品質更好。下一代手機終端將採用VGA解析度顯示器,這就是為何必須將繪圖處理器技術升級到更高顯示解析度,且無法允許記憶體頻寬失去控制的原因。快速提交數據將是記憶體頻寬方面的關鍵問題。
許多即將問世的匯流排介面標準,看起來將更像是多媒體匯流排。OCP2.0已經包含了增加多媒體能力所需的功能。晶片製造商都希望具有一個適用於所有IP的標準匯流排介面,以降低研發成本和加速上市時間。同樣,系統匯流排架構正透過增加快取記憶體並擴展記憶體介面,以充分利用繪圖處理器的優勢。
作者:
Umesh Gowda
Bitboys公司
社區今日頭條 |
---|