新四季網

基於嵌入式加速核心的獨立顯卡架構的製作方法

2023-06-15 12:05:46 2

專利名稱:基於嵌入式加速核心的獨立顯卡架構的製作方法
技術領域:
本發明涉及計算機技術領域,更具體地說,本發明涉及一種基於嵌入式加速核心的獨立顯卡架構。
背景技術:
隨著IT技術和網際網路的發展,家庭娛樂和消費類應用需求不斷擴大,在計算機系統中扮演著越來越重要的角色。家庭娛樂和消費類應用以顯示和多媒體需求為主要特點,為了滿足其不斷增長的應用需求,計算機系統中集成圖形處理器(GPU,GraphicsProcessing Unit)專門對其進行處理,並在此基礎上構建板級「顯卡」加速設備。目前,顯示與多媒體應用需求橫跨消費類電子、個人PC機和伺服器等計算機各領域,市場前景廣闊。
根據實現特點,業界將顯卡主要劃分為兩類集成顯卡和獨立顯卡。無論是「集成」還是「獨立」,兩者主要針對GPU是否與CPU共享主存儲器而言。集成顯卡主要特點為集成GPU,但未對應獨立的顯示存儲器,其訪問的存儲空間位於主存儲器中,即與CPU共享主存儲器。集成顯卡一般不作為獨立板級設備存在,主要集成在主板內;相反,獨立顯卡除集成GPU外,還對應獨立顯示存儲器,GPU內集成存儲控制器實現對顯示存儲器的訪問。獨立顯卡一般作為獨立板級設備存在,通過標準系統接口與主板和CPU連接。早期計算機系統中,存儲器控制器位於主板北橋晶片內,CPU通過標準系統接口與北橋晶片連接,訪問主存儲器;GPU亦與北橋晶片連接,實現與CPU交互。對於集成顯卡而言,GPU通過標準系統接口訪問主存儲器,與主CPU共享訪存帶寬,其延遲尚可接受,可滿足一般應用需求。但隨著計算機技術和工藝水平的發展,主存儲控制器逐漸由北橋晶片內轉移至CPU內。在此架構下,對GPU而言,其共享訪問主存儲器延遲變得更長,越來越難以接收。典型集成顯卡如Intel GMA系列,主要滿足低端和中低端應用需求。為了避免與CPU競爭主存儲器,獨立顯卡板集成顯示存儲器,GPU內集成存儲控制器對其進行訪問,同時通過標準系統接口與CPU和主存儲器交互,支持直接存儲訪問(DMA, Direct Memory Access)等高效操作。GPU可直接低延遲訪問獨立的顯示存儲器,有效提高其對應用的加速性能。獨立顯卡技術複雜、研製門檻高,關鍵技術主要掌握在個別廠商手中,且技術封閉性強,其驅動具有不開源特性。使得軟體上無法與非x86指令集CPU相匹配。除上述集成顯卡和獨立顯卡架構外,近年隨著工藝水平提高,還出現新型集成SoC(片上系統)架構實現顯卡功能。此類集成SoC架構特點是將GPU核心與CPU核心等集成在同一晶片內,兩者通過共享總線或其他互連接口與存儲控制器相連,實現對主存儲器的共享訪問。從某種意義上而言,集成SoC架構可視為集成顯卡架構延伸和改進,由於位於同一晶片內,CPU與GPU核心通信效率提高。國內具備顯示與多媒體處理能力、典型集成SoC架構晶片例如北大眾志,主要面向嵌入式和工業控制等領域應用,難以滿足PC機(個人計算機)、伺服器等系統需求。

發明內容
本發明所要解決的技術問題是針對現有技術中存在上述缺陷,提供一種獨立顯卡構架,其能夠滿足PC機和伺服器等各種系統對顯卡的需求。根據本發明,提供了一種基於嵌入式加速核心的獨立顯卡架構,其包括加速部件、互連總線和傳輸部件;其中,所述加速部件包括顯示控制器、圖形處理器和視頻加速器等;所述互連總線包括IO配置總線以及數據傳輸總線;所述傳輸部件包括接口轉換器、直接存儲訪問控制器、存儲控制器、第一路由部件和第二路由部件等。優選地,所述顯示控制器用於將顯示存儲器中像素數據輸出至顯示裝置;所述圖形處理器用於對圖形類任務進行加速;所述視頻加速器用於對視頻和圖像數據進行編解碼操作。優選地,所述IO配置總線用於轉發外部訪問各部件的IO請求,以及對顯示存儲器 數據的直接訪問;所述數據傳輸總線用於轉發各部件對主存儲器數據的直接訪問請求。優選地,所述接口轉換器用於實現獨立顯卡內總線協議與獨立顯卡外系統接口的協議轉換;所述直接存儲訪問控制器用於實現主存儲器和顯示存儲器之間數據批量傳輸;所述存儲控制器用於管理各部件對顯示存儲器數據的訪問;所述第一路由部件和所述第二路由部件分別用於將數據訪問請求路由至所述顯示存儲器和所述主存儲器。優選地,所述獨立顯卡架構中的各部件通過軟體驅動、管理和協作。優選地,所述存儲控制器支持與IO配置總線相連的第一埠、與顯示控制器相連的第二埠、與圖形處理器相連的第三埠、與視頻加速器相連的第四埠、與直接存儲訪問控制器相連的第五埠的並發訪問。優選地,所述路由部件包括地址基準寄存器以及地址比較邏輯單元;其中,所述地址基準寄存器通過所述IO配置總線獲取配置值,地址比較邏輯單元以從所述地址基準寄存器傳遞過來的地址數據作為劃分界限確定訪問所述主存儲器、訪問所述顯示存儲器。優選地,所述路由部件支持CPU通過所述IO配置總線動態修改地址基準寄存器。優選地,所述顯示控制器支持單路、雙路甚至更多路顯示輸出。優選地,所述圖形處理器和所述視頻加速器具有直接訪問主存儲器的數據的能力。本發明基於嵌入式加速核心構建功能完整的獨立顯卡,可滿足PC機和伺服器等領域對顯示與多媒體處理能力需求。其中,各加速核心彼此獨立,可通過驅動軟體統一管理協作,方便獨立升級;而且,通過增強單個加速核心能力或集成多個相同類型加速核心,可快速提升加速能力,具有很強的擴展性;集成專門視頻加速器,支持各種常見視頻格式編解碼,與主流商業顯卡相比,支持格式種類更加豐富、處理能力也大幅加強。


結合附圖,並通過參考下面的詳細描述,將會更容易地對本發明有更完整的理解並且更容易地理解其伴隨的優點和特徵,其中圖I示意性地示出了現有嵌入式技術中加速核心的組成示意圖。圖2示意性地示出了根據本發明實施例的獨立顯卡架構示意圖。圖3示意性地示出了根據本發明實施例的獨立顯卡架構中路由部件的結構框圖。
需要說明的是,附圖用於說明本發明,而非限制本發明。注意,表示結構的附圖可能並非按比例繪製。並且,附圖中,相同或者類似的元件標有相同或者類似的標號。
具體實施例方式為了使本發明的內容更加清楚和易懂,下面結合具體實施例和附圖對本發明的內容進行詳細描述。本發明基於嵌入式領域多種不同類型的顯示與多媒體加速核心構建可擴展獨立顯卡架構,實現完整功能的獨立顯卡裝置,從而滿足PC機和伺服器等系統中對獨立顯卡需求。在描述本發明的優選實施例之前,先簡要描述現有嵌入式技術中加速核心,以便於理解本發明與現有技術的區別。圖I示意性地示出了現有嵌入式技術中加速核心的組成示意圖。如圖I所示,現有嵌入式技術中加速核心包括10 (輸入輸出)接口 I、數據接口 2和功能核心3。在集成SoC架構晶片中,IO接口 I主要與IO配置總線4互連,接收CPU核 心對加速核心的配置命令從而啟動任務加速;數據接口 2主要與訪存數據總線5互連,從存儲器中獲取數據;功能核心3部分則為任務執行部件。對單個加速核心而言,IO接口 I和數據接口 2 —般具有唯一性。與上述現有技術不同的是,在本發明實施例中,顯卡加速晶片通過標準系統接口與CPU連接,片內集成存儲控制器管理板上顯示存儲器,通過顯示接口與顯示器互連。在晶片內部,加速核心仍舊通過IO配置總線和數據傳輸總線互連,但不再與CPU核心共享總線,而是通過接口轉換部件將片內總線協議轉換為標準系統接口協議後與CPU或主板連接,從而獨立於CPU或主板實現。與傳統獨立顯卡實現相比,本發明實施例中各加速核心彼此相對獨立,主要由驅動軟體進行管理和協作;且在顯存和主存之間支持各種粒度數據的高效傳輸,支持加速核心直接訪問主存。下面將具體描述本發明的優選實施例。圖2示意性地示出了根據本發明實施例的獨立顯卡架構示意圖。如圖2所示,根據本發明實施例的獨立顯卡架構主要組成可分為三大部分加速部件、互連總線和傳輸部件等。優選地,所述獨立顯卡架構中的各主要部件通過軟體驅動、管理和協作。其中加速部件為功能執行部件,其包括顯示控制器301、圖形處理器302和視頻加速器303。互連總線包括10配置總線L2、以及數據傳輸總線LI。傳輸部件為輔助部件,其包括接口轉換器31、直接存儲訪問控制器304、存儲控制器32和路由部件(第一路由部件ROUl和第二路由部件R0U2)等。更具體地說,各組成部分的主要功能和特點如下a)嵌入式加速核心顯示控制器301 :將顯示存儲器50中像素數據輸出至顯示裝置。例如將顯示存儲器50中幀緩衝像素數據輸出至顯示器40。顯示控制器301通過IO接口接收外部對其解析度等參數配置命令。根據性能不同,顯示控制器301可支持單路和/或雙路顯示輸出,並且可支持不同的顯示解析度等。
圖形處理器302:對圖形類任務進行加速。圖形類應用可分為2D (二維)/3D (三維)類型,相應地,圖形處理器302可支持2D和/或3D加速。視頻加速器303 :對各種視頻和圖像數據進行編解碼操作。常見視頻和圖像格式包括Η· 264、MPEG-4, MPGE-2、AVS、RV、DivX、MJPEG 和 JPEG 等。部分圖形類應用和視頻類應用訪問數據具有一定隨意性,因此,優選地,要求圖形處理器302/視頻加速器303核心具有直接訪問主存儲器數據的能力,即圖形處理器302/視頻加速器303能夠直接訪問主存儲器中的數據。b)互連總線IO配置總線L2 :轉發外部訪問各部件的IO請求,以及對顯示存儲器50數據的直接訪問。數據傳輸總線LI :轉發各部件對主存儲器20數據的直接訪問請求。 典型片內總線包括AMBA總線、Wishbone總線等。其中AMAB總線又可細分為AHB總線、AXI高速總線等。c)傳輸部件接口轉換器31 :實現獨立顯卡內總線協議與獨立顯卡外系統接口 11的協議轉換。為與主流商業獨立顯卡保持接口兼容,本發明實施例顯卡可採用PCI、PCI Express等標準接口與CPU或主板連接。更具體地說,例如,如圖2所示,接口轉換器31可分別通過IO配置接口 311和數據傳輸接口 312連接至IO配置總線L2和數據傳輸總線LI。直接存儲訪問控制器304 :實現主存儲器20和顯示存儲器50之間數據批量高效傳輸。CPU 10在啟動加速核心運行前,需將原始數據由主存加載至顯存。採用直接存儲訪問方式,直接存儲訪問控制器304可有效提高傳輸效率,減輕CPU 10負擔;同時,在加速核心執行某個任務時,直接存儲訪問控制器304可同時進行數據傳輸,為下個加速任務作準備,從而掩蓋數據搬遷延遲。存儲控制器32 :管理各部件對顯示存儲器數據的訪問;優選地,存儲控制器32支持多埠(與IO配置總線L2相連的第一埠 PO、與顯示控制器301相連的第二埠 P1、與圖形處理器302相連的第三埠 P2、與視頻加速器303相連的第四埠 P3、與直接存儲訪問控制器304相連的第五埠 P4)並發訪問。存儲控制器32除支持各部件通過數據接口(Pf P4)訪問顯示存儲器50外,還支持CPU 10通過IO配置總線L2 (PO)直接訪問顯示存儲器50數據(主要用於CPU 10對顯示存儲器50小規模數據操作)。路由部件ROU (第一路由部件ROUl和第二路由部件R0U2):實現加速核心唯一數據接口的拆分,將數據訪問請求路由至顯示存儲器50和主存儲器20。優選地,第一路由部件ROUl和第二路由部件R0U2支持CPU 10通過IO配置總線L2動態修改地址基準寄存器。雖然圖2示出了第一路由部件ROUl和第二路由部件R0U2分離的結構,但是實際上第一路由部件ROUl和第二路由部件R0U2可集成為單個路由單元。在圖2所示的構架中,獨立顯卡雖然與CPU相分離,但兩者存在大量數據交換需求。由此提供多條數據通路用於顯示存儲器50和主存儲器20的數據交換,支持各種不同粒度和規模下的數據高效傳輸。對於小規模數據,CPU可選擇直接通過IO配置總線L2訪問顯存數據;對於大批量數據,可通過直接存儲訪問控制器304實現高效遷移。本發明實施例利用包括第一路由部件ROUl和第二路由部件R0U2的路由部件的設計來有效擴展加速核心訪存對象。具體地說,在現有技術的嵌入式集成SoC架構中,主存與顯存為共享方式,加速核心僅需訪問此唯一空間;但在獨立顯卡架構中,顯存和主存彼此獨立,加速核心除訪問顯存數據外,還需訪問主存數據。圖3示意性地示出了根據本發明實施例的路由部件的結構框圖。如圖3所示,根據本發明實施例的路由部件包括地址基準寄存器Rl以及地址比較邏輯單元R2。其中,地址基準寄存器Rl通過IO配置總線L2獲取配置值,地址比較邏輯單元R2以從地址基準寄存器Rl傳遞過來的地址數據作為劃分界限確定訪存請求A3訪問主存Al (訪問主存儲器20)、訪問顯存A2 (訪問顯示存儲器50)。此外,路由部件所包含的IO接口可支持CPU通過IO配置總線L2動態修改地址基準寄存器,增強獨立顯卡靈活性。 本發明實施例僅包含兩個路由方向,因此僅需一個地址基準寄存器Rl作為路由表項即可。支持CPU在提交單個任務至加速核心前修改地址基準寄存器配置。本發明實施例路由部件的提供能夠有效規避嵌入式加速核心僅支持唯一數據接口缺陷,支持其對主存數據直接訪問,有效迎合顯示與多媒體類應用數據訪問具有一定隨意性要求。本發明實施例基於嵌入式加速核心構建功能完整的獨立顯卡,可滿足PC機和伺服器等領域對顯示與多媒體處理能力需求。其中,各加速核心彼此獨立,可通過驅動軟體統一管理協作,方便獨立升級;而且,通過增強單個加速核心能力或集成多個相同類型加速核心,可快速提升加速能力,具有很強的擴展性;集成專門視頻加速器,支持各種常見視頻格式編解碼,與主流商業顯卡僅支持H. 264/MPEG-4格式相比,支持格式種類更加豐富、處理能力也大幅加強。可以理解的是,雖然本發明已以較佳實施例披露如上,然而上述實施例並非用以限定本發明。對於任何熟悉本領域的技術人員而言,在不脫離本發明技術方案範圍情況下,都可利用上述揭示的技術內容對本發明技術方案作出許多可能的變動和修飾,或修改為等同變化的等效實施例。因此,凡是未脫離本發明技術方案的內容,依據本發明的技術實質對以上實施例所做的任何簡單修改、等同變化及修飾,均仍屬於本發明技術方案保護的範圍內。
權利要求
1.一種基於嵌入式加速核心的獨立顯卡架構,其特徵在於包括加速部件、互連總線和傳輸部件; 其中,所述加速部件包括顯示控制器、圖形處理器和視頻加速器;所述互連總線包括IO配置總線以及數據傳輸總線;所述傳輸部件包括接口轉換器、直接存儲訪問控制器、存儲控制器、第一路由部件和第二路由部件。
2.根據權利要求I所述的基於嵌入式加速核心的獨立顯卡架構,其特徵在於,所述顯示控制器用於將顯示存儲器中像素數據輸出至顯示裝置;所述圖形處理器用於對圖形類任務進行加速;所述視頻加速器用於對視頻和圖像數據進行編解碼操作。
3.根據權利要求I或2所述的基於嵌入式加速核心的獨立顯卡架構,其特徵在於,所述IO配置總線用於轉發外部訪問各部件的IO請求,以及對顯示存儲器數據的直接訪問;所述數據傳輸總線用於轉發各部件對主存儲器數據的直接訪問請求。
4.根據權利要求I至3之一所述的基於嵌入式加速核心的獨立顯卡架構,其特徵在於,所述接口轉換器用於實現獨立顯卡內總線協議與獨立顯卡外系統接口的協議轉換;所述直接存儲訪問控制器用於實現主存儲器和顯示存儲器之間數據批量傳輸;所述存儲控制器用於管理各部件對顯示存儲器數據的訪問;所述第一路由部件和所述第二路由部件分別用於將數據訪問請求路由至所述顯示存儲器和所述主存儲器。
5.根據權利要求I至4之一所述的基於嵌入式加速核心的獨立顯卡架構,其特徵在於,所述獨立顯卡架構中的各部件通過軟體驅動、管理和協作。
6.根據權利要求I至5之一所述的基於嵌入式加速核心的獨立顯卡架構,其特徵在於,所述存儲控制器支持與IO配置總線相連的第一埠、與顯示控制器相連的第二埠、與圖形處理器相連的第三埠、與視頻加速器相連的第四埠、與直接存儲訪問控制器相連的第五埠的並發訪問。
7.根據權利要求I至6之一所述的基於嵌入式加速核心的獨立顯卡架構,其特徵在於,所述路由部件包括地址基準寄存器以及地址比較邏輯單元;其中,所述地址基準寄存器通過所述IO配置總線獲取配置值,地址比較邏輯單元以從所述地址基準寄存器傳遞過來的地址數據作為劃分界限確定訪問所述主存儲器、訪問所述顯示存儲器。
8.根據權利要求I至7之一所述的基於嵌入式加速核心的獨立顯卡架構,其特徵在於,所述路由部件支持CPU通過所述IO配置總線動態修改地址基準寄存器。
9.根據權利要求I或2所述的基於嵌入式加速核心的獨立顯卡架構,其特徵在於,所述顯示控制器支持單路、雙路甚至更多路顯示輸出。
10.根據權利要求I或2所述的基於嵌入式加速核心的獨立顯卡架構,其特徵在於,所述圖形處理器和所述視頻加速器具有直接訪問主存儲器數據的能力。
全文摘要
一種基於嵌入式加速核心的獨立顯卡架構包括加速部件、互連總線和傳輸部件。顯示控制器用於將顯示存儲器中像素數據輸出至顯示裝置;圖形處理器用於對圖形類任務進行加速;視頻加速器用於對視頻和圖像數據進行編解碼操作。IO配置總線用於轉發外部訪問各部件的IO請求,以及對顯示存儲器數據的直接訪問;數據傳輸總線用於轉發各部件對主存儲器數據的直接訪問請求。接口轉換器用於實現獨立顯卡內總線協議與獨立顯卡外系統接口的協議轉換;直接存儲訪問控制器用於實現主存儲器和顯示存儲器之間數據批量傳輸;存儲控制器用於管理各部件對顯示存儲器數據的訪問;路由部件分別用於將數據訪問請求路由至所述顯示存儲器和所述主存儲器。
文檔編號G06F13/28GK102880587SQ201210380598
公開日2013年1月16日 申請日期2012年10月9日 優先權日2012年10月9日
發明者劉傑, 唐勇, 蔡亮, 畢小建, 陳薇, 葉維, 童磊 申請人:無錫江南計算技術研究所

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀