新四季網

一種圖形處理器光柵化單元的自適應低功耗時鐘門控結構的製作方法

2023-06-15 16:04:56

本發明涉及計算機硬體技術領域,尤其涉及圖形處理器光柵化單元的自適應低功耗時鐘門控結構。



背景技術:

隨著圖形化應用的不斷增加,早期單靠CPU進行圖形繪製的解決方案已經難以滿足成績和技術增長的圖形處理需求,圖形處理器(Graphic Processing Unit,GPU)應運而生。從1999年Nvidia發布第一款GPU產品至今,GPU技術的發展主要經歷了固定功能流水線階段、分離染色器架構階段、統一染色器架構階段,其圖形處理能力不斷提升,應用領域也從最初的圖形繪製逐步擴展到通用計算領域。GPU流水線高速、並行的特徵和靈活的可編程能力,為圖形處理和通用並行計算提供了良好的運行平臺。

目前,我國尚無基於統一染色架構的GPU,各領域顯示控制系統中大量採用國外進口的商用GPU晶片。尤其是在軍用領域中,國外進口商用GPU晶片存在溫度和環境適應性差、無法保證電路本身或配套軟體沒有「後門」、包含大量軍用領域不需要的冗餘功能單元,功耗指標無法滿足要求、商用GPU晶片更新換代快,隨時面臨停產、斷檔,難以滿足武器裝備持續保障等缺陷,在安全性、可靠性、保障性等方面的存在重大隱患。而且,出於政治、軍事、經濟等原因,國外對我國實行技術「封鎖」和產品「壟斷」,難以獲得GPU晶片的底層技術資料,如寄存器資料、詳細內部微架構、核心軟體源碼等,導致GPU功能、性能無法充分發揮,且移植性較差;上述問題嚴重製約了我國顯示系統的獨立研製和自主發展。

尤其是圖形處理器低功耗設計技術,是GPU圖形處理體系結構的核心技術,而光柵化單元是GPU的關鍵核心模塊,突破GPU光柵化單元低功耗設計關鍵技術,研製高性能圖形處理器晶片迫在眉睫。



技術實現要素:

本發明公開了一種圖形處理器光柵化單元的自適應低功耗時鐘門控結構,能夠實時的檢測到當前圖元頂點命令的類型,並根據圖元頂點命令類型對處於空閒狀態的圖元光柵化模塊的工作時鐘進行動態門控,從而降低光柵化單元的功耗。

本發明的技術解決方案是:

一種圖形處理器光柵化單元的自適應低功耗時鐘門控結構,包含光柵化模塊(1)和時鐘與功耗控制模塊(2);

所述光柵化模塊(1)中包含點圖元光柵化模塊(11)、直線圖元光柵化模塊(12)、三角形圖元光柵化模塊(13)、Early-Z單元(16)、片元輸出單元(15),以及圖元頂點命令類型判定單元(14)、頂層命令解析單元(17);

頂層命令解析單元(17)接收圖元頂點命令進行解析,如果解析的圖元頂點命令為點圖元光柵化命令,發送給點圖元光柵化模塊(11);如果解析的圖元頂點命令為直線圖元光柵化命令,發送給直線圖元光柵化模塊(12);如果解析的圖元頂點命令為三角形圖元光柵化命令,發送給三角形圖元光柵化模塊(13);

點圖元光柵化模塊(11)執行點圖元光柵化命令,完成點圖元光柵化功能,片元屬性數據發送給Early-Z單元(16);

直線圖元光柵化模塊(12)執行直線圖元光柵化命令,完成直線圖元光柵化功能,片元屬性數據發送給Early-Z單元(16);

三角形圖元光柵化模塊(13)執行三角形圖元光柵化命令,完成三角形圖元光柵化功能,片元屬性數據發送給Early-Z單元(16);

Early-Z單元(16)對所述執行結果進行提前深度測試,剔除最終不會被看到的片段,將剔除片段的片元屬性數據發送給片元輸出單元(15);

片元輸出單元(15)將所述剔除片段的片元屬性數據輸出;

圖元頂點命令類型判定單元(14)根據頂層命令解析單元(17)接收到的圖元頂點命令的類型向時鐘與功耗控制模塊(2)發送光柵化單元的門控時鐘控制信號,所述光柵化單元的門控時鐘控制信號至少包括3位,分別對應點圖元光柵化模塊、直線圖元光柵化模塊、三角形圖元光柵化模塊,1為有效,0為無效;

時鐘與功耗控制模塊(2)獨立產生光柵化模塊(1)中點圖元光柵化模塊(11)、直線圖元光柵化模塊(12)、三角形圖元光柵化模塊(13)的工作時鐘,並連接到上述三個功能模塊中;時鐘與功耗控制模塊(2)包含分別針對點圖元光柵化模塊(11)、直線圖元光柵化模塊(12)、三角形圖元光柵化模塊(13)的相關時鐘門控電路;解析光柵化單元的門控時鐘控制信號,將門控時鐘控制信號對應位為0的相應光柵化單元的工作時鐘關閉。

本發明的技術效果是:

1、通常來說,光柵化單元是一個完整的功能模塊,已有的低功耗技術都是把這個完整的功能模塊作為整體進行控制,如工作電壓的動態調整技術、時鐘頻率的動態縮放技術等。考慮到在GPU的實際繪製過程中,光柵化單元內部對三個不同類型圖元的光柵化模塊-點圖元光柵化模塊、直線圖元光柵化模塊、三角形圖元光柵化模塊,在同一時刻只有一個處於工作狀態,其它兩個處於空閒狀態。從低功耗的角度來說完全可以對三個光柵化模塊的工作時鐘進行獨立控制。因此,本發明所提方案,不但能夠實現將整個光柵化單元作為整體進行時鐘門控,而且還能夠在更細粒度的層面實現三種不同類型光柵化模塊的獨立時鐘門控,從而實現可以根據圖形繪製場景的行為特徵和實現對光柵化單元的多個工作時鐘的實時動態門控。既能夠動態調節光柵化單元功耗,還能夠顯著增強對光柵化單元功耗控制的靈活性。

附圖說明

圖1是本發明圖形處理器光柵化單元的自適應低功耗時鐘門控結構圖。

具體實施方式

下面結合附圖和具體實施例,對本發明的技術方案進行清楚、完整地表述。顯然,所表述的實施例僅是本發明一部分實施例,而不是全部的實施例,基於本發明中的實施例,本領域技術人員在沒有做出創造性勞動前提所獲得的所有其它實施例,都屬於本發明的保護範圍。

本發明提供一種圖形處理器光柵化單元的自適應低功耗時鐘門控結構,包含光柵化模塊1和時鐘與功耗控制模塊2;

所述光柵化模塊1中包含點圖元光柵化模塊11、直線圖元光柵化模塊12、三角形圖元光柵化模塊13、Early-Z單元16、片元輸出單元15,以及圖元頂點命令類型判定單元14、頂層命令解析單元17;

頂層命令解析單元17接收圖元頂點命令進行解析,如果解析的圖元頂點命令為點圖元光柵化命令,發送給點圖元光柵化模塊11;如果解析的圖元頂點命令為直線圖元光柵化命令,發送給直線圖元光柵化模塊12;如果解析的圖元頂點命令為三角形圖元光柵化命令,發送給三角形圖元光柵化模塊13;

點圖元光柵化模塊11執行點圖元光柵化命令,完成點圖元光柵化功能,片元屬性數據發送給Early-Z單元16;

直線圖元光柵化模塊12執行直線圖元光柵化命令,完成直線圖元光柵化功能,片元屬性數據發送給Early-Z單元16;

三角形圖元光柵化模塊13執行三角形圖元光柵化命令,完成三角形圖元光柵化功能,片元屬性數據發送給Early-Z單元16;

Early-Z單元16對所述執行結果進行提前深度測試,剔除最終不會被看到的片段,將剔除片段的片元屬性數據發送給片元輸出單元15;

片元輸出單元15將所述剔除片段的片元屬性數據輸出;

圖元頂點命令類型判定單元14根據頂層命令解析單元17接收到的圖元頂點命令的類型向時鐘與功耗控制模塊2發送光柵化單元的門控時鐘控制信號,所述光柵化單元的門控時鐘控制信號至少包括3位,分別對應點圖元光柵化模塊、直線圖元光柵化模塊、三角形圖元光柵化模塊,1為有效,0為無效;

時鐘與功耗控制模塊2獨立產生光柵化模塊1中點圖元光柵化模塊11、直線圖元光柵化模塊12、三角形圖元光柵化模塊13的工作時鐘,並連接到上述三個功能模塊中;時鐘與功耗控制模塊2包含分別針對點圖元光柵化模塊11、直線圖元光柵化模塊12、三角形圖元光柵化模塊13的相關時鐘門控電路;解析光柵化單元的門控時鐘控制信號,將門控時鐘控制信號對應位為0的相應光柵化單元的工作時鐘關閉。

實施例

如圖1所示,光柵化單元中包括點圖元光柵化模塊、直線圖元光柵化模塊、三角形圖元光柵化模塊。在任意時刻,上述三個不同類型的光柵化模塊只有一個處於工作狀態。

圖元頂點命令類型判定單元位於光柵化單元內部,根據圖元頂點命令接收模塊接收到的圖元頂點命令類型向時鐘與功耗控制模塊發送光柵化單元的門控時鐘控制信號。光柵化單元的門控時鐘控制信號至少包括3位,分別對應點圖元光柵化模塊、直線圖元光柵化模塊、三角形圖元光柵化模塊,時鐘與功耗控制模塊根據來自圖元頂點命令類型判定單元的時鐘門控控制信號決定應該如何對三個光柵化模塊的工作時鐘進行門控。

門控時鐘控制信號的某一位如果為0,則表示將其對應的時鐘關閉,即被門控;門控時鐘控制信號的某一位如果為1,則表示將其對應的時鐘打開。

時鐘與功耗控制模塊為光柵化單元中的3個獨立的光柵化功能子模塊提供獨立的工作時鐘,即使PLL產生3個光柵化單元的工作時鐘;3個光柵化單元的工作時鐘分別連接到時鐘與功耗控制模塊的3個獨立的時鐘門控電路中。經過門控電路處理後,輸出的時鐘分別連接到光柵化單元的點圖元光柵化模塊、直線圖元光柵化模塊、三角形圖元光柵化模塊中。

時鐘與功耗控制模塊包含針對光柵化單元中的3個獨立的光柵化功能子模塊的3個獨立的時鐘門控電路。每一個時鐘門控電路與一個光柵化功能子模塊相對應,在光柵化單元中的圖元頂點命令類型判定單元輸出的時鐘門控控制信號對應位為0的情況下,將對相應光柵化功能子模塊的工作時鐘關閉,從而實現對相應光柵化功能子模塊工作時鐘的門控。

如果光柵化單元接收到的是點圖元對應的圖元頂點命令,則圖元頂點命令類型判定單元輸出的時鐘門控控制信號為100,表示將點圖元光柵化模塊的工作時鐘打開,將直線圖元光柵化模塊和三角形圖元光柵化模塊的工作時鐘關閉。

如果光柵化單元接收到的是直線圖元對應的圖元頂點命令,則圖元頂點命令類型判定單元輸出的時鐘門控控制信號為010,表示將直線圖元光柵化模塊的工作時鐘打開,將點圖元光柵化模塊和三角形圖元光柵化模塊的工作時鐘關閉。

如果光柵化單元接收到的是三角形圖元對應的圖元頂點命令,則圖元頂點命令類型判定單元輸出的時鐘門控控制信號為001,表示將三角形圖元光柵化模塊的工作時鐘打開,將點圖元光柵化模塊和直線圖元光柵化模塊的工作時鐘關閉。

最後應說明的是,以上實施例僅用以說明本發明的技術方案,而非對其限制;儘管參照前述實施例對本發明進行了詳細的說明,本領域的普通技術人員應當理解;其依然可以對前述各實施例記載的技術方案進行修改,或者對其中部分技術特徵進行等同替換;而這些修改或者替換,並不使相應技術方案的本質脫離本發明各實施例技術方案的精神和範圍。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀