一種圖形處理器光柵化單元的自適應低功耗時鐘門控結構的製作方法
2023-06-15 16:04:56
本發明涉及計算機硬體技術領域,尤其涉及圖形處理器光柵化單元的自適應低功耗時鐘門控結構。
背景技術:
隨著圖形化應用的不斷增加,早期單靠CPU進行圖形繪製的解決方案已經難以滿足成績和技術增長的圖形處理需求,圖形處理器(Graphic Processing Unit,GPU)應運而生。從1999年Nvidia發布第一款GPU產品至今,GPU技術的發展主要經歷了固定功能流水線階段、分離染色器架構階段、統一染色器架構階段,其圖形處理能力不斷提升,應用領域也從最初的圖形繪製逐步擴展到通用計算領域。GPU流水線高速、並行的特徵和靈活的可編程能力,為圖形處理和通用並行計算提供了良好的運行平臺。
目前,我國尚無基於統一染色架構的GPU,各領域顯示控制系統中大量採用國外進口的商用GPU晶片。尤其是在軍用領域中,國外進口商用GPU晶片存在溫度和環境適應性差、無法保證電路本身或配套軟體沒有「後門」、包含大量軍用領域不需要的冗餘功能單元,功耗指標無法滿足要求、商用GPU晶片更新換代快,隨時面臨停產、斷檔,難以滿足武器裝備持續保障等缺陷,在安全性、可靠性、保障性等方面的存在重大隱患。而且,出於政治、軍事、經濟等原因,國外對我國實行技術「封鎖」和產品「壟斷」,難以獲得GPU晶片的底層技術資料,如寄存器資料、詳細內部微架構、核心軟體源碼等,導致GPU功能、性能無法充分發揮,且移植性較差;上述問題嚴重製約了我國顯示系統的獨立研製和自主發展。
尤其是圖形處理器低功耗設計技術,是GPU圖形處理體系結構的核心技術,而光柵化單元是GPU的關鍵核心模塊,突破GPU光柵化單元低功耗設計關鍵技術,研製高性能圖形處理器晶片迫在眉睫。
技術實現要素:
本發明公開了一種圖形處理器光柵化單元的自適應低功耗時鐘門控結構,能夠實時的檢測到當前圖元頂點命令的類型,並根據圖元頂點命令類型對處於空閒狀態的圖元光柵化模塊的工作時鐘進行動態門控,從而降低光柵化單元的功耗。
本發明的技術解決方案是:
一種圖形處理器光柵化單元的自適應低功耗時鐘門控結構,包含光柵化模塊(1)和時鐘與功耗控制模塊(2);
所述光柵化模塊(1)中包含點圖元光柵化模塊(11)、直線圖元光柵化模塊(12)、三角形圖元光柵化模塊(13)、Early-Z單元(16)、片元輸出單元(15),以及圖元頂點命令類型判定單元(14)、頂層命令解析單元(17);
頂層命令解析單元(17)接收圖元頂點命令進行解析,如果解析的圖元頂點命令為點圖元光柵化命令,發送給點圖元光柵化模塊(11);如果解析的圖元頂點命令為直線圖元光柵化命令,發送給直線圖元光柵化模塊(12);如果解析的圖元頂點命令為三角形圖元光柵化命令,發送給三角形圖元光柵化模塊(13);
點圖元光柵化模塊(11)執行點圖元光柵化命令,完成點圖元光柵化功能,片元屬性數據發送給Early-Z單元(16);
直線圖元光柵化模塊(12)執行直線圖元光柵化命令,完成直線圖元光柵化功能,片元屬性數據發送給Early-Z單元(16);
三角形圖元光柵化模塊(13)執行三角形圖元光柵化命令,完成三角形圖元光柵化功能,片元屬性數據發送給Early-Z單元(16);
Early-Z單元(16)對所述執行結果進行提前深度測試,剔除最終不會被看到的片段,將剔除片段的片元屬性數據發送給片元輸出單元(15);
片元輸出單元(15)將所述剔除片段的片元屬性數據輸出;
圖元頂點命令類型判定單元(14)根據頂層命令解析單元(17)接收到的圖元頂點命令的類型向時鐘與功耗控制模塊(2)發送光柵化單元的門控時鐘控制信號,所述光柵化單元的門控時鐘控制信號至少包括3位,分別對應點圖元光柵化模塊、直線圖元光柵化模塊、三角形圖元光柵化模塊,1為有效,0為無效;
時鐘與功耗控制模塊(2)獨立產生光柵化模塊(1)中點圖元光柵化模塊(11)、直線圖元光柵化模塊(12)、三角形圖元光柵化模塊(13)的工作時鐘,並連接到上述三個功能模塊中;時鐘與功耗控制模塊(2)包含分別針對點圖元光柵化模塊(11)、直線圖元光柵化模塊(12)、三角形圖元光柵化模塊(13)的相關時鐘門控電路;解析光柵化單元的門控時鐘控制信號,將門控時鐘控制信號對應位為0的相應光柵化單元的工作時鐘關閉。
本發明的技術效果是:
1、通常來說,光柵化單元是一個完整的功能模塊,已有的低功耗技術都是把這個完整的功能模塊作為整體進行控制,如工作電壓的動態調整技術、時鐘頻率的動態縮放技術等。考慮到在GPU的實際繪製過程中,光柵化單元內部對三個不同類型圖元的光柵化模塊-點圖元光柵化模塊、直線圖元光柵化模塊、三角形圖元光柵化模塊,在同一時刻只有一個處於工作狀態,其它兩個處於空閒狀態。從低功耗的角度來說完全可以對三個光柵化模塊的工作時鐘進行獨立控制。因此,本發明所提方案,不但能夠實現將整個光柵化單元作為整體進行時鐘門控,而且還能夠在更細粒度的層面實現三種不同類型光柵化模塊的獨立時鐘門控,從而實現可以根據圖形繪製場景的行為特徵和實現對光柵化單元的多個工作時鐘的實時動態門控。既能夠動態調節光柵化單元功耗,還能夠顯著增強對光柵化單元功耗控制的靈活性。
附圖說明
圖1是本發明圖形處理器光柵化單元的自適應低功耗時鐘門控結構圖。
具體實施方式
下面結合附圖和具體實施例,對本發明的技術方案進行清楚、完整地表述。顯然,所表述的實施例僅是本發明一部分實施例,而不是全部的實施例,基於本發明中的實施例,本領域技術人員在沒有做出創造性勞動前提所獲得的所有其它實施例,都屬於本發明的保護範圍。
本發明提供一種圖形處理器光柵化單元的自適應低功耗時鐘門控結構,包含光柵化模塊1和時鐘與功耗控制模塊2;
所述光柵化模塊1中包含點圖元光柵化模塊11、直線圖元光柵化模塊12、三角形圖元光柵化模塊13、Early-Z單元16、片元輸出單元15,以及圖元頂點命令類型判定單元14、頂層命令解析單元17;
頂層命令解析單元17接收圖元頂點命令進行解析,如果解析的圖元頂點命令為點圖元光柵化命令,發送給點圖元光柵化模塊11;如果解析的圖元頂點命令為直線圖元光柵化命令,發送給直線圖元光柵化模塊12;如果解析的圖元頂點命令為三角形圖元光柵化命令,發送給三角形圖元光柵化模塊13;
點圖元光柵化模塊11執行點圖元光柵化命令,完成點圖元光柵化功能,片元屬性數據發送給Early-Z單元16;
直線圖元光柵化模塊12執行直線圖元光柵化命令,完成直線圖元光柵化功能,片元屬性數據發送給Early-Z單元16;
三角形圖元光柵化模塊13執行三角形圖元光柵化命令,完成三角形圖元光柵化功能,片元屬性數據發送給Early-Z單元16;
Early-Z單元16對所述執行結果進行提前深度測試,剔除最終不會被看到的片段,將剔除片段的片元屬性數據發送給片元輸出單元15;
片元輸出單元15將所述剔除片段的片元屬性數據輸出;
圖元頂點命令類型判定單元14根據頂層命令解析單元17接收到的圖元頂點命令的類型向時鐘與功耗控制模塊2發送光柵化單元的門控時鐘控制信號,所述光柵化單元的門控時鐘控制信號至少包括3位,分別對應點圖元光柵化模塊、直線圖元光柵化模塊、三角形圖元光柵化模塊,1為有效,0為無效;
時鐘與功耗控制模塊2獨立產生光柵化模塊1中點圖元光柵化模塊11、直線圖元光柵化模塊12、三角形圖元光柵化模塊13的工作時鐘,並連接到上述三個功能模塊中;時鐘與功耗控制模塊2包含分別針對點圖元光柵化模塊11、直線圖元光柵化模塊12、三角形圖元光柵化模塊13的相關時鐘門控電路;解析光柵化單元的門控時鐘控制信號,將門控時鐘控制信號對應位為0的相應光柵化單元的工作時鐘關閉。
實施例
如圖1所示,光柵化單元中包括點圖元光柵化模塊、直線圖元光柵化模塊、三角形圖元光柵化模塊。在任意時刻,上述三個不同類型的光柵化模塊只有一個處於工作狀態。
圖元頂點命令類型判定單元位於光柵化單元內部,根據圖元頂點命令接收模塊接收到的圖元頂點命令類型向時鐘與功耗控制模塊發送光柵化單元的門控時鐘控制信號。光柵化單元的門控時鐘控制信號至少包括3位,分別對應點圖元光柵化模塊、直線圖元光柵化模塊、三角形圖元光柵化模塊,時鐘與功耗控制模塊根據來自圖元頂點命令類型判定單元的時鐘門控控制信號決定應該如何對三個光柵化模塊的工作時鐘進行門控。
門控時鐘控制信號的某一位如果為0,則表示將其對應的時鐘關閉,即被門控;門控時鐘控制信號的某一位如果為1,則表示將其對應的時鐘打開。
時鐘與功耗控制模塊為光柵化單元中的3個獨立的光柵化功能子模塊提供獨立的工作時鐘,即使PLL產生3個光柵化單元的工作時鐘;3個光柵化單元的工作時鐘分別連接到時鐘與功耗控制模塊的3個獨立的時鐘門控電路中。經過門控電路處理後,輸出的時鐘分別連接到光柵化單元的點圖元光柵化模塊、直線圖元光柵化模塊、三角形圖元光柵化模塊中。
時鐘與功耗控制模塊包含針對光柵化單元中的3個獨立的光柵化功能子模塊的3個獨立的時鐘門控電路。每一個時鐘門控電路與一個光柵化功能子模塊相對應,在光柵化單元中的圖元頂點命令類型判定單元輸出的時鐘門控控制信號對應位為0的情況下,將對相應光柵化功能子模塊的工作時鐘關閉,從而實現對相應光柵化功能子模塊工作時鐘的門控。
如果光柵化單元接收到的是點圖元對應的圖元頂點命令,則圖元頂點命令類型判定單元輸出的時鐘門控控制信號為100,表示將點圖元光柵化模塊的工作時鐘打開,將直線圖元光柵化模塊和三角形圖元光柵化模塊的工作時鐘關閉。
如果光柵化單元接收到的是直線圖元對應的圖元頂點命令,則圖元頂點命令類型判定單元輸出的時鐘門控控制信號為010,表示將直線圖元光柵化模塊的工作時鐘打開,將點圖元光柵化模塊和三角形圖元光柵化模塊的工作時鐘關閉。
如果光柵化單元接收到的是三角形圖元對應的圖元頂點命令,則圖元頂點命令類型判定單元輸出的時鐘門控控制信號為001,表示將三角形圖元光柵化模塊的工作時鐘打開,將點圖元光柵化模塊和直線圖元光柵化模塊的工作時鐘關閉。
最後應說明的是,以上實施例僅用以說明本發明的技術方案,而非對其限制;儘管參照前述實施例對本發明進行了詳細的說明,本領域的普通技術人員應當理解;其依然可以對前述各實施例記載的技術方案進行修改,或者對其中部分技術特徵進行等同替換;而這些修改或者替換,並不使相應技術方案的本質脫離本發明各實施例技術方案的精神和範圍。