新四季網

一種指令移除裝置及其方法

2023-12-02 06:23:21

專利名稱:一種指令移除裝置及其方法
技術領域:
本發明涉及一種指令移除裝置及其方法,尤指一種可用於圖像處理程序中的簡單指令移除裝置及其方法。
背景技術:
像素著色器(Pixel Shader,PS)可用於處理在3D圖像處理器(3-Dimensional Graphic Processor,GPU)或3D圖像加速器(3-DimensionalGraphic Accelerator,GPU整合入系統晶片組的情形)中像素的可程序化(Programmable)部份。近來,一些繪圖應用程式接口(Application ProgramInterface,API)加入像素著色器於其中,如DirectX規格由8.0版起加入的像素著色器,及OpenGL由1.5版加入的圖像片段處理器(FragmentProcessor),都各自定義了類似彙編語言(Assembly Language)的著色器語言(Shader Language)。
請參閱圖1,傳統的圖像處理器的處理程序包括若干主要步驟用以對像素進行處理。首先,由頂點處理程序(Vertex Processing Procedure)用以執行幾何轉換與光線處理程序(Transform and Lighting Process,TLProcess)902,並執行程序904以將該頂點切割(Clipping)至視窗(Viewport)。接著,用一個三角形圖像設定程序(Triangle Setup Process)906來結合該頂點使成為各個三角形圖像,並以二維像素鋪滿每個三角形圖像。這些二維像素會被傳送出去以執行像素處理程序。在像素處理程序中,有一個材質處理單元(Texture Unit,TU或稱為材質單元)908,可依據像素位置及對應三角形頂點中的材質坐標(Texture Coordinate),進行內插運算(Interpolate)從而求出該二維像素的材質坐標。該二維像素的材質坐標從材質圖(Texture Map)中取樣(Sample)出像素的材質顏色。同時,一個色彩內插器(Color Interpolator,CI)910依據像素位置及對應三角形頂點中的頂點顏色,內插運算出各像素的頂點顏色。而後,由混色程序(BlendingProcedure)912用以處理該材質顏色與像素顏色以獲得該像素的最終顏色。最後,用深度處理程序(Depth Processing Procedure)914來比較出最靠近視窗的像素並將其最終顏色畫出,以產生完整的畫面(Frame)。
在近來的繪圖應用程式接口中,該頂點處理程序與像素處理程序已被改變為可程序化,以符合為處理更多圖形特效所採用的硬體加速運算的要求。如圖2所示,在DirectX規格中的頂點著色器916(在OpenGL規格中為頂點處理器,vertex processor)即用以取代前述像素處理程序中的混色程序。頂點著色器916與像素著色器926為具有特殊指令的通用處理器(GeneralPurpose Processor)用以執行相應著色器語言的程序。頂點著色器916執行頂點著色器程式(Vertex Shader Program)以處理頂點層次的特效,而像素著色器926執行一像素著色器程式樣(Pixel Shader Program)以處理更精緻的特效。因此,更多特效可藉由頂點著色器程式與像素著色器程式的配合來達成,以改進硬體的效能。
另一現有技術的像素著色器如圖3所示,其即由在像素處理程序中材質顏色與頂點顏色的可程式化混色程序所演進而來。由材質著色器932所得到的材質顏色與由色彩內插器934所得到的頂點顏色會被像素著色程式與像素著色器936進行混色處理,以獲得各像素的最終顏色與深度,再傳給深度處理程序進行處理。
請續參閱圖4。目前最新的像素著色器可執行更複雜的運算處理以實現更精緻的光影特效與表面處理特效。像素著色器946被要求可處理算術運算指令(Algorithmic Instruction)以對來自材質處理單元942的材質坐標執行內插運算,再以特殊的材質擷取指令(Texture Load Instruction,如DirectX規格中的texld指令)將處理後的坐標傳回材質處理單元942從材質圖中取樣出材質顏色,再傳回像素著色器946做混色處理。
圖5為在DirectX規格中像素著色器程式的一個實例。DirectX規格的像素著色器定義了數組緩存器,包括一般緩存器rn、材質坐標緩存器tn、材質編號緩存器sn、頂點顏色緩存器vn及最終顏色緩存器oCn。材質坐標系由材質處理單元950進行內插運算獲得,而材質編號則用以指定材質處理單元950中的材質編號。該像素著色器程式包括四個主要階段(a)坐標運算;(b)材質處理;(c)混色處理;及(d)指令發出。
(a)在坐標運算階段,tn值與rn值被進行一般算術運算,運算所得的結果存於該一般緩存器rn中;
(b)在材質處理階段,將材質坐標緩存器tn與一般緩存器rn中所存的坐標以一材質擷取指令texld通知材質處理單元950從材質編號緩存器sn所指定的材質圖中取樣出材質顏色。該材質顏色信息將被傳回至一般緩存器rn;(c)在混色處理階段,將存於一般緩存器rn的材質顏色與存於頂點顏色緩存器vn的頂點顏色以一般算術運算混色,並將該運算結果存於一般緩存器rn中;(d)在指令發出階段,將存於一般緩存器rn中的最終顏色信息傳出以執行一深度處理程序。
圖6為某一現有技術之像素著色器的組件方塊圖。首先,像素著色器程式由被輸入至指令陣列(Instruction Queue)970,由三角形圖像設定程序得到像素方塊(Tile)中的每個像素必須被以指令隊列970中的所有指令執行過一次,然後由最後發出階段的指令將結果傳給深度處理程序972。程式計數器(Program Counter,PC)965擷取該指令並交由解碼器(Decoder)966進行解碼,以執行算術邏輯單元(Algorithmic Logic Unit,ALU)968的運算。
在指令間存在有資料相依性(Data Dependency)和控制相依性(ControlDependency)的問題,但像素間並不存在有資料或控制相依性。所謂資料相依性意是指若一個在後指令必須根據其在前指令的執行結果才能加以執行,則該在後指令就必須等待該在前指令處理完成後,才能開始進行處理。所謂控制相依性意是指除非具有複雜的資料相依性判別裝置來實現亂序執行(Out-of-order Execution),否則某一程式會根據各指令本身的順序來依序執行,亦即,每個指令都要等前一個指令完成,才能開始執行。因此,在一個執行時脈(Execution Cycle)中可同時處理數個像素,而且像素著色器可累積相同指令的多個時脈,在同一處理批次(Batch)中處理數個像素的執行時脈。藉此,在該處理批次的最後時脈所處理的像素髮出後,該處理批次的最初時脈所處理的像素已處理完成且可被發出,因此可避免或減少資料相依性所造成的管線阻滯(Pipeline Bubble)。然而,假設在同一處理批次中可處理N個像素,則像素著色器的規格即必須設置N組緩存器以存放N個像素於像素著色器960中。
假設算術邏輯單元968可於一時脈中同時執行W個像素,且其處理常用指令的最長執行時脈為L個時脈,則像素著色器960需要N個緩存器來儲存在同一處理批次中須同時執行的N個像素,其中N必須等於或大於L×W。否則,當在同一處理批次中所有可同時執行的像素都已執行,但最初執行的像素卻尚未完成,就無法繼續執行下個指令,而造成管線的間斷性節流(Pipeline Throttling)。
由於材質擷取指令texld須進行複雜的內插運算,故其為常用指令中執行時脈最長的指令。材質擷取指令texld必須由材質處理單元956從指定的材質圖中取樣出材質顏色,再傳回給像素著色器960。而取樣的動作是很複雜的內插運算,且材質圖又是存放在內存中,就算以內存快取(Memory Cache)來加速,都要30個時脈以上,當發生快取失誤(Cache Miss)時更要上百個時脈來由內存讀取。隨著每一代像素著色器新規格的緩存器數量倍增(目前約由300bit/pixel增至600bit/pixel),以及算術邏輯單元968每個時脈可平行執行的像素運算倍增(近期由1pixel/cycle增至16pixel/cycle),像素著色器960愈來愈不可能存放足夠的緩存器數量。如此會造成大量的管線間斷性節流,使得增加的運算頻寬無用化,而隨著材質圖愈來愈精緻,內存快取的失誤率(Miss Rate)也會愈來愈高。因此,具有長執行時脈的材質擷取指令texld會造成影響像素處理效能的嚴重問題。
近來愈來愈多的光線與陰影特效也會造成更高的快取失誤率,如曲面法線貼圖(Normal Map)技術。曲面法線貼圖技術為一種先進的皺面貼圖(Bump-mapping)技術,其包含多邊形對象詳細信息的特殊材質資料。然而,曲面法線貼圖技術需要更大的資料量,因而會導致更高的材質快取失誤率。
這種管線嚴重的間斷性節流起因是因為材質擷取指令texld和其它指令有數據和控制相依性。如圖7所示的例子,某程式的第一個指令為一個材質擷取指令texld,其後為其它指令。在此例中僅有一個材質擷取指令texld在此程式中。圖7例示管線的執行排程並標示出像素著色器與材質處理單元的執行與閒置狀態。假設該像素著色器以具有Lpixel/cycle頻寬(bandwidth)的算術邏輯單元在同一處理批次可執行N個像素。該材質處理單元根據一材質擷取指令texld取樣出材質顏色後傳回給像素著色器,而其它指令必須等到材質處理單元處理完該材質擷取指令texld後方可開始執行。由於N小於L,故像素著色器在執行其它指令前必須閒置L-N個時脈。接著,在像素著色器處理完其它指令前,由於材質處理單元將無法收到下N個像素的材質擷取指令texld,故材質處理單元必須閒置。此時材質處理單元變成效能瓶頸,故其閒置時間會造成顯著的管線間斷性節流。並且當其它指令的數量i增加時,材質處理單元的閒置時間將會倍增為N×i。
美國專利公告第5,978,871號揭示一種分解高速緩存操作與特定結構功能的分層方法,其利用一快取控制器以允許複雜的運算可被分解為數個相等的簡單運算。可將基本操作的結構變化態樣轉換成獨立的高速緩存和結構性,並且加以分別處理。以該邏輯運算可簡化複雜的操作並且提高效能。然而,該分解高速緩存操作與特定結構功能的分層方法並不適用於指令無法被分解為數個相同簡單指令的情況。
美國專利公告第6,609,190號揭示了一種處理器、數據處理系統和處理器執行指令的相關方法。該處理器可分派指令至一個發出單元。該發出單元包括主要發出陣列和次要發出陣列。如果當前的指令不滿足被發出的條件,則被存儲在主要發出陣列中。如果當前的指令滿足被發出的條件,則被存儲在次要發出陣列中。處理器從主要發出陣列的指令中確定要發出的下一個指令。如果指令依賴於另一個指令的執行結果,則可以從主要發出陣列中轉移到次要發出陣列中。然而,被分派至次要發出陣列的指令仍須在處理器的執行管線中等待,直到該指令被判定為可執行或去除。
綜上所述可知,即使指令間不存在數據相依性,材質擷取指令texld與其它指令間的控制相依性仍會造成嚴重的管線間斷性間斷性節流。因此必須消除材質擷取指令texld與其它指令間的控制相依性以增進圖像處理效能。

發明內容本發明的目的在於提供一種指令移除裝置及其方法,其可用以移除在圖像處理程序中的簡單指令。
本發明的另一目的在於提供一種指令移除裝置及其方法,其可用以降低在一個圖像處理程序中材質處理單元的閒置時間。
為實現上述目的,本發明採用如下技術方案本發明指令移除裝置及其方法,該指令移除裝置可掃描圖像處理程式以決定其中是否具有簡單材質擷取指令。而該簡單材質擷取指令將會被直接傳送至材質處理單元並從一個材質指令集中器中移除,以避免像素著色器在該材質處理單元處理該簡單材質擷取指令之前先執行該指令。
該方法用以偵測與移除該簡單材質擷取指令,其包括以下步驟步驟一開始;步驟二載入原始像素處理程式;步驟三清除材質指令表;步驟四掃描該原始像素處理程式中的一指令;步驟五對該指令進行解碼;步驟六判別該指令是否為簡單材質指令,若該指令為簡單材質指令則進行步驟七,否則進行步驟八;步驟七檢查該材質指令表是否已滿,若該材質指令表已滿則進行步驟八,否則進行步驟九;步驟八將該指令寫入新像素處理程式中;步驟九將該簡單材質指令寫入該材質指令表中;步驟十判斷是否仍有其它指令,若有其它指令則進行步驟四,否則進行步驟十一;步驟十一 準備執行該新像素處理程式並將材質處理命令傳送至材質處理單元;步驟十二 結束。
與現有技術相比,本發明具有以下優點(1)可改進圖像處理程序的效能;(2)可減少該材質處理單元的閒置時間;以及(3)可提供簡單指令移除裝置與方法以有效地利用被指派給該圖像處理程序的實體緩存器。

下面結合附圖和實施例對本發明進一步說明圖1為一現有技術圖像處理器的處理程序圖。
圖2為另一現有技術圖像處理器的處理程序圖。
圖3為一現有技術像素處理程序圖。
圖4為另一現有技術像素處理程序圖。
圖5為DirectX規格中像素著色器程序的一個例子。
圖6為一現有技術像素著色器的組件方塊圖。
圖7為現有技術像素著色器與材質處理單元的執行排程示意圖。
圖8為具有本發明指令移除裝置的圖像處理器的組件方塊圖。
圖9為本發明掃描與移除簡單材質擷取指令的一個實施例。
圖10為本發明掃描與移除簡單材質擷取指令的另一個實施例。
圖11為本發明指令移除裝置的一個實施例。
圖12為本發明指令移除裝置的簡化實施例。
圖13為本發明指令移除裝置的執行排程圖。
圖14為本發明指令移除裝置的像素著色器與材質處理單元的執行排程圖。
圖15為本發明指令移除裝置的像素著色器與材質處理單元的另一執行排程圖。
圖16為本發明指令移除方法的步驟流程圖。
圖17為本發明指令移除方法的另一步驟流程圖。
主要元件符號說明22簡單指令移除裝置24指令掃描裝置26材質擷取指令集中器27材質擷取指令轉換單元28、29材質擷取指令表30指令過濾器32材質處理單元34像素著色器36、38、48原始圖像處理程序42原始像素著色器程序44、50簡單材質擷取指令46新像素著色器程序52新圖像處理程序
具體實施方式本發明一種指令移除裝置及其方法,其可用以移除在圖像處理程序中的簡單指令。請注意以下的實施例是以DirectX規格來說明與例示。而本發明所揭示的新穎架構與方法亦可實現於其它圖像處理程式語言或硬體中,如OpenGL的著色器語言及硬體。
本發明中,簡單材質擷取指令意指該材質擷取指令的材質坐標是直接由材質處理單元經內插運算所得出的材質坐標,亦即該材質擷取指令的材質坐標未經過像素著色器(或其它像素處理單元)處理。在DirectX規格中就是指該材質擷取指令的材質坐標為tn的情形,若該材質擷取指令並非為簡單材質擷取指令,則該材質坐標為rn。一個簡單材質擷取指令的操作要素(Operation Factor)包括一目標緩存器rn、一材質編號緩存器sn及一材質坐標來源緩存器tn。在DirectX規格中簡單材質擷取指令的格式為[texldrn,sn,tn]。材質處理單元可直接存取該簡單材質擷取指令之材質而無須經過像素著色器的處理。故該簡單材質擷取指令可從須先經由該像素著色器的程式中移除。
圖8為具有本發明指令移除裝置的圖像處理器的組件方塊圖。圖像處理器20包括簡單指令移除裝置22、材質處理單元32與像素著色器34。該簡單指令移除裝置22包括指令掃描裝置24、材質擷取指令集中器26與指令過濾器30。指令過濾器30可對一原始程式36中的指令進行解碼與掃描,以根據該指令的靜態模式(Static Status or Non-dynamic Status)來判斷該指令是否為簡單材質擷取指令,在DirectX規格中即意指該材質擷取指令的材質坐標為tn。
圖9為掃描與移除一簡單材質擷取指令的一個例子。當一個簡單材質擷取指令[texld r1,s1,t0]在原始程式中被簡單指令移除裝置22發現時,該簡單材質擷取指令[texld r1,s1,t0]會被存放於一個材質擷取指令表29中。在簡單指令移除裝置22的指令掃描裝置24掃描過該原始程式後,指令過濾器24會將該簡單材質擷取指令[texld r1,s1,t0]從該原始程序中濾除,而此時該簡單材質擷取指令[texld r1,s1,t0]已被寫入該材質擷取指令表29。
圖10為本發明掃描與移除簡單材質擷取指令的另一個實施例。與圖9中所示實施例相較,此實施例是以一個材質擷取指令轉換單元27替代材質擷取指令集中器26。材質擷取指令轉換單元27用以轉換該簡單材質擷取指令並將其傳送至材質處理單元32以供執行。
請參閱圖11,常見的像素著色器程式42中的一個簡單材質擷取指令會由本發明的指令移除裝置22移除。指令移除裝置22先掃描原始程式42並發現一個簡單材質擷取指令[texld r2,s1,t2](即該簡單材質擷取指令[texld r2,s1,t2]的材質坐標為t2),接著簡單材質擷取指令[texld r2,s1,t2]會被傳送至材質處理單元32以直接取得該簡單材質擷取指令[texldr2,s1,t2]的材質信息。同時該簡單材質擷取指令[texld r2,s1,t2]會被從原始程式42中移除。在像素著色器所執行的原始程式中的指令具有程式計數器(Program Counter)所產生的順序關係,而在材質處理單元中的材質擷取指令並無控制相依性。因此,材質處理單元可更有效率地存取材質信息而不受控制相依性的限制。
本發明指令移除裝置可以硬體或軟體的方式來實現。以軟體方式實現時,該指令移除裝置可為一個獨立的應用程式(Application Program)、一個程式載入程式(Program Loader)或一個裝置驅動程式(Device Driver Program)的一部份。若為裝置驅動程式的一部份,則可附加於一程式編輯器(ProgramCompiler)上。而以硬體方式實現時,該指令移除裝置可內含於一個圖像處理器(Graphic Processor,GPU)或像素著色器中,該指令移除裝置須位於像素著色器指令擷取(Fetch)或解碼(Decode)之前。
圖12為本發明指令移除裝置的一個簡化實施例。原始程式48包括兩指令[texld r1,s1,t0]與[mov oC0,r1]。由於該指令[texld r1,s1,t0]為簡單材質擷取指令(因其材質坐標為t0),故指令移除裝置22將把該簡單材質擷取指令[texld r1,s1,t0]從原始程式48中移除並將該指令傳送至材質處理單元32。
請參閱圖13。其上半部為不具有簡單材質擷取指令移除裝置的指令執行流程圖,而下半部則為具有簡單材質擷取指令移除裝置的情形。在圖13的上半部的情形時,由於簡單材質擷取指令並未從原始程式中被移除,故當像素著色器在處理非簡單材質擷取指令時,材質處理單元必須閒置N×i個時脈,其中N代表該像素著色器在同一批次可執行的像素數量,而i代表非簡單材質擷取指令的數量。在圖13下半部的情形時,該簡單材質擷取指令由材質處理單元直接執行,故此時像素著色器可同時執行下一批N個像素材質擷取的動作。由於簡單材質擷取指令不須依照該像素著色器的控制順序或頻寬,故簡單材質擷取指令無須等待該像素著色器的執行結果。此外,該指令移除裝置亦可設計為可檢查原始程式在靜態模式下的資料相依性,以節省必須設置複雜的像素處理硬體來檢查資料相依性的成本。因此,本發明之指令移除裝置可減少材質處理單元的閒置時間,使材質處理單元保持連續運作,以提升圖像處理程序之效能。
圖14為較詳細的像素著色器與材質處理單元的處理流程圖,以比較具備有指令移除裝置與不具有指令移除裝置的情形。在該例中,假設像素著色器與材質處理單元在同一批次可執行N個像素,而材質處理單元執行每個指令需要L個時脈。如同圖13的上半部所示,圖14上半部不具有指令移除裝置的情形時,材質處理單元必須閒置等待像素著色器執行完同一批次中的非簡單材質擷取指令,才能繼續執行。而在圖14下半部具有指令移除裝置的情形時,材質處理單元可連續地執行簡單材質擷取指令而無須等待該像素著色器的執行結果。因此,與不具備指令移除裝置的情形相比,該材質處理單元每執行N個像素可節省N×i個時脈,其中N代表該像素著色器在同一批次可執行的像素數量,而i代表非簡單材質擷取指令的數量。
相較於圖14所示,圖15為一更詳細的像素著色器與材質處理單元的處理流程圖。在圖15所示的例子中,該原始程序包含一個簡單材質擷取指令[texld r1,s1,t0]與一其它指令[mov oC0,r1],且該像素著色器與材質處理單元在同一批次可執行4個像素。如同對圖14的說明,則具有指令移除裝置的該材質處理單元每執行4個像素可節省4個時脈。
圖16為本發明指令移除方法的步驟流程圖。該指令移除方法包括以下步驟步驟202 開始;步驟204 載入原始像素處理程式;步驟206 清除材質擷取指令表;步驟208 掃描該原始像素處理程式中的一個指令;步驟210 對該指令進行解碼;步驟212 判別該指令是否為簡單材質指令,若該指令為簡單材質指令則進行步驟214,否則進行步驟216;步驟214 檢查材質擷取指令表是否已滿,若該材質擷取指令表已滿則進行步驟216,否則進行步驟218;步驟216 將該指令寫入新像素處理程序中;步驟218 將該簡單材質指令寫入該材質擷取指令表中;步驟220 判斷是否仍有其它指令,若有其它指令則進行步驟208,否則進行步驟222;步驟222 準備執行該新像素處理程序並將材質處理命令傳送至材質處理單元;步驟224 結束。
請參閱圖17,為本發明指令移除方法的另一步驟流程圖。圖10所示的實施例是以材質擷取指令轉換單元27替代圖9中所示的材質擷取指令集中器26,而圖17配合圖10實施例的指令移除方法步驟流程圖。該指令移除方法包括以下步驟步驟302 開始;步驟304 載入原始像素處理程式;步驟306 令K值為0,其中K為正整數;步驟308 掃描該原始像素處理程式中的一個指令;步驟310 對該指令進行解碼;步驟312 判別該指令是否為簡單材質指令,若該指令為簡單材質指令則進行步驟314,否則進行步驟316;步驟314 檢查該K值是否與材質處理單元中所預設的材質擷取指令表的容量相等,若該K值相等於材質擷取指令表的容量則進行步驟316,否則進行步驟318;步驟316 將該指令寫入新像素處理程式中;步驟318 將該簡單材質指令轉換為材質擷取命令,並發出該材質擷取命令至材質處理單元,同時令K=K+1;步驟320 判斷是否仍有其它指令,若有其它指令則進行步驟308,否則進行步驟322;步驟322 準備執行該新像素處理程式;步驟324 結束。
本發明的指令移除裝置及其方法,可掃描圖像處理程式中是否具有簡單材質擷取指令,該簡單材質擷取指令將會被直接傳送至材質處理單元並從材質指令集中器中移除,以避免像素著色器在材質處理單元處理簡單材質擷取指令之前先執行該指令,本發明指令移除裝置及其方法除了可改進圖像處理程序的效能與減少材質處理單元的閒置時間之外,還可以使該圖像處理程序的實體緩存器得到有效的利用。
權利要求
1.一種指令移除裝置,其包括指令掃描裝置,其掃描一指令,以判定該指令是第一類型指令還是第二類型指令;材質處理單元;及像素處理單元;其中該指令掃描裝置將被判定為第一類型指令的指令傳送至該材質處理單元,並將被判定為該第二類型指令的指令傳送至該像素處理單元,且該材質處理單元對該第一類型的指令進行處理後傳送至該像素處理單元。
2.如權利要求1所述的指令移除裝置,其中該指令掃描裝置根據該指令是否已經過該像素處理單元處理來判定其指令類型。
3.如權利要求1所述的指令移除裝置,其中該第一類型指令為簡單材質擷取指令,而該第二類型指令為非簡單材質擷取指令。
4.如權利要求1所述的指令移除裝置,還包括一個指令集中器,用以收集該第一類型指令。
5.如權利要求4所述的指令移除裝置,其中該指令集中器可轉換該第一類型指令為一個材質著色命令。
6.如權利要求4所述的指令移除裝置,其中該指令集中器包括指令表,用以儲存該第一類型指令。
7.如權利要求4所述的指令移除裝置,還包括一個指令轉換單元用以轉換該第一類型指令為一個材質著色命令。
8.如權利要求4所述的指令移除裝置,其中該材質處理單元包括一個命令表用以儲存該材質著色命令。
9.如權利要求1所述的指令移除裝置,其中該第二類型指令被傳送至該像素處理單元。
10.如權利要求1所述的指令移除裝置,其中該像素處理單元是一個像素著色器。
11.如權利要求10所述的指令移除裝置,其中該指令掃描裝置根據該指令是否已經過該像素著色器處理來判定其指令類型。
12.如權利要求1所述的指令移除裝置,還包括一個指令過濾器用以防止該第一類型指令被直接傳送至該像素處理單元。
13.一種用於圖像處理裝置的指令移除方法,該圖像處理裝置包括像素處理單元、材質處理單元與指令掃描器,該指令移除方法包括以下步驟步驟一該指令掃描器根據一指令是否已經過像素處理單元處理來判定該指令為第一類型指令還是第二類型指令;步驟二將該第一類型指令儲存至一個指令表;步驟三對儲存至該指令表的該第一類型指令的格式進行轉換;步驟四將該第一類型指令傳送至該材質處理單元;步驟五將該第一類型指令從原始圖像處理程式中移除;及步驟六產生新程式並將該新程式傳送至該像素處理單元。
14.如權利要求13所述的指令移除方法,其中該第一類型指令為簡單材質擷取指令而該第二類型指令為非簡單材質擷取指令。
15.如權利要求13所述的指令移除方法,在判定該指令類型的步驟之前,還包括對該指令進行解碼的步驟。
16.如權利要求13所述的指令移除方法,在判定該指令類型的步驟之後,還包括檢查該指令表狀態的步驟。
17.一種用於圖像處理裝置的指令移除方法,該圖像處理裝置包括像素處理單元、材質處理單元與指令掃描器,該指令移除方法包括以下步驟步驟一該指令掃描器根據一指令是否已經過像素處理單元處理來判定該指令為第一類型指令還是第二類型指令;步驟二轉換該第一類型指令的格式;步驟三將該第一類型指令傳送至該材質處理單元;步驟四將該第一類型指令從原始圖像處理程式中移除;及步驟五產生新程式並將該新程式傳送至該像素處理單元。
18.如權利要求17所述的指令移除方法,其中該第一類型指令為簡單材質擷取指令而該第二類型指令為非簡單材質擷取指令。
19.如權利要求17所述的指令移除方法,在判定該指令類型的步驟之前,還包括對該指令進行解碼的步驟。
20.如權利要求17所述的指令移除方法,在傳送該第一類型指令至該材質處理單元的步驟之後,還包括將該第一類型指令儲存至該材質處理單元中的一個指令表的步驟。
全文摘要
本發明公開了一種指令移除裝置及其方法。該指令移除裝置可掃描圖像處理程式以決定其中是否具有簡單材質擷取指令。該簡單材質擷取指令將會被直接傳送至材質處理單元、並從原始圖像處理程式中移除,以避免像素著色器在該材質處理單元處理該簡單材質擷取指令之前先執行該指令。
文檔編號G06T15/00GK1971614SQ20051011964
公開日2007年5月30日 申請日期2005年11月25日 優先權日2005年11月25日
發明者徐日明 申請人:矽統科技股份有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀