新四季網

選擇預測模式的方法及編碼器的製作方法

2023-05-24 07:12:26

專利名稱:選擇預測模式的方法及編碼器的製作方法
技術領域:
本發明一般是關於視頻編解碼,更特定言之,本發明是關於選擇一預測 模式以在一視頻序列的畫面中將一區塊編碼的方法。
背景技術:
隨著現今消費性電子產品的發展,越來越多針對手持裝置而開發及設計 的多媒體相關技術,例如,行動電話。當手持裝置處理一視頻序列時,特別
是將一視頻序列以H.264/AVC ("先進視頻編碼技術-Advanced Video Coding", 以下簡稱H.264編碼技術)格式進行壓縮或編碼時,若具有視頻壓縮能力的 編碼器被設計為具有相對較高的計算複雜度,則可提升影像質量。然而,手 持裝置的電力消耗可能也會相對提高,因此可能不適於電池容量有限的手持 裝置。相反地,若具有視頻壓縮能力的編碼器被設計為具有相對較低的計算 複雜度,即使電力消耗可能相對較低,影像質量在壓縮或編碼的過程中可能 因為信息或數據遺失而降低,以致於無法滿足H.264編碼技術標準的影像質 量需求。因此,視頻壓縮可在計算複雜度、電力消耗以及影像質量間做出抉 擇。
一 H.264編碼技術視頻序列編碼器可在藉由使用空間域信息的畫面內編 碼期間針對一視頻序列內的一像素區塊執行一畫面內預測。該畫面內預測可 包含一 Intra—4x4預測以及一 Intra—16x16預測,其中該Intra—4x4預測可包括 九種預測模式,且該Intra—16x16預測可包括四種預測模式。在H.264編碼技 術標準中, 一視頻畫面可被分割成複數個宏區塊(macroblock),各宏區塊由 16x16像素所組成。此外,複數個宏區塊的各宏區塊可被分割成4x4區塊,各 區塊一次由4x4像素所組成。畫面內編碼可使用鄰近一區塊的參考像素值以預測區塊內像素值。圖1所示為說明一根據Intra—4x4預測而進行編碼的示例 性區塊102的圖示。參考圖1,區塊102可包含像素"a"至"p"。像素"a" 至"p"的值可根據部份或全部參考像素"A"至"M"來預測。
為達到最佳編碼效益,可使用壓縮率-失真最佳化(Rate-Distortion Optimization, RDO)來針對各預測模式預先計算一壓縮率-失真成本(RD cost)。 具有最小RD成本的預測模式可被選為將一區塊編碼的最佳模式。圖2所示為 說明用於壓縮率-失真最佳化的模塊300的方塊圖。參考圖2, 一原始區塊102 及一預測區塊304可被饋入壓縮率-失真最佳化模塊300,壓縮率-失真最佳化 模塊300可針對預測模式執行RDO並在針對各預測模式將原始區塊進行編碼 時計算RD成本。壓縮率-失真最佳化模塊300可包括一整數離散餘弦轉換 (DCT)模塊306, 一量化模塊308, 一反向量化模塊310, 一反向整數DCT模 塊312, 一位計算模塊314, 一失真計算模塊318以及一 RD成本計算模塊316。
由於計算複雜度的關係,RDO技術可能需要相對較大的計算能力,也因 此需要相對較高的電力消耗。可能需要一種選擇最佳預測模式,且可減少計 算複雜度與電力消耗而不影響視頻壓縮質量的方法。

發明內容
本發明的部分實例可針對一視頻序列的一區塊提供選擇候選預測模式的 數量的方法,該方法包含計算一預定數量的區塊中各區塊的各預測模式的成 本值,識別該等預測模式中具有各區塊的最小成本值的一預測模式,計算使 用一成本函數的各區塊的各預測模式的一函數值,藉由各預測模式的函數值 將各區塊的該等預測模式排列,並識別一具有最小成本值的預測模式的序值, 該序值與排列後的預測模式的序數相關,根據與各區塊相關的各預測模式的 函數值計算各區塊的一特徵值,識別複數組區塊,各組區塊具有實質上相同 的特徵值,識別各組區塊的數量並計算各組區塊的各區塊的預測模式的序值 總和,針對該等複數組區塊的各組計算各組區塊數量總和的一平均值,以及針對該等預定數量的區塊決定一介於該等平均值與該等特徵值間的關係。
本發明的部分實例可同樣針對一視頻序列的一區塊提供選擇候選預測模 式的數量的方法,該方法包含識別可用於該視頻序列的壓縮率-失真最佳化
(RDO)運算的預測模式的數量,識別在視頻序列中欲進行編碼的區塊的數量, 識別一位於所有其它畫面前且在該視頻序列中欲進行編碼的第一畫面,分配 預測模式的數量至該第一畫面的各區塊,在處理該第一畫面的一第一區塊後, 識別剩餘預測模式的數量,分配剩餘預測模式的數量至一緊隨著該第一畫面 的第一區塊的第二區塊,以及識別該第二區塊的第一預測模式的數量,該等 第一預測模式的數量包括分配至該第一畫面的各區塊的預測模式的數量以及 該等剩餘預測模式的數量。
本發明的部分實例可進一步針對一視頻序列的一區塊提供選擇候選預測 模式的數量的方法,該方法包含對於一第一視頻序列識別一第一區塊的一特 徵值與候選預測模式的最佳數量間的一關係,在一使用一成本函數的第二視 頻序列中計算一第二區塊的各預測模式的一函數值,根據該第二區塊的各預 測模式的函數值計算該第二區塊的一特徵值,根據該關係識別該第二區塊的 第一候選預測模式的數量,識別該第二視頻序列的一預定數量的壓縮率-失真 最佳化(RDO)運算,識別可用於一畫面的預定數量的RDO運算的平衡,其中 該第二視頻序列的第二區塊位於該畫面內,在該畫面的區塊間分配可使用的 RDO運算,以及在處理該第二視頻序列的畫面的第二區塊前的一區塊後,識 別是否有剩餘的RDO運算。
本發明的部分實例可進一步針對一視頻序列的一區塊提供可選擇候選預 測模式的數量的編碼器,該編碼器包含一第一計算器,該第一計算器用以對 一第一視頻序列建立該第一視頻序列的一第一區塊的一特徵值與候選預測模 式的最佳數量間的一關係,及根據該關係識別一第二視頻序列中一第二區塊 的第一候選預測模式的數量, 一第二計算器,該第二計算器用以在一使用一 成本函數的第二視頻序列中計算該第二區塊的各預測模式的一函數值,並且根據該第二區塊的各預測模式的函數值計算該第二區塊的一特徵值,以及一 第三計算器,該第三計算器用以接收該第二視頻序列的預定壓縮率-失真最佳
化(RDO)運算的數量,識別可用於一畫面的預定數量的RDO運算的平衡,其 中該第二視頻序列的第二區塊位於該畫面內,分配該畫面的區塊中可用的 RDO運算,以及在處理該第二視頻序列的畫面的第二區塊前,先行處理一區 塊後,識別是否有剩餘RDO運算。
根據本發明的一實例,該第三計算器可用以將剩餘RDO運算的數量增加 到分配給該第二區塊的可用RDO運算的數量,以形成該第二區塊的結果RDO 運算的數量。
此外,該編碼器可進一步包含一比較器,該比較器用以比較該第二區塊 的第一候選預測模式的數量與該第二區塊的結果RDO運算的數量,以識別候 選預測模式的數量而執行該第二區塊的RDO運算。
在一實例中,成本函數可包含下列函數的一絕對誤差和(SAD)函數、變 換後絕對誤差和(SATD)函數、差值平方和(SSD)函數以及平均絕對差值(MAD) 函數。
在一實例中,第一計算器可用以計算每一複數個預定區塊的各預測模式 的一成本值,識別預測模式的一具有各區塊的最小成本值,計算使用該成本 函數的各區塊的各預測模式的一函數值,藉由各預測模式的函數值將各區塊 的預測模式排列,且識別具有最小成本值的預測模式的一序值,該序值與排 列後的預測模式的序數相關。
再者,該第一計算器可用以根據與各區塊相關的各預測模式的函數值計 算各區塊的一特徵值,識別複數組區塊,各組區塊具有實質上相同的特徵值, 識別各組區塊的數量並計算各組區塊的各區塊的預測模式的序值總和,以及 針對該等複數組區塊的各組計算各組區塊數量總和的一平均值。
在一實例中,成本值可包含一壓縮率-失真(RD)成本以執行各該等預測模 式的一RDO運算。在一實例中,各區塊的特徵值可為與各區塊相關的預測模式的函數值的 一標準差。
本發明的額外特徵及優勢將部分陳述於隨後的描述中且部分將自描述而 顯而易見或可藉由對本發明的實踐而習得。本發明的特徵及優勢將經由在所 附權利要求中特別指出的組件及組合而實現及獲得。
應了解前述的大體描述及隨後的詳細描述僅為例示性及說明性的且不對 所主張的本發明加以限制。


圖1所示為根據一 Intra—4x4預測而進行編碼的一示例性區塊的圖示; 圖2所示為一壓縮率-失真最佳化模塊的方塊圖3A所示為根據本發明的一實例中,用以識別第一候選預測模式的數量 的方法的流程圖3B所示為根據本發明的一實例的預定數量的區塊的平均值與特徵值 間的關係圖3C為根據本發明的一實例中,用以決定第一候選預測模式數量的方法 的圖標;
圖4所示為根據本發明的一實例中,用以識別第二候選預測模式的數量 的方法的流程圖5所示為根據本發明的另一實例中,用以識別候選預測模式數量的方 法的流程圖;以及
圖6所示為根據本發明的一實例中,用以識別候選預測模式的數量的編 碼器的方塊圖。
附圖標號 102原始區塊
300壓縮率-失真最佳化模塊304預測區塊
306整數DCT
308量化
310反向量化
312反向整數DCT
314位計算
316RD成本計算
318失真計算
51曲線
52曲線
80編碼器
81特徵值計算器
82數學模型計算器
83分配模型計算器
84比較器
具體實施例方式
現將詳細參考本發明的當前實例,該等實例將在隨附圖式中進行說明。 儘可能地,在所有圖式中相同參考數字將指代相同或類似部分。
視頻壓縮中,對於畫面序列進行編碼可包括畫面內編碼(intra-coding)及畫 面間編碼(inter-coding)。畫面內編碼為針對單一視頻畫面的編碼過程,而畫面 間編碼為利用前後畫面對於一視頻畫面予以重建使用前後幀的編碼過程。雖 然以下所述為本發明根據畫面內編碼過程的實例,熟悉此領域的相關人員將 理解該等實例可同樣應用至畫面間編碼過程。
根據H.264編碼技術標準來壓縮內畫面(I-frames)的視頻序列時,計算復 雜度可由已執行的RDO計算數量來決定,以計算一視頻序列中一畫面的4x4區塊的每一預測模式的一 RD成本。根據H.264編碼技術標準所有九種預測模 式,即模式0至模式8,各自與一預測方向相關,皆對於4x4區塊而進行計算。 一具有最小RD成本的候選預測模式可隨後被選擇以對該區塊進行編碼。在本 發明的一實例中,根據計算的預定預算,僅自九種預測模式中選出"n"個候 選模式以執行一區塊的RDO,而非檢查所有九種預測模式的RDO。 一視頻序 列的預定預算相關於該視頻序列可用的預定數量的候選預測模式,因此可同 樣相關於可被執行以計算各候選預測模式的一 RD成本的預定數量的RDO運 算。
圖3A所示為根據本發明的一實例中,用以識別一區塊中第一候選預測模 式的數量的方法的流程圖。參考圖3A,可在步驟401中計算各預定數量區塊 的各預測模式的一成本值。該成本值與計算複雜度相關。在本發明的一實例 中,當執行一預測模式的RDO運算時,成本值可為該預測模式的RD成本。
接著,在步驟402中,針對各預定數量區塊識別具有最小成本值的一預 測模式。因此,各預定數量區塊具有包含最小成本值的一對應預測模式。
步驟403中,可使用一成本函數來計算各預定數量區塊的各預測模式的 一函數值。在一實例中,成本函數可包含下列函數的一絕對誤差和(SAD) 函數、變換後絕對誤差和(SATD)函數、差值平方和(SSD)函數以及平均絕對差 值(MAD)函數。為求簡明,說明書中將根據SAD函數來敘述及說明本發明的 實例。各預測模式的函數值SADk可定義如下
&4 A = S S 力—A(/, /)|, 0 ^ ("力^ 3
其中P(i, j)及Pk(i, j)各自表示欲進行編碼的當前區塊以及一預測區塊的 像素強度,且k為該等預測模式的索弓l(即O《k《8, k為一整數)。
步驟404中,針對各預定數量區塊,藉由預測模式的函數值將該等預測 模式自最小到最大而排列。接著,步驟405中,可識別各預定數量區塊經排 列的預測模式(已識別於步驟402中)所處順位的序數。具有最小成本值的預測 模式不一定具有最小函數值。舉例來說,當與一區塊的預測模式比較時,具有最小成本值的預測模式可能排列在一第三順位。該預測模式的序數被識別 為三(3)。
步驟406中,可根據與各區塊相關的各預測模式的函數值計算各預定數
量區塊的一特徵值。
在根據本發明的一實例中, 一區塊的特徵值可為與該預測區塊相關的預 測模式的函數值的一標準差。因此,區塊的特徵值,定義為標準差",可由下
列算式計算得出
可能預期到具有最小函數值的一預測模式更有可能變成一候選預測模 式。因此,可假設若有一預測模式及該等排列在該預測模式前的模式可能被
選擇做為一組候選預測模式以針對一對應區塊進行編碼。步驟407中,預定
數量區塊可根據特徵值而進行分類。識別複數組區塊,每組區塊具有實質上 相同的特徵值。
步驟408中,可識別各組區塊的數量(N)。再者,可計算各組區塊的各區 塊的預測模式的一序值的總和(S)。例如,假定有l,OOO個預定數量的區塊; 一第一組區塊(例如五個區塊),可具有實質上相同的特徵值,例如ci-10; — 第二組七個區塊,可具有實質上相同的特徵值,例如^=15,等等。第一組五 個區塊的各區塊中具有最小成本值的預測模式可根據第一組五個區塊的各區 塊的函數值而個別排列成一排,例如第四、第二、第三、第一及第二順位。 具有實質上相同特徵值的第一組五個區塊的預測模式的序值4, 2, 3, 1及2隨 後被加總。
接著,步驟409中,可計算複數組區塊的各組數量(N)的總和(S)的平均值 (S/N)。例如,前述第一組五個區塊的第五序值產生的總和為12,且該平均值 S/N為2.4(=12/5),在一實例中可意味著數量為"2.4"的預測模式可被選擇為該等第一候選預測模式以針對一具有一特徵值0= IO的區塊進行編碼,即針
對該第一組五個區塊的一進行編碼。實際應用時,數量2.4可被環行至2或3。 此外,亦可計算其餘組區塊的其它平均值。
圖3B所示為根據本發明的一實例的預定數量的區塊的平均值與特徵值 間的關係圖。參考圖3B,曲線51代表平均值,其可分布於範圍在例如大致ci =0至cj = 750的特徵值的數量。在一實例中,該等特徵值可為捨入值 (round-off value)。由於特徵值在曲線51的側部處的數量相對較小,因此曲線 51的側部處的平均值可能相對較高或具有較陡峭的變化。
參考圖3A,步驟410中,可決定複數個預測區塊的平均值與特徵值間的 關係。在根據本發明的一實例中,可藉由統計分析建立平均值對於特徵值的 分布的數學模型。同樣參考圖3B, 一曲線52或表示為Optimalj ,可表示平 均值與特徵值間的關係,其可藉由例如一回歸法(regression method)而獲得。
該數學模型可表示如下
formula see original document page 17
其中係數a、 b、 c及可藉由應用以下的最小平方法(LSM)而得出
其中Ni至Nn分別為對應至特徵值c^至 的平均值。可針對數量為300 的內畫面(I-frame)而自具有量化參數(QP)為28的四分的一通用媒介格式 (QCIF)中的佛曼序列(Foreman s叫uence)得出曲線51及52。
在根據本發明的一實例中,對應曲線52中特徵值的平均值可被定義為具 有特徵值的區塊的第一候選預測模式的數量。因此,參考圖3A,步驟411中, 可根據該關係識別一區塊的第一候選預測模式的數量。圖3C為根據本發明的 一實例中,用以決定第一候選預測模式數量的方法的圖標。參考圖3C,當識別出一區塊的特徵值(q)時,可識別執行RDO運算的平均值(Optimah)以及第
一候選預測模式的數量。
步驟401的預定數量區塊的功能可做為訓練區塊以建立數學模型。根據 數學模型的區線52可應用至其它視頻序列的區塊。換句話說, 一旦為一給定 視頻序列建立圖3C所示的關係以識別第一候選預測模式的數量,僅需計算一 區塊各預測模式的函數值(圖3A所示的步驟403)以及基於函數值的區塊的特 徵值(圖3A所示的步驟406),與RDO運算相較的下,此等計算相對而言較為 簡單。可根據該關係來識別第一候選預測模式的數量,例如為"M"。各區塊 的第一候選預測模式可包含根據函數值的排列中的"M"個最前預測模式。
在根據本發明的一實例中,藉由數學模型決定的第一候選預測模式的數 量可與藉由一 "分配模型"決定的第二候選預測模式的數量進行比較,以決 定候選預測模式的數量進而執行RDO。具體來說,可藉由將RDO運算可用
的計算資源納入考慮來決定候選預測模式的數量。根據分配模型, 一預定次 數的RDO運算可被分配至一視頻序列。此外,被分配至視頻序列的一畫面的 RDO運算次數取決於欲在該視頻序列中被編碼的畫面可用的平衡RDO運算 次數。根據本發明的一實例的分配模型可由下列的等式來表示
其中Budgetj可代表計算資源或一第j(j-th)畫面的各區塊可用的RDO運算 次數,Buffer可代表欲在視頻序列中被編碼的畫面可用的平衡RDO運算次數, 且C代表欲在視頻序列中被編碼的區塊的數量。假定一具有10個內畫面的 QCIF序列的總計算資源的比率為40%, C與Buffer的值可於下列算式計算得 出。
C = 176/4 x 144/4 x 10 = 15,840 (區塊),及 Buffer = 15,840 x 9 x 40% = 57,024 (預測模式)
當檢驗所有預測模式時,總計算資源可代表視頻序列中所有區塊所需的 RDO運算的總次數。該比率可因而可代表總計算資源的限制。因此,只有一預定次數的RDO運算可用於視頻序列的區塊。因為RDO的運算次數可與預 測模式的數量成比例,所以該預定次數的RDO運算可以和於可用來對視頻序 列予以編碼的一預定數量的預測模式有關。再者,第j畫面的第i區塊可用的 RDO運算次數需視結餘的RDO運算次數而定,而結餘的RDO運算次數包括 處理完位於第j畫面前的第(j-l)畫面後所剩餘的RDO運算次數以及處理完位 於第i區塊前的第(i-l)區塊後是否有多餘的RDO運算次數。即,
其中Budgeti可代表第i區塊可用的RDO運算次數且Extraw可代表處理 位於第i區塊前的第(i-l)區塊後多餘的RDO運算次數。每個畫面的"Budget/' 值可能相異,但對於同一畫面內的所有區塊而言,"Budget/'值可以相同。 因此,分配至當前第i區塊的總計算資源可包含次數為"Budgetj"的RDO運算, 其對於第j畫面的所有區塊而言為一常數;以及處理先前第(i-l)區塊後次數為 "ExtoiV,的RDO運算,其為一可變值。由上述等式可知,次數為"Budget, 而可被第j畫面使用的RDO運算可分配至一第一區塊,即第j畫面的第0區 塊(1=0)。此外,若被分配的RDO運算次數在第一區塊中沒有全部被使用,剩 下的RDO運算次數將被加至隨後區塊的計算資源中。
藉由分配模型決定的第二候選預測模式的數量可與藉由數學模型決定的 第一候選預測模式的數量進行比較,以決定一區塊的候選預測模式的數量。 在根據本發明的一實例中,可根據以下規則加以比較則
規則2:
formula see original document page 19其中Optimali及Budgeti可分別表示藉由數學模型與分配模型所決定的 區塊的第一及第二候選預測模式的數量,且Finalj可表示執行區塊的RDO的 候選預測模式數量,此外,符號"^」"與"「z,"可分別表示X的取整函數 (floor fimction)及取頂函數(ceiling function),且"Lx」"與"「xl"的值可為整 數。數量"Finali"因而可根據考慮到實際應用的資源限制(分配模式)的一理想
模式(數學模式)來決定。
舉例來說,若第一區塊的Optimal,及Budget,值分別為2.5及4.5,則滿 足規則1。因此,Final!及Extra!的值分別為4及0.5。此外,Budget2等於5(=4.5+ Extra,)。
若緊隨著第一區塊的第二區塊的Optimal2的值為4.5,則滿足規則2。因 此,Final2及Extra2的值分別為4及l。此外,Budget3等於5.5(=4.5+Extra2)。
若緊隨著第二區塊的第三區塊的Optimal3的值為6.4,則滿足規則3。因 此,Final3及Extra3的值分別為6及0。此外,Budget4等於4.5(=4.5+Extra3)。
若緊隨著第三區塊的第四區塊的Optimal4的值為6.8,則滿足規則4。因 此,Final4及Extra4的值分別為5及0。
將當前第j畫面(framej)編碼後,下一個畫面framej+l的"Buffer"與"C" 的值可藉由以下算式更新,其中Swm,可為當前framej中可用來做RDO運算的預測模式總次數,而 Mj為framej的區塊總數量。
圖4所示為根據本發明的一實例中,用以識別第二候選預測模式的數量 的方法的流程圖。參考圖4,步驟501可識別執行一視頻序列的RDO的預測 模式的數量。例如,可預定可用的預測模式數量與視頻序列所需的預測模式 總數量的比率。在步驟502中,可識別欲在視頻序列中被編碼的區塊數量。 接著,在步驟503中,可識別欲在視頻序列中被編碼且在其它所有畫面前的 一第一畫面。在步驟504中,可分配預測模式的數量至第一畫面的各區塊。 如上所述,預測模式的數量可等於"Buffer/C",第一畫面的各區塊具有相同 預測模式的數量。
接著,在步驟505中,可識別處理第一畫面的區塊後的多餘預測模式的 數量。該數量可能為零、正整數或小數。在步驟506中,可將該項多餘的預 測模式數量分配給緊隨該已處理區塊的下一個區塊。在步驟507中,可識別 是否第一畫面內所有區塊皆已編碼。若第一畫面內並非所有區塊皆已編碼, 可重複步驟505及506。在步驟508中,若第一畫面內所有區塊均已編碼,可 識別剩餘預測模式的數量以及欲進行編碼的剩餘畫面的數量。其次,在步驟 509中,可識別視頻序列中欲進行編碼的剩餘區塊的數量。步驟508及509可 決定分配至一緊隨該第一畫面的第二畫面(若存在的話)的各區塊的預測模式 數量。接著,在步驟510中,可識別是否視頻序列中所有畫面皆已編碼。若 視頻序列中並非所有畫面皆已編碼,可重複步驟503及509。
圖5所示為根據本發明的另一實例中,用以識別候選預測模式數量的方 法的流程圖。參考圖5,步驟61中可識別一區塊的特徵值與一第一視頻序列 的區塊的候選預測模式的最佳數量間的關係。該關係可包含但不限於圖3B及 3C所敘述及說明的關係。步驟62中,可使用一成本函數,例如SAD、 SATD、 SSD及MAD的一來計算一第二視頻序列的區塊的各預測模式的函數值。步 驟63中,可接著使用區塊的各預測模式的函數值來計算第二視頻序列的區塊的特徵值。步驟64中,可藉由步驟63所識別的特徵值以及步驟61所建立的 關係,識別第二視頻序列的區塊的第一候選預測模式的數量。
接著,在步驟65中,可識別第二視頻序列可用的RDO運算的預定次數。 此等RDO運算的預定次數可分配至第二視頻序列的畫面, 一個畫面分配完接 著分配下一個畫面。在步驟66中,可識別第二視頻序列的區塊所在的畫面可 用的預定RDO運算次數的結餘量。在步驟67中,可在畫面的區塊間分配該 項預定RDO運算次數的結餘量。在步驟68中,可識別在處理第二視頻序列 中位於所討論的區塊的前一區塊後,可識別是否有多餘的RDO運算次數。分 配至所討論的區塊的RDO運算次數可包含在步驟67所分配的第一部份及來 自先前區塊的一第二部份(若存在的話)。在步驟69中,可識別所討論的區塊 的第二候選預測模式的數量。步驟64及69所分別識別的第一及第二候選預 測模式可在步驟70中相互比較,以識別出執行第二視頻序列中所討論的區塊 的RDO的候選預測模式的數量。隨後,在步驟71中,可識別具有最小RD 成本的候選預測模式的一,其可被使用來對第二視頻序列的區塊進行編碼。
圖6所示為根據本發明的一實例中,用以識別候選預測模式的數量的編 碼器80的方塊圖。參考圖6,編碼器80可包含一特徵值計算器81、 一數學 模型計算器82、 一分配模型計算器83及一比較器84。根據本發明的一實例 中,編碼器80可支持H.264編碼技術編碼器的功能且可以硬體或軟體來實現, 其中前者在運算速度上可能較具優勢,而後者在設計複雜度上較能節省成本。 若以硬體來實現,編碼器80可製造於一整合晶片(IC)中。若以軟體來實現, 編碼器80可安裝於個人計算機(PC)或行動通信裝置中,例如筆記型計算機、 行動電話及個人數字助理(PDA)。
特徵值計算器81可用於計算一視頻序列中一畫面的第一區塊的一特徵 值,該視頻序列可包含諸如"n"個畫面,畫面o(frameo)至畫面n.j(framen.O。 可使用一成本函數來識別一函數值,以計算該特徵值。數學模型計算器8可 建立一區塊的特徵值與該區塊的候選預測模式的最佳數量間的關係。可使用與圖3B相似的敘述及說明方式來建立該關係。根據特徵值計算器81所獲得 第一區塊的特徵值,可識別第一區塊的第一候選預測模式的數量。
分配模型計算器83可用以將RDO運算的預定次數依逐項畫面予以分配 至視頻序列的畫面。此外,可在一畫面的區塊間分配該畫面可用的RDO運算 次數,致使各區塊可分配到一第一相同部份。分配給位於該第一區塊前的第 二區塊的RDO運算次數的第一部份可根據先前討論的規則1至4,而在比較 器84中與第二區塊的第一候選預測模式的數量相比較,以識別出是否有多餘 的RDO運算次數。若有多餘的RDO運算次數,可將其加入己分配至該第一 區塊的第一部份。於第一區塊可使用的第一部份及多餘部份,即第二預測模 式的數量,可隨後在比較器84中與第一區塊的第一候選預測模式的數量相比 較,以識別出第一區塊的候選預測模式的數量,除此的外還可識別出是否有 多餘的RDO運算次數給緊隨於第一區塊後的一第三區塊。
熟悉此領域的相關人員應了解,雖然說明書於敘述前揭實例時可使用4x4 區塊作為實例。然而,熟悉此領域的相關人員應明了本發明的方法可應用於 8x8區塊、16x16區塊或R264編碼技術視頻序列中可能為其它形式的區塊。 因此,應用於實例的區塊的形式不應解讀為權利要求的限制。
另外,在描述本發明的代表性實例的過程中,說明書將本發明的方法及/ 或過程表示為特定的步驟序列。然而,在等方法或過程不依賴於此處提出的 特定步驟次序的情況下,方法或過程不應限於本文所描述的特定步驟序列。 熟悉此領域的相關人員應了解,其它的步驟序列為可行的。因此,說明書中 所陳述的特定步驟次序不應被解讀為對權利要求的限制。此外,關於本發明 的方法及/或過程的權利要求不應限於執行所記載次序的步驟,且熟悉此領域 的相關人員應易於了解序列可加以變化而仍位於本發明的精神及範疇內。
熟悉此領域的相關人員應了解,在不脫離本發明的廣泛發明概念的情況 下可對上述實例進行更改。因此應了解,本發明不限於所揭示的特定實例, 而是意欲涵蓋在隨附權利要求所界定的本發明的精神及範疇內的所做的修改。
權利要求
1. 一種針對一視頻序列的一區塊選擇候選預測模式的數量的方法,該方法包含計算一預定數量的區塊中各區塊的各預測模式的一成本值;識別該等預測模式中具有各區塊的最小成本值的一預測模式;計算使用一成本函數的各區塊的各預測模式的一函數值;藉由各預測模式的函數值將各區塊的該等預測模式排列,並識別一具有最小成本值的預測模式的序值,該序值與排列後的預測模式的序數相關;根據與各區塊相關的各預測模式的函數值計算各區塊的一特徵值;識別複數組區塊,各組區塊具有實質上相同的特徵值;識別各組區塊的數量並計算各組區塊的各區塊的預測模式的序值總和;針對該等複數組區塊的各組計算各組區塊數量總和的一平均值;以及針對該等預定數量的區塊決定一介於該等平均值與該等特徵值間的關係。
2. 如權利要求1所述的方法,其中該成本值包括一針對各預測模式執行 一壓縮率-失真最佳化運算的壓縮率-失真成本。
3. 如權利要求1所述的方法,其中該成本函數包含下列函數的一絕對 誤差和函數、變換後絕對誤差和函數、差值平方和函數以及平均絕對差值函 數。
4. 如權利要求1所述的方法,其中各區塊的特徵值為與各區塊相關的預 測模式的函數值的一標準差。
5. 如權利要求l所述的方法,該方法進一步包括表示一回歸曲線中,該 等平均值與特徵值間的關係。
6. 如權利要求5所述的方法,該方法進一步包括 計算另一視頻序列的一區塊的一特徵值;以及藉由根據該特徵值的回歸曲線識別該區塊的第一預測模式的數量。
7. 如權利要求6所述的方法,該方法進一步包括識別可用於該視頻序列的壓縮率-失真最佳化RDO運算的預測模式的數 識別在該視頻序列中欲進行編碼的區塊的數量;識別一位於所有其它畫面前且在該視頻序列中欲進行編碼的第一畫面;以及分配複數個預測模式至該第一畫面的各區塊。
8. 如權利要求7所述的方法,該方法進一步包括 在處理該第一畫面的一第一區塊後,識別多餘的預測模式的數量; 分配該項多餘的預測模式數量至一緊隨著該第一畫面的第一區塊的第二區塊;以及藉由比較第一預測模式的數量與第二預測模式的數量以決定該第二區塊 的候選預測模式的數量,該第二預測模式的數量包括分配至該第一畫面的各 區塊的預測模式的數量以及該項多餘的預測模式數量。
9. 如權利要求8所述的方法,該方法進一步包括 在處理該第一畫面後,識別剩餘的預測模式數量; 識別該視頻序列中欲進行編碼的剩餘畫面的數量;以及 識別該視頻序列中欲進行編碼的剩餘區塊的數量。
10. —種針對一視頻序列的一區塊選擇候選預測模式的數量的方法,該方 法包含識別可用於該視頻序列的壓縮率-失真最佳化運算的預測模式的數量; 識別在視頻序列中欲進行編碼的區塊的數量;識別一位於所有其它畫面前且在該視頻序列中欲進行編碼的第一畫面; 分配複數個預測模式至該第一畫面的各區塊;在處理該第一畫面的一第一區塊後,識別多餘的預測模式的數量;分配該項多餘的預測模式數量至一緊隨著該第一畫面的第一區塊的第二 區塊;以及識別該第二區塊的第一預測模式的數量,該等第一預測模式的數量包括 分配至該第一畫面的各區塊的預測模式的數量以及該多餘的預測模式的數
11. 如權利要求10所述的方法,其中識別可用於RDO運算的預測模式的 數量包括識別一可用於RDO運算的預測模式的數量與該視頻序列所需的預測 模式總數量的比率。
12. 如權利要求10所述的方法,其中可用於一第j畫面的各區塊的ROD運算數量滿足Budgetj = Buffer / C其中該第j畫面位於該視頻序列中所有其它欲進行編碼的畫面前,Buffer 代表欲在該視頻序列中進行編碼的畫面可用的剩餘RDO運算次數,且C代表 欲在該視頻序列中進行編碼的剩餘區塊的數量。
13. 如權利要求12所述的方法,其中分配至該第j畫面的一第i區塊的預 測模式的數量包括預測模式的數量"Budget/'以及在處理位於該第i區塊前的 一第i-1區塊後的多餘預測模式的數量。
14. 如權利要求10所述的方法,該方法進一步包括 計算一預定數量的區塊中各區塊的各預測模式的成本值; 識別該等預測模式中具有各區塊的最小成本值的一預測模式; 計算使用一成本函數的各區塊的各預測模式的一函數值;以及 藉由各預測模式的函數值將各區塊的該等預測模式排列,並識別一具有最小成本值的預測模式的序值,該序值與排列後的預測模式的序數相關。
15. 如權利要求14所述的方法,該方法進一步包括 根據與各區塊相關的各預測模式的函數值計算各區塊的一特徵值; 識別複數組區塊,各組區塊具有實質上相同的特徵值;識別各組區塊的數量並計算各組區塊的各區塊的預測模式的序值總和; 針對該等複數組區塊的各組計算各組區塊數量總和的一平均值; 以及針對該等預定數量的區塊決定一介於該等平均值與該等特徵值間的 關係。
16. 如權利要求15所述的方法,該方法進一步包括 計算該第二區塊的一特徵值;根據該特徵值識別該第二區塊的第二預測模式的數量。
17. 如權利要求16所述的方法,該方法進一步包括藉由比較第一預測模 式的數量與第二預測模式的數量,以決定該第二區塊的候選預測模式的數量。
18. —種針對一視頻序列的一區塊選擇候選預測模式的數量的方法,該方 法包含對於一第一視頻序列識別一第一區塊的一特徵值與候選預測模式的最佳 數量間的一關係;在一使用一成本函數的第二視頻序列中計算一第二區塊的各預測模式的 一函數值;根據該第二區塊的各預測模式的函數值計算該第二區塊的一特徵值; 根據該關係識別該第二區塊的第一候選預測模式的數量; 識別該第二視頻序列的一預定次數的壓縮率-失真最佳化運算; 識別可用於一畫面的預定數量的RDO運算的結餘量,其中該第二視頻序列的第二區塊位於該畫面內;在該畫面的區塊間分配可使用的RDO運算次數;以及 在處理該第二視頻序列的畫面的第二區塊前的一區塊後,識別是否有多餘的RDO運算次數。
19. 如權利要求18所述的方法,該方法進一步包括將該項多餘的RDO運算次數加到已分配給該第二區塊的可用RDO運算 次數,以形成該第二區塊的總和RDO運算次數;以及比較該第二區塊的第一候選預測模式的數量與該第二區塊的總和RDO運 算次數,以識別出用來執行該第二區塊的RDO運算的候選預測模式的數量。
20. 如權利要求19所述的方法,該方法進一步包括識別出該等候選預測 模式中具有最小壓縮率-失真成本的一候選預測模式。
21. 如權利要求18所述的方法,其中該成本函數包含下列函數之一絕 對誤差和函數、變換後絕對誤差和函數、差值平方和函數以及平均絕對誤差 值函數。
22. 如權利要求18所述的方法,其中識別該第一區塊的特徵值與候選預 測模式的最佳數量間的一關係進一步包括計算一預定數量的區塊中各區塊的各預測模式的一成本值; 識別該等預測模式中具有各區塊的最小成本值的一預測模式; 計算使用該成本函數的各區塊的各預測模式的一函數值; 藉由各預測模式的函數值將各區塊的該等預測模式排列,並識別一具有 最小成本值的預測模式的序值,該序值與排列後的預測模式的序數相關; 根據與各區塊相關的各預測模式的函數值計算各區塊的一特徵值; 識別複數組區塊,各組區塊具有實質上相同的特徵值; 識別各組區塊的數量並計算各組區塊的各區塊的預測模式的序值總和;以及針對該等複數組區塊的各組計算各組區塊數量總和的一平均值。
23. 如權利要求21所述的方法,其中該成本值包括一針對各預測模式執 行一壓縮率-失真最佳化運算的壓縮率-失真成本。
24. 如權利要求21所述的方法,其中各區塊的特徵值為與各區塊相關的 預測模式的函數值的一標準差。
25. —種可針對一視頻序列的一區塊選擇候選預測模式的數量的編碼器, 該編碼器包含一第一計算器,該第一計算器用以對一第一視頻序列建立該第一視頻序列的一第一區塊的一特徵值與候選預測模式的最佳數量間的一關係,及根據該關係識別一第二視頻序列中一第二區塊的第一候選預測模式的數量;一第二計算器,該第二計算器用以在一使用一成本函數的第二視頻序列中計算該第二區塊的各預測模式的一函數值,並且根據該第二區塊的各預測模式的函數值計算該第二區塊的一特徵值;以及一第三計算器,該第三計算器用以接收該第二視頻序列的預定壓縮率-失真最佳化運算的數量,識別可用於一畫面的預定數量的RDO運算的平衡,其中該第二視頻序列的第二區塊位於該畫面內,分配該畫面的區塊中可用的RDO運算,以及在處理該第二視頻序列的畫面的第二區塊前,先行處理一區塊後,識別是否有剩餘RDO運算。
26. 如權利要求25所述的編碼器,其特徵在於,該第三計算器可用以將 剩餘RDO運算的數量增加到分配給該第二區塊的可用RDO運算的數量,以 形成該第二區塊的結果RDO運算的數量。
27. 如權利要求26所述的編碼器,其特徵在於,該編碼器進一步包含比 較器,該比較器用以比較該第二區塊的第一候選預測模式的數量與該第二區 塊的結果RDO運算的數量,以識別候選預測模式的數量而執行該第二區塊的 RDO運算。
28. 如權利要求25所述的編碼器,其特徵在於,該成本函數包含下列函 數的一絕對誤差和函數、變換後絕對誤差和函數、差值平方和函數以及平 均絕對差值函數。
29. 如權利要求25所述的編碼器,其特徵在於,該第一計算器可用以計 算每一複數個預定區塊的各預測模式的一成本值,識別預測模式的一具有各 區塊的最小成本值,計算使用該成本函數的各區塊的各預測模式的一函數值, 藉由各預測模式的函數值將各區塊的預測模式排列,且識別具有最小成本值 的預測模式的一序值,該序值與排列後的預測模式的序數相關。
30. 如權利要求29所述的編碼器,其特徵在於,該第一計算器可用以根據與各區塊相關的各預測模式的函數值計算各區塊的一特徵值,識別複數組 區塊,各組區塊具有實質上相同的特徵值,識別各組區塊的數量並計算各組 區塊的各區塊的預測模式的序值總和,以及針對該等複數組區塊的各組計算 各組區塊數量總和的一平均值。
31. 如權利要求29所述的編碼器,其特徵在於,該成本值包含一壓縮率-失真成本以執行各該等預測模式的一 RDO運算。
32. 如權利要求25所述的編碼器,其特徵在於,該各區塊的特徵值為與 各區塊相關的預測模式的函數值的一標準差。
全文摘要
針對一選擇預測模式的方法及編碼器,該編碼器包含第一計算器,該第一計算器用以對第一視頻序列建立該第一視頻序列的第一區塊的一特徵值與候選預測模式的最佳數量間的一關係,及根據該關係識別第二視頻序列中第二區塊的第一候選預測模式的數量。第二計算器,該第二計算器用以在使用成本函數的第二視頻序列中計算該第二區塊的各預測模式的函數值,並且根據該第二區塊的各預測模式的函數值計算該第二區塊的特徵值。以及第三計算器,該第三計算器用以接收該第二視頻序列的預定壓縮率-失真最佳化(RDO)運算的數量,識別可用於一畫面的預定數量的RDO運算的平衡。
文檔編號H04N7/50GK101431671SQ200810005508
公開日2009年5月13日 申請日期2008年2月4日 優先權日2007年11月7日
發明者林嘉文, 沈志聖 申請人:財團法人工業技術研究院

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀