視頻編解碼方法和相應的編解碼設備的製作方法
2023-07-17 13:24:01 1
專利名稱:視頻編解碼方法和相應的編解碼設備的製作方法
技術領域:
本發明總體涉及視頻壓縮領域,例如涉及MPEG系列的視頻編碼標準(MPEG-1、MPEG-2、MPEG-4)以及ITU-H.26X系列的視頻推薦(H.261、H.263及擴展、H.264)。更具體來說,本發明涉及一種被應用於一個輸入視頻序列的編碼方法,該視頻輸入序列對應於被細分成連續的視頻對象平面(VOP)的連續場景,並且為了編碼所述場景的所有視頻對象,該編碼方法產生一個編碼比特流,該編碼比特流的內容按照分開的通道被描述並且由編碼的視頻數據構成,其中藉助於一個比特流語法來描述每一個數據項以便允許識別和解碼所述內容的所有單元,所述語法包括被提供來獨立地描述對各個通道的時間預測的類型的附加語法信息,所述預測是從包括下列情況的列表中選擇的-時間預測是通過對於一個或多個參考畫面直接應用由編碼器發送的運動場(motion field)而形成的;-時間預測是參考圖像的一個拷貝;-時間預測是通過對該運動場進行時間內插而形成的;-時間預測是通過對當前運動場進行時間內插而形成的,並且進一步通過由編碼器發送的運動場來細化。
本發明還涉及一種相應的編碼設備、一種包括由此類編碼設備產生的編碼比特流的可傳輸視頻信號以及一種用於對包括此類編碼比特流的視頻信號進行解碼的方法和設備。
背景技術:
在第一類視頻編碼標準和推薦(直到MPEG-4和H.264)中,假定視頻是矩形的,並且假定按照一個亮度通道和兩個色度通道來描述視頻。在MPEG-4中,已經引入了一個載送形狀信息的附加通道。有兩種方法可以用來壓縮這些通道INTRA模式,根據該模式,通過利用單個圖像的給定通道中的像素的空間冗餘來編碼每一個通道;以及INTER模式,該模式利用分開的圖像之間的時間冗餘。該INTER模式依賴於運動補償技術,這種技術根據一個或幾個先前解碼的圖像來描述一個圖像,這是通過編碼從一個圖像到另一個圖像的像素運動來實現的。通常來說,將待編碼的圖像分割成獨立的塊或者宏塊,其中為每一個塊或者宏塊分配一個運動矢量。然後,通過根據該組運動矢量從所述參考圖像對各像素塊進行位移來構造對圖像的預測(亮度和色度通道共享相同的運動描述)。最後,在INTER模式中對待編碼圖像及其經運動補償的預測之間的差異(稱為殘餘信號)進行編碼,以便進一步細化解碼的圖像。然而,由於所有的像素通道都是由相同的運動信息描述的,所以這種限制損害了視頻編碼系統的壓縮效率。
發明概要因此,本發明的目的是提供一種視頻編碼方法,其中通過對形成時間預測的方式進行適配來避免所述缺陷。
為此,本發明涉及一種諸如在說明書介紹部分中定義的方法,該方法的特徵還在於所述附加語法信息是一個放置在所產生的所述編碼比特流中的語法單元,其意義對於每個存在的通道是特定的,根據所提出的實施例,所述單元被放置在片段級(slice level)或者宏塊級。
本發明還涉及一種相應的編碼設備、一種包括由此類編碼設備產生的編碼比特流的可傳輸視頻信號以及一種用於對包括此類編碼比特流的視頻信號進行解碼的方法和設備。
發明的具體描述本發明提出在由各視頻標準和推薦所使用的編碼語法中引入附加的信息,該附加信息包括一個新的語法單元,該語法單元支持各視頻標準和推薦所缺乏的靈活性,並且啟發了對各通道的時間預測進行更為有效和獨立的編碼的新的可能性。該附加語法單元(例如稱為「通道時間預測」)採取下列的符號值Motion_compensation(運動補償)Temporal_copy(時間拷貝)Temporal_interpolation(時間內插)Motion_compensated_temporal_interpolation(經運動補償的時間內插),這些值的意義是a)motion_compensation時間預測是通過對於一個或多個參考畫面直接應用由編碼器發送的運動場而形成的(此默認模式隱含地是大多數當前編碼系統的INTER編碼模式);b)temporal_copy時間預測是參考圖像的一個拷貝;c)temporal_interpolation時間預測是通過對所述運動場進行時間內插而形成的;d)motion_compensated_temporal_interpolation時間預測是通過對當前運動場進行時間內插而形成的,並且進一步通過由編碼器發送的運動場來細化。
術語「時間內插」必須廣義地來理解,也就是說,其意味著由諸如Vnew=a.V1+b.V2+K之類的表達式定義的該種類型的任何操作,其中V1和V2表示先前解碼的運動場,a和b表示分別被分配給所述運動場的係數,K表示一個偏移量,而Vnew則是所獲得的新的運動場。因此可以看出,時間拷貝的特定情況實際上被包括在時間內插的更為一般的情況中,對於時間拷貝的特定情況有b=0和K=0(或者a=0和K=0)。
根據本發明,必須把所提出的附加語法單元放置在需要被存儲(或者被傳輸到解碼側)的編碼比特流中的下列級別上1)片段級;或者2)宏塊級;其中在每種情況下,該附加語法單元或者對於每一個存在的通道是特定的,或者可以由所有通道共享。
本發明可以用於這樣的情況其中在片段、宏塊或者通道的基礎上切換構造時間預測的方式。第一個實例例如可以是具有形狀通道的序列形狀信息可能不會改變太多,而亮度和色度通道則載送變化的信息(例如描繪旋轉星球的視頻就是這種情況形狀總是圓盤,但是其紋理則取決於星球的旋轉)。在這種情況下,可以通過時間拷貝來恢復形狀通道,並且可以通過經運動補償的時間內插來恢復亮度和色度通道。第二個實例可以是宏塊級的改變的情況。在顯示海景的視頻序列中,畫面的上部是天空,與海不同,天空在各圖像間保持不變。因此,可以通過時間拷貝來編碼天空的各宏塊,而海的各宏塊則必須通過時間內插來編碼。
權利要求
1.一種被應用於一個輸入視頻序列的編碼方法,該視頻輸入序列對應於被細分成連續的視頻對象平面(VOP)的連續場景,並且為了編碼所述場景的所有視頻對象,該編碼方法產生一個編碼比特流,該編碼比特流的內容按照分開的通道被描述並且由編碼的視頻數據構成,其中藉助於一個比特流語法來描述每一個數據項以便允許識別和解碼所述內容的所有單元,所述語法包括被提供來獨立地描述對各個通道的時間預測的類型的附加語法信息,所述預測是從包括下列情況的一個列表中選擇的-時間預測是通過對於一個或多個參考畫面直接應用由編碼器發送的運動場而形成的;-時間預測是參考圖像的一個拷貝;-時間預測是通過對該運動場進行時間內插而形成的;-時間預測是通過對當前運動場進行時間內插而形成的,並且進一步通過由編碼器發送的運動場來細化;所述方法的特徵還在於所述附加語法信息是一個在片段級被放置於所產生的所述編碼比特流中的語法單元,並且它的意義對於每個存在的通道是特定的。
2.一種被應用於一個輸入視頻序列的編碼方法,該視頻輸入序列對應於被細分成連續的視頻對象平面(VOP)的連續場景,並且為了編碼所述場景的所有視頻對象,該編碼方法產生一個編碼比特流,該編碼比特流的內容按照分開的通道被描述並且由編碼的視頻數據構成,其中藉助於一個比特流語法來描述每一個數據項以便允許識別和解碼所述內容的所有單元,所述語法包括被提供來獨立地描述對各個通道的時間預測的類型的附加語法信息,所述預測是從包括下列情況的一個列表中選擇的-時間預測是通過對於一個或多個參考畫面直接應用由編碼器發送的運動場而形成的;-時間預測是參考圖像的一個拷貝;-時間預測是通過對該運動場進行時間內插而形成的;-時間預測是通過對當前運動場進行時間內插而形成的,並且進一步通過由編碼器發送的運動場來細化;所述方法的特徵還在於所述附加語法信息是一個在宏塊級被放置於所產生的所述編碼比特流中的語法單元,並且它的意義對於每個存在的通道是特定的。
3.根據權利要求1和2中的任一條的編碼方法,其特徵在於,所述意義是由所有存在的通道共享的。
4.一種處理一個輸入視頻序列的編碼設備,該視頻輸入序列對應於被細分成連續的視頻對象平面(VOP)的連續場景,並且為了編碼所述場景的所有視頻對象,該編碼設備產生一個編碼比特流,該編碼比特流的內容按照分開的通道被描述並且由編碼的視頻數據構成,其中藉助於一個比特流語法來描述每一個數據項以便允許識別和解碼所述內容的所有單元,所述編碼設備被提供來執行根據權利要求1和2中的任一條的編碼方法。
5.一種包括一個編碼比特流的可傳輸的視頻信號,該編碼比特流由一個處理一個輸入視頻序列的編碼設備產生,該視頻輸入序列對應於被細分成連續的視頻對象平面(VOP)的連續場景,並且為了編碼所述場景的所有視頻對象,該編碼設備產生一個編碼比特流,該編碼比特流的內容按照分開的通道被描述並且由編碼的視頻數據構成,其中藉助於一個比特流語法來描述每一個數據項以便允許識別和解碼所述內容的所有單元,所述可傳輸的視頻信號包括被提供來獨立地描述對各個通道的時間預測的類型的附加語法信息,所述預測是從包括下列情況的一個列表中選擇的-時間預測是通過對於一個或多個參考畫面直接應用由編碼器發送的運動場而形成的;-時間預測是參考圖像的一個拷貝;-時間預測是通過對該運動場進行時間內插而形成的;-時間預測是通過對當前運動場進行時間內插而形成的,並且進一步通過由編碼器發送的運動場來細化;並且所述附加語法信息是一個在片段級或者在宏塊級被放置於所產生的所述編碼比特流中的語法單元,並且它的意義對於每個存在的通道是特定的。
6.一種用於解碼一個可傳輸的視頻信號的方法,該可傳輸的視頻信號包括一個編碼比特流,該編碼比特流由一個處理一個輸入視頻序列的編碼設備產生,該視頻輸入序列對應於被細分成連續的視頻對象平面(VOP)的連續場景,並且為了編碼所述場景的所有視頻對象,該編碼設備產生一個編碼比特流,該編碼比特流的內容按照分開的通道被描述並且由編碼的視頻數據構成,其中藉助於一個比特流語法來描述每一個數據項以便允許識別和解碼所述內容的所有單元,所述可傳輸的視頻信號包括被提供來獨立地描述對各個通道的時間預測的類型的附加語法信息,所述預測是從包括下列情況的一個列表中選擇的-時間預測是通過對於一個或多個參考畫面直接應用由編碼器發送的運動場而形成的;-時間預測是參考圖像的一個拷貝;-時間預測是通過對該運動場進行時間內插而形成的;-時間預測是通過對當前運動場進行時間內插而形成的,並且進一步通過由編碼器發送的運動場來細化;並且所述附加語法信息是一個在片段級或者在宏塊級被放置於所產生的所述編碼比特流中的語法單元,並且它的意義對於每個存在的通道是特定的。
7.一種用於執行根據權利要求6的解碼方法的解碼設備。
全文摘要
本發明涉及一種被應用於一個輸入視頻序列的編碼方法,該視頻輸入序列對應於被細分成連續的視頻對象平面(VOP)的連續場景,並且為了編碼所述場景的所有視頻對象,該編碼方法產生一個編碼比特流,該編碼比特流的內容按照分開的通道被描述並且由編碼的視頻數據構成,其中藉助於一個比特流語法來描述每一個數據項以便允許識別和解碼所述內容的所有單元,所述語法包括被提供來獨立地描述對各個通道的時間預測的類型的附加語法信息。根據本發明,所述附加語法信息是一個在片段級或者在宏塊級被放置於所述編碼比特流中的語法單元,並且其意義或者對於每一個存在的通道是特定的,或者可以由所有存在的通道共享。
文檔編號H04N7/36GK1784905SQ200480012118
公開日2006年6月7日 申請日期2004年4月28日 優先權日2003年5月6日
發明者C·杜福爾, G·馬匡特, S·瓦倫特 申請人:皇家飛利浦電子股份有限公司