新四季網

圖象編碼裝置、圖象解碼裝置、圖象編碼方法、圖象解碼方法及媒體的製作方法

2023-06-17 20:05:51 4

專利名稱:圖象編碼裝置、圖象解碼裝置、圖象編碼方法、圖象解碼方法及媒體的製作方法
技術領域:
本發明涉及圖象編碼裝置、圖象解碼裝置、圖象編碼方法、圖象解碼方法以及可以被用於傳送和存儲圖象的媒體。
背景技術:
當對圖象進行合成時,存在這種情況,除了目標的亮度外還附加稱為α值的信息,表示目標的重疊區和透明度。確定每個象素的α值,α值為1表示完全不透明或遮斷,α值為0表示完全透明或不遮斷。當目標圖象重疊在背景圖象上時α值變為必不可少。以下將僅由這種α值表示的圖象稱為α平面。
在雲、毛玻璃等情況中,可以採用介於
之間的α值來表示圖象,但是,存在用兩個值{0,1}就足夠的情況。
對應傳統的二值α平面的編碼,可以採用傳真等系統常用的CCITT國際標準中所定義的二值圖象編碼技術,如MR和MMR,或者用JPEG進行標準化的編碼技術。這種編碼方案通常稱為二值靜止圖象編碼。在二值靜止圖象編碼中,通過在掃描方向上從高階象素預測低階象素以及對它們之間的差值進行熵編碼能夠實現有效的編碼。
在二值活動圖象中,如活動圖象的兩個順次α平面,可以利用順次幀之間的相關性。即,通過從以前獲得的具有高度相關性的二值圖象中預測待編碼的象素和對它們之間的差值進行編碼,而不是在掃描方向上從高階象素預測低階象素和對它們之間的差值進行編碼,能夠實現有效的編碼。
然而,即使在編碼器或者解碼器上獲得與待編碼或解碼二值圖象具有高度相關性的二值圖象時,以現有技術進行的二值靜止圖象編碼僅利用了掃描方向上高階與低階象素之間的相關性,因此,現有技術一直存在需要大量代碼位數的問題。
對於傳統α平面的編碼,採用波形編碼,象以JPEG編碼方案進行的那樣。
然而,許多α平面具有絕大部分是均勻的而中間值沿邊界分布的特性。
由於這種α平面包含沿邊界的高頻成分,採用現有技術進行的波形編碼一直存在難以實現有效編碼的問題。
發明的公開考慮到現有技術的上述問題,本發明的一個目的是提供圖象編碼裝置、圖象解碼裝置、圖象編碼方法、圖象解碼方法以及其上記錄了使計算機執行這些處理操作的程序的媒體,這裡,從以前獲得的具有高度相關性的二值圖象中對待編碼的象素進行預測並對其差值進行編碼,由此能夠實現比利用現有技術中所採用的二值圖象編碼和解碼技術更有效的編碼和解碼。
考慮到上述問題,本發明的再一個目的是提供圖象編碼裝置及其相應的解碼裝置、圖象編碼方法及其相應的圖象解碼方法以及存儲它們執行程序的媒體,這裡,對例如中間值的分布進行分析,對近似該分布的平滑函數和僅有兩個值(最大值和最小值)的二值基本圖象分別進行編碼,由此實現比現有技術所能實現的更有效的編碼。
本發明權利要求1是一種圖象編碼裝置,包括分塊裝置1,取待編碼的目標二值圖象作為輸入,通過將所述目標二值圖象劃分為各含有多個象素的塊而獲得目標塊;分塊裝置2,通過將以前獲得的參考二值圖象劃分為各含有多個象素的塊而獲得參考塊;異或塊構成裝置,通過依次地對所述目標塊和所述參考塊進行掃描和通過對所述兩個塊之間象素值進行異或而構成異或塊;以及異或編碼裝置,產生代表所述異或結果的代碼序列並將其輸出為編碼數據。
本發明權利要求2是一種圖象解碼裝置,包括分塊裝置2,通過將以前獲得的參考二值圖象劃分為各含有多個象素的塊而獲得參考塊;異或解碼裝置,通過對經權利要求1圖象編碼裝置編碼的編碼數據進行解碼而恢復所述異或塊;以及目標塊構成裝置,通過將所述異或塊與所述參考塊進行組合而構成目標塊。
本發明權利要求9是一種圖象編碼裝置,包括分塊裝置1,取待編碼的目標二值圖象作為輸入,通過將所述目標二值圖象劃分為各含有多個象素的塊而獲得目標塊;分塊裝置2,通過將以前獲得的參考二值圖象劃分為各含有多個象素的塊而獲得參考塊;統計模型選擇裝置,基於所述參考塊中參考象素周圍的象素的狀態從多個統計模型中選擇一個統計模型,所述參考象素對應於所述目標塊中的目標塊;以及熵編碼裝置,基於所述的所選統計模型對所述目標象素進行熵編碼並將其輸出為編碼數據。
本發明權利要求12是一種圖象解碼裝置,包括分塊裝置2,通過將以前獲得的參考二值圖象劃分為各含有多個象素的塊而獲得參考塊;統計模型選擇裝置,基於所述參考塊中參考象素周圍的象素的狀態從多個統計模型中選擇一個統計模型,所述參考象素對應於所述目標塊中的目象素;以及熵解碼裝置,根據所述所選統計模型通過對權利要求9圖象編碼裝置輸出的編碼數據進行熵解碼而恢復所述目標塊。
本發明權利要求14是一種依照權利要求9的圖象編碼裝置,進一步包括運動估計裝置,通過所述參考二值圖象搜索與所述目標塊最相似的塊,從所述搜索結果獲得運動信息,這裡,所述分塊裝置2是運動補償分塊裝置2,它利用所述運動信息將運動補償施加到所述參考二值圖象上而獲得參考塊,所述運動信息也是從所述圖象編碼裝置輸出的。
本發明權利要求15是一種依照權利要求12的圖象解碼裝置,這裡,所述分塊裝置2是運動補償分塊裝置2,它利用從權利要求14圖象編碼裝置輸出的運動信息將運動補償施加到所述以前獲得的參考二值圖象上而獲得參考塊。
本發明權利要求16是一種依照權利要求9的圖象編碼裝置,進一步包括參考塊採用確定裝置,將所述目標塊與所述參考塊進行比較,根據所述比較的結果確定所述參考塊是否被採用,由此切換各個裝置之間其餘的處理;以及目標象素編碼裝置,產生代表所述目標塊中象素值的代碼序列並將其輸出為編碼數據,這裡,當所述參考塊採用確定裝置確定所述參考塊被採用時,所述熵編碼裝置和所述統計模型選擇裝置這樣操作,即輸出所述熵編碼裝置的所述編碼數據,而另一方面,當確定所述參考塊不被採用時,所述目標象素編碼裝置這樣操作,即輸出所述目標象素編碼裝置的所述編碼數據,確定所述參考塊是否被採用的結果作為參考塊採用確定信號而輸出。
本發明權利要求18是一種依照權利要求12的圖象解碼裝置,進一步包括參考塊採用控制裝置,根據從權利要求16或17圖象編碼裝置輸出的參考塊採用確定信號確定所述參考塊是否被採用,由此切換各個裝置之間其餘的處理;以及目標象素解碼裝置,通過對所述圖象編碼裝置輸出的所述編碼數據進行解碼而恢復所述目標塊,這裡,當所述參考塊採用控制裝置確定所述參考塊被採用時,所述熵解碼裝置和所述統計模型選擇裝置這樣操作,即從所述熵解碼裝置輸出所述目標塊,而另一方面,當確定所述參考塊不被採用時,所述目標象素解碼裝置這樣操作,即從所述目標象素解碼裝置輸出所述目標塊。
本發明權利要求20是一種圖象編碼裝置,包括分塊裝置1,取待編碼的目標二值圖象作為輸入,通過將所述目標二值圖象劃分為各含有多個象素的塊而獲得目標塊;分塊裝置2,通過將以前獲得的參考二值圖象劃分為各含有多個象素的塊而獲得參考塊;統計模型產生裝置,從所述參考塊產生目標象素的統計模型;以及熵編碼裝置,基於所述產生的統計模型對所述目標象素進行熵編碼並將其輸出為編碼數據。
本發明權利要求21是一種圖象解碼裝置,包括分塊裝置2,通過將以前獲得的參考二值圖象劃分為各含有多個象素的塊而獲得參考塊;統計模型產生裝置,從所述參考塊產生目標象素的統計模型;以及熵解碼裝置,根據所述產生的統計模型通過對權利要求20圖象編碼裝置輸出的編碼數據進行熵解碼而恢復所述目標塊。
本發明權利要求26是一種圖象編碼方法,包括步驟取待編碼的目標二值圖象作為輸入,通過將所述目標二值圖象劃分為各含有多個象素的塊而獲得目標塊;通過將以前獲得的參考二值圖象劃分為各含有多個象素的塊而獲得參考塊;通過依次地對所述目標塊和所述參考塊進行掃描和通過對所述兩個塊之間象素值進行異或而構成異或塊;以及產生代表所述異或結果的代碼序列並將其輸出為編碼數據。
本發明權利要求27是一種圖象解碼方法,包括步驟通過將以前獲得的參考二值圖象劃分為各含有多個象素的塊而獲得參考塊;取由權利要求26圖象編碼方法編碼的編碼數據為輸入,通過對所述編碼數據進行解碼而恢復所述異或塊;以及通過將所述異或塊與所述參考塊進行組合而構成目標塊。
本發明權利要求28是一種圖象編碼方法,包括分塊步驟1,取待編碼的目標二值圖象作為輸入,通過將所述目標二值圖象劃分為各含有多個象素的塊而獲得目標塊;分塊步驟2,通過將以前獲得的參考二值圖象劃分為各含有多個象素的塊而獲得參考塊;統計模型選擇步驟,基於所述參考塊中參考象素周圍的象素的狀態從多個統計模型中選擇一個統計模型,所述參考象素對應於所述目標塊中的目標塊;以及熵編碼步驟,基於所述的所選統計模型對所述目標象素進行熵編碼並將其輸出為編碼數據。
本發明權利要求29是一種圖象解碼方法,包括分塊步驟2,通過將以前獲得的參考二值圖象劃分為各含有多個象素的塊而獲得參考塊;統計模型選擇步驟,基於所述參考塊中參考象素周圍的象素的狀態從多個統計模型中選擇一個統計模型,所述參考象素對應於所述目標塊中的目標塊;以及熵解碼步驟,根據所述所選統計模型通過對按照權利要求28圖象編碼方法輸出的編碼數據進行熵解碼而恢復所述目標塊。
本發明權利要求30是一種依照權利要求28的圖象編碼方法,進一步包括運動估計步驟,通過所述參考二值圖象搜索與所述目標塊最相似的塊,以及從所述搜索的結果獲得運動信息,這裡,所述分塊步驟2是指運動補償分塊步驟2,它利用所述運動信息將運動補償施加到所述參考二值圖象上而獲得參考塊,所述運動信息也是由所述圖象編碼方法輸出的。
本發明權利要求31是一種依照權利要求29的圖象解碼方法,這裡,所述分塊步驟2是指運動補償分塊步驟2,它利用按照權利要求30圖象編碼方法輸出的運動信息將運動補償施加到所述以前獲得的參考二值圖象上而獲得參考塊。
本發明權利要求32是一種依照權利要求28的圖象編碼方法,進一步包括參考塊採用確定步驟,將所述目標塊與所述參考塊進行比較,根據所述比較的結果確定所述參考塊是否被採用,由此切換接下來步驟的執行;以及目標象素編碼步驟,產生代表所述目標塊中象素值的代碼序列並將其輸出為編碼數據,這裡,當在所述參考塊採用確定步驟中確定所述參考塊被採用時,執行所述熵編碼步驟和所述統計模型選擇步驟,從而由所述熵編碼步驟輸出所述編碼數據,而另一方面,當確定所述參考塊不被採用時,執行所述目標象素編碼步驟,從而由所述目標象素編碼步驟輸出所述編碼數據,所述參考塊是否被採用的確定結果作為參考塊採用確定信號而輸出。
本發明權利要求34是一種依照權利要求29的圖象解碼方法,進一步包括參考塊採用控制步驟,根據按照權利要求32或33圖象編碼方法輸出的參考塊採用確定信號確定所述參考塊是否被採用,由此切換接下來步驟的執行;以及目標象素解碼步驟,通過對按照所述圖象編碼方法輸出的所述編碼數據進行解碼而恢復所述目標塊,這裡,當在所述參考塊採用控制步驟中確定所述參考塊被採用時,執行所述熵解碼步驟和所述統計模型選擇步驟,從而從所述熵解碼步驟輸出所述目標塊,而另一方面,當確定所述參考塊不被採用時,執行所述目標象素解碼步驟,從而從所述目標象素解碼步驟輸出所述目標塊。
本發明權利要求36是一種圖象編碼方法,包括步驟取待編碼的目標二值圖象作為輸入,通過將所述目標二值圖象劃分為各含有多個象素的塊而獲得目標塊;通過將以前獲得的參考二值圖象劃分為各含有多個象素的塊而獲得參考塊;從所述參考塊產生目標象素的統計模型;以及基於所述產生的統計模型對所述目標象素進行熵編碼並將其輸出為編碼數據。
本發明權利要求37是一種圖象解碼方法,包括步驟通過將以前獲得的參考二值圖象劃分為各含有多個象素的塊而獲得參考塊;從所述參考塊產生目標象素的統計模型;以及根據所述產生的統計模型通過對按照權利要求36圖象編碼方法輸出的編碼數據進行熵解碼而恢復所述目標塊。
本發明權利要求40是一種圖象編碼裝置,包括多值至二值轉換裝置,取待編碼的目標多值圖象和平滑函數作為輸入,基於所述平滑函數由所述多值圖象產生二值圖象;二值圖象編碼裝置,對所述二值圖象進行編碼並將其輸出為二值圖象編碼數據;以及平滑函數編碼裝置,對所述平滑函數進行編碼並將其輸出為平滑函數編碼數據,這裡,所述平滑函數是指一種這樣調節功能,即如果將所述平滑函數運用到所述二值圖象上能夠有效地再現原始的多值圖象。
本發明權利要求42是一種圖象編碼裝置,包括平滑函數估計裝置,由待編碼的目標多值圖象估計平滑函數;多值至二值轉換裝置,基於確定與所述所估計平滑函數相匹配的多值至二值轉換準則將所述多值圖象轉換為二值圖象並將其輸出為二值圖象編碼數據;二值圖象編碼裝置,對所述二值圖象進行編碼並將其輸出為二值圖象編碼數據;以及平滑函數編碼裝置,對所述平滑函數進行編碼並將其輸出為平滑函數編碼數據。
本發明權利要求43是一種圖象編碼裝置,包括多值至二值轉換裝置,由待編碼的目標多值圖象產生二值圖象;二值圖象編碼裝置,對所述二值圖象進行編碼並將其輸出為二值圖象編碼數據;平滑函數產生裝置,由所述二值圖象和所述目標多值圖象產生平滑函數;以及平滑函數編碼裝置,對所述平滑函數進行編碼並將其輸出為平滑函數編碼數據。
本發明權利要求44是一種依照權利要求43的圖象編碼裝置,這裡,所述平滑函數是利用由相鄰象素的二值化圖案和對應於所述圖案的替換值構成的一個或多個表來表示的。
本發明權利要求45是一種依照權利要求43的圖象編碼裝置,進一步包括二值至多值轉換裝置,利用所述平滑函數通過對所述二值圖象進行平滑而產生多值圖象;以及剩餘成分編碼裝置,對由所述二值至多值轉換裝置產生的多值圖象與由所述多值至二值轉換裝置輸入進行轉換的所述目標多值圖象之間存在的剩餘成分進行編碼。
本發明權利要求46是一種圖象編碼裝置,包括多值至二值轉換裝置,基於確定與所述多值相匹配的多值至二值轉換準則將多值圖象,即待編碼的目標圖象轉換為二值圖象;平滑函數估計裝置,這樣估計平滑函數,即如果將所述平滑函數運用到所述二值圖象上能夠有效地再現原始的多值圖象;二值圖象編碼裝置,對所述二值圖象進行編碼並將其輸出為二值圖象編碼數據;以及平滑函數編碼裝置,對所述所估計平滑函數進行編碼並將其輸出為平滑函數編碼數據。
本發明權利要求48是一種圖象解碼裝置,包括接收由權利要求40、42、43或46圖象編碼裝置所編碼的各種編碼數據作為其輸入的裝置;二值圖象解碼裝置,通過對所述編碼數據當中的所述二值圖象編碼數據進行解碼而恢復所述二值圖象;平滑函數解碼裝置,通過對所述編碼數據當中的所述平滑函數編碼數據進行解碼而恢復所述平滑函數;以及二值至多值轉換裝置,通過用所述已解碼的平滑函數對所述已解碼二值圖象進行平滑而恢復所述多值圖象。
本發明權利要求49是一種圖象解碼裝置,包括接收由權利要求47圖象編碼裝置所編碼的各種編碼數據作為輸入的裝置;二值圖象解碼裝置,通過對所述編碼數據當中的所述二值圖象編碼數據進行解碼而恢復所述二值圖象;平滑函數解碼裝置,通過對所述編碼數據當中的所述平滑函數編碼數據進行解碼而恢復所述平滑函數;動態範圍解碼裝置,通過對所述編碼數據當中的所述動態範圍編碼數據進行解碼而恢復所述動態範圍;以及二值至多值轉換裝置,通過用所述已解碼的平滑函數對所述已解碼二值圖象進行平滑和用所述已解碼的動態範圍對所述象素值進行轉換而恢復所述多值圖象。
本發明權利要求50是一種圖象解碼裝置,包括接收由權利要求44圖象編碼裝置所編碼的各種編碼數據作為輸入的裝置;二值圖象解碼裝置,通過對所述編碼數據當中的所述二值圖象編碼數據進行解碼而恢復所述二值圖象;平滑函數解碼裝置,通過對所述編碼數據當中的所述平滑函數編碼數據進行解碼而恢復所述平滑函數;以及二值至多值轉換裝置,通過用所述已解碼的平滑函數對所述已解碼二值圖象進行平滑而恢復所述多值圖象,這裡,所述已解碼的平滑函數是利用由相鄰象素的二值化圖案和對應於所述圖案的替換值構成的一個或多個表來表示的。
本發明權利要求52是一種圖象解碼裝置,包括接收由權利要求45圖象編碼裝置所編碼的各種編碼數據作為輸入的裝置;二值圖象解碼裝置,通過對所述編碼數據當中的所述二值圖象編碼數據進行解碼而恢復所述二值圖象;平滑函數解碼裝置,通過對所述編碼數據當中的所述平滑函數編碼數據進行解碼而恢復所述平滑函數;二值至多值轉換裝置,通過用所述已解碼的平滑函數對所述已解碼二值圖象進行平滑而恢復所述多值圖象;以及剩餘成分解碼裝置,對所述剩餘成分進行解碼,這裡,輸出圖象是通過將所述已解碼的剩餘成分加在所述二值至多值轉換裝置的輸出上而獲得的。
附圖簡述

圖1是本發明第A1實施例的圖象編碼裝置的方框圖。
圖2是本發明第A2實施例的圖象解碼裝置的方框圖。
圖3是本發明第A3實施例的圖象編碼裝置的方框圖。
圖4是本發明第A4實施例的圖象解碼裝置的方框圖。
圖5是本發明第A5實施例的圖象編碼裝置的方框圖。
圖6是本發明第A6實施例的圖象解碼裝置的方框圖。
圖7是本發明第A7實施例的圖象編碼裝置的方框圖。
圖8是本發明第A8實施例的圖象解碼裝置的方框圖。
圖9是本發明第A9實施例的圖象編碼裝置的方框圖。
圖10是本發明第A10實施例的圖象解碼裝置的方框圖。
圖11是本發明第A11實施例的圖象編碼裝置的方框圖。
圖12是本發明第A12實施例的圖象解碼裝置的方框圖。
圖13是本發明第A13實施例的圖象編碼裝置的方框圖。
圖14是本發明第A14實施例的圖象解碼裝置的方框圖。
圖15是本發明第A15實施例的圖象編碼裝置的方框圖。
圖16是本發明第A16實施例的圖象解碼裝置的方框圖。
圖17是本發明第A17實施例的圖象編碼裝置的方框圖。
圖18是本發明第A18實施例的圖象解碼裝置的方框圖。
圖19是表明掩膜運動圖象中參考圖象和目標圖象的圖。
圖20是說明如何構成異或塊的圖。
圖21是說明算術編碼原理的圖。
圖22是算術編碼的方框圖。
圖23是表明一部分統計模型表的圖。
圖24是表明一部分統計模型表的圖。
圖25是表明一部分統計模型表的圖。
圖26是表明一部分統計模型表的圖。
圖27是說明外推參考塊的圖。
圖28是說明統計模型表中指數的圖。
圖29是頻度-產生機率轉換圖的說明圖。
圖30是本發明另一實施例的圖象編碼裝置的方框圖。
圖31是根據同一實施例的圖象解碼裝置的方框圖。
圖32是本發明又一實施例的圖象編碼裝置的方框圖。
圖33是根據同一實施例的圖象解碼裝置的方框圖。
圖34是本發明再一實施例的圖象編碼裝置的方框圖。
圖35是根據同一實施例的圖象解碼裝置的方框圖。
圖36是本發明第B1實施例的圖象編碼裝置的方框圖。
圖37是表明同一實施例中所使用的多值圖象的圖。
圖38是沿圖37中A-B線的象素值的分布圖。
圖39是根據第B1實施例的平滑函數估計裝置的方框圖。
圖40是本實施例中所使用的非最大值抑制的說明圖。
圖41表明歸一化平均梯度與第B1實施例平滑濾波之間的對應關係。
圖42是根據第B1實施例的平滑濾波器的說明圖。
圖43是說明根據第B1實施例的平滑濾波步驟響應的圖。
圖44是說明本實施例中所使用的閾值化的圖。
圖45是本發明第B2實施例的圖象解碼裝置的方框圖。
圖46是本實施例中所使用的象素值轉換的圖。
圖47是本發明第B3實施例的圖象編碼裝置的方框圖。
圖48是根據第B3實施例的平滑函數估計裝置的方框圖。
圖49表明歸一化平均梯度與根據第B3實施例平滑濾波之間的對應關係。
圖50是說明第B1實施例的平滑濾波器的圖。
圖51是說明根據第B1實施例的平滑濾波步驟響應的圖。
圖52是說明本實施例中形態濾波器的圖。
圖53是本發明第B4實施例的圖象解碼裝置的方框圖。
圖54是本發明第B5實施例的圖象編碼裝置的方框圖。
圖55是根據第B5實施例的平滑函數估計裝置的方框圖。
圖56是說明第B5實施例的平滑濾波器的圖。
圖57是本發明第B6實施例的圖象解碼裝置的方框圖。
圖58是本發明第B7實施例的圖象編碼裝置的方框圖。
圖59是本發明第B8實施例的圖象解碼裝置的方框圖。
圖60是說明第B7、B8、B9和B10實施例中平滑圖案的圖。
圖61是說明第B7、B8、B9和B10實施例中多級平滑的圖。
圖62是本發明第B9實施例的圖象編碼裝置的方框圖。
圖63是本發明第B10實施例的圖象解碼裝置的方框圖。
圖64是本發明第B11實施例的圖象解碼裝置的方框圖。
圖65是第B1實施例的改進例中圖象編碼裝置的方框圖。
圖66是本發明另一實施例的圖象編碼裝置的方框圖。
圖67是圖66所示實施例的改進例中圖象編碼裝置的方框圖。
圖68是第B11實施例的改進例中圖象編碼裝置的方框圖。
圖69是本發明另一實施例的圖象編碼裝置的方框圖。
(參考標號的說明)101分塊裝置1102分塊裝置2103異或塊構成裝置104異或編碼裝置
201異或解碼裝置202分塊裝置2203目標塊構成裝置301分塊裝置1302運動補償分塊裝置2303異或塊構成裝置304異或編碼裝置305運動估計裝置401異或解碼裝置402運動補償分塊裝置2403目標塊構成裝置501分塊裝置1502分塊裝置2503異或塊構成裝置504異或編碼裝置505參考塊採用確定裝置506目標象素編碼裝置601異或解碼裝置602分塊裝置2603目標塊構成裝置604參考塊採用控制裝置605目標象素解碼裝置701分塊裝置1702分塊裝置2703統計模型估計裝置704統計模型705熵編碼裝置801熵解碼裝置802分塊裝置2803統計模型估計裝置
804統計模型901分塊裝置1902運動補償分塊裝置903統計模型估計裝置904統計模型905熵編碼裝置906運動估計裝置1001熵解碼裝置1002運動補償分塊裝置21003統計模型選擇裝置1004統計模型表1101分塊裝置11102分塊裝置21103統計模型選擇裝置1104統計模型表1105熵編碼裝置1106參考塊採用確定裝置1107目標象素編碼裝置1201熵解碼裝置1202分塊裝置21203統計模型選擇裝置1204統計模型表1205參考塊採用控制裝置1206目標象素解碼裝置1301分塊裝置11302分塊裝置21303統計模型估計裝置1304統計模型1305熵編碼裝置1401熵解碼裝置
1402分塊裝置21403統計模型估計裝置1404統計模型1501分塊裝置11502運動補償分塊裝置21503熵編碼裝置1504統計模型估計裝置1505統計模型1506運動估計裝置1601熵解碼裝置1602運動補償分塊裝置21603統計模型估計裝置1604統計模型1701分塊裝置11702分塊裝置21703統計模型估計裝置1704統計模型1705熵估計裝置1706參考塊採用確定裝置1707目標象素編碼裝置1801熵解碼裝置1802分塊裝置21803統計模型估計裝置1804統計模型1805參考塊採用控制裝置1806目標象素解碼裝置1901掩膜運動圖象1902參考圖象1903目標圖象1904參考塊圖象
1905目標塊圖象2001參考塊2002目標塊2003異或塊2101數值線2102範圍2103二進位小數2104產生機率模型2105符號串2201開始2202對範圍進行初始化2203輸入符號2204限制範圍2205是結束符號嗎?2206輸出二進位小數2207結束2301統計模型表2401參考塊2402外推參考塊2403外推參考塊2501參考塊2502目標塊2503參考掩膜2504目標掩膜2601轉換圖10101動態範圍估計裝置10102平滑函數估計裝置10103多值-二值轉換裝置10104二值圖象編碼裝置10105動態範圍編碼裝置
10106平滑函數編碼裝置10201多值圖象10301 X-方向濾波10302 Y-方向濾波10303梯度檢測10304梯度方向檢測10305非最大值抑制10306平均梯度檢測10307平滑函數選擇10601濾波器110602濾波器210603濾波器310604濾波器410901二值圖象解碼裝置10902平滑函數解碼裝置10903動態範圍解碼裝置10904二值-多值轉換裝置10905二值掩膜應用裝置11101動態範圍估計裝置11102平滑函數估計裝置11103多值-二值轉換裝置11104二值圖象編碼裝置11105動態範圍編碼裝置11106平滑函數編碼裝置11201 X-方向濾波11202 Y-方向濾波11203梯度檢測11204梯度方向檢測11205非最大值抑制11206平均梯度檢測
11207平滑函數構成11401平滑濾波步驟211402平滑濾波步驟311403平滑濾波步驟411404平滑濾波係數表11601形態濾波111602形態濾波211603形態濾波311701二值圖象解碼裝置11702平滑函數解碼裝置11703動態範圍解碼裝置11704二值-多值轉換裝置11801動態範圍估計裝置11802平滑函數估計裝置11803多值-二值轉換裝置11804二值圖象編碼裝置11805動態範圍編碼裝置11806平滑函數係數編碼裝置11901 X-方向濾波11902 Y-方向濾波11903梯度檢測11904梯度方向檢測11905非最大值抑制11906平均梯度檢測11907平滑函數產生12101二值圖象解碼裝置12102平滑函數係數解碼裝置12103動態範圍解碼裝置12104二值-多值轉換裝置12201多值-二值轉換裝置
12202二值圖象編碼裝置12203平滑函數估計裝置12204平滑函數編碼裝置12301二值圖象解碼裝置12302平滑函數解碼裝置12303二值-多值轉換裝置12601多值-二值轉換裝置12602二值圖象編碼裝置12603平滑函數估計裝置12604平滑函數編碼裝置12605二值-多值轉換裝置12606差分計算器12607剩餘編碼裝置12701二值圖象解碼裝置12702平滑函數解碼裝置12703二值-多值轉換裝置12704剩餘解碼裝置12705加法器實現本發明的最佳方式以下將參考附圖描述本發明的實施例。
(實施例A1)圖1是表明本發明一個實施例的圖象編碼裝置結構的方框圖。
在圖1中,分塊裝置1(101)是將待編碼的目標圖象作為輸入並將輸入圖象劃分成多個各由多個象素組成的塊的裝置。分塊裝置2(102)是將以前獲得的參考圖象劃分成多個各由多個象素組成的塊的裝置。異或塊構成裝置(103)是通過對由分塊裝置1(101)劃分的圖象所獲取的目標塊和由分塊裝置2(102)劃分的圖象所獲取的參考塊進行掃描以及對它們之間的象素值進行異或而構成一個異或塊的裝置。異或編碼裝置(104)是對異或塊進行編碼並輸出編碼數據的裝置。
以下將描述由此構成的本實施例的圖象編碼裝置的操作以及按照本發明一個實施例的圖象編碼方法的操作。
這裡,將如圖19所示的人的運動掩膜圖象(1901)的第(t+1)幀作為目標二值圖象,將第t幀(1902)作為參考二值圖象。在以下所述的附圖中,值1代表黑,值0代表白。目標二值圖象(1903)被分塊裝置1(101)劃分為8×8象素的目標塊,如目標塊圖象(1905)所示。然而,分塊裝置1(101)中的圖象分塊不限於8×8象素或16×16象素的塊。同樣,參考二值圖象(1902)被劃分為參考塊,如參考塊圖象(1904)所示。
參考二值圖象(1902)被分塊裝置2(102)劃分為8×8象素的參考塊,如參考塊圖象(204)中所示。然而,分塊裝置2(102)中的圖象分塊不限於8×8象素或16×16象素的塊。
圖20中所示的目標塊(2002)是從目標塊圖象(1905)中獲得的一個塊。參考塊(2001)是從參考塊圖象(1904)中獲得的與目標塊(2001)相匹配的一個塊。異或塊構成裝置(103)從左上到右下對目標塊(2002)和參考塊(2001)進行掃描,對它們之間的象素值進行異或,由此而構成異或塊(2003)。異或編碼裝置(104)採用通常稱為算術編碼的技術對由0和1組成的異或塊(2003)進行編碼。下面將簡要地描述一下算術編碼(參考Hiroshi Yasuda,「多媒體編碼的國際標準」,第3章算術編碼,Maruzen出版)。
圖21是說明算術編碼原理的圖。在算術編碼中,利用符號串(2105)和符號產生機率模型(2104),從0到1的數值線(2101)逐次限制來自符號串(2105)的每個符號輸入,不管下一個將是什麼,將不超出所獲範圍(2102)的最短二進位小數(2103)輸出為編碼數據。
圖22示出了算術編碼的流程圖。在2201中,開始進行算術編碼。在2202中,將範圍初始化為由0和1限制的間隔。在2203中,輸入符號。在2204中,將產生機率模型指定為當前範圍並將輸入符號的機率範圍設定為新範圍。在2205中,如果符號是結束符號,那麼,在2206中由被輸出的二進位小數表示範圍,在2207中終止算術編碼。如果在2205中符號不是結束符號,那麼,在2203中輸入下一個符號。如果符號的數目是預定的,那麼可以省略結束符號。
通過確定來自二進位小數的符號串而進行解碼。眾所周知,算術編碼具有符號與符號的產生機率模型匹配得越好,符號產生機率偏移越大,對符號串進行編碼的代碼位越少的特點。人們還知道,即使在編碼期間改變了產生機率模型,如果改變模型的方法是已知的,也能夠進行解碼。
利用上述算術編碼和將(0,0.9)作為符號0和(0.9,1.0)作為符號1的產生機率模型,異或塊編碼裝置(104)產生由0和1符號串組成的異或塊的編碼序列並將其輸出為編碼數據。
如上所述,在本實施例中,利用在掩膜運動圖象等的情況中由目標塊和參考塊的異或以約9∶1比率得到符號0和符號1的產生機率的特點,以及通過將異或與算術編碼相結合,能夠實現具有較少代碼位數的有效編碼。
(實施例A2)圖2是表明本發明一個實施例的圖象解碼裝置結構的方框圖。以下將參考該圖描述本實施例的結構。
在本圖中,異或解碼裝置(201)是將編碼數據作為輸入並對其進行解碼以恢復異或塊的裝置。分塊裝置2(202)是將以前獲得的參考圖象劃分成多個各由多個象素組成的參考塊的裝置。目標塊構成裝置(203)是從異或解碼裝置(201)提供的異或塊和分塊裝置(202)提供的參考塊中恢復目標塊的裝置。
以下將描述由此構成的本實施例的圖象解碼裝置的操作以及按照本發明一個實施例的圖象解碼方法的操作。
異或解碼裝置(201)是算術編碼的解碼器,其產生機率模型象異或編碼裝置(104)一樣的將(0,0.9)作為符號0和(0.9,1.0)作為符號1。異或塊是象編碼數據和產生機率模型一樣通過從二進位小數產生的符號串並按掃描方向排列這些符號而構成的。
在操作中,分塊裝置2(202)等效於分塊裝置2(102)。目標塊構成裝置(203)通過對異或塊和參看塊進行掃描以及將參考塊中其值在異或塊中為1的象素的象素值反轉構成目標塊。
如上所述,在本實施例中,利用在掩膜運動圖象等的情況中由目標塊和參考塊的異或以約9∶1比率得到符號0和符號1的產生機率的特點,以及通過將異或與算術編碼相結合,能夠實現具有較少代碼位數的有效解碼。
(實施例A3)圖3是表明本發明一個實施例的圖象編碼裝置結構的方框圖。以下將參考該圖描述本實施例的結構。
在本圖中,分塊裝置1(301)是將待編碼的目標圖象作為輸入並將輸入圖象劃分成多個各由多個象素組成的塊的裝置。運動估計裝置(305)是通過參考圖象搜索同目標塊相似的塊並產生該塊的運動矢量的裝置。運動補償分塊裝置2(302)是將參考圖象和運動信息作為輸入並根據運動信息將輸入參考圖象劃分成多個各由多個象素組成的塊的裝置。異或塊構成裝置(303)是通過對由分塊裝置1(301)劃分的圖象所獲取的目標塊和由運動補償分塊裝置2(302)劃分的圖象所獲取的參考塊進行掃描以及對它們之間的象素值進行異或而構成一個異或塊的裝置。異或編碼裝置(304)是對異或塊進行編碼並輸出編碼數據的裝置。
以下將描述由此構成的本實施例的圖象編碼裝置的操作以及按照本發明一個實施例的圖象編碼方法的操作。
在操作中,分塊裝置1(301)等效於分塊裝置1(101)。當待估計的運動矢量由v表示、目標塊中的象素數目由m表示、圖象中每個象素的位置由u_i(i=1至m)表示、目標圖象中位置x上的象素值由A(x)表示、參考圖象中位置x上的象素值由B(x)表示時,運動估計裝置(305)在預定範圍內檢測使相似性S(v)(方程式A1)到達最小的v並將v輸出為運動矢量。
(方程式A1)S(v)=i=1m|A(u_i+v)-B(u_i)|-----(1)]]>運動補償分塊裝置(302)通過運動矢量使從參考圖象獲取的塊移動並產生輸出的參考塊。在操作中,異或塊構成裝置(303)等效於異或塊構成裝置(103)。異或編碼裝置(304)等效於異或編碼裝置(104)。
如上所述,根據本實施例,利用運動估計裝置和運動補償分塊裝置,以使得產生機率的比率更接近9∶1的這種方式將運動補償運用於在異或塊中符號0和符號1的產生機率遠不同於9∶1比率的塊上,能夠實現具有較少代碼位數的有效編碼。
(實施例A4)圖4是表明本發明一個實施例的圖象解碼裝置結構的方框圖。以下將參考該圖描述本實施例的結構。
在本圖中,異或解碼裝置(401)是將編碼數據作為輸入並對其進行解碼以恢復異或塊的裝置。運動補償分塊裝置2(402)是將參考圖象和運動信息作為輸入並根據該運動信息將輸入參考圖象劃分成多個各由多個象素組成的塊的裝置。目標塊構成裝置(403)是從異或解碼裝置(401)提供的異或塊和運動補償分塊裝置(402)提供的參考塊恢復目標塊的裝置。
以下將描述由此構成的本實施例的圖象解碼裝置的操作以及按照本發明一個實施例的圖象解碼方法的操作。
在操作中,異或塊解碼裝置(401)等效於異或塊解碼裝置(201)。運動補償分塊裝置2(402)等效於運動補償分塊裝置2(302)。目標塊構成裝置(403)等效於目標塊構成裝置(203)。
如上所述,根據本實施例,利用運動估計裝置和運動補償分塊裝置,以使得產生機率的比率更接近9∶1的這種方式將運動補償運用於在異或塊中符號0和符號1的產生機率遠不同於9∶1比率的塊上,能夠實現具有較少代碼位數的有效解碼。
(實施例A5)圖5是表明本發明一個實施例的圖象編碼裝置結構的方框圖。以下將參考該圖描述本實施例的結構。
在本圖中,分塊裝置1(501)是將待編碼的目標圖象作為輸入並將輸入圖象劃分成多個各由多個象素組成的塊的裝置。分塊裝置2(502)是將參考圖象劃分成多個各由多個象素組成的塊的裝置。異或塊構成裝置(503)是通過對由分塊裝置1(501)劃分的圖象所獲取的目標塊和由分塊裝置2(502)劃分的圖象所獲取的參考塊進行掃描以及通過對它們之間的象素值進行異或而構成一個異或塊的裝置。異或編碼裝置(504)是對異或塊進行編碼並輸出編碼數據的裝置。參考塊採用確定裝置(505)是將目標塊與參考塊進行比較以及輸出參考塊採用確定信號以切換下一步處理的裝置。目標象素編碼裝置(506)是對目標塊進行編碼並輸出編碼數據的裝置。
以下將描述由此構成的本實施例的圖象編碼裝置的操作以及按照本發明一個實施例的圖象編碼方法的操作。
在操作中,分塊裝置1(501)等效於分塊裝置1(101),分塊裝置2(502)等效於分塊裝置2(102)。如果絕對差之和大於或等於閾值則利用目標象素編碼裝置(506)進行編碼,如果絕對差之和小於閾值則利用異或塊構成裝置(503)和異或編碼裝置(504)進行編碼,參考塊採用確定裝置(505)以這種方式,根據目標塊與參考塊之間的絕對差之和(SAD)輸出參考塊採用確定信號,進行處理的切換。這裡,5用作閾值。在操作中,異或塊構成裝置(503)等效於異或塊構成裝置(103),異或編碼裝置(504)等效於異或編碼裝置(104)。目標象素編碼裝置(506)大體上等效於異或編碼裝置(504),是一個將目標塊作為輸入的算術編碼器,其產生機率模型取
]>在梯度方向檢測(10304)中,利用x-方向濾波(10301)獲得的x-方向梯度dx(i,j)和y-方向濾波(10302)獲得的y-方向梯度dy(i,j),通過對下列方程式B2的計算,對梯度方向θ(i,j)進行檢測,這裡(i,j)是圖象上的坐標。
(方程式B2)=tan-1dydx---(2)]]>在非最大值抑制(10305)中,如圖40所示,利用隨0變化的窗口,以這樣的方式產生圖象,即如果在窗口中參考點上的梯度值是最大值,那麼給該參考點的坐標上的圖象部分分配1值;否則,給參考點的坐標上的圖象部分分配0值。
在平均梯度檢測(10306)中,對於由非最大值抑制(10305)所獲得的二值圖象中的取1值的象素,通過計算梯度檢測(10303)中所檢測到梯度的平均值可獲得平均梯度d』ave。此外,利用動態範圍估計裝置(10101)所檢測的最大象素值Dmax和最小象素值Dmin,由以下的方程式B3重新計算歸一化的平均梯度,得到dave。
(方程式B3)dave=255Dmax-Dmindave---(3)]]>如圖41所示,平滑函數選擇裝置(10307)根據平均梯度dave選擇一個平滑濾波器。圖42示出圖41中平滑濾波器1的詳細情況。在圖42中,劃圓圈的位置表示接受平滑的象素的位置。在對圖象掃描時,分別計算與濾波器1的卷積結果(10601)、與濾波器2的卷積結果(10602)、與濾波器3的卷積結果(10603)和與濾波器4的卷積結果(10604),取四個濾波器的最小值為平滑濾波器1的結果。在圖42中,a、b、c、d、e、f、g和h各為0.5。平滑濾波器2是在應用平滑濾波器1之後應用平滑濾波器1的濾波器。
平滑濾波器3是在應用平滑濾波器2之後應用平滑濾波器1的濾波器。當dave大於191時,由於圖象的梯度被認為是代表階躍邊緣,所以不應用平滑濾波器進行平滑。另一方面,當dave小於10時,由於被認為不存在圖象梯度,所以不應用平滑濾波器進行平滑。
考慮到平滑函數估計裝置(10102)所估計的平滑函數的特徵,多值至二值轉換轉換裝置(10103)將多值圖象轉換為僅具有兩個象素值255和0的二值圖象。圖43示出平滑濾波器1、平滑濾波器2和平滑濾波器3對一維階躍的響應,於是,對應於平滑濾波器1、平滑濾波器2和平滑濾波器3的多值至二值的轉換是諸如圖44所示的閾值化。因此,多值至二值轉換裝置(10103)將圖44所示的閾值化運用到多值圖象上。
二值圖象編碼裝置(10104)利用二值圖象編碼方案MMR(在傳真系統常用的CCITT國際標準中所定義的)對二值圖象進行編碼並輸出編碼數據。
平滑函數編碼裝置(10106)對平滑函數估計裝置(10102)所估計的平滑函數進行編碼並輸出編碼數據。在本實施例中,由於平滑函數是從三個平滑函數中選出的,所以對所選平滑函數的識別號進行編碼,將其輸出為編碼數據。
動態範圍編碼裝置(10105)分別對動態範圍估計裝置(10101)所獲得的Dmax和Dmin進行編碼並將其輸出為編碼數據。
如上所述,在本實施例中,通過利用圖象中幾乎所有的象素都具有一致的最小值或最大值以及沿邊界分布的中間值的多值圖象的特性,對中間值的分布狀態進行分析,對中間值分布提供良好近似的平滑函數進行估計,以及對與所估計平滑函數相對應的二值基本圖象進行估計。通過對所估計的最大象素值和最小象素值、估計的平滑函數和估計的二值基本圖象分別進行編碼以及將結果輸出為編碼數據,能夠實現有效的編碼。
(實施例B2)圖45是表明本發明第B2實施例的圖象解碼裝置結構的方框圖。以下將參考該圖描述本實施例的結構。
在該圖中,二值圖象解碼裝置(10901)是通過對二值圖象編碼數據進行解碼而恢復二值圖象的裝置。
平滑函數解碼置(10902)是通過對平滑函數編碼數據進行解碼而恢復平滑函數的裝置。
動態範圍解碼裝置(10903)是通過對動態範圍編碼數據進行解碼而恢復動態範圍的裝置。
二值至多值轉換裝置(10904)是通過利用平滑函數解碼裝置(10902)所恢復的平滑函數對二值圖象進行平滑以及通過利用動態範圍解碼裝置(10903)所恢復的動態範圍進行亮度轉換而恢復多值圖象的裝置。
二值掩膜應用裝置(10905)是通過用二值圖象解碼裝置(10901)所恢復的二值圖象把掩膜化應用到多值圖象上而獲得新的多值圖象的裝置。
以下將描述由此構成的本實施例的圖象解碼裝置的操作。
二值圖象解碼裝置(10901)通過對利用傳真等系統常用的CCITT國際標準中所定義的二值圖象編碼方案MMR進行編碼的二值圖象編碼數據進行解碼,恢復僅具有兩個象素值0和255的二值圖象。
平滑函數解碼裝置(10902)是通過對平滑函數編碼數據進行解碼而恢復平滑函數。
動態範圍解碼裝置(10903)是通過對動態範圍編碼數據進行解碼而恢復最大象素值Dmax和最小象素值Dmin。
二值至多值轉換裝置(10904)實際上應用平滑函數解碼裝置(10902)所恢復的平滑濾波器。(對於應用平滑濾波器的方法,參考平滑函數選擇裝置(10307)和圖42的描述)。此外,利用動態範圍解碼裝置(10903)所恢復的最大象素值Dmax和最小象素值Dmin,進行如圖46所示的線性轉換,恢復多值圖象。在二值掩膜應用裝置(10905)中,利用二值圖象解碼裝置(10901)所恢復的二值圖象,與二值圖象中0值象素相對應的多值圖象中象素的值被強迫改變為Dmin,從而使編碼的多值圖象中具有最小象素值的象素不會取最小象素值以外的其它任何值。當需要限制Dmin的位置以維持與紋理數據的匹配時,二值掩膜應用裝置(10905)是特別有效的,但是,如果沒有這樣的需要,則可以省略該裝置。
如上所述,在本實施例中,通過利用圖象中幾乎所有的象素都具有均勻的最小值或最大值以及沿邊界分布的中間值的多值圖象的特性,對中間值的分布狀態進行分析,對中間值分布提供良好近似的平滑函數進行估計,以及對與所估計平滑函數相對應的二值基本圖象進行估計。通過對所估計的最大象素值和最小象素值、估計的平滑函數和估計的二值基本圖象分別進行編碼以及對編碼數據進行解碼並輸出,能夠實現具有較少代碼位的有效解碼。
(實施例B3)圖47是表明本發明第B3實施例的圖象編碼裝置結構的方框圖。以下將參考該圖描述本實施例的結構。
在該圖中,動態範圍估計裝置(11101)是取目標多值圖象作為輸入、提取多值圖象中最大面積的象素值和次最大面積的象素值的裝置。
平滑函數估計裝置(11102)是取多值圖象和動態範圍作為輸入以及通過對多值圖象中亮度梯度的分析而估計平滑函數的裝置。
多值至二值轉換裝置(11103)是利用動態範圍、平滑函數和多值圖象產生二值圖象,從而在利用動態範圍進行亮度轉換和利用平滑函數進行平滑時能夠很好地接近多值圖象的裝置。
動態範圍編碼裝置(11104)是對動態範圍進行編碼和輸出編碼數據的裝置。
平滑函數編碼裝置(11105)是對平滑函數進行編碼和輸出編碼數據的裝置。
二值圖象編碼裝置(11106)是對二值圖象進行編碼和輸出編碼數據的裝置。
以下將描述由此構成的本實施例的圖象編碼裝置的操作。
動態範圍估計裝置(11101)提取多值圖象中最大面積的象素值和次最大面積的象素值;在許多個多值圖象中,這些象素值分別與最大象素值和最小象素值相一致,從而在本實施例中,最大象素值Dmax和最小象素值Dmin是通過對目標多值圖象的掃描提取的。
圖48示出平滑函數估計裝置(11102)。
在x-方向濾波(11201)中,應用x-方向濾波器(10401)在圖象上掃描,沿x-方向對圖象中的梯度進行檢測。在y-方向濾波(11202)中,應用y-方向濾波器(10402)在圖象上掃描,沿y-方向對圖象中的梯度進行檢測。
在梯度檢測(11203)中,利用x-方向濾波(11201)獲得的x-方向梯度dx(i,j)和y-方向濾波(11202)獲得的y-方向梯度dy(i,j),通過方程式B1的計算,對梯度d(i,j)進行檢測,這裡(i,j)是圖象上的坐標。
在梯度方向檢測(11204)中,利用x-方向濾波(11201)獲得的x-方向梯度dx(i,j)和y-方向濾波(11202)獲得的y-方向梯度dy(i,j),通過方程式B2的計算,對梯度方向θ(i,j)進行檢測,這裡(i,j)是圖象上的坐標。
在非最大值抑制(11205)中,如圖40所示,利用隨θ變化的窗口,以這樣的方式產生圖象,即如果在窗口中參考點上的梯度值是最大值,那麼給該參考點的坐標上的圖象部分分配1值;否則,給參考點的坐標上的圖象部分分配0值。
在平均梯度檢測(11206)中,對於由非最大值抑制(11205)所獲得的二值圖象中的取1值的象素,通過計算梯度檢測(11203)中所檢測到梯度的平均值,可獲得平均梯度d』ave。此外,利用動態範圍估計裝置(11101)所檢測的最大象素值Dmax和最小象素值Dmin,由方程式B3重新計算歸一化的平均梯度,得到dave。
在平滑函數構成(11207)中,根據歸一化的平均梯度dave構成平滑濾波器,如圖49所示。構成平滑濾波器的步驟的次數是根據梯度而變化的,如圖49所示。圖50示出圖49中平滑濾波器的詳細情況。在該圖中,分別用11401、11402和11403表示平滑濾波器2、平滑濾波器3和平滑濾波器4。該圖還示出平滑濾波器係數表11404。當dave大於191時,由於圖象的梯度被認為是代表階躍邊緣,所以不應用平滑濾波器進行平滑。另一方面,當dave小於10時,由於認為不存在圖象梯度,所以不應用平滑濾波器進行濾波。
考慮到平滑函數估計裝置(11102)所估計的平滑函數的特徵,多值至二值轉換轉換裝置(11103)將多值圖象轉換為僅具有兩個象素值255和0的二值圖象。圖51示出平滑濾波步驟2、平滑濾波步驟3和平滑濾波器步驟4對一維階躍的響應,於是,對應於平滑濾波步驟2(11401)、平滑濾波步驟3(11402)和平滑濾波步驟4(11403)的多值至二值轉換涉及到如圖44所示的閾值化,接著用諸如圖52所示的形態濾波器進行形態濾波。即,這樣進行處理,當構成平滑濾波步驟2時,利用形態濾波器1(11601)以濾波器窗口中的最小值取代參考點;當構成平滑濾波步驟3(11603)時,利用形態濾波器2(11602)以濾波器窗口中的最小值取代參考點;當構成平滑濾波步驟4時,利用形態濾波器3以濾波器窗口中的最小值取代參考點。
因此,多值至二值轉換裝置(11103)在進行圖44所示的閾值化後,利用按照圖52所示構造的平滑濾波器將形態處理運用到多值圖象上。
二值圖象編碼裝置(11104)利用二值圖象編碼方案MMR(在傳真系統常用的CCITT國際標準中所定義的)對二值圖象進行編碼並輸出編碼數據。
平滑函數編碼裝置(11105)對平滑函數估計裝置(11102)所估計的平滑函數進行編碼並輸出編碼數據。
動態範圍編碼裝置(11106)對動態範圍估計裝置(11101)所獲得的Dmax和Dmin進行編碼並輸出為編碼數據。
如上所述,在本實施例中,通過利用圖象中幾乎所有的象素都具有均勻的最小值或最大值以及沿邊界分布的中間值的多值圖象的特性,對中間值的分布狀態進行分析,對中間值分布提供良好近似的平滑函數進行估計,以及對與所估計平滑函數相對應的二值基本圖象進行估計。通過對所估計的最大象素值和最小象素值、估計的平滑函數和估計的二值基本圖象分別進行編碼以及將結果輸出為編碼數據,能夠實現有效的編碼。
(實施例B4)圖53是表明本發明第B4實施例的圖象解碼裝置結構的方框圖。以下將參考該圖描述本實施例的結構。
在該圖中,二值圖象解碼裝置(11701)是通過對二值圖象編碼數據進行解碼而恢復二值圖象的裝置。
平滑函數解碼裝置(11702)是通過對平滑函數編碼數據進行解碼而恢復平滑函數的裝置。
動態範圍解碼裝置(11703)是通過對動態範圍編碼數據進行解碼而恢復動態範圍的裝置。
二值至多值轉換裝置(11704)是通過利用平滑函數解碼裝置(11702)所恢復的平滑函數對二值圖象進行平滑以及通過利用動態範圍解碼裝置(11703)所恢復的動態範圍進行亮度轉換而恢復多值圖象的裝置。
以下將描述由此構成的本實施例的圖象解碼裝置的操作。
二值圖象解碼裝置(11701)通過對利用傳真等系統常用的CCITT國際標準中所定義的二值圖象編碼方案MMR進行編碼的二值圖象編碼數據進行解碼,恢復僅具有兩個象素值0和255的二值圖象。
平滑函數解碼裝置(11702)是通過對平滑函數編碼數據進行解碼而恢復平滑函數。
動態範圍解碼裝置(11703)是通過對動態範圍編碼數據進行解碼而恢復最大象素值Dmax和最小象素值Dmin。二值至多值轉換裝置(11704)實際上應用平滑函數解碼裝置(11702)所恢復的平滑濾波器。(對於應用平滑濾波器的方法,參考平滑函數構成裝置(11207)和圖50的描述)。此外,利用動態範圍解碼裝置(10903)所恢復的最大象素值Dmax和最小象素值Dmin,如圖46所示,進行線性轉換,恢復多值圖象。
如上所述,在本實施例中,通過利用圖象中幾乎所有的象素都具有均勻的最小值或最大值以及沿邊界分布的中間值的多值圖象的特性,對中間值的分布狀態進行分析,對中間值分布提供良好近似的平滑函數進行估計,以及對與所估計平滑函數相對應的二值基本圖象進行估計。通過對所估計的最大象素值和最小象素值、估計的平滑函數和估計的二值基本圖象分別進行編碼以及對編碼數據進行解碼並輸出,能夠實現具有較少代碼位的有效解碼。
(實施例B5)圖54是表明本發明第B5實施例的圖象編碼裝置結構的方框圖。以下將參考該圖描述本實施例的結構。
在該圖中,動態範圍估計裝置(11801)是取目標多值圖象作為輸入、以及提取多值圖象中最大面積的象素值和次最大面積的象素值的裝置。
平滑函數估計裝置(11802)是取多值圖象和動態範圍作為輸入以及通過對多值圖象中亮度梯度的分析而估計平滑函數的裝置。多值至二值轉換裝置(11803)是利用動態範圍、平滑函數和多值圖象產生二值圖象,從而在利用動態範圍進行亮度轉換和利用平滑函數進行平滑時能夠很好地接近多值圖象的裝置。
動態範圍編碼裝置(11804)是對動態範圍進行編碼和輸出編碼數據的裝置。
平滑函數編碼裝置(11805)是對平滑函數進行編碼和輸出編碼數據的裝置。二值圖象編碼裝置(11806)是對二值圖象進行編碼和輸出編碼數據的裝置。
以下將描述由此構成的本實施例的圖象編碼裝置的操作。
動態範圍估計裝置(11801)提取多值圖象中最大面積的象素值和次最大面積的象素值;在許多個多值圖象中,這些象素值分別與最大象素值和最小象素值相一致,從而在本實施例中,最大象素值Dmax和最小象素值Dmin是通過對目標多值圖象的掃描提取的。
圖55示出平滑函數估計裝置(11802)。在x-方向濾波(11901)中,應用x-方向濾波器(10401)在圖象上掃描,沿x-方向對圖象中的梯度進行檢測。
在y-方向濾波(11902)中,應用y-方向濾波器(10402)在圖象上掃描,沿y-方向對圖象中的梯度進行檢測。在梯度檢測(11903)中,利用x-方向濾波(11901)獲得的x-方向梯度dx(i,j)和y-方向濾波(11902)獲得的y-方向梯度dy(i,j),通過方程式B1的計算,對梯度d(i,j)進行檢測,這裡(i,j)是圖象上的坐標。
在梯度方向檢測(11904)中,利用x-方向濾波(11901)獲得的x-方向梯度dx(i,j)和y-方向濾波(11902)獲得的y-方向梯度dy(i,j),通過方程式B2的計算,對梯度方向θ(i,j)進行檢測,這裡(i,j)是圖象上的坐標。在非最大值抑制(11905)中,如圖40所示,利用隨θ變化的窗口,以這樣的方式產生圖象,即如果在窗口中參考點上的梯度值是最大值,那麼給該參考點的坐標上的圖象部分分配1值;否則,給參考點的坐標上的圖象部分分配θ值。
在逐個方向平均梯度檢測(11906)中,對於通過非最大值抑制(11905)所獲得的二值圖象中取1值的象素,通過計算梯度檢測(11903)中所檢測到梯度的平均值,根據梯度方向(11904)中檢測到梯度方向,可獲得兩個方向中每個方向,即水平方向和垂直方向的平均梯度。此外,利用動態範圍估計裝置(11801)所檢測的最大象素值Dmax和最小象素值Dmin,由方程式B2重新計算歸一化的平均梯度,得到垂直方向的平均梯度dave_1和水平方向的平均梯度dave_2。
在平滑函數構成(11907)中,根據平均梯度dave_1和dave_2,通過估計平滑濾波器係數產生平滑濾波器。在本實施例中,估計圖56所示的步驟次數3的平滑濾波器的係數。這裡,通過方程式B4進行限制,但是,根據圖象可以對每個係數進行加權。
(方程式B4)a=1(4)b=f,c=h (5)g=i=e=d=h+f2---(6)]]>j=a+b+c+d+e+f+g+h+i(7)利用dave_1,通過方程式B5估計c。然而,當dave_1大於200時,圖象的梯度被認為是代表階躍邊緣,所以將c設定為0。另一方面,當dave_1小於50時,認為不存在圖象梯度,所以將c設定為0。
(方程式B5)b=255-dave12dave1---(8)]]>利用dave_2,通過方程式B6估計b。然而,當dave_2大於200時,圖象的梯度被認為是代表階躍邊緣,所以將b設定為0。另一方面,當dave-2小於50時,認為不存在圖象梯度,所以將b設定為0。
(方程式B6)b=255-dave22dave2---(9)]]>如上所述,利用方程式B4、B5和B6估計濾波器係數和標度。考慮到平滑函數估計裝置(11902)所估計的平滑函數的特徵,多值至二值轉換轉換裝置(11903)將多值圖象轉換為僅具有兩個象素值255和0的二值圖象。在本實施例中,閾值是根據濾波器係數估計的,二值圖象是通過利用估計的閾值對多值圖象進行閾值化而獲得的。閾值γ是通過方程式B7估計的。
(方程式B7)=255(a+2b4j+a+2h4j)---(10)]]>二值圖象編碼裝置(11904)利用傳真等系統常用的CCITT國際標準中所定義的二值圖象編碼方案MMR對二值圖象進行編碼並輸出編碼數據。
平滑函數係數編碼裝置(11905)對平滑函數估計裝置(11902)所估計的平滑函數的每個係數和標度進行編碼並輸出編碼數據。動態範圍編碼裝置(11906)分別對動態範圍估計裝置(11801)所獲得的Dmax和Dmin進行編碼並輸出編碼數據。
如上所述,在本實施例中,通過利用圖象中幾乎所有的象素都具有均勻的最小值或最大值以及沿邊界分布的中間值的多值圖象的特性,對中間值的分布狀態進行分析,對中間值分布提供良好近似的平滑函數進行估計,以及對與所估計平滑函數相對應的二值基本圖象進行估計。通過對所估計的最大象素值和最小象素值、估計的平滑函數和估計的二值基本圖象分別進行編碼以及將結果輸出為編碼數據,能夠實現有效的編碼。
(實施例B6)圖57是表明本發明第B6實施例的圖象解碼裝置結構的方框圖。以下將參考該圖描述本實施例的結構。
在該圖中,二值圖象解碼裝置(12101)是通過對二值圖象編碼數據進行解碼而恢復二值圖象的裝置。
平滑函數係數解碼裝置(12102)是通過對平滑函數編碼數據進行解碼而恢復平滑函數的裝置。
動態範圍解碼裝置(12103)是通過對動態範圍編碼數據進行解碼而恢復動態範圍的裝置。
二值至多值轉換裝置(12104)是通過利用平滑函數解碼裝置(12102)所恢復的平滑函數對二值圖象進行平滑以及通過利用動態範圍解碼裝置(12103)所恢復的動態範圍進行亮度轉換而恢復多值圖象的裝置。
以下將描述由此構成的本實施例的圖象解碼裝置的操作。
二值圖象解碼裝置(12101)通過對利用傳真等系統常用的CCITT國際標準中所定義的二值圖象編碼方案MMR編碼的二值圖象編碼數據進行解碼,恢復僅具有兩個象素值0和255的二值圖象。
平滑函數係數解碼裝置(12102)是通過對平滑函數編碼數據進行解碼而恢復平滑濾波器係數和標度,以及因此恢復平滑函數。動態範圍解碼裝置(12103)是通過對動態範圍編碼數據進行解碼而恢復最大象素值Dmax和最小象素值Dain。
二值至多值轉換裝置(12104)採用與平滑函數係數解碼裝置(12102)所恢復的平滑濾波器的卷積。此外,利用動態範圍解碼裝置(12103)所恢復的最大象素值Dmax和最小象素值Dmin,進行如圖46所示的線性轉換,恢復多值圖象。
如上所述,在本實施例中,通過利用圖象中幾乎所有的象素都具有均勻的最小值或最大值以及沿邊界分布的中間值的多值圖象的特性,對中間值的分布狀態進行分析,對中間值分布提供良好近似的平滑函數進行估計,以及對與所估計平滑函數相對應的二值基本圖象進行估計。通過對所估計的最大象素值和最小象素值、估計的平滑函數和估計的二值基本圖象分別進行編碼以及對編碼數據進行解碼並輸出,能夠實現具有較少代碼位的有效解碼。
(實施例B7)圖58是表明本發明第B7實施例的圖象編碼裝置結構的方框圖。以下將參考該圖描述本實施例的結構。
在該圖中,多值至二值轉換裝置(12201)是取目標圖象(取值範圍在0至255之間,每個取值為整數)作為輸入,通過給0值的象素分配0值而給其它值的象素分配255值而對輸入目標圖象進行二值化的裝置。
二值圖象編碼裝置(12202)是對取值為{0,255}的二值圖象進行編碼和輸出編碼數據的裝置。平滑函數估計裝置(12203)是確定平滑函數的裝置。平滑函數編碼裝置(12204)是對如此確定的功能進行編碼的裝置。這裡,平滑函數估計裝置(12203)對應於本發明的平滑函數發生裝置。
以下將描述由此構成的本實施例的圖象編碼裝置的操作。
通過二值圖象編碼裝置(12202)對由多值至二值圖象轉換裝置(12201)作過二值化的二值圖象進行編碼。對於這種編碼,採用了傳真等系統常用的CCITT國際標準中所定義的二值圖象編碼方案MMR,0值為白,255值為黑。
另一方面,利用平滑函數估計裝置(12203)將二值化的圖象與輸入多值圖象進行比較,確定平滑函數。以下將參考圖60和61說明這一點。
正如在背景技術中所描述的,許多α平面具有絕大部分是均勻的和中間值沿邊界分布的特性。為了再現沿邊界分布的中間值,考慮平滑操作,這裡,根據垂直(b3,b0)和水平(b2,b1)相鄰象素的值是否為255,對於中心象素值x作出替換。
由於通過給0值的象素分配0和給其它值的象素分配255對目標多值圖象進行二值化,只有在目標象素的值為255時才進行替換。因此,取值為255的象素的四個相鄰象素的二值化圖案是由四個位(16個圖案)表示的。
平滑函數估計裝置(12203)對圖象進行掃描,通過尋找取值為255的象素的四個相鄰象素的16圖案中每個圖案的平均值獲得替換值。表1示出一個例子。
(表1)

於是,在邊界處的象素值從0變為255的情況下,例如,如圖61中第一平滑級所示,將象素值替換為128。如果在輪廓上或者附近存在兩個具有中間值的象素,那麼,對於取值為255的象素,以遞歸方式重複進行尋找取值為255的象素的四個相鄰象素的16個圖案中每個圖案的平均值的操作。表2示出第二操作的結果。以這種方式,能夠表示對應於圖61中第二平滑級的具有中間值的邊界。
(表2)


獲得平滑函數估計裝置(12203)的輸出,作為平滑級的數目(在所示的例子中,是2級,最大可能數目是8級)和對應於級數目的(b3、b2、b1、b0)圖案的象素值表。這裡,級的數目是指以遞歸方式重複進行平滑操作的重複次數。平滑函數編碼裝置(12204)將平滑級的數目編碼為三個位數和將(b3、b2、b1、b0)圖案的象素值表編碼為8位×15(包括所有象素值為255圖案在內的圖案的數目)×級的數目。
(實施例B8)圖59是表明本發明第B8實施例的圖象解碼裝置結構的方框圖。以下將參考該圖描述本實施例的結構。將第七實施例圖象編碼裝置的輸出提供作為本實施例圖象解碼裝置的輸入。二值圖象解碼裝置(12301)是取二值圖象編碼裝置(12202)的輸出作為輸入並從二值圖象編碼數據中恢復{0,255}二值圖象的裝置。平滑函數解碼裝置(12302)是對平滑函數編碼裝置(12204)的輸出進行解碼的解碼裝置。二值至多值轉換裝置(12303)是取平滑函數和二值圖象為輸入和重構多值圖象的裝置。
以下將描述由此構成的本實施例的圖象解碼裝置的操作。
二值圖象解碼裝置(12301)採用MMR解碼方案。對於與級數目相對應的圖案,平滑函數解碼裝置對平滑級的數目和替換象素值表進行解碼。假設在圖象解碼裝置例子中所採用的解碼錶是兩個表,即表1和表2。二值至多值轉換裝置(12303)在取值為255的每個象素上進行轉換,通過參考其四個相鄰象素利用表1和2以兩級對其值進行轉換,如圖61所示。
如上所述,在第七和第八實施例中,通過利用圖象中幾乎所有的象素都具有均勻的二值以及中間值沿邊界分布的多值圖象的特性,對中間值的分布狀態進行分析,對中間值分布提供良好近似的平滑函數進行估計。由於平滑函數是由多級表示的,即使中間值的寬度大於或等於兩個象素,對應最高為8個象素,能夠表示任何平滑圖案。這裡,任何平滑圖案是指邊界上的升/降特性。
(實施例B9)圖62是表明本發明第B9實施例的圖象編碼裝置結構的方框圖。以下將參考該圖描述本實施例的結構。在該圖中,多值至二值轉換裝置(12601)是取目標圖象(取值範圍為0至255,每個取值為整數)作為輸入,通過給0值的象素分配0值和給其它值的象素分配255值對輸入目標圖象進行二值化的裝置。二值圖象編碼裝置(12602)是對取值為{0,255}的二值圖象進行編碼和輸出編碼數據的裝置。平滑函數估計裝置(12603)是確定平滑函數的裝置。
平滑函數編碼裝置(12604)是對如此確定的功能進行編碼的裝置。二值至多值轉換裝置(12605)是取平滑函數和二值圖象作為輸入並重構多值圖象的裝置。差分計算器(12606)是獲得二值至多值轉換裝置(12605)輸出與目標多值圖象之間差值的裝置。剩餘編碼裝置(12607)是對差值進行編碼的裝置。
以下將描述由此構成的本實施例的圖象編碼裝置的操作。
標號2601至2605表示的方塊與以前參考圖58和59所述的相同名稱的方塊的構造和操作是相同的。在本實施例中,採用第七實施例中所示的圖象編碼裝置作為預測器,即取二值至多值轉換裝置(12605)的輸出作為預測圖象,通過差分計算器(12606)獲得預測圖象的差值,然後,由剩餘編碼裝置(12607)對差值進行編碼。
對於差值的編碼,採用活動圖象編碼H.261的CCITT國際標準所定義的幀間編碼模式(離散餘弦變換編碼)。
(實施例B10)圖63是表明本發明第B10實施例的圖象解碼裝置結構的方框圖。以下將參考該圖描述本實施例的結構。將第九實施例圖象編碼裝置的輸出提供作為本實施例圖象解碼裝置的輸入。
在該圖中,二值圖象解碼裝置(12701)是取二值圖象編碼裝置(12602)的輸出作為輸入並從二值圖象編碼數據中恢復{0,255}二值圖象的裝置。平滑函數解碼裝置(12702)是對平滑函數編碼裝置(12604)的輸出進行解碼的解碼裝置。二值至多值轉換裝置(12703)是取平滑函數和二值圖象為輸入和重構多值圖象的裝置。剩餘解碼裝置(12704)是取剩餘編碼裝置(12607)的輸出作為輸入和獲得剩餘的裝置。加法器(12705)將二值至多值轉換裝置(12703)的輸出與剩餘解碼裝置(12704)相加。
以下將描述由此構成的本實施例的圖象解碼裝置的操作。
標號2701至2705表示的方塊與以前參考圖58和59所述的相同名稱的方塊的構造和操作是相同的。剩餘解碼裝置(12704)採用活動圖象編碼H.261中所定義的幀間解碼模式,與剩餘編碼裝置(12607)的輸出相對應。因此重構差值信號,代表圖41中目標多值圖象與通過對二值圖象進行平滑而獲得的圖象之間的差值,在加法器(12705)中加上差值信號,重構多值圖象。
在第九和第十實施例中,採用第七和第八實施例中所示的圖象編碼方法進行預測,對預測的剩餘成分分別進行編碼、發送和存儲,由此實現目標多值圖象的更準確的再現。具體地說,通過預測邊界上象素值的突然變換,能夠從剩餘信號中去除高頻成分,因此而能夠提高離散餘弦變換編碼的效率。
(實施例B11)圖64是表明本發明第B11實施例的圖象編碼裝置結構的方框圖。以下將參考該圖描述本實施例的結構。
在該圖中,動態範圍估計裝置(20101)是取目標多值圖象作為輸入、提取多值圖象中最大面積的象素值和次最大面積的象素值以及將它們作為動態範圍而輸出的裝置。
多值至二值轉換裝置(20103)是利用動態範圍進行亮度轉換以及利用預定的閾值進行閾值化,產生二值圖象的裝置。
平滑函數估計裝置(20102)是通過考慮多值至二值轉換裝置(20103)中進行的閾值化對多值圖象中亮度梯度進行分析並估計平滑函數的裝置。
動態範圍編碼裝置(20105)是對動態範圍進行編碼和輸出編碼數據的裝置。
平滑函數編碼裝置(20106)是對平滑函數進行編碼和輸出編碼數據的裝置。
二值圖象編碼裝置(20104)是對二值圖象進行編碼和輸出編碼數據的裝置。
以下將參考圖40、49等描述由此構成的本發明的圖象編碼裝置的操作以及按照本發明一個實施例的圖象編碼方法的操作。
動態範圍估計裝置(20101)提取多值圖象中最大面積的象素值和次最大面積的象素值;在許多多值圖象中,這些象素值分別與最大象素值和最小象素值相一致,從而在本實施例中,通過對目標的多值圖象的掃描可提取最大象素值Dmax和最小象素值Dmin。
多值至二值轉換裝置(20103)進行線性轉換,如圖40所示,並利用閾值128對每個象素值進行閾值化,將最大值Dmax設定為255和將最小值Dmin設定為0。
平滑函數估計裝置(20102)通過多值至二置轉換裝置(20103)所進行的閾值化和圖象中象素值的平均梯度,對平滑函數進行估計。在本實施例中,由於閾值化是利用多值至二值轉換裝置(20103)中閾值128進行的,採用了參考點在其中心處的平均濾波器。
平均濾波器的大小是由圖象中象素值的平均梯度確定的。
圖象中象素值的平均梯度dave。是以以下方式計算的。
在x-方向濾波(10301)中,應用x-方向濾波器(10401)在圖象上掃描,沿圖象中的x-方向對梯度進行檢測。
在y-方向濾波(10302)中,應用y-方向濾波器(10402)在圖象上掃描,沿圖象中的y-方向對梯度進行檢測。
在梯度檢測(10303)中,利用x-方向濾波(10301)獲得的x-方向梯度dx(i,j)和y-方向濾波(10302)獲得的y-方向梯度dy(i,j),通過在第1實施例中給出的方程式B1的計算,對梯度d(i,j)進行檢測,這裡(i,j)是圖象上的坐標。
在梯度方向檢測(10304)中,利用x-方向濾波(10301)獲得的x-方向梯度dx(i,j)和y-方向濾波(10302)獲得的y-方向梯度dy(i,j),通過在第1實施例中給出的方程式B2的計算,對梯度方向θ(i,j)進行檢測,這裡(i,j)是圖象上的坐標。
在非最大值抑制(10305)中,如圖40所示,利用隨θ變化的窗口,以這樣的方式產生圖象,即如果在窗口中參考點上的梯度值是最大值,那麼給該參考點的坐標上的圖象部分分配1值;否則,給參考點的坐標上的圖象部分分配0值。
在平均梯度檢測(10306)中,對於由非最大值抑制(10305)所獲得的二值圖象中取1值的象素,通過計算梯度檢測(10303)中所檢測到梯度的平均值可獲得平均梯度d』ave。此外,利用動態範圍估計裝置(20101)所檢測的最大象素值Dmax和最小象素值Dmin,由第1實施例中給出的方程式B3重新計算歸一化的平均梯度,得到dave。
平均濾波器的大小是根據歸一化的平均梯度dave並參考圖49而確定的。
二值圖象編碼裝置(20104)利用二值圖象編碼方案MMR(在傳真系統常用的CCITT國際標準中所定義的)對二值圖象進行編碼並輸出編碼數據。
平滑函數編碼裝置(20106)對平滑函數估計裝置(20102)所估計的平滑函數進行編碼並輸出編碼數據。在本實施例情況中,對平均濾波器的大小進行編碼,將其輸出為編碼數據。
動態範圍編碼裝置(20105)分別對動態範圍估計裝置(20101)所獲得的Dmax和Dmin進行編碼並輸出編碼數據。
如上所述,在本實施例中,通過利用圖象中幾乎所有的象素都具有均勻的最小值或最大值以及沿邊界分布的中間值的多值圖象的特性,對中間值的分布狀態進行分析,以及對中間值分布提供良好近似的平滑函數進行估計。通過對所估計的最大象素值和最小象素值、估計的平滑函數和估計的二值圖象分別進行編碼以及將結果輸出為編碼數據,能夠實現有效的編碼。
在任一上述實施例中,可以產生擁有由計算機執行以上所述全部或部分裝置功能的程序的磁性記錄媒體或光學記錄媒體,這些程序能夠在計算機上運行,以執行上述的操作。
在以上的實施例中已經對本發明的圖象編碼裝置作了描述,它包括動態範圍估計裝置及其編碼裝置,但是,這並不是必要條件,例如,在許多情況中由於Dmax為255和Dmin為0,上述這兩個裝置可以被省略。在這種情況下,如圖65所示,圖象編碼裝置包括平滑函數估計裝置(10102),從目標多值圖象(這是待編碼的圖象)估計平滑函數;多值至二值轉換裝置(10103),按照確定與估計平滑函數匹配的多值至二值轉換準則將多值圖象轉換為二值圖象;二值圖象編碼裝置(10104),對二值圖象進行編碼並將其輸出為二值圖象編碼數據;平滑函數編碼裝置(10106),對估計的平滑函數進行編碼並將其輸出為平滑函數編碼數據。根據這種結構,從待編碼的目標多值圖象估計平滑函數;按照確定與估計平滑函數匹配的多值至二值轉換準則將多值圖象轉換為二值圖象;對二值圖象進行編碼並輸出為二值圖象編碼數據;對估計的平滑函數進行編碼並輸出為平滑函數編碼數據。此外,在這種情況下,能夠獲得同第一種所述結構中所實現的相同效果。
此外,在以上的實施例中已經對本發明的圖象編碼裝置作了描述,它包括平滑函數估計裝置,但是,這並不是必要條件,例如,不包括平滑函數估計裝置的結構也是可以的。在這種情況下,如圖66所示,圖象編碼裝置包括多值至二值轉換裝置,取待編碼的目標多值圖象和平滑函數作為輸入和基於平滑函數從多值圖象產生二值圖象;二值圖象編碼裝置,對二值圖象進行編碼並將其輸出為二值圖象編碼數據;平滑函數編碼裝置,對平滑函數進行編碼並將其輸出為平滑函數編碼數據。平滑函數是這麼進行調節的預定功能,即如果將平滑函數運用到二值圖象上,能夠有效地或者以逼近方式再現原始多值圖象。根據這種結構,輸入待編碼的目標多值圖象和平滑函數;基於平滑函數從多值圖象產生二值圖象;對二值圖象進行編碼並輸出為二值圖象編碼數據;對平滑函數進行編碼並輸出為平滑函數編碼數據。此外,在這種情況下,能夠獲得同第一種所述結構中所實現的大致相同效果。
在圖66所示的實施例中已經對本發明的圖象編碼裝置作了描述,它不包括動態範圍估計裝置等,但是,這並不是必要條件,例如,包括動態範圍估計裝置的結構也是可以的。在這種情況下,圖象編碼裝置除了圖66中所示的元件外還包括從目標多值圖象中獲得動態範圍的動態範圍估計裝置和對動態範圍進行編碼並將其輸出為動態範圍編碼數據的動態範圍編碼裝置,如圖67所示。在這種結構中,多值至二值轉換裝置還通過考慮動態範圍產生二值圖象。在操作中,這種結構除了涉及到聯繫圖66結構所描述的操作外還涉及到從目標多值圖象獲得動態範圍、對動態範圍進行編碼並將其輸出為動態範圍編碼數據。
此外,在圖64所示的實施例中已經對本發明的圖象編碼裝置作了描述,它包括動態範圍估計裝置等,但是,這並不是必要條件,例如,不包括動態範圍估計裝置的結構也是可以的。在這種情況下,如圖68所示,圖象編碼裝置包括多值至二值轉換裝置(20103),按照確定與多值圖象匹配的多值至二值轉換準則將多值圖象(待編碼的圖象)轉換為二值圖象;平滑函數估計裝置(20102),這樣估計平滑函數,即如果將相同的平滑函數運用到二值圖象上,能夠有效地或者以逼近方式再現原始多值圖象;二值圖象編碼裝置(20104),對二值圖象進行編碼並將其輸出為二值圖象編碼數據;以及平滑函數編碼裝置(20106),對估計的平滑函數進行編碼並將其輸出為平滑函數編碼數據。根據這種結構,按照確定與估計待編碼目標多值圖象匹配的多值至二值轉換準則將多值圖象轉換為二值圖象;對平滑函數進行估計,如果被運用到二值圖象上,它能夠有效地或者以逼近方式再現原始多值圖象;對二值圖象進行編碼並輸出為二值圖象編碼數據;以及對估計的平滑函數進行編碼並輸出為平滑函數編碼數據。此外,在這種情況下,能夠獲得同第一種所述結構中所實現的相同效果。
在以上的實施例中已經對本發明的圖象解碼裝置作了描述,它包括動態範圍解碼裝置等,但是,這並不是必要條件,例如,不包括動態範圍解碼裝置的結構也是可以的。在這種情況下,圖象解碼裝置具有接受圖58、65、66或68中所示圖象編碼裝置輸出的多種的編碼數據的結構,如圖69所示,它包括二值圖象解碼裝置,通過對編碼數據之中的二值圖象編碼數據進行解碼而恢復二值圖象;平滑函數解碼裝置,通過對編碼數據之中的平滑函數編碼數據進行解碼而恢復平滑函數;以及二值至多值轉換裝置,利用已解碼的平滑函數通過對已解碼的二值圖象進行平滑而恢復多值圖象。根據這種結構,輸入從任何一個圖象編碼裝置輸出的多種編碼數據;在編碼數據之中,對二值圖象編碼數據進行解碼,恢復二值圖象;在編碼數據之中,對平滑函數編碼數據進行解碼,恢復平滑函數;利用已解碼的平滑函數通過對已解碼的二值圖象進行平滑而恢復多值圖象。此外,在這種情況中,能夠獲得同所述第一結構中實現的效果大致相同的效果。
如上所述,由於下面給出的原因,利用本發明的圖象編碼裝置、圖象解碼裝置、圖象編碼方法和圖象解碼方法能夠實現比利用現有多值圖象編碼技術更有效的編碼和解碼。
1.在多值圖象中,對中間值沿佔據圖象中主要部分的最大值區域與也佔據圖象中主要部分的最小值區域之間邊界的分布進行分析,確定提供該分布良好近似的平滑函數。
2.基於在1中所確定的平滑函數,產生僅有兩個值(最大值和最小值)的二值圖象。
3.採用1中所確定的平滑函數以及在2中產生的二值圖象表示多值圖象進行相應的編碼。
4.在解碼器上,對已編碼的平滑函數和二值圖象進行解碼,重構多值圖象。
從以上的描述中顯而易見,本發明的優點在於能夠實現比現有技術所能實現的更有效的編碼和解碼。
工業應用性如上所述,根據本發明,通過從以前獲得的具有高度相關性的二值圖象中對待編碼的象素進行預測以及通過對其差值進行編碼,能夠實現比利用現有二值圖象編碼和解碼技術更有效的編碼和解碼。此外,根據本發明,對例如中間值的分布進行分析,分別對近似該分布的平滑函數和僅有兩個值(最大值和最小值)的二值基本圖象進行編碼,然後進行解碼,由此實現比現有技術所能實現的更有效的編碼和解碼。
權利要求
1.一種圖像解碼裝置,對通過對每個塊上二值圖像編碼所獲得的編碼數據進行解碼,以恢復目標塊的二值圖像,其特徵在於所述圖像解碼裝置包括參考塊採納控制裝置,用於基於在算術解碼中表示參考塊是否被採納的參考塊採用確定信號在各種裝置之間切換其餘的處理;分塊裝置,用於從參考二值圖像獲得包含多個像素的一個參考塊;統計模型選擇裝置;用於基於所述參考塊中參考像素周圍像素的狀態從多個統計模型中選擇一個統計模擬,所述參考像素對應於所述目標塊中的一個目標像素;以及算術解碼裝置,用於利用所述所選統計模型對所述編碼數據進行解碼而恢復所述目標塊;目標像素解碼裝置,用於通過對所述編碼數據進行算術解碼而恢復所述目標塊;以及其中當所述參考塊採納確定信號表示一個參考塊被採納時,如此操作所述分塊裝置、所述統計模型選擇裝置使得從所述算術解碼裝置輸出解碼二值圖像,而另一方面當所述參考塊採納確定信號表示一個參考塊未被採納時,如此操作所述目標像素解碼裝置使得從所述目標像素解碼裝置輸出解碼二值圖像
2.如權利要求1所述的圖像解碼裝置,其特徵在於所述參考塊中所述參考像素周圍的所述像素是定位在與所述參考像素一個像素距離中的像素。
3.如權利要求1所述的圖像解碼裝置,其特徵在於所述參考塊中所述參考像素周圍的所述像素是直接位於所述參考像素上、下、左和右的四個像素。
4.如權利要求1、2或3所述的圖像解碼裝置,其特徵在於所述統計模型選擇裝置用於進一步基於所述目標像素周圍的像素的狀態從多個統計模型中選擇一個統計模型。
5.如權利要求4所述的圖像解碼裝置,其特徵在於所述目標像素周圍的所述像素直接位於所述目標像素之上、之下、之左和之右。
6.一種圖像解碼方法,用於對通過對每個塊上二值圖像編碼所獲得的編碼數據進行解碼,以恢復目標塊的二值圖像,其特徵在於所述圖像解碼方法包括步驟參考塊採納控制步驟,用於基於在算術解碼中表示參考塊十分被採納的參考塊採用確定信號在各種裝置之間切換其餘的處理;分塊步驟,用於從參考二值圖像獲得包含多個像素的一個參考塊;統計模型選擇步驟;用於基於所述參考塊中參考像素周圍像素的狀態從多個統計模型中選擇一個統計模擬,所述參考像素對應於所述目標塊中的一個目標像素;以及算術解碼步驟,用於利用所述所選統計模型對所述編碼數據進行解碼而恢復所述目標塊;目標像素解碼步驟,用於通過對所述編碼數據進行算術解碼而恢復所述目標塊;以及其中當所述參考塊採納確定信號表示一個參考塊被採納時,如此操作所述分塊裝置、所述統計模型選擇裝置使得從所述算術解碼裝置輸出解碼二值圖像,而另一方面當所述參考塊採納確定信號表示一個參考塊未被採納時,如此操作所述目標像素解碼裝置使得從所述目標像素解碼裝置輸出解碼二值圖像
7.如權利要求6所述的圖像解碼方法,其特徵在於所述參考塊中所述參考像素周圍的所述像素是定位在與所述參考像素一個像素距離中的像素。
8.如權利要求6所述的圖像解碼方法,其特徵在於所述參考塊中所述參考像素周圍的所述像素是直接位於所述參考像素上、下、左和右的四個像素。
9.如權利要求6、7或8所述的圖像解碼方法,其特徵在於所述所選統計模型進一步基於所述目標像素周圍的像素的狀態。
10.如權利要求9所述的圖像解碼方法,其特徵在於所述目標像素周圍的所述像素直接位於所述目標像素之上、之下、之左和之右。
全文摘要
一種圖象編碼裝置,包括:獲得待編碼目標多值圖象動態範圍的動態範圍估計裝置10101;對動態範圍進行編碼並將其輸出為動態範圍編碼數據的動態範圍編碼裝置10105;估計目標多值圖象的平滑函數的平滑函數估計裝置10102;基於確定為平滑函數匹配的多值至二值轉換準則將多值圖象轉換為二值圖象的多值至二值轉換裝置10103;對二值圖象進行編碼並將其輸出為二值圖象編碼數據的二值圖象編碼裝置10104;對平滑函數進行編碼並將其輸出為平滑函數編碼數據的平滑函數編碼裝置10106。這種結構可實現多值圖象的有效編碼。
文檔編號H04N7/50GK1339915SQ01121159
公開日2002年3月13日 申請日期1997年7月25日 優先權日1996年7月31日
發明者畑幸一, 栄藤稔, 安慶武志 申請人:松下電器產業株式會社

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀