增強的票據壓縮的製作方法

2023-05-04 10:32:51 1

專利名稱：增強的票據壓縮的製作方法
技術領域：
本發明通常涉及表示圖形影像之數據的壓縮，用於傳輸和/或存儲，更具體地說，涉及票據的數字影像的極度壓縮。
背景技術：
圖畫的和圖形的影像包含著極大容量的數據，如果為了能夠傳輸和由數字數據處理器進行處理而數位化，往往需要許多兆字節才能以良好的保真度表示影像或者說圖形的各個像素。影像壓縮的目的就是以較小的數據來表示影像，以便節省存儲的成本或傳輸的時間和成本。最有效的壓縮是模仿原始的影像，而不是嚴格地再現它。在VanNostrand Reinhold 1993年出版的、Pennebaker和Mitchell所著的「JPEG Still Image Data Compression Standard」中詳細討論過的JPEG(聯合圖象專家組)標準——這裡全文引用作為參考——使得在各種應用程式之間能夠交換影像，並且開發了在多媒體應用程式中提供數字連續影調彩色影像的能力。
JPEG主要涉及具有二維空間、包含灰度或彩色信息和與時間無關的影像，與MPEG(運動圖象專家組)標準不同。JPEG壓縮能夠降低存儲需求一個數量級以上，並且能夠改善系統的處理響應時間。JPEG標準的主要目標是在給定的數據容量和/或可用時間或處理時間條件下提供最高的影像保真度，以及實現任意程度的數據壓縮。往往會發生這樣的情況，二十或更大倍數的數據壓縮(以及傳輸數據和存儲規模減小相當倍數)將不會產生普通觀察者可以察覺的失真。
當然，其它的數據壓縮技術也是可能的，並且對於某些已知特徵的某些類別的影像或圖形，可能產生更大程度的影像壓縮。JPEG標準已經全面推廣到無論影像內容如何都能實質上同樣地執行，以及滿足多種多樣的數據壓縮需求。所以，採用了幾種版本的JPEG標準中的一種或多種的編碼器和解碼器，已經投入了相對廣泛的使用，能夠廣泛地存取多種多樣目的的影像。標準化也降低了成本，尤其是對解碼器，使得高質量影像能夠廣泛地獲取。所以，使用JPEG標準通常優於其它的數據壓縮技術，即使它們或許會獲得某種微小的效率提高，特別是對於特定的和定義明確的類別的影像。
儘管在數據容量中可能有這樣大的縮減，尤其是使用依據JPEG標準的技術時，但是某些應用需要在影像質量和數據存儲的成本或傳輸時間之間進行艱難的折衷。例如，可能會需要存放一幅影像，其時間周期佔存儲介質或設備之有用壽命的相當大比例，同時需要佔用其存儲容量的相當大部分。所以，在一個給定的時間周期內存放一幅影像的成本，可以視為該存儲介質或設備以及支持數據處理器裝置之成本的一個比例，儘管影像數據可以潛在地重寫任意多的次數。此類存儲的成本當然是要乘以必須存放之影像的數目。
確定存儲成本與影像質量之間折衷的另一種方法，是確定可接受存儲的最大成本，然後確定對於一種給定的質量水平，在可用的存儲中所需數目的影像能夠保存多長時間。這一點與影像壓縮後的長度有關，而長度通常隨影像的複雜程度增加而增長，隨所需重建功能之質量的提高而縮短。
這種苛刻應用的一個實例是法定票據的存儲，如果不存檔的話，它們也必須存放很長時間，特別是可流通票據，比如個人支票，每天都會成千上萬地產生。雖然個人支票的初始清算和資金的傳遞目前是使用自動裝備來進行，而且使用支票上印刷的機器可讀的標記使這些工作更為方便，還是可能會出錯，並且在使用了支票的一項具體業務發生很久之後，可能還需要證明該業務以糾正一個錯誤。
實際上，在這樣一種應用中，所需的影像數據質量也是隨時間而變的。例如，在票據之日期或者處理它的幾個月之內，往往產生是否真實的問題，因而需要影像質量例如足以鑑別籤字，而在其後很久的一個日期，可能僅僅需要影像質量足以確認該票據內容有關的基本信息。所以，當降低的影像質量變得可容許時，尤其是存儲的成本變為更重要的因素時，為了更長期的存儲，影像數據可以進一步壓縮。現在，為了存檔目的，把個人支票影像立即存放在一次寫入的CD-ROM或其它不可修改的介質上，並且按法律規定保存七年。同樣的數據於在線的快速存取存儲介質中僅僅保留幾個月。
個人支票尤其表現了某些影像數據壓縮的複雜性。例如，為了預防欺詐交易，毫無例外地配備了複雜程度或高或低的背景圖案，並且具有一個範圍的影像數值。某些信息將以高反差油墨印刷，可能包括多種顏色，而其它的安全信息則是相對低反差的。還可以包括若干裝飾，包括範圍很寬的影像數值。此外，將以不容易預測的影像數值提供手寫的或印刷的標記(如支票額和籤字)。
即使簡單得多的票據也可能包括多種影像數值，比如信箋抬頭中的顏色和底紋、高反差印刷、紙張上的水印以及多個籤字。需要準確的影像重建時，在一張票據中可能包括之影像數值的這個範圍，可能會限制影像數據可以壓縮的程度。所以，影像重建可能與原始票據達到高保真時，以這樣一種形式存儲的成本相對比較大，這種成本限制了這種存儲形式經濟上切實可行的時間，無論在更長的時間內如何需要維持這種存儲以及如何可能實現快速的電子存取。
由於這種影像數值必須能夠準確再現，以及為了實現廣泛的存取和系統相互兼容性而需要使用JPEG標準，在具有良好的影像再現保真度的前提下，用於數據容量進一步壓縮的實質上惟一的技術，就是降低原始影像的空間採樣頻率。不過，採樣不可避免地會產生假頻，並且降低微小標記的清晰度，尤其是在低反差時。目前，每英寸100點或者說像素的採樣(從目前一般使用之印表機的解析度300dpi或600dpi降低到大約三分之一至六分之一)被視為個人支票上低反差標記之適當清晰度的極限。美國國家標準協會(ANSI)的影像交換標準委員會推薦100dpi為最小解析度。大多數支票應用使用或者是100dpi，或者是120dpi的灰度影像。更低的採樣頻率也會導致對噪音引起的影像惡化或者說退化更加敏感。

發明內容
所以，本發明的一個目標是提供一種技術，用於在改善影像保真度的前提下，對多於兩種亮度的數位化票據進行極度壓縮。
本發明的另一個目標是降低表示票據之壓縮後影像數據的存儲成本，對於能夠進行電子存取和適當再現的存儲形式，延長其經濟上切實可行的時間。
本發明的一個進一步的目標是增強低反差的票據在重建後的反差或者說其中的特點。
本發明的又一個目標是對票據上低反差的標記提供適當的或者說增強的清晰度。
本發明的另一個進一步的目標是由快速存取的存儲器延長票據的可用期，而不增加存儲成本。
為了達到本發明的這些和其它目標，提供了壓縮數據的一種方法和裝置，包括以下功能或者說步驟選擇第一量化表，縮小數據的動態範圍，形成動態範圍縮小後的數據，以第一量化表來壓縮動態範圍縮小後的數據以形成壓縮後的數據，以及同第二量化表一起存放或傳送壓縮後的數據，第二量代表表示一個動態範圍，而不是所述縮小的動態範圍。
附圖簡要說明參考附圖閱讀了本發明的一個優選實施例的以下詳細說明之後，將會更好地理解上述的和其它的目標、特性和優點，其中

圖1是一臺示範性票據掃描裝置的剖視圖，它適於採集個人支票的影像，圖2是一臺控制器和數據處理設備的示意圖，它可用於圖1中的影像採集裝置，圖2A是一組示範性表格，包括遵循JPEG標準之定義量化表(DQT)標記的兩個量化表，
圖2B展示了按照JPEG標準的量化，展示了本發明中操作的基本原理，圖3是一幅流程圖，展示了依據本發明的影像數據編碼處理，圖3A是一幅影像的示範性直方圖，顯示了影像數值的峰和谷，圖3B是一幅示範性直方圖，顯示了將影像數值裁剪至所關注的範圍，圖3C是一張支票正面影像的直方圖，圖3D是相同影像對極端值進行裁剪之後的直方圖，圖3E是圖3D中裁剪後影像進行了2∶1的動態範圍縮減之後的直方圖，圖3F是除了裁剪和動態範圍縮減之外，進行了背景峰值核心化後影像的直方圖，圖4是一幅流程圖，展示了依據本發明的影像數據解碼處理，圖5是一幅流程圖，展示了縮短壓縮後影像長度的一種優選形式，利用了動態範圍縮減的再編碼，圖6A展示了縮減輸出範圍的對稱核心化，圖6B展示了通過極端值裁剪而縮減輸出範圍，圖6C展示了通過動態範圍縮減而縮減輸出範圍，圖6D顯示了通過裁剪和核心化，以及通過裁剪、核心化和動態範圍縮減而縮減輸出範圍，圖7是一幅流程圖，展示了通過縮減影像的範圍，在一個資料庫中延伸影像的時間，以及圖8是一幅流程圖，展示了檢索一幅縮減了範圍的影像。
具體實施例方式
現在參考附圖，更確切地說是參考圖1和圖2，其中顯示了示範形式的一臺掃描儀，適於個人支票的影像採集，以及所用的一臺控制器和數據處理裝置，依據本發明的一個優選實施例。雖然執行類似功能的掃描儀已是業內熟知，而且本領域的技術人員將容易理解其基本原理，但是由於圖1和圖2所示的裝置還說明了本發明的操作以及其優選的環境，所以對於本發明，這兩張圖中的任何部分都不能視為現有技術。
優選情況下，圖1的剖視圖中所示的掃描儀照相機10包括一個外殼12，它具有一個票據臺14，由任何適當設計的一種票據固定和傳送裝置16驅動，票據在臺上(或臺下)通過。外殼12的基本功能是保持照明裝置18和照相機20相對於票據臺14的相對定位，使得票據(通常是高速地)由傳送裝置16送過票據臺14時，能夠採集到良好照明和良好聚焦的票據影像。對於本發明的實踐來說，掃描儀照相機的其它細節是不重要的。
應當理解，在採集個人支票(以及可能的其它類型票據)的影像時，重要的是票據兩面的影像都要採集，因為雖然金額、付款人、日期和收款人標註在支票的正面，但是收款人的背書和支票清算有關的各種往來信息將出現在其背面。通常在支票的兩面也都會出現安全信息。所以，優選情況下為了票據的兩面而分別提供傳送裝置，通常是對應於圖1所示的裝置，優選情況下是沿著票據行走路徑分開，使得正面和背面的影像依次採集，以便獲得最優的數據採集速率，並且簡化影像的跟蹤和識別。
這種幾何結構示意性地顯示在圖2的10』中。優選情況下，配備了掃描儀適配卡22，在票據跟蹤邏輯電路24的控制下，對來自正面和背面掃描儀的影像數據進行多路傳輸，其細節對於本發明的實踐來說是不重要的。各個掃描儀的掃描儀數據輸出在26接受標定處理，並且由於影像傳感器通常是部分串行部分並行的高速電荷耦合器件，在28對像素次序進行重排，影像數據在30進行緩衝，以便傳遞到總線32。
圖2顯示了正面和背面掃描儀以及一片掃描儀適配(SA)卡。它也顯示了影像採集處理器路徑(ICPP)之一。有四條這樣的路徑，每一條都位於其自身的處理器卡(IPC)中。SA卡與正面和背面掃描儀通信，並且也與每片IPC通信。
在所有時間，SA卡都為可用的正面和背面掃描儀，對所有四條ICPP產生視頻數據。在程序的控制下，在任何指定的時間，ICPP之一分流正面掃描儀的影像，而一條不同的ICPP分流背面掃描儀的影像。該程序控制也確保了一條指定的ICPP首先分流同一票據的正面，然後分流其背面。
在一條ICPP中，SI卡包含著三個原始影像緩衝區。這些緩衝區用於存放分流的視頻信息，並且是依次使用。下一步，分別用於正面影像和背面影像的兩個IPC從SI卡的原始影像緩衝區獲取各自的影像，並且對它們進行處理。
一個控制器的中央處理單元34和一個影像採集處理路徑存儲器36也連接到總線32，以便分別控制掃描儀和初始影像數據處理。優選情況下，配備了在38合併指明的一片乙太網卡和一片令牌環卡，以便與主機的處理器通信並且允許圖2所示的可能會有的眾多設備能夠同時和並行地使用。
優選情況下，還配備了並行處理設備40、42，分別用於處理支票的正面影像和背面影像。來自緩衝區30的原始影像數據，經過總線32並在總線接口44中進行緩衝。在46對原始影像數據進行圖象條帶去除處理，以便糾正在票據臺14上定位中的錯誤。然後，圖象條帶去除處理後的數據在48處理成灰度影像，並且在50進行壓縮，優選情況下是按照JPEG標準，或者在49壓縮成黑白影像，並且壓縮，優選情況下是按照G4 Modified Modified Read(MMR)標準的ABIC，放在緩衝區中，以便傳遞迴總線32並存儲在影像採集處理路徑(ICPP)存儲器36中。ICPP存儲器36可視為或者是用於壓縮後影像數據的海量存儲器，或者是在傳遞到這樣一種海量存儲器之前的一種中間存儲器，可用從它選擇性地檢索影像數據，並重建所需的影像。
應當承認，本發明主要是針對按照JPEG標準進行的影像數據壓縮和影像重建，對於這一點，將會講解本發明的一個優選形式。不過，也應當理解，本發明也完全可以應用於任何其它數據壓縮方法，並且無論該數據是否表示影像。不過，對於票據的影像特別宣告了對影像數據壓縮和重建後影像質量的效果，因為利用JPEG標準，可接受的數據壓縮程度受限於從壓縮後數據可重建之數據質量的可接受程度。儘管如此，至少對於票據影像數據和能夠粗糙地量化而不損失重要信息之清晰度的其它數據，本發明提供了實質上增加的壓縮程度，同時提高了重建後/解壓後數據或者說影像的質量，因此在很大程度上避免了在數據質量和數據容量縮減之間的折衷。
在進一步詳細說明本發明之前，有必要回顧一下JPEG壓縮標準的某些方面，本領域的技術人員據此將能夠把本發明的原理應用到其它數據壓縮方法中。用於JPEG的基本標準部件之一是離散餘弦變換(DCT)。這種變換的一個重要表現是它會產生不相關的係數。對於壓縮來說，係數的解相關非常重要的，因為每個係數就都能夠獨立地處理而不損失壓縮效率。DCT的另一個重要表現是能夠使用視覺加權的量化值來量化DCT係數。由於人類視覺系統的響應非常依賴於空間頻率，通過把影像分解成一組波形，每個波形都具有特定的空間頻率，就有可能把眼睛能夠看見的影像結構與看不見的影像結構分離開。因此DCT提供了這種分解的一個良好近似，使得對觀察者的影像保真度感覺貢獻不大的數據能夠截去或者說省略。
按照JPEG標準，原始的單色影像首先用大概足夠高以至於不產生明顯假頻的任意解析度，以8×8的採樣陣列分解成64像素的方塊。
(壓縮彩色影像時，首先分別將每個分量分解成8×8像素的方塊。在這方面，一個「分量」就是一組影像值之一，與其它分量獨立或者說正交，比如從影像獲得的亮度或色度，它們表示其像素的視覺數值。下面將從單分量的角度來介紹本發明，比如灰度或亮度，但是對於任何數目的分量都能夠實現本發明，正如本領域的技術人員對此一目了然。JPEG基本標準適於多至四個獨立的分量。)眾所周知，若干技術和硬體能夠非常快速地對這種量化的影像數據進行DCT，產生64個DCT係數。
對於許多方塊，這些DCT係數中有許多會是零(它們對影像完全沒有貢獻)或者接近於零，當眼睛對它們對應的空間頻率相對不敏感時，就可以忽略或者省略它們。由於人類的眼睛對非常高和非常低的空間頻率不太敏感，作為JPEG標準的一部分，以一種所謂的鋸齒形圖案提供DCT係數，該圖案近似對應於在水平和垂直方向上一種增長的空間頻率的求和，趨於把不太重要的空間頻率對應的DCT係數劃分在DCT係數數據流的兩端，使得在許多情況下能夠作為一組來高效地壓縮它們。
雖然以上介紹的離散餘弦變換和編碼可以實際上遇到的多數影像提供足夠的數據壓縮，但是不沒有保證數據容量的實際縮減，而且壓縮的程度在理論上也不可能最優(因為JPEG的目標是對於經濟上可提供的數據處理量和數據容量，提供獲得最小影像退化的能力)，尤其是由於以相等的精度表示每個DCT係數會需要傳送相同數目的數位。不過，JPEG標準允許DCT係數值由64個獨立的量化值線性量化，這些量化值在一個表格(比如圖2A中所示)中隨著壓縮後的數據傳送，其後是熵(如霍夫曼)代碼和一個或多個影像分量的代碼表達。
為了清楚起見，圖2A是以16列的右對齊顯示，使得兩字節的標記延伸在16列的左側。每個字節都由兩個十六進位代碼的數碼表示，它們分別表示其兩個半字節。
圖2A中的第一個標記是「FFD8」，表示影像起點(SOI)。第二個標記是「FFDB」，表示一個量化表(DQT＝定義量化表)的說明。
從人類視覺系統的實驗，或者從原始影像對應之DCT係數的詳細分析，可以製成這個表，其方式對於理解本發明並不重要，而且隨後在影像重建期間對DCT係數進行「反量化」時還將使用。此外，也可以使用一種標準量化表，它是由經驗或者通過相對眾多的影像而製成的。JPEG標準的特徵在於，雖然從量化範圍可以自由設置以便優化一幅影像的編碼(或者過去使用的成功的表格)這一角度來說，量化範圍是任意的，但是為了提高重建影像至原始影像的保真度，編碼和解碼都使用同一量化表。
第三個標記是「FFC0」，它是幀起點(SOF)標記，指明這是一幅基本的DCT式的壓縮影像。SOF標記之後的參數指明精度(即每個分量的位數)、高度、寬度、分量數等。
第四個標記是「FFC4」，它表示一個標記區段的開始，該區段說明了熵編碼影像數據的一個或多個霍夫曼表，用於第五個標記——掃描起點(SOS)標記——之後的「…」表示的真正影像數據進行解碼。在以上引入的出版物(圖2A即是從中複製的)中，全面地討論了這些編碼格式標準，因而對本領域的技術人員理解本發明以便能夠同樣地實踐，本文中進一步的討論不重要。最後的標記——「FFD9」——是影像結束(EOI)標記。
從圖2A應當注意，在指明一個DQT區段的標記之後提供了兩個量化表。可以定義多至四個量化表，而且同時用於反量化和重建影像，定義的量化表與量化原始影像數據時使用的表相同。
圖2B從這一角度展示了本發明的基本原理。圖2B中上面的四條線也是從以上引入的出版物中複製的。圖2B中的第五條線展示了本發明的基本原理以及本發明與JPEG標準的完全兼容性，以便達到對壓縮後影像數據進行解碼和重建影像的目的。
具體地說，圖2B中的第一條線是未量化前DCT係數值的標尺，為了這個實例之用，從-9延伸至+9，中心值為0。圖2B中的第二條線展示了量化間隔，為了這種展示之用，間隔是相等的，間隔值為4。應當注意，按照JPEG標準，量化間隔的邊界偏離中心或者說0值量化間隔的一半，使得中心量化間隔將對稱於0量化值，而且避免了重建影像的影像值相對於原始影像產生偏置。這種處理使原始未量化的DCT係數進行了有效的捨入。
圖2B中的第三條線顯示了量化後DCT係數的標尺；前面一條線上的每個量化間隔的中心對應一個係數，它與第一條線上未量化前DCT係數的標尺相差一個等於量化間隔的因子。換句話說，這種處理按照以上介紹的量化間隔進行捨入，有效地縮小了量化後DCT係數的比例。按照JPEG標準，採用量化表中的數值代換的解碼，這種比例變換(但是不是量化，它是假定從建立一個適當小的量化間隔來限制的)能夠變換回來，如圖2B中第四條線所示。注意，圖2B中第四條線的比例與第一條線的比例一致，因此(如果沒有量化)對應於原始影像。
不過，依據本發明，以及如圖2B中的第五條線所示，由圖2B中第三條線上的量化後DCT係數代換的數值不必局限為進行量化時使用的量化表中的數值，與JPEG標準的常規做法不同。不僅如此，本發明還利用了以下事實實現JPEG標準所用的標準硬體和/或軟體這樣做時，就是通過簡單的查表和把傳送給它的數值代換為多個量化表中的任何一個。換句話說，雖然JPEG標準說明了，編碼所用的量化表也用於解碼，在解碼器處卻沒有硬體或軟體的約束來確保在所採用的量化表中數據的一致性。所以，根據解碼器中使用的量化表中的數據，任何其它量化比例都可以使用，而不必修改解碼器的任何方面，尤其是涉及JPEG標準之處。
例如，如圖2B中的第五條線所示，以及考慮到分量數值原始動態範圍-8至+8，圖2B中的第一條線上原始(但是量化後)的DCT數值可以恢復成如圖2B中的第四條線所示，或者也可以代換成實質上任意地選擇的或者按照經驗、數學或理論設立的數值，這些數值可以極大地擴展動態範圍，如圖2B中的第五條線所示，它們與原始的或者量化後的DCT係數可能有線性關係，也可能沒有；完全取決於解碼器中使用的量化表中的數據值。此外，由於解碼器中使用的量化表數值事實上能夠自由選擇以便在解碼器中使用，遵從JPEG標準不改變，本發明人已經發現，當影像編碼的方式遵從一種標準的、符合JPEG的解碼器之不改變的操作時，實現低反差特點的分離、真實噪音量的壓制以及影像特點清晰度的實質提高，與數據壓縮效率的實質提高並不矛盾。
圖3的流程圖中顯示了編碼器操作的一種優選形式。再次應當記住，為了簡單和清楚起見，以下說明是就單分量而言，比如表示一幅單色或者說灰度影像，但是也可以使用另外的分量，比如表示彩色線性所包括的分量。應當理解，每個分量都能夠而且可能會具有其自身獨立範圍的縮減和擴展。如上所述，可以同時激活多至四個量化表，在掃描起點(SOS)標記之後，四個分量可以交錯放置。
圖3圖示之方法的主要功能是對縮減了動態範圍的影像進行編碼。不過，也可以包括其它的和可選的影像分析和處理，作為本發明的一種改善特性。具體地說，步驟110針對建立影像數值之相對數目或者說發生頻度的一個直方圖，它對於任何指定的票據都是可選的，但是對於一張票據或者代表至少一類票據的多張票據，需要至少要進行一次這樣的分析。由此建立的直方圖可能適合也可能不適合其它類別的票據。不過，許多類別的票據事實上都具有此類直方圖的很多類似性質，實質上有可能做到，根據單一類別票據的分析結果，也能夠很好地——如果不是最優地——應付具有類似一般外觀的不同類別的票據。
一般來說，可以期望一張票據的直方圖包括一個或多個大峰值，位於或者聚集在一個給定的分量值處，該值對應於一種背景，該票據可能包括一種低反差圖案。通常還會產生一個或多個較小的直方圖峰值，對應於具有不同影像數值的標記(如印刷的文本、手寫的標記、信箋抬頭、安全標記等)。這些峰值表示的影像數值，其範圍表示了可能受關注之影像數值的範圍，因此可以期望影像的動態範圍包含了所關注的信息。圖3A展示了一幅示範性直方圖，可以期望它是從處理一張已生效和已兌現個人支票的正面和/或背面影像而得到的(一般來說，該直方圖在個人支票的正面和背面之間會有實質差異；背面通常表示低反差特點，因此更接近成組的峰值)。
在這幅示範性直方圖中，連接著的峰值181包括子峰值182和183，通常表示背景(對於支票的正面和背面這可能是常見的)，而峰值184可能表示手寫的標記，峰值185可能表示安全標記，峰值186可能表示高反差印刷和機器可讀標記。作為常規方式，對於一個單色分量，橫軸的指標是從0(黑)到256(白)。應當注意，該直方圖在峰值之間不一定達到零，同時表示掃描期間採集數值中的噪音和變化。還應當注意，峰值並不延伸到整個動態範圍，但是在整個動態範圍中可能存在著非零的影像直方圖數值。
圖3中步驟120指示了影像數據的可選處理，比如有益於增強影像壓縮、降低噪音和改善影像清晰度的濾波、邊緣銳化或信噪分離技術。不過，應當理解，即使在沒有此類預處理的情況下，本發明也提供了這種增強的基本程度，而當採用預處理時，對於這些有益的效果，本發明也提供了一種協同效應。從以下對本發明的討論，這一點將會變得更加明顯。
按照直方圖進行預處理的一個實例(無論如何得到也假設近似代表該影像)，會是把比峰值更加過度的背景峰值的所有數值近似地重新映射回峰值的中心數值。這樣做具有將峰值之間的數據(如區域187)移向峰值(如187之內)的效果，並且增大了峰值的精確度，同時壓制了可能表示噪音的許多影像數值。對於任何或者全部峰值都可以進行類似的處理。此外，在這種重新映射的過程中，(對於一個相對較淺的背景)已經發現背景峰值需要放置在(或者說背景放置需要聚集在)影像數值200附近，以便提供代表較淺色特點的影像數值，同時假設所關注的所有其它特點都比該背景更深色。這種處理被稱為核心化，因為實質上去除了峰值之間的數據。圖6A中顯示了核心化的另一種描述，在不期望存在所關注信息的區域，即使分配了動態範圍也不大。
在影像的明顯信息內容之名義動態範圍的兩端(如範圍189之外)，由裁剪可以去除更多的噪音，正如歐洲專利申請書EP 188193中所討論的，這裡全文引用作為參考。此外，與裁剪和核心化相結合，可以對數據進行重新映射以便進一步縮小動態範圍。圖6B中顯示了裁剪的另一種描述，顯示出對超過所關注之動態範圍(從15至240)的區域，即使分配了動態範圍也不大。
這裡應當承認，雖然以上的預處理降低了噪音，保存了細節，但是壓縮的程度與動態範圍以及使用的量化數值有關，動態範圍將表示為編碼數據中的數值。
不用閾值處理時也可以實現這一點，但是比較困難並且容易產生誤差，可能增加起作用的作用含量。不過，如果進行了預處理，峰值的噪音就比較少，而且更加清晰明確(因此增加了數據壓縮的潛力)。因此，在預處理、直方圖峰值重新映射之後，圖3A的直方圖中表示的數據可以表現出圖3B所示的重新映射結果，其動態範圍189』有了顯著的縮小。
步驟130描述了動態範圍的設置，它將在影像的編碼中使用。動態範圍的縮減一般將與保持所需的影像細節條件下(如限制下)所能達到之數據壓縮的程度成比例。在這些約束之內，可以自由地選擇動態範圍。因而斷定，由於期望包含著信息之影像數值的數字很好地分離，並且映射到狹窄的範圍中，對於票據或者能夠粗略量化的其它數據，能夠達到實質的數據壓縮程度而不損失所關注的信息。在圖6C中以另一種方式描述了這一點——對於影像數值和動態範圍之內數據數值之間的對應關係，降低反映該關係之直線的斜率。
這個「新的」範圍可以根據每幅影像的直方圖，或者從多幅影像匯集，或者僅僅按照假設，利用或者不用以上討論的預處理/重新映射。一旦建立了這個「新的」動態範圍，這個動態範圍就能夠進一步縮小，在符合清晰度需求的條件下使壓縮後的影像規模最小。
在實驗中，每英寸160像素的採樣和僅僅使用五個量化級別——一個51∶1(＝256/5)的範圍縮減比率，儘管亮度的數目減少到目前視為可接受的最小值以下，還是實現了重建影像的良好清晰度。背景影像以強烈的輪廓(如提高的反差)著色，但是出現的最細緻的印跡保持清晰，符合該實驗的首要要求。其它的處理可以清楚地改善影像的整體滿意度和外觀。
然後，在一個第一量化表(後文中的Q表1)中表示這種改變的動態範圍，根據該表能夠計算出一個第二量化表(後文中的Q表2)，以便恢復或者說擴展動態範圍。在這方面應當注意，動態範圍189和189』都能夠擴展到實質上0至256的全部動態範圍。然後，使用Q表1以正常的遵從JPEG的方式，對表示原始影像的重新映射後影像數據進行編碼，如在150處所示，接著在編碼後的數據中以Q表2替代Q表1，如在160處所示，並且存放或者發送，如在170處所述。
圖6D顯示了裁剪和核心化結合的結果，以及裁剪、核心化和動態範圍縮減的結合。裁剪的整體效果是通過使所關注之信號的動態範圍最終擴展到一個更大的範圍，使得在可用的動態範圍之內的信號能夠更準確地表達。在區分數值類似的數據很重要之處，核心化在峰值之間產生了更大的斜率/靈敏度。動態範圍縮減使數據容量的壓縮率更大，而且與裁剪和核心化相結合，減小了所關注數值的整體和最大差異，如直線500所描述，其結果進一步降低了噪音，潛在地提高了影像保真度。
圖3D-圖3F顯示了在減小動態範圍的不同預處理階段之後，一張包含背景影像的支票正面的實際直方圖。圖3C是原始影像的直方圖。圖3D表示同一影像在裁剪至寬度為226的範圍(從15到240)後的情況。圖3E表示裁剪後的影像之動態範圍按比例再縮小一半，到寬度為113的新範圍(從72到184)，圖3F顯示的直方圖，是裁剪和按比例縮小的影像在背景中正負十個數值的核心化之後，最後寬度為93的範圍(從82到174)的情況。(為了這種展示的目的，幅度為110k的新峰值已經縮小了。)使用JPEG標準的附件K中發現的JPEG實例量化表和霍夫曼代碼，原始影像(圖3C)壓縮到15650位元組。裁剪之後，壓縮後規模稍微減小到15513位元組(圖3D)。動態範圍按比例縮小進一步將壓縮後影像規模減小到10397位元組(圖3E)，核心化(圖3F)進一步將壓縮後數據規模減小到8802位元組，或者說在數據規模中有大約2∶1的縮減。
現在參考圖4，現在將討論的問題是，按以上討論之方法編碼的影像如何進行解碼。如在210處所示，檢索或者接收編碼後的影像。不過，應當記住指定如何進行解碼的量化表現在是Q表2，它是為了恢復或者說增強原始動態範圍而計算出並替代原表的。然後進行解碼，以便由大幅壓縮後的數據重建一個恢復的或者說增強的影像。本領域的技術人員將會理解，步驟210和220表示按照JPEG標準的正常解碼，未進行修改，同樣代表了包括量化的然後其它數據壓縮方案。JPEG標準指出，在解碼器中重建的數值是從0到2P-1範圍內的整數，其中P為影像分量的精度。它並沒有指出轉換成整數是進行捨入還是截斷。要是使用了解碼器的Q表1，隨後將範圍擴展，這種量化至整數輸出值就會引入不必要的額外誤差，尤其是當為了獲得極大的壓縮率而使範圍縮減很大時。
另外，JPEG標準指出，任何重建的數值，如果超出允許範圍之外，將會在期望的邊界處截斷。由於人類觀察者趨於注重票據的高反差影像，如果Q表2設計為對原始影像縮減過補償，這種內部截斷可以用於產生高反差影像。在這個過程中，某些邊緣量化噪音可能被截掉。如果需要，還可以進行可選的分析230和後處理240，例如將背景峰值重新映射到不同的影像數值或者說分離。為了恢復原始的均值、平均反差或者某些均值和/或範圍，比如原始的範圍，可以使用可選的直方圖和後處理。
如圖5所示，一旦按照JPEG的標準重建，本發明也可以應用於JPEG編碼的數據。換句話說，可以按照適當的Q表0(與Q表1和Q表2截然不同)，對影像數據進行壓縮和編碼，如在310處所示，存放和/或發送(320)，接收/檢索(330)，然後使用相同的Q表0進行解碼，完全符合圖3中進行壓縮的JPEG技術。所以，本發明完全可以應用於現有的影像數據倉庫，進一步壓縮，減少其存儲成本。
圖7是一幅流程圖，顯示了一個優選實施例，用於延長一幅影像可以在資料庫中保存的時間。在710檢索影像，如果在720判斷出它利用任何壓縮技術(包括無損編碼)壓縮過，就在730由適當的解碼器解壓/解碼。在圖7中沒有展示(圖3所示的)可選直方圖和預處理，但是如果需要也可以包括。在方框740中，減小該影像的範圍，如果在750確定減小了範圍的影像要壓縮(可能利用一種不同的壓縮技術)，就在760進行編碼。然後，在770將減小了範圍的影像(壓縮過或者沒有壓縮過)與範圍擴展信息一起存放。對於JPEG的基於DCT的壓縮，這種範圍擴展信息的形式可以是替代的按比例縮小的Q表2。對於其它應用，它的形式可以是JPEG-LS輸出重新映射表。
圖8是一幅流程圖，顯示了如何使用這種縮減了範圍的影像。在810檢索帶有範圍擴展信息的影像。如果在820判斷出它是壓縮過的，就在830利用對應的解碼器進行解碼。(如果在830尚未進行)然後對影像的範圍進行擴展，如840所示。可選的直方圖850和後處理860階段顯示在範圍擴展之後，但是也可以在它之前。
鑑於前面的介紹並參考圖6A-圖6D，本發明對票據的影像或能夠粗略量化而沒有顯著損失的其它數據，提供了實質的附加數據容量壓縮，進一步減小了要傳送或存放的數據容量。預處理和/或以任何所需的方式重新映射影像數值的後處理，提供了實質上進一步的增強和性能改善。
雖然是以單一的優選實施例介紹了本發明，本領域的技術人員將會理解，本發明實施時可以具有附帶的權利要求書之實質和範圍之內的修改。
權利要求
1.一種壓縮數據的方法，包括以下步驟選擇一個第一量化表，減小數據的動態範圍，形成動態範圍縮減後的數據，利用所述第一量化表，壓縮所述動態範圍縮減後的所述數據，形成壓縮後的數據，以及與表示不同於所述縮減的動態範圍之動態範圍的一個第二量化表一起，存放或傳送所述壓縮後的數據。
2.根據權利要求1所述的方法，包括以下進一步的步驟對於所關注的數據，確定一個名義動態範圍。
3.根據權利要求1所述的方法，進一步包括重新映射影像數值的一個步驟。
4.根據權利要求1所述的方法，其特徵在於，減小所述數據之動態範圍的所述步驟包括至少裁剪和核心化二者之一。
5.根據權利要求1的方法，其特徵在於，重新映射所述數據之影像數值的所述步驟包括至少裁剪、核心化和動態範圍縮減三者之一。
6.根據權利要求1所述的方法，包括以下進一步的步驟使用所述第二量化表，對所述壓縮後的數據進行解碼。
7.根據權利要求6所述的方法，其特徵在於，使用一種實施JPEG標準的解碼器執行所述解碼步驟。
8.一種壓縮數據的設備，包括選擇一個第一量化表的裝置，減小數據的動態範圍，形成動態範圍縮減後數據的裝置，利用所述第一量化表，壓縮所述動態範圍縮減後的所述數據，形成壓縮後數據的裝置，以及與表示不同於所述縮減的動態範圍之動態範圍的一個第二量化表一起，存放或傳送所述壓縮後數據的裝置。
9.根據權利要求8所述的設備，進一步包括對於所關注的數據，確定一個名義動態範圍的裝置。
10.根據權利要求8所述的設備，進一步包括重新映射影像數值的裝置。
11.根據權利要求8所述的設備，其特徵在於，減小所述數據之動態範圍的所述裝置包括至少裁剪和核心化二者之一的裝置。
12.根據權利要求8所述的設備，其特徵在於，減小所述數據之動態範圍的所述裝置包括至少裁剪、核心化和動態範圍縮減三者之一的裝置。
13.根據權利要求8所述的設備，進一步包括使用所述第二量化表，對所述壓縮後數據進行解碼的裝置。
14.根據權利要求13所述的設備，其特徵在於，所述解碼裝置實施JPEG標準。
全文摘要
通過對票據影像的動態範圍進行縮減/重新映射(140)，可能連同進一步的影像分析(110)和預處理(120)以及存放票據(170)時帶有恢復票據影像之動態範圍所用的適當表格，實現對票據進行增大的而且極有可能是極度的壓縮。
文檔編號H04N1/41GK1524246SQ01822014
公開日2004年8月25日申請日期2001年11月19日優先權日2001年1月16日
發明者喬納·L·米切爾, 喬納 L 米切爾, 普拉卡什, 拉溫德·普拉卡什, 戴維·斯特普尼斯基, 斯特普尼斯基申請人:國際商業機器公司

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

增強的票據壓縮的製作方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法