新四季網

圖像處理裝置和方法、圖像讀取裝置和圖像形成裝置的製作方法

2023-05-25 12:01:36

專利名稱:圖像處理裝置和方法、圖像讀取裝置和圖像形成裝置的製作方法
技術領域:
本發明涉及具有存儲定型格式的圖像的部件的圖像處理裝置、圖像讀取 裝置、圖像形成裝置和圖像處理方法。背景糹支術以往,提出了一種歸檔裝置和歸檔(filing)方法,通過從輸入圖像中識 別字符、字符串框或框等,並基於框信息進行每個框的匹配,從而可以進行 穩定的格式識別,減輕用戶的處理工序(例如參照特開平8-255236號公報)。但是,特開平8-255236號公報中記載的歸檔裝置中,在進行歸檔時,進 行對每個註冊格式附加文件名或部分圖像的切出等,但在保存文件整體的情 況下,註冊格式等的相同部分也一起被歸檔,因此存在保存所必須的存儲容 量增大的問題。發明內容本申請鑑於這樣的情況而完成,其目的在於提供一種圖像處理裝置、圖 像讀取裝置、圖像形成裝置和圖像處理方法,通過從要存儲的圖像中單獨提 取出格線和字符,在提取出的格線的樣式為規定樣式的情況下,將提取出的 字符和規定樣式的格線相關聯地存儲,同時在提取出的格線的樣式不是規定 樣式的情況下,存儲提取出的格線,從而可以削減進行帳票等的歸檔的情況 下所必須的存儲器容量。本申請的圖像處理裝置的特徵在於,包括圖像輸入單元,輸入圖像; 圖像存儲單元,存儲圖像;類比判定單元,對通過所述圖像輸入單元輸入的 輸入圖像和存儲在所述圖像存儲單元中的存儲圖像的類比進行判定;以及區 域提取單元,在判定為所述輸入圖像和所述存儲圖像類似的情況下,判定所 述輸入圖像是否是對所述存儲圖像施加了寫入的圖像,從所述輸入圖像中提 取包含所述寫入的區域,其中,將由所述區域提取單元提取的區域內的圖像 存儲在所述圖像存儲單元中。
本申請中,判定輸入圖像是對存儲圖像施加了寫入的圖像的情況下,提 取包含寫入的區域,將提取的區域內的圖像存儲在圖像存儲單元中,因此關 於僅由字符構成的格式、由字符以及格線構成的格式等任意的格式,使格式 相同,並保存被寫入了的圖像。本申請的圖像處理裝置的特徵在於,在提取了多個所述區域的情況下, 對提取的每個區域,將區域內的圖像存儲在所述圖像存儲單元中。本申請中,由於在提取了多個包含寫入區域的情況下,對提取的每個區 域,將區域內的圖像存儲在所述圖像存儲單元中,因此在將被寫入的圖像和 格式合成後輸出的情況下,可以將一部分不輸出等,任意地進行編輯。本申請的圖像處理裝置的特徵在於,將存儲在所述圖像存儲單元中的圖 像壓縮。本申請中,由於壓縮存儲的圖像,因此能夠削減存儲器容量。本申請的圖像處理裝置的特徵在於,將被壓縮存儲在所述圖像存儲單元中的圖像解壓縮,並將被解壓縮了的圖像合成。本申請中,由於將被壓縮存儲的圖像解壓縮,並將解壓縮了的圖像合成,因此能夠生成用於列印帳票等具有定型格式的文檔的數據。本申請的圖像處理裝置的特徵在於,包括圖像輸入單元,輸入圖像; 提取單元,單獨提取出在通過該圖像輸入單元輸入的輸入圖像中包含的格線 以及字符;以及判斷單元,判斷由該提取單元提取出的格線的樣式是否為規 定樣式,其中,在所述判斷單元判斷為規定樣式的情況下,將提取出的字符 與所述規定樣式的格線相關聯地存儲在存儲單元中,在所述判斷單元判斷為 不是規定樣式的情況下,將提取出的格線存儲在所述存儲單元中。本申請中,由於單獨提取出在輸入圖像中包含的格線以及字符,在判斷 為提取出的格線的樣式是規定樣式的情況下,將提取出的字符與規定樣式的 格線相關聯地存儲在存儲單元中,因此不會重複存儲格線的圖像。此外,由 於在判斷為提取出的格線的樣式不是規定樣式的情況下,將格線存儲在存儲 單元中,因此存儲了的格線的樣式可以被用作下次輸入圖像的情況下的判定 基準。本申請的圖像處理裝置的特徵在於,在判斷為提取出的格線的樣式不是 規定樣式的情況下,將提取出的字符與所述格線相關聯地存儲在所述存儲單 元中。
在本申請中,即使在提取出的格線不是規定樣式的情況下,格線以及字 符也被相關聯地存儲在存儲單元中。本申請的圖像處理裝置的特徵在於,將提取出的格線和字符壓縮,將壓 縮了的格線以及字符存儲在所述存儲單元中。在本申請中,由於將提取出的格線和字符壓縮,因此能夠進一步削減歸 檔所需的存儲器容量。特別是,由於通過將格線以及字符單獨壓縮,從而壓 縮率提高,因此歸檔所需的存儲器容量被大幅地削減。本申請的圖像處理裝置的特徵在於,將被壓縮存儲在所述圖像存儲單元 中的格線和字符解壓縮,並將被解壓縮了的格線和字符合成。在本申請中,由於將被壓縮存儲的格線和字符解壓縮,並將被解壓縮了 的格線和字符合成,因此生成用於列印帳票等的數據。本申請的圖像讀取裝置的特徵在於,包括圖像讀取單元,從原稿讀取 圖像;以及所述圖像處理裝置,其中,由所述圖像處理裝置處理由所述圖像 讀取單元讀取的圖像。在本申請中,可使用掃描器裝置等圖像讀取裝置進行圖像的存儲。本申請的圖像形成裝置的特徵在於,包括所述圖像處理裝置;以及圖 像形成單元,在片材上形成由該圖像處理裝置合成了的圖像。在本申請中,由於將被相關聯存儲的格線和字符合成並形成在片材上, 因此能夠製作帳票等。本申請的圖像處理方法的特徵在於,包括對輸入圖像和存儲圖像的類 比進行判定的步驟;在判定為所述輸入圖像和所述存儲圖像類似的情況下, 判定所述輸入圖像是否是對所述存儲圖像施加了寫入的圖像的步驟;在判定 為所述輸入圖像是在所述存儲圖像中施加了寫入的圖像的情況下,從所述輸 入圖像中提取包含所述寫入的區域的步驟;以及將提取的區域內的圖像存儲 在存儲裝置中的步驟。在本申請中,由於在判定為輸入圖像是在存儲圖像中施加了寫入的圖像的情況下,提取包含寫入的區域,將提取的區域內的圖像存儲在存儲裝置中, 因此關於僅由字符構成的格式、由字符以及格線構成的格式等任意的格式, 使格式相同,並保存被寫入了的圖像。本申請的圖像處理方法的特徵在於,包括單獨提取出在輸入圖像中包 含的格線以及字符的步驟;判斷取出的格線的樣式是否為規定樣式的步驟;
在判斷為規定樣式的情況下,將提取出的字符與所述規定樣式的格線相關聯地存儲在存儲裝置中的步驟;以及在判斷為不是規定樣式的情況下,將提取 出的格線存儲在所述存儲裝置中的步驟。在本申請中,由於單獨提取出在輸入圖像中包含的格線以及字符,在判 斷為提取出的格線的樣式是規定樣式的情況下,將提取出的字符與規定樣式 的格線相關聯地存儲在存儲裝置中,因此不會重複存儲格線的圖像。此外, 由於在判斷為提取出的格線的樣式不是規定樣式的情況下,將格線存儲在存 儲裝置中,因此存儲了的格線的樣式可以被用作輸入了下次要存儲的圖像的 情況下的判定基準。在本申請的情況下,由於在判定為輸入圖像是在存儲圖像中施加了寫入 的圖像的情況下,提取包含寫入的區域,將提取的區域內的圖像存儲在存儲 單元中,因此關於僅由字符構成的格式、由字符以及格線構成的格式等任意 的格式,使格式相同,並單獨保存被寫入了的圖像。本申請的情況下,由於在提取了多個包含寫入區域的情況下,對提取的 每個區域,將區域內的圖像存儲在存儲單元中,因此在將被寫入的圖像和格 式合成後輸出的情況下,可以將一部分不輸出等,任意地進行編輯。本申請的情況下,由於壓縮存儲的圖像,因此能夠削減存儲器容量。本申請的情況下,由於將被壓縮存儲的圖像解壓縮,並將解壓縮了的圖 像合成,因此能夠生成用於列印帳票等具有定型格式的文檔的數據,並且能 夠輸出合成了的圖像。本申請的情況下,單獨提取出在圖像中包含的格線以及字符,在提取出 的格線的樣式是規定樣式的情況下,將提取出的字符與規定樣式的格線相關 聯地存儲在存儲單元中。從而,不會重複存儲格線的圖像,因此在對使用張 票等定型格式的文檔進行歸檔時,能夠削減所需的存儲器容量。此外,在提 取出的格線的樣式不是規定樣式的情況下,將格線存儲在存儲單元中,因此 存儲了的格線的樣式可以被用作輸入下次要存儲的圖像的情況下的判定基 準。在本申請的情況下,即使在提取出的格線不是規定樣式的情況下,也可以將格線以及字符相關聯地存儲在存儲單元中。在本申請的情況下,由於將提取出的格線和字符壓縮,因此能夠進一步削減歸檔所需的存儲器容量。特別是,由於通過將格線以及字符單獨壓縮, 從而壓縮率提高,因此能夠大幅地削減歸檔所需的存儲器容量。在本申請的情況下,由於將被壓縮存儲的格線和字符解壓縮,並將被解壓縮了的格線和字符合成,因此可以生成用於列印帳票等的數據。在本申請的情況下,可使用掃描器裝置等圖像讀取裝置進行圖像的存儲。 在本申請中,由於將被相關聯存儲的格線和字符合成並形成在片材上,因此能夠製作帳票等。本發明的上述和其它的對象以及特徵將會隨著附圖在下面的詳細說明中變得更清楚。


圖1是說明包括本實施方式的圖像處理裝置的圖像處理系統的內部結構 的方框圖。圖2是表示文檔核對處理單元的內部結構的方框圖。 圖3是表示特徵點計算單元的結構的方框圖。圖4是表示濾波處理單元所使用的混合濾波器(filter)的一例的概念圖。 圖5A和圖5B是表示特徵點的提取例子的示意圖。 圖6是表示關注特徵點和周邊特徵點的說明圖。圖7A至圖7C是說明通過關注特徵點P1計算不變量的例子的說明圖。 圖8A至圖8C是il明以關注特徵點作為特徵點P4的情況下的不變量的 計算例子的說明圖。圖9A至圖9D是說明通過關注特徵點P1計算不變量的其它例子的說明圖。圖IOA至圖IOD是說明以關注特徵點作為特徵點P4的情況下的不變量 的其它計算例子的說明圖。圖IIA和圖IIB是示出表示散列值和註冊格式的關聯的散列表的例子的 概念圖。圖12是表示累計投票結果的累計表的一例的概念圖。圖13是表示存儲註冊格式的索引和特徵點的坐標的表的一例的概念圖。圖14是表示投票結果的一例的曲線圖。圖15是說明由文檔核對處理單元執行的處理步驟的流程圖。圖16是說明寫入區域提取處理的步驟的流程圖。 圖17是說明輸入圖像和註冊格式之間的對應的說明圖。圖18A和圖18B是表示註冊格式的一例的示意圖。圖19是表示對每個註冊格式決定了要提取的區域的表的一例的概念圖。圖20是包括說明本實施方式的圖像處理裝置的圖像處理系統的內部結構的方框圖。圖21是表示歸檔處理單元的內部結構的方框圖。圖22A至圖22C是表示格線圖像和字符圖像的提取例子的示意圖。圖23A至圖23C是表示格線圖像和字符圖像的提取例子的示意圖。圖24A至圖24C是表示格線圖像和字符圖像的提取例子的示意圖。圖25是表示格線圖像的註冊例子的概念圖。圖26是表示字符圖像的註冊例子的概念圖。圖27是表示格線圖像和字符圖像的註冊步驟的流程圖。圖28是表示安裝了執行所述處理的電腦程式的圖像處理裝置的內部結構的方框圖。
具體實施方式
以下 ,基於附圖詳細敘述實施方式。 實施方式1.圖1是說明包括本實施方式的圖像處理裝置的圖像處理系統的內部結構 的方框圖。本實施方式的圖像處理系統包括操作面板1、圖像輸入裝置3、圖 像處理裝置4、圖像輸出裝置7。操作面板1是用於接受用戶的操作的接口,包括各種開關、按鈕等操作 單元以及顯示要對用戶通知的信息、圖像等的顯示單元。圖像輸入裝置3是光學式讀取原稿的圖像的裝置,包括對讀取用的原稿 照射光的光源、CCD (Charge CoupledDevice)這樣的圖像傳感器等。在圖像 輸入裝置3中,將來自設置在規定的讀取位置上的原稿的反射光像被成像在 該圖像傳感器上,輸出RGB(R: Red, G: Green, B: Blue)的模擬電信號。 圖像輸入裝置3輸出的模擬電信號被輸入圖像處理裝置4。圖像處理裝置4將從圖像輸入裝置3輸出的模擬電信號變換為數字電信 號之後,進行適當的圖像處理,並將得到的圖像數據輸出到圖像輸出裝置7。 另外,圖像處理裝置4的內部結構、動作等在後面詳細敘述。
圖像輸出裝置7是基於圖像處理裝置4輸出的圖像信號在用紙、OHP膠 片等片材上形成圖像的裝置。因此,圖像輸出裝置7包括使感光體鼓帶上規 定的電位的帶電器、根據從外部接受的圖像數據而發出雷射從而在感光體鼓 上生成靜電潛像的雷射寫入裝置、對感光體鼓表面形成的靜電潛像提供色粉 (toner)並顯像的顯像器、將形成在感光體鼓表面的色粉像轉印到用紙上的 轉印器等(未圖示),通過電子照片方式在用紙上形成用戶所希望的圖像。另 外,除了通過使用雷射寫入裝置的電子照片方式進行圖像形成之外,也可以 是通過噴墨、熱轉印方式、升華方式等進行圖像形成的結構。接著,說明圖像處理裝置4的內部結構。AD變換單元40將從圖像輸入 裝置3輸入的RGB的模擬信號變換為數位訊號。黑斑(shading)校正單元 41對從AD變換單元40輸出的數字形式的RGB信號實施用於除去由圖像輸 入裝置3的照明系統、成像系統、拍攝系統產生的各種失真的處理。被進行 了黑斑校正的RGB信號被輸出到輸入色調校正單元42。輸入色調校正單元42進行基底濃度的除去或對比度等畫質調整處理。區 域分離處理單元43進行由RGB信號將輸入圖像中的各像素分離為字符區域、 網點區域、照片區域的其中 一個的處理。區域分離處理單元43基於分離結果, 將表示像素屬於哪個區域的區域識別信號輸出到後級的黑版生成底色除去單 元46、空間濾波處理單元47以及色調再現處理單元49,同時將輸入的RGB 信號原樣輸出到後級的文檔核對處理單元44。文檔核對處理單元44判定輸入的圖像(輸入圖像)是否與預先存儲的存 儲圖像(以下稱作註冊格式)類似,在判定為類似的情況下,判斷輸入圖像 是否是對註冊格式進行了寫入的圖像。在判斷為輸入圖像是對註冊格式進行 了寫入的圖像的情況下,提取對應於寫入的區域,將提取出的區域的圖像與 註冊格式相關聯地存儲。顏色校正單元45為了忠實地進行顏色再現而進行以下處理,即除去基於 包含不需要吸收分量的CMY色材的分光特性的色渾濁。被進行了顏色校正 的RGB信號被輸出到後級的黑版生成底色除去單元46。黑版生成底色除去 單元46進行從顏色校正後的CMY的三色信號生成黑(K)信號的黑版生成, 以及從原來的CMY信號減去通過黑版生成得到的K信號而生成新的CMY 信號的處理。通過該處理,CMY的三色信號被變換為CMYK的四色信號。作為黑版生成處理的一例,有通過骨架黑版(skeleton black)進行黑版
生成的方法。在該方法中,如果將骨架曲線的輸入輸出特性設為y = f (x), 將輸入的數據設為C、 M、 Y,將輸出的數據設為C,、 M,、 Y,、 K,,將UCR 率(UCR: Under Color Removal)設為a ( 0< a <1 ),則黑版生成底色除去處 理由以下的式子表示。K, = f{min(C,M,Y)}C, = C- otK,M, =M - aK'Y, = Y_ aK,空間濾波處理單元47基於區域識別信號,通過數字濾波器對由黑版生成 底色除去單元46輸入的CMYK信號的圖像數據進行空間濾波處理,並校正 空間頻率特性,從而進行處理以防止輸出圖像的模糊或粒子狀惡化。例如,由區域分離處理單元43分離為字符的區域,特別為了提高黑色字 符或彩色字符的再現性,通過空間濾波處理單元47的空間濾波處理中的清晰 強調處理提高高頻的強調量。同時,色調再現處理單元49中,選擇通過適於 再現高頻率的高解析度的屏幕(screen)的二值化或多值化。此外,關於由區 域分離處理單元43分離為網點區域的區域,在空間濾波處理單元47中,實 施用於除去輸入網點分量的低通濾波處理。而且,在輸出色調校正單元48中 進行了將濃度信號等信號變換為彩色圖像輸出裝置的特性值即網點面積率的 輸出色調校正處理之後,在色調再現處理單元49中進行色調再現處理,即最 終將圖像分離為像素來進行處理以便能夠再現各自的色調。此外,關於由區 域分離處理單元43分離為照片的區域,進行通過重視色調再現的屏幕的二值 化或多值化。被實施了所述各處理的圖像數據臨時被存儲在存儲單元(未圖示)中, 在規定的定時被讀出並被輸出到圖像輸出裝置7。圖2是表示文檔核對處理單元44的內部結構的方框圖。文檔核對處理單 元44包括控制單元440、特徵點計算單元441、特徵量計算單元442、投票 處理單元443、類似度判定處理單元444、寫入區域提取單元445、註冊控制 單元446、壓縮/解碼處理單元477、合成處理單元448。控制單元440例如為CPU,進行所述硬體的各部分的控制。特徵點計算 單元441從包含在輸入圖像中的字符串、格線等中提取連接部分,以連接部 分的重心作為特徵點進行計算。特徵量計算單元442使用由特徵點計算單元441計算出的特徵點,計算對於旋轉、放大、縮小不變的特徵量。投票處理 單元443使用由特徵量計算單元442計算出的特徵量對預先註冊的註冊格式 進行投票。類似度判定處理單元444使用投票結果判定輸入圖像和註冊格式 的類似度。寫入區域提取單元445在判定為輸入圖像與註冊格式類似的情況下,從 輸入圖像中提取寫入註冊格式的字符串、圖像等。註冊控制單元446在輸入 圖像與註冊格式類似的情況下,設定與該註冊格式相關聯的ID,並將提取出 的每個區域的圖像數據輸出到壓縮/解碼處理單元477。此外,在輸入圖像不 與註冊格式類似的情況下,在操作面板1中顯示用於促使註冊該輸入圖像作 為註冊格式的消息。壓縮/解碼處理單元477使用MH (Modified Huffman )、 MR (Modified Read )、 MMR ( Modified Modified Read )、 JPEG ( Joint Photographic Experts Group)等方法壓縮由寫入區域提取單元445提取出的圖像數據。MH是如下 的編碼方式,即按每一行通過霍夫曼碼對行中的白遊程和黑遊程的遊程長度 (run length)進行編碼,在一行的碼的最終附加行同步信號EOL。 MR是對 MH進行了改進的編碼方式,為了提高壓縮率而利用前一行的相關進行編碼。 第一行通過MH進行編碼,但第二行到第k行利用與前一行的相關進行編碼。 第K+1行再次通過MH進行編碼,重複同樣的工作。MMR相當於I0 w的 MR,是始終利用與前一行的相關進行編碼的編碼方式。JPEG中,將圖像分 割為規定尺寸的塊,以該塊為單位使用離散餘弦變換而變換為空間頻率區域 位。然後,變換後的數據通過量化而降低信息量之後,通過霍夫曼碼進行熵 編碼。被壓縮後的圖像數據被存儲在圖像數據存儲單元449中。此外,在輸 出以被壓縮的狀態存儲在圖像數據存儲單元449中的圖像數據時,壓縮/解碼 處理單元477進行圖像數據的解碼。合成處理單元448進行將解碼後的圖像 數據合成到註冊格式中的處理。以下,詳細說明文檔核對處理單元44中的處理內容。圖3是表示特徵點 計算單元441的結構的方框圖。特徵點計算單元441包括無彩色化處理單元 4410、解析度變換單元4411、濾波處理單元4412、 二值化處理單元4413和 重心計算單元4414。無彩色化處理單元4410是用於在輸入圖像數據為彩色圖像的情況下進 行無彩色化,從而變換為明度信號或亮度信號的處理單元。例如,通過下述
變換式求亮度信號。Yj = 0.30Rj + 0.59Gj + 0.11Bj這裡,Yj表示各像素的亮度值,Rj、 Gj、 Bj表示各像素的顏色分量。此 外,也可以將RGB信號變換為CIE1976I^a^M言號(CIE: Commission International del,Eclairage,L*:明度,a*、 b*:色度)而不是該方法。解析度變換單元4411是在輸入圖像數據由圖像輸入裝置3進行光學變倍 的情況下,進行再次變倍以便成為規定的解析度的處理單元。此外,解析度 變換單元4411中,為了減少後級的處理量,也被用作用於使解析度低於由圖 像輸入裝置3等倍時讀入的解析度的解析度變換。例如,將以600dpi (dotper inch)讀入的圖像數據變換為300dpi。濾波處理單元4412是被用於吸收圖像輸入裝置的空間頻率特性對於每 個機種的不同的處理單元。CCD輸出的圖像信號中,由於透鏡或鏡子等光學 部件、CCD的受光面的孔徑(aperture)數值孔徑、傳送效率或殘像、物理掃 描的積分效果和掃描不均等,產生圖像的模糊等惡化。濾波處理單元4412進 行通過實施適當的濾波處理(強調處理),從而修復MTF的惡化引起的模糊 的處理。此外,也被用作抑制後級的處理所不需要的高頻分量。即,使用混 合濾波器進行強調和平滑處理。圖4是表示濾波器處理單元4412所使用的混合濾波器的一例的概念圖。 混合濾波器例如具有7x7的大小。掃描被輸入的圖像的像素,對所有像素進 行通過混合濾波器的運算處理。另外,混合濾波器的大小不限定於7x7的大 小,也可以是3x3、 5x5等大小。此外,濾波係數的數值為一例,不限定於 此,根據使用的圖像輸入裝置3的特性等適當設定。二值化處理單元4413是從無彩色化的圖像數據生成適於計算重心的二 值圖像數據的處理單元。重心計算單元4414從被二值化了的數據求連接分量的重心,將其作為特 徵點輸出到特徵量計算單元442。作為重心的計算方法,可以使用以往方法。 即,基於二值圖像的二值化信息對各像素進行標示(labeling),確定由用被 附加了同一標誌的像素連接的連接區域,以確定的連接區域的重心作為特徵 點來計算。圖5A和圖5B是表示特徵點的提取例子的示意圖。圖5A是通過所述方 法將"A,,的字符確定為連接區域的例子,示出了圖中的黑點所表示的點被 作為特徵點(重心)計算的情況。圖5B同樣是從"j"的字符提取連出接區域的例子,示出了連接區域被分割為兩個區域並確定的情況。在該情況下, 由於從各連接區域計算特徵點(重心),因此從一個字符計算兩個特徵點(特徵點A、特徵點B)。接著,說明特徵量的計算方法。特徵量計算單元442從由特徵點計算單 元441計算的多個特徵點計算圖像的特徵量。此時,將計算出的特徵點的任 意的一個選擇作為關注特徵點,從該關注特徵點選擇距離小的四個特徵點作 為周邊特徵點。圖6是表示關注特徵點和周邊特徵點的說明圖。圖6示出了由特徵點計 算單元441計算六個特徵點PI ~ P6的情況。此時,特徵量計算單元442在將 特徵點P3選擇為關注特徵點的情況下,特徵點P1、 P2、 P4、 P5被選擇作為 周邊特徵點。特徵量計算單元442使用選擇了的關注特徵點(P3)和周邊特 徵點(Pl、 P2、 P4、 P5),通過輸入圖像的傾斜、移動、旋轉等計算不變的 不變量,並從計算出的不變量計算表示輸入圖像的特徵的特徵量。圖7A至圖7C是說明關注特徵點P1的不變量的計算例子的說明圖。使 用關注特徵點P3和周邊特徵點Pl 、P2、P4、P5之間的距離,由H3j = ( A3j/B3j) xC/D定義不變量H3j。這裡,取j-l、 2、 3的值,A3j、 B3j表示各個特徵 點之間的距離,C表示標準化的常數,D表示預定的常數。即,計算三個不 變量,不變量H31的值為(A31/B31) xC/D (參照圖7A),不變量H32的 值為(A32/B32 ) x c/D (參照圖7B ),不變量H33的值為(A33/B33 ) x c/D (參照圖7C)。這些不變量H3j例如在讀取原稿時,即使在原稿旋轉、移動、 傾斜的情況下,值也不變化,可以在後級的類似判定中高精度地進行圖像的 類比判定。圖8A至圖8C是說明將關注特徵點設為特徵點P4時的不變量的計算例 子的說明圖。特徵量計算單元442選擇特徵點P2、 P3、 P5、 P6作為周邊特 徵點。此時,不變量H4j(j^ 1、 2、 3)與所述同樣,可以通過H4j^ (A4j/B4j) xC/D計算。即,不變量H41的值為(A41/B41) xc/D(參照圖8A),不變 量H42的值為(A42/B42 ) x C/D(參照圖8B ),不變量H43的值為(A43/B43 ) xC/D (參照圖8C)。將其他的特徵點Pl、 P2、 P5、 P6選擇作為關注特徵點的情況也同樣, 特徵量計算單元442依次變更關注特徵點,計算選糹奪各特徵點P1、 P2..... P6時的不變量Hij (i=l、 2..... 6: j = l、 2、 3)。接著,特徵量計算單元442使用由各關注特徵點計算出的不變量計算特 徵量(散列值Hi )。在將關注特徵點設為特徵點Pi時的散列值Hi表示為Hi =(Hil x 102 + Hi2 x 101 + Hi3 x 10° ) /E。這裡,E是由將餘數i殳為何種程度 而決定的常數,例如,在E-10的情況下,餘數取0 9的值,這是計算的散 列值可取的範圍。作為通過關注特徵點計算不變量的方法,例如圖9A至圖9D所示,也可 以由關注特徵點P3的周邊特徵點Pl、 P2、 P4、 P5的四點選擇四個組合,與 上述情況同樣,通過HSj- (A5j/B5j) xC/D計算不變量H5j (j-1、 2、 3、 4)。此外,將關注特徵點設為P4時也同樣,如圖IOA至圖IOD所示,也可 以由關注特徵點P4的周邊特徵點P2、 P3、 P5、 P6的四點選擇四個組合,通 過H6j^ (Aj/Bj) xC/D計算不變量H6j (j = l、 2、 3、 4)。另夕卜,此時,散 列值Hi通過Hi = (Hil x 103 + Hi2 x 102 + Hi3 x 101 + Hi4 x 10° ) /E計算。另外,作為特徵量的上述散列值為一例,不限定於此,也可以使用其他 散列函數。此外,上述中,選擇四個作為周邊特徵點,但不限定於四個。例 如,也可以提取六個。在該情況下,也可以從六個特徵點提取五個,對於提 取五個的六組方法分別從5點提取3點來求不變量,並計算散列值。作為註冊格式存儲在圖像數據存儲單元449中的存儲圖像與這樣計算出 的散列值相關聯。圖IIA和圖IIB是示出表示散列值和註冊格式的關聯的散 列表的例子的概念圖。散列表由表示散列值和註冊格式的索引的各欄構成。 即,如圖11A所示,對應於表示註冊格式的索引,註冊表示圖像中的位置的 點索引(point index )和不變量。為了判定圖像的類似度,預先將要核對的圖 像、文檔圖像等註冊在散列表中。另外,如圖11B所示,在散列值相等的情 況下,(Hl-H5),可以將散列表12b的兩個條目集中為一個。投票處理單元443基於特徵量計算單元442計算出的散列值(特徵量) 對散列表進行檢索,並對註冊了的索引的原稿進行投票。此時,存儲輸入圖 像的哪個特徵點對哪個註冊格式的哪個特徵點投票了。圖12是表示用於累計 投票結果的累計表的一例的概念圖。在圖12所示的例子中,判定為對輸入圖 像的特徵點Pl求出的特徵量(散列值)與註冊的註冊格式ID1的特徵點fl 的特徵量一致。對於輸入圖像的其他的特徵點P2-P7也同樣。此外,事先存 儲用於識別註冊格式的各特徵點的索引和該特徵點的坐標。圖13是表示存儲
註冊格式的索引和特徵點的坐標的表的一例的概念圖。圖14是表示投票結果的一例的曲線圖。橫軸表示註冊格式的種類,縱軸表示投票數。圖14所示的例子示出了對三種註冊格式("N1" ~ "N3,,)進 行了投票的情況。對投票累加的投票結果被輸出到類似度判定處理單元444。類似度判定處理單元444基於從^l票處理單元443輸入的^:票結果,判 定圖像的類似度,並將判定結果通知給控制單元440。類似度判定處理單元 444將從投票處理單元443輸入的投票數(得票數)和預定的閾值進行比較, 在投票數為闊值以上的情況下,判定為輸入圖像與註冊格式類似。類似度判 定處理單元444在從投票處理單元443輸入的投票數小於閾值的情況下,判 定為沒有類似的原稿。並將該結果通知給控制單元440。另外,上述判定方法為一例,作為其它的方法,例如,也可以在得票數 除以每個原稿的最大得票數(對每個原稿求出的特徵點的數等)並標準化後,進行類比判定。接著,說明由圖像輸入裝置3讀入帳票等具有定型格式的原稿的圖像, 由文檔核對處理單元44對讀入的圖像進行處理時的具體處理步驟。圖15是 說明由文檔核對處理單元44執行的處理步驟的流程圖。文檔核對處理單元 44首先執行計算輸入圖像的特徵點的特徵點計算處理(步驟Sll )。如前所述, 將輸入圖像二值化之後,基於二值化信息對各像素進行標示,確定被附加了 同一標記的像素連接的連接區域,以確定的連接區域的重心作為特徵點計算。接著,文檔核對處理單元44基於計算出的特徵點進行計算輸入圖像的特 徵量的特徵量計算處理(步驟S12)。此時,文檔核對處理單元44的特徵量 計算單元442選擇計算出的特徵點中的一個作為關注特徵點,並使用關注特 徵點和周邊特徵點,通過輸入圖像的移動、旋轉等計算不變的不變量,並從計算出的不變量計算輸入圖像的特徵量。接著,文檔核對處理單元44基於作為特徵量計算單元442計算出的特徵 點的散列值,檢索如圖12所示的散列表,進行對註冊的索引的註冊格式投票 的投票處理(步驟S13)。接著,文檔核對處理單元44基於步驟S13中的投票結果進行判定輸入圖 像和註冊格式的類似度的類似度判定處理(步驟S14),判定輸入圖像是否與 註冊格式類似(步驟S15)。即,將註冊在散列表中的各註冊格式的得票數和 預定的閾值進行比較,在投票數為閾值以上的情況下,判定輸入圖像和註冊 格式類似,在沒有具有閾值以上的得票數的註冊格式的情況下,判定為輸入 圖像不與註冊格式類似。在判斷為輸入圖像與註冊格式類似的情況下(S15:是),文檔核對處理 單元44進行提取對註冊格式進行了寫入的區域的寫入區域提取處理(步驟 S16)。後面詳細敘述寫入區域提取處理的細節。然後,對通過寫入區域提取處理判定為有寫入的區域分別實施壓縮處理 (步驟S17),並與表示和註冊格式的關聯的表(form) ID—同保存在圖像數 據存儲單元449中(步驟S18)。此外,在判斷為輸入圖像與註冊格式不類似 的情況下(S15:否),在操作面板l中顯示註冊格式的消息(步驟S19)。圖16是說明寫入區域提取處理的步驟的流程圖。寫入區域提取單元445 將讀入的輸入圖像的坐標系變換為註冊格式的坐標系(步驟S21)。因此,首 先將在步驟Sll中對輸入圖像計算出的特徵點的坐標和被判定為類似的註冊 格式中的特徵點的坐標進行對應。圖17是說明輸入圖像和註冊格式之間的對 應的說明圖。示出了對註冊格式註冊了四個特徵點的坐標(xl, yl)、 (x2, y2)、 (x3, y3)、 (x4, y4),這四個特徵點的坐標與對輸入圖像計算出的四個 特徵點的坐標(xl,, yl,)、 (x2', y2,)、 (x3', y3, )、 (x4', y4,)分別對應的 情況。將使用註冊格式的特徵點的坐標生成的矩陣設為Pin,將使用輸入圖像的 特徵點的坐標生成的矩陣設為Pout,並將兩個矩陣Pin、 Pout之間的變換矩 陣設為A的情況下,註冊格式上的坐標和輸入圖像上的坐標之間成立以下的 關係式。[算式l]=屍/w X爿其中yl1)「;cl'/6、x2少21x2'1,爿=/少31x3'1、"1,、x4'少4'、g由於矩陣Pin不是正方矩陣,所以在兩邊乘以Pin的轉置矩陣PinT,進而
乘以PinTPin的逆矩陣,從而可以求變換矩陣A。 [算式2]爿=(屍/^屍z'")一屍z7/戶owf輸入圖像上的任意的坐標(x,,y,)和註冊格式上的坐標(x,y)之間成立 以下的關係式。 [算式3]使用變換矩陣A的坐標變換被用於從輸入圖像求要提取的區域。例如, 說明從使用註冊格式生成的帳票的圖像中提取區域的情況。圖18A和圖18B 是表示註冊格式的一例的示意圖。圖18A所示的註冊格式具有日期欄、姓名 欄、住址欄、電話號碼欄、填寫事項欄。在使用該註冊格式生成帳票的情況 下,在日期欄、姓名欄、住址欄、電話號碼欄、填寫事項欄中記錄了字符串。 另外,被寫入帳票的字符串可以是由人手寫入的,也可以是通過計算機等電 子記錄的。在將各欄中,例如,姓名欄、住址欄、填寫事項欄中記錄的字符串作為 圖像提取的情況下,提取附加了圖18B的填補的矩形區域。因此,對每個注 冊格式存儲確定各矩形區域的坐標值。例如,在將姓名欄的四角的坐標設為 (xll, yll)、 (xl2, yll)、 (xll, y12)、 (xl2, y12)的情況下,存儲表示 矩形區域的對角的兩個坐標(xll, yll)和(xl2, y12)。對於住所欄、填寫 事項欄也同樣。圖19是表示對每個註冊格式確定要提取的區域的表的一例的 概念圖。在該表中,與表示註冊格式的索引對應存儲用於決定要提取的區域 的兩個對角坐標和項目名。在使用變換矩陣A的逆矩陣將輸入圖像的坐標系變換為註冊格式的坐標 系之後,對每個區域計算輸入圖像和註冊格式之間的差分(步驟S22)。此時, 也考慮讀入原稿時的像素值的再現性等,圖像數據以256色調表示的情況下, 在像素值為5~ IO左右的差時,視為相同來取差分。接著,對註冊格式的區域的像素數計算判定為相同的像素數的比率(步 驟S23),判斷該比率是否比閾值THwr (例如,0.99)小(步驟S24 )。在判 斷為比閾值THwr小的情況下(步驟S24:是),判定為有寫入(步驟S25 ), 在判斷為閾值THwr以上的情況下(S24:否),判定為無寫入(步驟S26 )。接著,判斷是否結束了提取的全部區域的處理(步驟S27),在判定為未
結束的情況下(S27:否),將處理返回步驟S22。此外,在判斷為結束了提 取的全部區域的處理(步驟S27:是),結束本流程圖的處理。在這樣利用存儲在圖像數據存儲單元449中的圖像數據的情況下,用戶 首先選擇作為對象的字符串的圖像數據。此外,也可以將字符串的圖像數據 和關鍵字對應,以縮略圖顯示或依次顯示由關鍵字檢索的結果,並從其中選 擇。字符串的圖像數據由於通過表ID與註冊格式相關聯,所以對應的註冊格 式被讀出,基於每個區域的坐標位置合成圖像。此時,也可以對某一區域(例 如,姓名欄)進行不輸出等編輯處理。編輯處理利用操作面板1,例如設置 編輯模式,在顯示單元中顯示進行處理的內容,觸摸面板等來進行選擇即可。實施方式2.在實施方式1中,首先判定輸入圖像和存儲圖像(註冊格式)的類比, 在類似的情況下提取必要的區域,但從輸入圖像首先提取用於判定類比的區 域,並判定提取的區域是否與註冊格式類似也可以。在本實施方式中,說明 讀取包含字符串以及格線的帳票的圖像,並從讀入的圖像中提取格線,判定 提取出的格線和預先存儲的定型的格式(以下稱為定型格式)是否類似。圖20是說明包括本實施方式的圖像處理裝置的圖像處理系統的內部結 構的方框圖。實施方式2的圖像處理系統包括操作面板1、圖像輸入裝置3、 圖像處理裝置5、圖像輸出裝置7。操作面板1是用於接受用戶的操作的接口,包括各種開關、按鈕等操作 單元以及顯示要對用戶通知的信息、圖像等的顯示單元。圖像輸入裝置3是光學讀取原稿的圖像的裝置,包括對讀取用的原稿照 射光的光源、CCD (Charge Coupled Device )這樣的圖像傳感器等。在圖像輸 入裝置3中,將來自設置在規定的讀取位置上的原稿的反射光像被成像在該 圖像傳感器上,輸出RGB (R: Red, G: Green, B: Blue)的模擬電信號。 圖像輸入裝置3輸出的模擬電信號被輸入圖像處理裝置5。本實施方式中, 作為原稿,設置帳票。圖像處理裝置5將從圖像輸入裝置3輸出的模擬電信號變換為數字電信 號之後,進行適當的圖像處理,並將得到的圖像數據輸出到圖像輸出裝置7。 另外,圖像處理裝置5的內部結構、動作等在後面詳細敘述。圖像輸出裝置7是基於圖像處理裝置5輸出的圖像信號在用紙、OHP膠 片等片材上形成圖像的裝置。因此,圖像輸出裝置7包括使感光體鼓帶上規
定的電位的帶電器、根據從外部接受的圖像數據而發出雷射從而在感光體鼓 上生成靜電潛像的雷射寫入裝置、對感光體鼓表面形成的靜電潛像提供色粉 並顯像的顯像器、將形成在感光體鼓表面的色粉像轉印到用紙上的轉印器等 (未圖示),通過電子照片方式在用紙上形成用戶所希望的圖像。另外,除了 通過使用雷射寫入裝置的電子照片方式進行圖像形成之外,也可以是通過噴 墨、熱轉印方式、升華方式等進行圖像形成的結構。接著,說明圖像處理裝置5的內部結構。AD變換單元51將從圖像輸入 裝置3輸入的RGB的模擬信號變換為數位訊號。黑斑校正單元52對從AD 變換單元51輸出的數字形式的RGB信號實施用於除去由圖像輸入裝置3的 照明系統、成像系統、拍攝系統產生的各種失真的處理。被進行了黑斑校正 的RGB信號被輸出到歸檔處理單元50和原稿種類判定單元53。在歸檔處理單元50中,從輸入圖像進行格線和字符的提取,將提取出的 格線和字符相關聯地存儲。此時,提取出的格線為已經註冊了的定型格式時, 不重新存儲提取出的格線,而與識別該定型格式的識別符(以下設為表ID) 相關聯地存儲字符圖像。此外,在未註冊提取出的格線的格式的情況下,在 對該格線的格式賦予新的表ID的基礎上,與該表ID相關聯地存儲字符圖像。原稿種類判定單元53由黑斑校正單元52除去各種失真,將被進行了彩 色平衡的調整的RGB (RGB的反射率信號)變換為濃度信號等彩色圖像處理 裝置中採用的閨像處理系統容易處理的信號,同時進行原稿種類的判定。原 稿種類的判定可以採用公知的技術。輸入色調調整單元54進行基底濃度的除去或對比度等畫質調整處理。區 域分離處理單元55進行由RGB信號將輸入圖像中的各像素分離為字符區域、 網點區域、照片區域的其中一個的處理。區域分離處理單元55基於分離結果, 將表示像素屬於哪個區域的區域識別信號輸出到後級的黑版生成底色除去單 元58、空間濾波處理單元59以及色調再現處理單元61,同時將從輸入色調 調整單元54輸出的輸入信號直接輸出到後級的顏色校正單元56。顏色校正單元56為了忠實地進行顏色再現而進行以下處理,即除去基於 包含不需要吸收分量的CMY色材的分光特性的色渾濁。被進行了顏色校正 的RGB信號被輸出到後級的放大縮小處理單元57。 ^:大縮小處理單元57基 於由操作面板1輸入的信號進行圖像的放大或縮小。黑版生成底色除去單元58進行從顏色校正後的CMY的三色信號生成黑(K)信號的黑版生成,以及從原來的CMY信號減去通過黑版生成得到的K 信號而生成新的CMY信號的處理。通過該處理,CMY的三色信號被變換為 CMYK的四色信號。作為黑版生成處理的一例,有通過骨架黑版進行黑版生成的方法。在該 方法中,如果將骨架曲線的輸入輸出特性設為y = f (x),將輸入的數據設為 C、 M、 Y,將輸出的數據設為C,、 M,、 Y,、 K,,將UCR率(UCR: Under Color Removal)設為oc (0<a<l),則黑版生成底色除去處理由以下的式子表示。K, = f{min(C,M,Y)}C, = C- otK,M, =M- aK'Y, = Y - ccK,空間濾波處理單元59基於區域識別信號,通過數字濾波器對由黑版生成 底色除去單元58輸入的CMYK信號的圖像數據進行空間濾波處理,並校正 空間頻率特性,從而進行處理以防止輸出圖像的模糊或粒狀惡化。例如,由區域分離處理單元5 5分離為字符的區域特別為了提高黑色字符 或彩色字符的再現性,通過空間濾波處理單元59的空間濾波處理中的清晰強 調處理提高高頻率的強調量。同時,色調再現處理單元61中,選擇通過適於 再現高頻率的高解析度的屏幕(screen)的二值化或多值化。此外,關於由區 域分離處理單元55分離為網點區域的區域,在空間濾波處理單元59中,實 施用於除去輸入網點分量的低通濾波處理。而且,在輸出色調校正單元60中 進行了將濃度信號等信號變換為彩色圖像輸出裝置的特性值即網點面積率的 輸出色調校正處理之後,在色調再現處理單元61中進行色調再現處理,即最 終將圖像分離為像素來進行處理以便能夠再現各自的色調。此外,關於由區 域分離處理單元55分離為照片的區域,進行通過重視色調再現的屏幕的二值 化或多值化。被實施了所述各處理的圖像數據臨時被存儲在存儲單元(未圖示)中, 在規定的定時被讀出並被輸出到圖像輸出裝置7。圖21是表示歸檔處理單元50的內部結構的方框圖。歸檔處理單元50包 括控制單元500、 二值化處理單元501 、格線提取單元502、核對處理單元503、 字符串提取單元504、註冊控制單元505、壓縮/解壓縮處理單元506、圖像數 據存儲單元507、圖像數據合成單元508。
控制單元500例如是CPU,進行所述硬體各部分的動作的控制。 二值化處理單元501基於輸入圖像生成輸入二值圖像。首先,將由RGB信號構成的輸入圖像變換為單色圖像。作為該變換,例如可以通過以下的計算式求出。L = 0.299 x R + 0.587 x G + 0.114 x B由通過該變換得到的單色圖像生成在格線提取單元502以後使用的二值 圖像。說明二值圖像的生成方法的一例。對輸入二值圖像,將進行二值化處 理的一行作為關注行,以某一定數為單位對關注行的各像素進行分割。這裡 的分割的像素數成為屏蔽尺寸(mask size )。例如,在以128像素為單位分割 的情況下,屏蔽尺寸為128像素X128行。求該屏蔽尺寸內的平均值,通過 平均值決定二值化處理所使用的閾值,通過比較該闊值和關注行的各像素來 進行二值化,並生成二值圖像。在格線提取單元502中,從讀取的圖像數據中提取格線,生成格線圖像。 作為格線提取方法,例如可以使用特開平1-214934號公報所記載的方法。該 方法將圖像數據以一定帶寬分割為長方形,在各帶取垂直方向的投影。接著, 從投影數據中提取被認為是格線的一部分的部分。在對每個帶提取了該部分 之後,關於某一著眼的候選,從鄰接帶中搜索出重疊最大的候選,並將其作 為同一格線候選連接。然後,關於被連接的候選,重複進行從鄰接帶中搜索 出重疊最大的候選的作業,從而生成被認為是同一格線的連接候選組。這裡 將這些連接候選組的水平方向的投影定義為部分投影,通過取與帶投影直角 方向的投影從而決定兩端的坐標並得到格線。通過進行將這樣得到的格線組 合成或統一為一條的處理,從而求出最終的格線組。不僅橫格線,而且縱格 線也能夠同樣提取。核對處理單元503進行輸入的格線圖像和已經註冊的定型格式的核對, 在已經註冊了的情況下,取得設定在註冊定型格式中的表ID,在未註冊的情 況下,將輸入的格線數據設為註冊定型表,設定新的表ID。作為定型格式的核對方法,例如,可以使用特開平8-255236號公報所記 載的方法。在該方法中如下進行,首先,在由輪廓提取處理對格線圖像進行 光柵掃描(raster scan)而檢測到追蹤開始點之後,從該追蹤開始點按順時針 方向或逆時針方向追蹤由圖形邊界構成的封閉曲線。通過這樣的封閉曲線追 蹤而提取的輪廓的信息被作為坐標點串保存。基於提取出的輪
圖像的交叉部分和角點等特徵點,從點串的組合提取框。然後,計算輸入框 信息的外接圖形。接著,計算各個框數據的中心坐標數據。例如將框坐標從左下角起設為(xO, y0)、 (xl, yl)、 (x2, y2 )、 (x3, y3 )時,對角線的交叉點成為(cx, cy)。將上面的左上的坐標和輸入圖像上的左上的坐標的位置的差分設為dx、 dy,校正註冊定型格式的框或格線圖像的框的中心位置。接著,將框數據分 別建立對應。這例如將註冊定型格式上的框數據的中心坐標設為tcx、 tcy,通 過以下的式子求出格線圖像上的框數據設為icx、 icy的情況下的距離D。 D = (icx - tcx ) 2 + (icy - tcy ) 2此外,類似度是在存在對應於註冊定型格式上的框對應的框(D〈dth, dth 為距離的閾值)的情況下進行投票,如果在註冊定型格式上對全部框結束了 投票則除以框數n。即,通過類似度=對應的框的11/註冊帳票上的框數求出。 使用該類似度,判斷格線圖像是否作為定型格式註冊了 。字符串提取單元504從輸入二值圖像和格線圖像生成字符圖像。作為進 行字符串部分的提取的方法,可以使用取輸入二值圖像和由格線提取單元502 提取的格線圖像的"異或"的方法。通過取"異或",不提取輸入二值圖像和 格線圖像中相同的格線部分而僅提取字符。在註冊控制單元505中,進行是否將格線圖像存儲在圖像數據存儲單元 507中的判斷和與字符圖像的定型格式的關聯。在由格線提取單元502提取 的格線圖像為定型格式的情況下,註冊控制單元505判斷為不存儲提取出的 格線圖像。此外,由字符串提取單元504提取的字符圖像與定型格式相關聯, 並存儲在圖像數據存儲單元507中。另一方面,在由格線提取單元502提取出的格線圖像不是定型格式的情 況下,判斷為將提取出的格線圖像作為定型格式存儲,在對格線圖像賦予表 ID的基礎上存儲在圖像數據存儲單元507中。進而,由字符串提取單元504 提取的字符圖像與被新作為定型格式存儲的格線圖像相關聯並存儲在圖像數 據存儲單元507中。壓縮/解壓縮處理單元506進行存儲在圖像數據存儲單元507中的圖像數 據的壓縮、和被壓縮存儲在圖像數據存儲單元507中的格線圖像、字符圖像 的解壓縮。註冊控制單元505在對被判斷為存儲在圖像數據存儲單元507中 的格線圖像、字符圖像實施了壓縮處理之後,存儲在圖像數據存儲單元507
中。作為壓縮方式,可舉出MH、 MR、 MMR等。此外,也可以使用分別不 同的壓縮方式對字符圖像和格線圖像進行壓縮。被壓縮存儲的格線圖像、字符圖像的解壓縮實施與上述壓縮處理相反的 處理。另外,上述中,進行了格線圖像、字符圖像兩者的壓縮,也可以壓縮 格線圖像、字符圖像的其中一個。控制單元500進行將分別存儲在圖像數據存儲單元507中的定型格式的 格線圖像和字符圖像讀出的控制。例如,在基於存儲在圖像數據存儲單元507 中的數據生成帳票的情況下,在操作面板1上顯示存儲的多個字符圖像,使 用戶選擇所希望的字符圖像。然後,取得與被選擇的字符圖像相關聯的表ID, 並從圖像數據存儲單元507中讀出字符圖像和格線圖像的數據,將讀出的數 據輸出到後級的圖像數據合成單元508。另外,將字符圖像和關鍵字相對應,對通過關鍵字檢索出的結果進行縮 略顯示或依次顯示,也可以從中選擇。圖像數據合成單元508將從圖像數據存儲單元507中讀出的兩個圖像數 據合成,將合成而得到的圖像數據(RGB信號)輸出到原稿種類判定單元53 。 被實施了原稿種類判定單元53-色調再現處理單元61中的各處理的圖像數 據被輸出到圖像輸出裝置7,通過在用紙上合成的圖像被記錄從而進行帳票 的生成。以下,說明本圖像處理系統中的處理內容。圖22A至圖22C、圖23A至 圖23C、圖24A至圖24C是表示格線圖像和字符圖像的提取例子的示意圖, 圖25是表示格線圖像的註冊例子的概念圖,圖26是表示字符圖像的註冊例 子的概念圖。在圖22A所示的帳票10的圖像通過圖像輸入裝置3被輸入的 情況下,圖像處理裝置5的歸檔處理單元50通過所述方法,從輸入圖像中提 取格線圖像11 (圖22B)和字符圖像12 (圖22C)。提取出的格線圖像11在 未作為定型格式註冊的情況下,在賦予新的表ID的基礎上將格線圖像11存 儲在圖像數據存儲單元507中。圖25所示的註冊例子示出了對格線圖像11 賦予'T,的表ID,作為定型格式註冊的情況。進而,將從相同的帳票10的 圖像提取出的字符圖像12與賦予格線圖像11的表ID相關聯地存儲在圖像數 據存儲單元507中。在圖26所示的註冊例子中,示出了通過賦予具有與對格 線圖像11賦予的表ID相同的值(=1)的關聯表ID從而建立關聯的情況。同樣,在通過圖像輸入裝置3輸入了圖23A所示的帳票20的圖像的情
況下,圖像處理裝置5的歸檔處理單元50通過所述方法從輸入圖像中提取格 線圖像21 (圖23B)和字符圖像22 (圖23C)。提取出的格線圖像21在未作 為定型格式註冊的情況下,在賦予新的表ID的基礎上將格線圖像21存儲在 圖像數據存儲單元507中。圖25所示的註冊例子示出了對格線圖像21賦予 "2"的表ID,作為定型格式註冊的情況。進而,將從相同的帳票20的圖像 提取出的字符圖像22與格線圖像21相關聯地存儲在圖像數據存儲單元507 中。在圖26所示的註冊例子中,示出了通過賦予具有與對格線圖像21賦予 的表ID相同的值(=2)的關聯表ID從而建立關聯的情況。在通過圖像輸入裝置3輸入了圖24A所示的帳票30的圖像的情況下, 圖像處理裝置5的歸檔處理單元50通過所述方法從輸入圖像中提取格線圖像 31 (圖24B)和字符圖像32 (圖24C)。格線圖像31的格式與表ID為"1" 的定型格式相同,因此不賦予新的表ID,取得分配給所述定型格式的表ID。 此外,將從相同的帳票30的圖像提取出的字符圖像32與格線圖像31的表ID 相關聯地存儲在圖像數據存儲單元507中。在圖25所示的註冊例子中,示出 了通過賦予具有與對格線圖像31賦予的表ID相同的值(=1 )的關聯表ID 從而建立關聯的情況。以下,說明本圖像處理系統中執行的處理步驟。圖27是表示格線圖像和 字符圖像的註冊步驟的流程圖。首先,本圖像處理系統的圖像輸入裝置3進 行帳票的讀取(步驟S31)。圖像輸入裝置3將通過讀取帳票而得到的模擬 RGB信號(輸入圖像)輸出到圖像處理裝置5。被輸入圖像處理裝置5的模擬RGB信號經由AD變換單元51和黑斑校 正單元52 ^皮輸入歸檔處理單元50。歸檔處理單元50的二值化處理單元501 從輸入圖像生成二值化圖像(步驟S32 )。格線提取單元502從由二值化處理 單元501生成的二值圖像進行格線圖像的提取(步驟S33 )。接著,核對處理單元503通過確認存儲在圖像數據存儲單元507中的格 線圖像,從而核對提取出的格線圖像的註冊狀況(步驟S34),並判斷在步驟 S33中提取出的格線圖像是否已作為定型格式註冊(步驟S35 )。在判斷為未作為定型格式註冊的情況下(S35:否),對格線圖像賦予新 表ID(步驟S36)。接著,字符串提取單元504通過取輸入圖像和格線圖像的 "異或,,從而提取輸入圖像中包含的字符串,並生成字符圖像(步驟S37)。接著,註冊控制單元505將賦予新表ID的格線圖像存儲到圖像數據存儲 單元507,從而將格線圖像作為定型格式保存(步驟S38)。此時,格線圖像 在壓縮處理單元506中被壓縮之後被存儲在圖像數據存儲單元507。此外,註冊控制單元505通過對字符圖像賦予具有與賦予格線圖像的表 ID相同值的關聯表ID,從而將字符圖像和表ID建立關聯(步驟S39)。然後, 由壓縮處理單元506對字符圖像進行壓縮之後保存在圖像數據存儲單元507 中(步驟S40)。另一方面,在步驟S35中,在判斷為提取出的格線圖像已作為定型格式 註冊的情況下(S35:是),取得對該定型格式分配的表ID(步驟S41)。接著, 字符串提取單元504通過取輸入圖像和格線圖像的"異或"從而提取輸入圖 像中包含的字符串,並生成字符圖像(步驟S42)。而且,註冊控制單元505通過對字符圖像賦予具有與賦予格線圖像的表 ID相同值的關聯表ID,從而將字符圖像和表ID建立關聯(步驟S39),由壓 縮處理單元506對字符圖像進行壓縮之後保存在圖像數據存儲單元507中(步 驟S40 )。實施方式3.在實施方式1和2中,採用由硬體實現各處理的結構,但也可以使計算 機執行電腦程式(執行形式程序、中間代碼程序、源程序)來實現上述處 理。圖28是表示安裝了執行所述處理的電腦程式的圖像處理裝置的內部 結構的方框圖。圖中100是本實施方式的圖像處理裝置,具體來說,如個人 計算機、工作站等。圖像處理裝置100包括CPUIOI, CPU101上經由總線102 連接有ROM103、 RAM104、硬碟105、外部存儲單元106、輸入單元107、 顯示單元108、通信埠 109等硬體。CPU101按照ROM103中預先存儲的 控制程序的程序代碼控制所述硬體各部分。RAM104是臨時存儲所述控制程序或在執行所述處理的電腦程式的執 行中生成的各種數據的易失性存儲器。硬碟105是具有磁記錄介質的存儲單 元,存儲了所述電腦程式的程序代碼等。外部存儲單元106包括用於從記 錄了執行所述處理的電腦程式的程序代碼的記錄介質M中讀取程序代碼的 讀取裝置。作為記錄介質M,可以使用FD ( Flexible Disk )、 CD - ROM等。 由外部存儲單元106讀取的程序代碼被存儲在硬碟105中。CPU101將存儲在 硬碟105中的程序代碼載入RAM104上來執行,從而使裝置整體具有實現如 實施方式1中說明的註冊處理的裝置的功能,將要註冊的格線圖像和字符圖像相關聯地保存在硬碟105中。輸入單元107具有用於從外部取得圖像數據的接口的功能。輸入單元107 上例如連接有彩色掃描裝置等。顯示單元108具有用於顯示處理對象的圖像 數據、圖像處理中的圖像數據、圖像處理後的圖像數據等的界面的功能。顯 示單元108上連接液晶顯示器裝置等外部顯示裝置從而顯示圖像數據,也可 以顯示單元108本身具有顯示裝置並顯示圖像數據。通信埠 109是用於對 外部連接印表機150的接口。在由印表機150列印被圖像處理後的圖像數據 時,圖像處理裝置IOO基於所述圖像數據生成可在印表機150中解碼的列印 數據,並將生成的列印數據發送到印表機150。另外,在本實施方式中,假設CPU101執行各種運算,但也可以另外設 置進行圖像處理相關的運算的專用晶片,通過來自CPU101的指示進行運算。此外,作為記錄所述電腦程式的程序代碼的記錄介質M,除了所述FD 和CD-ROM之外,也可以利用MO、 MD、 DVD等光碟、硬碟等磁記錄介 質、IC卡、存儲卡、光卡等卡型記錄介質、屏蔽ROM、 EPROM (Erasable Programmable Read Only Memory ) 、 EEPROM ( Electrically Erasable Programmable Read Only Memory )、快閃記憶體ROM等半導體存儲器。此外,也可 以採用可連接包含網際網路的通信網絡的系統結構,從所述網絡下載實現所述 處理的電腦程式的程序代碼。此外,上述計算機代碼可以以電子傳輸具體 化的、嵌入載波中的計算機數據信號的形式來實現。此外,所述電腦程式可以是作為單獨的程序、應用程式(utility program ) 提供的方式,也可以是裝入其他的應用程式、實用程序,作為該程序的一部 分功能提供的方式。
權利要求
1.一種圖像處理裝置,包括圖像輸入單元,輸入圖像;圖像存儲單元,存儲圖像;類比判定單元,對通過所述圖像輸入單元輸入的輸入圖像和存儲在所述圖像存儲單元中的存儲圖像的類比進行判定;以及區域提取單元,在判定為所述輸入圖像和所述存儲圖像類似的情況下,判定所述輸入圖像是否是對所述存儲圖像施加了寫入的圖像,從所述輸入圖像中提取包含所述寫入的區域,其中,將由所述區域提取單元提取的區域內的圖像存儲在所述圖像存儲單元中。
2. 如權利要求1所述的圖像處理裝置,其中,在提取了多個所述區域的情 況下,對提取的每個區域,將區域內的圖像存儲在所述圖像存儲單元中。
3. 如權利要求1所述的圖像處理裝置,還包括將存儲在所述圖像存儲單元 中的圖像進行壓縮的壓縮單元。
4. 如權利要求1所述的圖像處理裝置,還包括解壓縮單元,將被壓縮存 儲在所述圖像存儲單元中的圖像解壓縮;以及合成單元,將被解壓縮了的圖 像合成。
5. —種圖像處理裝置,包括 圖像輸入單元,輸入圖像;提取單元,特別提取出在通過該圖像輸入單元輸入的輸入圖像中包含的 格線以及字符;以及其中,在所述判斷單元判斷為規定樣式的情況下,將提取出的字符與所 述規定樣式的格線相關聯地存儲在存儲單元中,在判斷為不是規定樣式的情 況下,將提取出的格線存儲在所述存儲單元中。
6. 如權利要求5所述的圖像處理裝置,其中,在判斷為提取出的格線的樣 式不是規定樣式的情況下,將提取出的字符與所述格線相關聯地存儲在所述 存儲單元中。
7. 如權利要求6所述的圖像處理裝置,還包括將提取出的格線和字符壓縮的壓縮單元,其中,將壓縮了的格線以及字符存儲在所述存儲單元中。
8. 如權利要求7所述的圖像處理裝置,還包括解壓縮單元,將被壓縮存 儲在所述存儲單元中的格線以及字符解壓縮;以及合成單元,將被解壓縮了 的格線以及字符合成。
9. 一種圖像讀取裝置,包括 圖像讀取單元,從原稿讀取圖像;以及如權利要求1至權利要求8的任何一項所述的圖像處理裝置, 其中,由所述圖像處理裝置處理由所述圖像讀取單元所讀取的圖像。
10. —種圖像形成裝置,包括如權利要求4或權利要求8所述的圖像處理裝置;以及圖像形成單元,在片材上形成由該圖像處理裝置的合成單元合成了的圖像。
11. 一種圖像處理方法,包括以下步驟 對輸入圖像和存儲圖像的類比進行判定;在判定為所述輸入圖像和所述存儲圖像類似的情況下,判定所述輸入圖 像是否是對所述存儲圖像施加了寫入的圖像;在判定為所述輸入圖像是在所述存儲圖像中施加了寫入的圖像的情況 下,從所述輸入圖像中提取包含所述寫入的區域;以及將提取的區域內的圖像存儲在存儲裝置中。
12. —種圖像處理方法,包括以下步驟: 特別提取出在輸入圖像中包含的格線以及字符; 判斷取出的格線的樣式是否為規定樣式;在判斷為規定樣式的情況下,將提取出的字符與所述規定樣式的格線相 關聯地存儲在存儲裝置中;以及在判斷為不是規定樣式的情況下,將提取出的格線存儲在所述存儲裝置中。
全文摘要
提供一種圖像處理裝置和方法、圖像讀取裝置和圖像形成裝置。包括特徵點計算單元,計算輸入圖像的特徵點;特徵量計算單元,基於計算出的特徵點,對圖像的移動、傾斜、旋轉等計算不變的特徵量;投票處理單元,使用計算出的特徵量對預先註冊的註冊格式進行投票;類似度判定處理單元,使用投票結果判定輸入圖像和註冊格式的類比;寫入區域提取單元,在判定為類似的情況下,從輸入圖像中提取對註冊格式進行了寫入的區域;以及註冊控制單元,控制對圖像數據存儲單元的註冊。
文檔編號H04N1/21GK101163188SQ200710143778
公開日2008年4月16日 申請日期2007年8月2日 優先權日2006年8月3日
發明者太平雅和, 小西陽介 申請人:夏普株式會社

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀