新四季網

圖像處理設備和圖像處理方法與流程

2023-10-10 10:41:24 1


本發明涉及圖像處理設備和圖像處理方法。



背景技術:

日本未經審查的專利申請公開No.9-138837公開了以下的技術:提取二值圖像的水平和垂直邊界,檢測圖的拐角,檢測充當邊界交叉處的點,連接這些點,檢測具有矩形形狀的最靠外外部框架的輪廓,提取框架結構的特徵,通過參考列出預先登記的框架結構的特徵的框架結構參考表來識別輸入報告形式,並且檢測字符讀取區域。

日本未經審查的專利申請公開No.6-119491公開了以下的技術:準備將識別目標報告形式的各項之間的物理布局關係與條目類型(諸如,用戶的地址和名稱)關聯的報告形式定義表,從輸入報告形式的圖像數據中提取限定連續排列的白色像素的邊界的矩形,將大小等於或大於閾值的矩形確定為寫框架,用報告形式定義表的定義信息來檢查得自所確定的寫框架的各項的物理布局關係,確定寫入項的類型,並且使用各寫入項的類型特有的信息對寫入項執行字符識別操作。

可通過識別在原始文檔(諸如,報告形式)中繪出的字符和邊界將原始文檔分類。例如,字符或邊界的識別可根據原始文檔的類型而表現得好或不好。



技術實現要素:

本發明的目的是相比於使用不顧及原始文檔類型而確定的識別處理的系統,在分類原始文檔時大幅提高了分類準確性。

根據本發明的第一方面,提供了一種圖像處理設備。所述圖像處理設備包括:獲取單元,其獲取原始文檔上形成的圖像的圖像信息;以及分類單元,其使用所述獲取單元獲取的圖像信息,響應於作為第一識別操作和第二識別操作中的一個的操作結果,按照所述第一識別操作和所述第二識別操作中的所述一個或兩個將所述圖像分類。所述第一識別操作被配置為根據所述圖像的特徵量將圖像分類,所述第二識別操 作被配置為根據圖像的字符信息將所述圖像分類。

根據本發明的第二方面,依據圖像處理設備的第一方面,如果預定關聯關係指明作為所述第一識別操作和所述第二識別操作中的另一個的另一個識別操作的執行與所述一個識別操作的操作結果關聯,則所述分類單元在所述一個識別操作之後,執行所述另一個識別操作。

根據本發明的第三方面,依據圖像處理設備的第一方面,分別針對所述第一識別操作和所述第二識別操作預定多個項並且所述分類單元在所述第一識別操作和所述第二識別操作中的每個中識別所述圖像屬於哪一個項。如果在所述一個識別操作之後執行所述另一個識別操作,則所述分類單元減少預定項,以響應於所述一個識別操作的操作結果來選擇更少量的項,並且在所述另一個識別操作中識別所述圖像屬於所選擇的項中的哪一個。

根據本發明的第四方面,依據圖像處理設備的第三方面,預先按照每一項將針對各識別操作預定的項與圖像的分類目的地關聯。所述分類單元將所述圖像分類為與在所述另一個識別操作中所述圖像被識別所屬的項關聯的分類目的地。

根據本發明的第五方面,依據圖像處理設備的第一方面,如果如果作為所述一個識別操作的結果輸出了多個候選,則所述分類單元按照預定次序來選擇所述候選,直到確定了所述圖像的分類目的地,並且使用所選擇的候選,按照所述第一識別操作和所述第二識別操作中的一個或兩個將所述圖像分類。

根據本發明的第六方面,依據圖像處理設備的第一方面,所述分類單元根據用戶指定的條件,確定首先要執行所述第一識別操作和所述第二識別操作中的哪一個。

根據本發明的第七方面,依據圖像處理設備的第一方面,所述圖像的特徵量包括所述圖像中包含的邊界。

根據本發明的第八方面,提供了一種圖像處理設備。所述圖像處理設備包括:獲取單元,其獲取原始文檔上形成的圖像的圖像信息;以及分類單元,其使用所述獲取單元獲取的圖像信息,響應於第一識別操作和與所述第一識別操作不同的第二識別操作中的一個的操作結果,按照所述第一識別操作和所述第二識別操作中的所述一個或兩個將所述圖像分類。

根據本發明的第九方面,提供了一種圖像處理方法。所述圖像處理方法包括:獲取原始文檔上形成的圖像的圖像信息;以及使用獲取的所述圖像信息,響應於第一識 別操作和第二識別操作中的一個的操作結果,按照所述第一識別操作和所述第二識別操作中的所述一個或兩個將所述圖像分類,所述第一識別操作被配置為根據所述圖像的特徵量將圖像分類,所述第二識別操作被配置為根據圖像的字符信息將所述圖像分類。

根據本發明的第一方面和第九方面,相比於使用不顧及原始文檔類型而確定的識別處理的系統,所述圖像處理設備在分類原始文檔時大幅提高了分類準確性。

根據本發明的第二方面,相比於使用不顧及原始文檔類型而確定的識別處理的系統,所述圖像處理設備大幅提高了分類準確性。

根據本發明的第三方面,相比於確定圖像是否屬於所有預定項中的每個的系統,所述圖像處理設備大幅增加了處理速度。

根據本發明的第四方面,相比於使用不顧及原始文檔類型而確定的識別處理的系統,所述圖像處理設備大幅提高了分類準確性。

根據本發明的第五方面,即使所述一個識別操作不能夠唯一地識別圖像,所述圖像處理設備也確定原始文檔的分類目的地。

根據本發明的第六方面,所述圖像處理設備首先根據用戶指定的條件來確定首先要執行第一識別操作和第二識別操作中的哪一個。

根據本發明的第七方面,根據圖像中包含的邊界將原始文檔分類。

根據本發明的第八方面,相比於使用不顧及原始文檔類型而確定的識別處理的系統,所述圖像處理設備在分類原始文檔時大幅提高了分類準確性。

附圖說明

將基於下面的附圖詳細地描述本發明的示例性實施方式,其中:

圖1總體上示出示例性實施方式的圖像處理系統;

圖2示出示例性實施方式的圖像讀取設備的硬體構造;

圖3示出示例性實施方式的終端設備的硬體構造;

圖4是示例性實施方式的終端設備的功能構造的框圖;

圖5示出光學字符識別(OCR)操作和邊界識別操作的示例;

圖6是示出圖像處理系統的處理的例程的流程圖;

圖7示出可靠性表的示例;以及

圖8是示出在為OCR識別操作賦予較高優先級的情況下執行的處理的例程的流程圖。

具體實施方式

以下,參照附圖描述本發明的示例性實施方式。

首先,描述示例性實施方式的圖像處理系統1的整體構造。圖1總體上示出示例性實施方式的圖像處理系統1。示例性實施方式的圖像處理系統1將諸如報告的原始文檔分類。更具體地,示例性實施方式的圖像處理系統1將諸如報告的原始文檔分類。更具體地,在圖像處理系統1上設置包括「交付聲明」和「帳單」的各種類型的原始文檔並且圖像處理系統1根據原始文檔的內容將原始文檔分類。通過將原始文檔分類,用戶驗證處於被分類狀態的原始文檔上寫上的各項,並且按照各分類類別預定的處理流程來處理原始文檔。

如圖1中所示,圖像處理系統1包括圖像讀取設備10和終端設備20。圖像讀取設備10通過讀取原始文檔上形成的圖像,生成圖像數據(圖像信息)。終端設備20藉助網絡30從圖像讀取設備10接收圖像信息並且將接收到的圖像信息分類。

具有掃描功能的圖像讀取設備10讀取諸如報告的原始文檔(紙張)上形成的圖像,並且生成指示被讀取圖像的圖像信息(下文中被稱為「原始文檔圖像信息」)。圖像讀取設備10可以例如是掃描儀裝置,並且是基於電荷耦合器件(CCD)系統或接觸式圖像傳感器(CIS)系統。在CCD系統中,用光束照射文檔,然後藉助透鏡收集被文檔反射的光束。在CIS系統中,用來自發光二極體(LED)的光束照射文檔,並且由CIS傳感器接收被文檔反射的光束。除了掃描功能之外,圖像讀取設備10還可具有印刷功能、複印功能或傳真功能。

終端設備20藉助網絡30接收由圖像讀取設備10生成的原始文檔圖像信息,並且使用接收到的原始文檔圖像信息將原始文檔分類(即,將原始文檔上形成的圖像分類)。個人計算機(PC)可用於終端設備20。按照示例性實施方式,終端設備20具有用作圖像處理設備的功能。

如以下更詳細描述的,終端設備20通過執行通過光學字符識別(OCR)識別原始文檔(原始文檔圖像信息)中包含的字符(包括數字、符號和標記)的操作和識別原始文檔中包含的邊界的操作將原始文檔分類。OCR是分析圖像數據中的字符並且 將字符轉換成計算機將要操縱的字符數據的技術。邊界代表垂直地或水平地繪製以勾畫或包圍各項的線,並且被視為代表圖像的特徵量的信息示例。

通過OCR識別原始文檔中包含的字符信息並且將所識別的字符信息分類的操作還可被稱為OCR識別操作。識別原始文檔中包含的邊界並且將其分類的操作還可被稱為邊界識別操作。按照示例性實施方式,使用邊界識別操作作為第一識別操作的示例。使用OCR識別操作作為第二識別操作的示例。

網絡30是用於圖像讀取設備10和終端設備20之間的信息通信的通信網絡。例如,網絡30是區域網(LAN)。

以下,描述圖像讀取設備10的硬體構造。圖2示出示例性實施方式的圖像讀取設備10的硬體構造。如圖2中所示,圖像讀取設備10包括中央處理單元(CPU)101、隨機存取存儲器(RAM)102、只讀存儲器(ROM)103、硬碟驅動(HDD)104、顯示面板105、圖像形成單元106、圖像讀取單元107和通信接口(下文中被稱為通信I/F)108。這些元件藉助總線109彼此相互連接,並且藉助總線109交換數據。

CPU 101執行各種程序,包括作業系統(OS)和應用。RAM 102用作CPU 101的作業存儲器。ROM 103存儲CPU 101將要執行的各種程序。CPU 101將來自ROM 103等的各種程序加載到RAM 102,以執行這些程序。CPU 101因此執行圖像讀取設備10的功能中的每個。HDD 104存儲輸入到各種軟體程序或者從各種軟體程序輸出的數據。

顯示面板105從用戶接收各種信息或操作輸入的顯示。

圖像形成單元106響應於輸入圖像數據,在記錄介質上形成圖像。圖像形成單元106是通過將光導鼓上的色調劑轉移到記錄介質或噴墨系統來形成圖像的電子攝影系統,噴墨系統通過將墨水噴射到記錄介質上來形成圖像。

圖像讀取單元107讀取記錄介質上形成的圖像,並且生成代表讀取圖像的原始文檔圖像信息。

通信I/F 108藉助網絡30從諸如終端設備20的外部設備接收各種數據或者將數據發送到外部設備。

以下,描述終端設備20的硬體構造。圖3示出示例性實施方式的終端設備20的硬體構造。如圖3中所示,終端設備20包括CPU 201、存儲器202和磁碟裝置(HDD)203。

CPU 201執行包括OS和應用的各種程序,從而實現終端設備20的功能。存儲器202存儲執行程序時使用的各種程序和數據。磁碟裝置203存儲輸入程序的數據或者從程序輸出的數據。終端設備20還包括被配置為與外部通信的通信I/F 204、包括視頻存儲器、顯示器等的顯示機構205、和諸如鍵盤和滑鼠的輸入裝置206。

以下,描述終端設備20的功能和構造。圖4是示例性實施方式的終端設備20的功能構造的框圖。

終端設備20包括圖像信息接收器21、操作輸入接收器22、OCR識別單元23和邊界識別單元24。圖像信息接收器21藉助網絡30從圖像讀取設備10接收原始文檔圖像信息。操作輸入接收器22從該用戶接收操作輸入。OCR識別單元23識別原始文檔圖像信息。邊界識別單元24通過邊界識別操作來識別原始文檔圖像信息。

終端設備20還包括分類處理器25和可靠性表存儲器26。分類處理器25基於OCR識別操作的操作結果和邊界識別操作的操作結果來確定分類目的地。可靠性表存儲器26預先存儲系統管理員製作的可靠性表。

圖像信息接收器21藉助網絡30從圖像讀取設備10接收圖像讀取單元107已經通過讀取原始文檔上形成的圖像而生成的原始文檔圖像信息。

操作輸入接收器22從用戶接收操作輸入。例如,操作輸入接收器22接收指定當要將原始文檔分類時的分類模式的操作輸入。分類模式指示各原始文檔所屬的分類類別。用戶通過考慮各設置文檔的內容來指定分類模式。以下,詳細地描述分類模式。

OCR識別單元23通過OCR識別操作來識別原始文檔圖像信息。更具體地,OCR識別單元23通過OCR識別操作來識別圖像信息接收器21接收的原始文檔圖像信息中包含的字符。基於所識別的字符(字符串)的信息,OCR識別單元23將原始文檔分類為針對OCR識別操作預定的多個分類項中的一個。

邊界識別單元24通過邊界識別操作來識別原始文檔圖像信息。更具體地,邊界識別單元24水平地和垂直地掃描圖像信息接收器21接收的原始文檔圖像信息,並且識別具有預定長度或更長的連續黑點的線作為邊界。基於所識別的邊界的信息,邊界識別單元24將原始文檔分類,使其成為針對邊界識別操作確定的多個分類項中的一個。

參照圖5描述OCR識別操作和邊界識別操作。圖5示出OCR識別操作和邊界識別操作的示例。圖5的原始文檔301包括由邊界形成的圖302和圖303。圖302包括 字符串「AAA」並且圖303包括字符串「BBB」。

在OCR識別操作中,OCR識別單元23執行字符識別,從而得知在原始文檔301中繪製字符串「AAA」和字符串「BBB」。如果在原始文檔301中繪製字符串「AAA」和字符串「BBB」的情況下針對OCR識別操作預定分類項,則OCR識別單元23將原始文檔分類為預定分類項。當在OCR識別操作中執行分類時,可使用與字符相關的任何信息(諸如,字符的大小和位置(坐標信息))。

在邊界識別操作中,邊界識別單元24識別在原始文檔301中繪製邊界(諸如,圖302和圖303)。如果在原始文檔301中繪製圖302和圖303的情況下針對邊界識別操作預定分類項,則邊界識別單元24將原始文檔分類為預定分類項。當在邊界識別操作中執行分類時,可使用與邊界相關的任何信息(諸如,邊界的類型、大小和位置(坐標信息))。

因此,執行OCR識別操作和邊界識別操作。

分類處理器25確定是將要使用OCR識別操作和邊界識別操作中的一個還是兩個。分類處理器25通過執行OCR識別操作和邊界識別操作中的一個或兩個,確定原始文檔的最終分類目的地。分類處理器25在本文中確定原始文檔的類型是原始文檔的最終分類目的地。

對分類時用戶指定的各分類模式,確定具有優先級的識別操作(即,OCR識別操作或邊界識別操作)。另外,根據原始文檔,可通過識別字符而非邊界,更容易地將一些文檔分類,並且可通過識別邊界而非字符,更容易地將其他文檔分類。預先地,系統管理員可基於各分類模式來確定哪一個識別操作優先於其他。按照用戶指定的分類模式,分類處理器25將OCR識別操作和邊界識別操作之間的一個識別操作優先於其他識別操作。在示例性實施方式中,用戶將要指定的條件的示例是分類模式。

分類處理器25為OCR識別操作和邊界識別操作中的一個賦予優先級,然後基於執行的具有優先級的一個識別操作的操作結果,確定是否要執行另一個識別操作。存儲在可靠性表存儲器26中的可靠性表將OCR識別操作的操作結果與是否要在OCR識別操作之後執行邊界識別操作關聯。另外,存儲在可靠性表存儲器26中的可靠性表將邊界識別操作的操作結果與是否要在邊界識別操作之後執行OCR識別操作關聯。為此原因,在執行一個識別操作之後,分類處理器25參考可靠性表來確定是否要執行另一個識別操作。

基於在OCR識別操作和邊界識別操作之中的在另一個識別操作之前執行一個識別操作的操作結果,分類處理器25使用識別操作中的一個或兩個的操作結果,確定原始文檔的分類目的地。

可靠性表存儲器26存儲預先製作的可靠性表。可靠性表列出用於確定是否要執行OCR識別操作和邊界識別操作的信息。可靠性表還列出用於按照OCR識別操作的操作結果和邊界識別操作的操作結果來確定原始文檔的分類目的地的信息。以下,詳細描述可靠性表。在示例性實施方式中,使用可靠性表作為預定關聯關係的示例。

顯示器27向用戶顯示分類處理器25提供的分類結果。

當軟體資源與硬體資源協作時,實現終端設備20中的這些功能中的每個。更具體地,CPU 201將來自磁碟裝置203的被配置為實現終端設備20的功能的程序讀取到存儲器202上,並且執行程序。CPU 201因此實現功能。例如,可用磁碟裝置203實現可靠性表存儲器26。例如,可用顯示機構205實現顯示器27。

在示例性實施方式中,圖像信息接收器21用於充當獲取單元的示例。OCR識別單元23、邊界識別單元24和分類處理器25用於充當分類單元的示例。

以下,描述圖像處理系統1的處理的例程。圖6是示出圖像處理系統1的處理的例程的流程圖。在初始狀態下,用戶將原始文檔設置為圖像讀取設備10上的分類目標。

用戶響應於設置的原始文檔來指定分類模式。操作輸入接收器22接收指定分類模式的操作(步驟S101)。分類模式指示原始文檔所屬的類別。更具體地,以各作業為基礎,以各情況為基礎,或者以消費者為基礎,確定訂購作業、交付作業等分類模式。在示例性實施方式中,用戶僅僅指定預先準備的多個分類模式之中的響應於設置的原始文檔的分類模式。

用戶操作圖像讀取設備10以讀取設置的原始文檔。因此生成的原始文檔圖像信息被發送到終端設備20。

分類處理器25按照指定的分類模式,確定是否要使OCR識別操作優先於邊界識別操作(步驟S102)。如果步驟S102中的確定結果是「是」,則通過OCR識別操作來識別原始文檔圖像信息(步驟S103)。

在步驟S103中,OCR識別單元23通過OCR識別操作來識別原始文檔圖像信息。分類處理器25參考可靠性表,以響應於OCR識別操作的操作結果,確定是否要執行 邊界識別操作。換句話講,如果可靠性表將OCR識別操作的操作結果與邊界識別操作的執行關聯,則分類處理器25確定要執行邊界識別操作。如果確定要執行邊界識別操作,則邊界識別單元24通過邊界識別操作來識別原始文檔圖像信息。

如果步驟S102中的確定結果是「否」,則通過具有優先級的邊界識別操作來識別原始文檔圖像信息(步驟S104)。在步驟S104中,邊界識別單元24通過邊界識別操作來識別原始文檔圖像信息。通過參考可靠性表,分類處理器25參考響應於邊界識別操作的操作結果,確定是否要執行OCR識別操作。換句話講,如果可靠性表將邊界識別操作的操作結果與OCR識別操作的執行關聯,則確定要執行OCR識別操作。如果確定要執行OCR識別操作,則OCR識別單元22識別原始文檔圖像信息。

在步驟S103或步驟S104之後,分類處理器25響應於OCR識別操作的操作結果和邊界識別操作的操作結果,確定原始文檔的分類目的地(步驟S105)。響應於步驟S103和步驟S104中執行的識別操作的操作結果,確定原始文檔的分類目的地。更具體地,使用OCR識別操作和邊界識別操作的操作結果中的一個或兩個,確定原始文檔的分類目的地。確定被構造用於用戶指定的分類模式的各種類型的原始文檔之中的一種類型的原始文檔是原始文檔的分類目的地。因此完成處理的例程。

以下,描述可靠性表。圖7示出可靠性表的示例。可靠性表是已經得知用作分類目標的各種不同原始文檔的格式的系統管理員製作的。更具體地,系統管理員已經得知關於用作分類目標的各原始文檔上繪製的字符和邊界的信息,然後製作可靠性表。

「分類模式標識」代表分類模式。如圖7中所示,分類模式標識列出「分類模式1」和「分類模式2」。更具體地,「分類模式1」指示「交付」的作業,「分類模式2」指示「完成合約」的作業。

「分類名稱」代表原始文檔的類型。如圖7中所示,列出「文檔1」和「文檔2」。更具體地,列出「交付聲明」、「帳單」等。此外,「文檔1」、「文檔2」和「文檔3」這三種文檔類型被包括在「分類模式1」的類別中。換句話講,如果「分類模式」指示「交付操作」,則使用「文檔1」、「文檔2」和「文檔3」這三種文檔類型。在示例性實施方式中,分類處理器25確定列在「分類名稱」下方的文檔類型是原始文檔的分類目的地。

「OCR分類」代表OCR識別操作的分類項,根據其將原始文檔進行分類。如圖7中所示,OCR識別操作將「文檔1」的原始文檔分類為「A1」至「A7」分類項中 的一個。預先將分類項「A1」至「A7」與用作原始文檔的分類目的地的「文檔1」關聯。

如果「文檔1」代表「交付聲明」,則通常從不同來源發出交付聲明。一些交付聲明可被印刷為「發票」。其他交付聲明可被印刷為「交付證書」。文檔的類型一般被作為交付聲明來操縱,但對於不同文檔,OCR將要識別的字符串可以是不同的。即使文檔具有相同的「分類名稱」,也將它們分類為分類項「A1」至「A7」。例如,「A1」指示上面印刷有「交付聲明」的原始文檔,「A2」指示上面印刷有「發票」的原始文檔。

如果在OCR分類中將原始文檔分類為「不可應用」類別,則這意味著,沒有將原始文檔分類為分類項「A1」至「A7」中的任一個。在交付聲明的「文檔1」中,可按給定格式印刷交付聲明的僅僅單個詞語「交付」來替代全部詞語「交付聲明」。在這種情況下,通過OCR識別操作,可不能將文檔分類為交付聲明。依據這種情況,「不可應用」類別被包括在OCR分類中。

「邊界分類」代表邊界識別操作的分類項,根據其將原始文檔進行分類。如圖7中所示,邊界識別操作將「文檔1」的原始文檔分類為「B1」至「B4」分類項中的一個。預先將分類項「B1」至「B4」與用作原始文檔的分類目的地的「文檔1」關聯。

如果「文檔1」代表「交付聲明」,則通常從不同來源發出交付聲明。根據邊界的邊界結構,可將文檔分類為四個分類項「B1」至「B4」。例如,將具有「OCR分類」下方的「A2」的所有原始文檔分類為「邊界分類」下方的「B1」。另一方面,將具有「OCR分類」下方的「A3」的原始文檔中的一些分類為「邊界分類」下方的「B1」,而將具有「OCR分類」下方的「A3」的其他原始文檔分類為「邊界分類」下方的「B2」。

在邊界分類下方的「不可應用」類別中,沒有將原始文檔分類為分類項「B1」至「B4」中的任一個。在「文檔1」的情況下,一些交付聲明可沒有按其格式繪製的邊界,並且可不根據邊界進行分類。依據這種情況下,通過邊界識別操作,不可將原始文檔分類為交付聲明。因此,包括邊界分類類別「不可應用」。

「OCR確定」基於邊界識別操作的操作結果並且指示是否要執行OCR識別操作。這裡,「是」指示將要執行OCR識別操作而「否」指示將不執行OCR識別操作。

「邊界確定」基於OCR識別操作的操作結果並且指示是否要執行邊界識別操作。這裡,「是」指示將要執行邊界識別操作而「否」指示將不執行邊界識別操作。

按照OCR識別操作的操作結果或邊界識別操作的操作結果的可靠性,確定OCR識別操作或邊界識別操作的「是」或「否」。

例如,即使通過OCR識別操作將原始文檔分類為「A4」,可靠性也不會高得足以確定「分類名稱」是「文檔1」。另一方面,如果通過邊界識別操作將原始文檔分類為「B2」,可靠性可高得足以確定原始文檔是「文檔1」,而不需要執行OCR識別操作。在這種情況下,確定「OCR確定」是「否」而確定「邊界確定」是「是」。

如果「OCR分類」是不可應用的,則通過OCR識別操作不能分類原始文檔,並且「OCR確定」因此是「否」。類似地,如果「邊界分類」是不可應用的,則通過邊界識別操作不能分類原始文檔,並且「邊界確定」因此是「否」。

參照圖7的可靠性表,描述基於可靠性表進行的處理的例程的特定示例。本文中的處理對應於圖6的步驟S103至S105中的操作。用戶可即刻指定「分類模式1」。

以下,描述第一特定示例。在這個示例中,在OCR識別操作具有優先級的情況下,OCR識別操作可已經將原始文檔分類為分類項「A2」。

分類處理器25參考可靠性表,並且響應於「OCR分類」下方的「A2」來檢查「邊界確定」。如圖7中列出的,響應於「A2」的「邊界確定」是「是」。為此原因,執行邊界識別操作。

可靠性表指示響應於「A2」的「邊界分類」是「B1」。如果邊界識別單元24提供的操作結果是「B1」,則操作結果匹配可靠性表中的信息。確定響應於原始文檔圖像信息的原始文檔的類型是「文檔1」,「文檔1」是響應於「A2」和「B1」的「分類名稱」。更具體地,分類處理器25確定原始文檔的類型是作為原始文檔的分類目的地的「文檔1」。另一方面,如果邊界識別單元24提供的操作結果不是「B1」,則操作結果無法匹配可靠性表中的信息。在這個時間點,沒有確定原始文檔的類型。

邊界識別單元24提供的操作結果可僅僅確定是否能將原始文檔分類為「B1」,而不一定必須確定是否能將原始文檔分類為「B2」或「B3」而非「B1」。換句話講,邊界識別單元24比照被分類為「B1」的邊界來檢查原始文檔圖像信息中繪製的邊界,以確定邊界是否能被分類為「B1」。

在示例性實施方式中,首先對原始文檔執行OCR識別操作減少了預定多個分類項,以在邊界識別操作中選擇更少量的分類項,並且執行將原始文檔歸類為所選擇分類項中的一個的操作。在這個示例中,在預定分類項「B1」至「B4」收窄至「B1」 的情況下,執行邊界識別操作。

以下,描述第二特定示例。在這個示例中,在邊界識別操作具有優先級的情況下,邊界識別操作可已經將原始文檔歸類為分類項「B3」。

分類處理器25參考可靠性表,並且響應於「邊界分類」下方的「B3」來檢查「OCR確定」。如圖7中列出的,響應於「B3」的「OCR確定」是「是」。為此原因,執行OCR識別操作。

可靠性表指示響應於「B3」的「OCR分類」是「A6」或「A7」。如果OCR識別單元23提供的操作結果是「A6」或「A7」,則操作結果匹配可靠性表中的信息。確定響應於原始文檔圖像信息的原始文檔的類型是「文檔1」,「文檔1」是響應於「B3」的「分類名稱」。更具體地,分類處理器25確定原始文檔的類型是作為原始文檔的分類目的地的「文檔1」。另一方面,如果OCR識別單元23提供的操作結果既不是「A6」又不是「A7」,則操作結果無法匹配可靠性表中的信息。在這個時間點,沒有確定原始文檔的類型。

OCR識別單元23提供的操作結果可僅僅確定是否能將原始文檔分類為「A6」或「A7」,而不一定必須確定是否能將原始文檔分類為「A1」或「A2」而非「A6」或「A7」。換句話講,OCR識別單元23比照被分類為「A6」的字符串或被分類為「A7」的字符串來檢查原始文檔上印刷的字符串,以確定字符串是否能被分類為「A6」或「A7」。

在示例性實施方式中,首先對原始文檔執行邊界識別操作減少了預定多個分類項,以在OCR識別操作中選擇更少量的分類項,並且執行將原始文檔歸類為所選擇分類項中的一個的操作。在這個示例中,在預定分類項「A1」至「A7」收窄至「A6」和「A7」的情況下,執行OCR識別操作。

以下,描述第三特定示例。在這個示例中,在邊界識別操作具有優先級的情況下,邊界識別操作可已經將原始文檔分類為分類項「B4」。

分類處理器25參考可靠性表,並且響應於「邊界分類」下方的「B4」來檢查「OCR確定」。如圖7中列出的,響應於「B4」的「邊界確定」列出「是」和「否」。在這種情況下,執行OCR識別操作,並且只使用邊界識別操作的操作結果來確定原始文檔的分類目的地。更具體地,確定原始文檔的分類目的地是響應於「B4」的「文檔1」。

如果「OCR確定」是「否」,則OCR識別操作的操作結果的可靠性低,並且將 通過邊界識別操作將原始文檔分類。如果「OCR確定」列出「是」和「否」,則只使用邊界識別操作的操作結果來確定原始文檔的分類目的地,而不顧及OCR識別操作的操作結果。

如果「邊界確定」列出「是」和「否」,則執行與上述操作類似的操作。更具體地,只使用OCR識別操作的操作結果來確定原始文檔的分類目的地,而不顧及邊界識別操作的操作結果。

以下,描述第四特定示例。在這個示例中,已經在OCR識別操作具有優先級的情況下執行OCR識別操作,但是通過OCR識別操作沒有將原始文檔分類為屬於「分類模式1」的「OCR分類」的任何分類項。

如果通過OCR識別操作沒有將原始文檔分類為分類項中的任一個,則隨後執行邊界識別操作。只使用邊界識別操作的操作結果來確定原始文檔的分類目的地。

如果通過OCR識別操作沒有將原始文檔分類為作為指定「分類模式1」的分類項的「A1」至「A7」和「071」至「073」和「074」中的任一個,則執行邊界識別操作。如果邊界識別操作的操作結果是例如「B1」,則確定響應於原始文檔圖像信息的原始文檔的類型是作為響應於「B1」的「分類名稱」的「文檔1」。更具體地,分類處理器25確定原始文檔的類型是作為原始文檔的分類目的地的「文檔1」。例如,如果邊界識別操作的操作結果是「173」,則分類處理器25確定原始文檔的分類目的地是作為響應於「173」的「分類名稱」的「文檔3」。

在第四特定示例中,OCR識別操作具有優先級。如果通過邊界識別操作沒有將原始文檔分類為分類項中的任一個,執行與上述操作類似的操作。更具體地,邊界識別操作之後繼續進行OCR識別操作,並且通過只使用OCR識別操作的操作結果來確定原始文檔的分類目的地。

在示例性實施方式的可靠性表中,用於OCR識別操作的分類項的數量不必等於單個「分類名稱」(即,原始文檔類型)下的邊界識別操作的分類項的數量。換句話講,OCR識別操作的分類項不必逐一對應於邊界識別操作的分類項。例如,如果「分類名稱」是圖7的可靠性表中的「文檔1」,則OCR識別操作的分類項的數量是7個,即,「A1」至「A7」,並且邊界識別操作的分類項的數量是4個,即,「B1」至「B4」。此外,「OCR分類」下的「A3」類別對應於「邊界分類」下方的「B1」和「B2」這兩個類別。

如以上在示例性實施方式的可靠性表中描述的,將OCR識別操作的分類項和邊界識別操作的分類項與用作分類目標的原始文檔的類型關聯。即使OCR識別操作的分類項沒有逐一對應於邊界識別操作的分類項,也唯一地確定原始文檔類型。

詳細描述具有優先級的OCR識別操作的處理的例程。圖8是示出在OCR識別操作具有優先級的情況下執行的處理的例程的流程圖。圖8的處理對應於圖6的步驟S103和S105中的操作。

如果OCR識別操作具有優先級,則OCR識別單元23通過OCR識別操作來識別原始文檔(步驟S201)。分類處理器25確定原始文檔已經通過OCR識別操作被分類到的分類項(在圖7的可靠性表中的「OCR分類」下方列出的分類項)(步驟S202)。如果分類處理器25確定沒有將原始文檔圖像信息確定為分類項中的任一個(步驟S202中的「否」分支),則邊界識別單元24通過邊界識別操作來識別原始文檔圖像信息(步驟S203)。分類處理器25參考可靠性表並且識別與通過邊界識別操作分類的分類項(在圖7的可靠性表中的「邊界分類」下方列出的分類項)對應的原始文檔的類型。更具體地,分類處理器25隻使用邊界識別操作的操作結果來確定原始文檔的類型(分類目的地)(步驟S204)。處理的例程因此結束。

如果在步驟S202中將原始文檔分類為分類項中的一個(步驟S202中的「是」分支),則存在將原始文檔分類為多個分類項的可能性。更具體地,OCR識別操作的操作結果沒有唯一地確定圖7的可靠性表中的「OCR分類」下方的分類項,而是提供多個候選。如果存在多個候選,則可在確定原始文檔的類型之前,按照任何類型的次序(諸如,可針對分類項確定的次序)來依次選擇候選。

分類處理器25這裡按照任何類型的次序在OCR識別操作中選擇分類項候選中的一個(步驟S205)。分類處理器25參考可靠性表,以按照所選擇的分類項來確定是否執行邊界識別操作(步驟S206)。在確定將不執行邊界識別操作時(步驟S06中的「否」分支),分類處理器25參考可靠性表來識別響應於所選擇的分類項的原始文檔的類型。更具體地,分類處理器25響應於OCR識別操作的操作結果來確定原始文檔的類型(步驟S207)。處理的例程因此結束。

如果分類處理器25在步驟S206中確定將執行邊界識別操作(步驟S206中的「是」分支),則邊界識別單元24通過邊界識別操作來識別原始文檔圖像信息(步驟S208)。分類處理器25參考可靠性表,然後響應於OCR識別操作的操作結果和邊界識別操作 的操作結果,確定是否確定了原始文檔的類型(步驟S209)。

參照圖7的可靠性表來描述步驟S209中的操作。分類處理器25參考可靠性表並且響應於步驟S205中選擇的「OCR分類」的分類項來識別「邊界分類」的分類項。如果本文中識別的「邊界分類」的分類項匹配步驟S208中的邊界識別操作的操作結果,則確定原始文檔的類型。另一方面,如果本文中識別的「邊界分類」的分類項無法匹配步驟S208中的邊界識別操作的操作結果,則在這個時間點還沒有確定原始文檔的類型。

如果步驟S209中的確定結果是「是」,則響應於OCR識別操作的操作結果和邊界識別操作的操作結果來確定原始文檔的類型(步驟S210)。處理的例程因此結束。

另一方面,如果步驟S209中的確定結果是「否」,則分類處理器25確定步驟S201中的OCR識別操作中分類的分類項之中是否有任何分類項未選擇(步驟S211)。如果有分類項未選擇(步驟S211中的「是」分支),則處理返回步驟S205。如果選擇了所有分類項(步驟S211中的「否」分支),則處理前進至步驟S204。如果處理前進至步驟S204,則響應於步驟S208中的邊界識別操作的操作結果來確定原始文檔的類型。

已經參照圖8描述了具有優先級的OCR識別操作的情況。當邊界識別操作具有優先級時,執行類似處理。更具體地,如果邊界識別操作具有優先級,則邊界識別操作識別原始文檔圖像信息。然後,響應於邊界識別操作的操作結果來執行OCR識別操作,並且確定響應於原始文檔圖像信息的原始文檔的類型。

如上所述,示例性實施方式的終端設備20使用OCR識別操作和邊界識別操作將原始文檔分類。在這種情況下,響應於OCR識別操作和邊界識別操作中的一個的操作結果,終端設備20通過OCR識別操作和邊界識別操作中的另一個來確定是否要分類原始文檔。然後,終端設備20基於OCR識別操作和邊界識別操作的操作結果中的一個或兩個,確定原始文檔的分類目的地。

按照示例性實施方式,即使沒有響應於OCR識別操作和邊界識別操作中的一個的操作結果確定原始文檔的類型,也執行另一個識別操作。基於這兩個識別操作的操作結果來識別原始文檔的類型。

按照示例性實施方式,以各分類圖案為基礎確定OCR識別操作和邊界識別操作中的哪一個具有優先級。本發明不限於這種方法。例如,用戶可直接指定OCR識別 操作和邊界識別操作中的哪一個具有優先級。在這種情況下,操作輸入接收器22接收指定OCR識別操作和邊界識別操作中的哪一個具有優先級的操作輸入。

按照示例性實施方式,終端設備20使用兩個識別操作(即,OCR識別操作和邊界識別操作)將原始文檔分類。可另外使用另一種識別操作(諸如,使用QR碼(註冊商標)進行的識別操作)。在這種情況下,如果原始文檔包含QR碼,則終端設備20使用QR碼將原始文檔分類。如果原始文檔不含QR碼,則終端設備20使用多個識別操作之中的OCR識別操作和邊界識別操作將原始文檔分類。

在示例性實施方式中,圖像讀取設備10可實現終端設備20的功能。在這種情況下,圖像讀取設備10讀取原始文檔上形成的圖像,並且通過參考可靠性表來確定響應於讀取的原始文檔圖像信息的原始文檔的類型。在這種情況下,圖像讀取設備10可以是圖像處理設備的示例。

可使用通信系統來供應用於實現本發明的示例性實施方式的電腦程式。還可使用記錄介質(諸如,壓縮盤只讀存儲器(CD-ROM))的記錄介質來供應電腦程式。

已經出於例證和描述的目的提供了以上對本發明的示例性實施方式的描述。它不旨在是排他性的或者將本發明限於所公開的精確形式。顯而易見,對於本領域的從業技術人員而言,許多修改形式和變形形式將是清楚的。選擇描述實施方式是為了最佳地說明本發明的原理及其實際應用,從而使本領域的其他技術人員能夠理解適於特定用戶的預料的各種實施方式和各種修改形式。本發明的範圍旨在由下面的權利要求書及其等同物來限定。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀