新四季網

用於選擇並顯示分割參數進行光學字符識別的系統與方法

2023-10-21 05:01:22

用於選擇並顯示分割參數進行光學字符識別的系統與方法
【專利摘要】本發明提供了一種用於選擇並顯示分割參數進行光學字符識別的系統與方法,所述方法可包括接收圖像,所述圖像具有包括一個或多個字符的字符串。所述方法還可包括接收識別所述一個或多個字符中的每個的字符串。所述方法還可包括自動生成至少一個分割參數。所述方法還可包括利用所述至少一個分割參數對具有字符串的圖像進行分割。所述方法還可包括確定所產生的分割是否滿足一個或多個標準,並且如果所產生的分割滿足所述一個或多個標準,則選擇至少一個分割參數。
【專利說明】用於選擇並顯示分割參數進行光學字符識別的系統與方法
[0001]相關申請
[0002]本申請要求於2012年11月21日提交的美國專利申請序號13/684,007以及於2012年10月17日提交的美國專利申請序號13/653,948的優先權,其全部內容結合於此作為參考。
【技術領域】
[0003]本技術涉及機器視覺系統與方法,更具體地,涉及用於光學字符識別的系統與方法。
【背景技術】
[0004]OCR技術通常用於很多機器視覺系統中,以便檢測與各種製造處理相關的文本。然而,非常難以針對指定的應用程式設置OCR參數,尤其對於新用戶而言。例如,在用戶圍繞OCR字符串選擇區域並且分割器未正確地找出字符時,用戶在試圖手動解決問題時通常遇到困難。與可由系統集成商提前解決的很多應用程式不同,OCR可要求生產車間的技術人員或工程師訓練或修改運行時間參數。在引入新部件或使用新印刷或標籤時,可發生這種情況。如果默認分割參數起作用,則可相當容易設立現有系統,然而,在這些參數不起作用時,用戶面臨可能需要調整的一列20-30個參數。這就超過了大部分用戶的技能水平。

【發明內容】

[0005]在一個實現方式中,提供了一種用於選擇至少一個分割參數以進行光學字符識別的計算機實現方法。該方法可包括使用一個或多個計算裝置接收圖像,該圖像具有包括一個或多個字符的字符串。該方法還可包括使用所述一個或多個計算裝置接收識別所述一個或多個字符中的每個的字符串。該方法還可包括使用所述一個或多個計算裝置自動生成至少一個分割參數。該方法還可包括使用所述一個或多個計算裝置利用所述至少一個分割參數對具有字符串的圖像進行分割。該方法還可包括使用所述一個或多個計算裝置確定所產生的分割是否滿足一個或多個標準,並且如果所產生的分割滿足所述一個或多個標準,則該方法可包括選擇所述至少一個分割參數。該方法還可包括在所述一個或多個計算裝置處顯示該圖像的至少一部分。
[0006]可包括一個或多個以下特徵。在一些實施方式中,該方法可包括使用所述一個或多個計算裝置顯示與該分割相關的用戶可選的選項,所述用戶可選的選項被配置為允許用戶指出正確的分割或錯誤的分割。該方法還可包括使用所述一個或多個計算裝置顯示用戶可選的選項,所述用戶可選的選項被配置為允許用戶手動生成經手動產生的分割。該方法還可包括使用所述一個或多個計算裝置顯示所產生的分割。該方法還可包括使用所述一個或多個計算裝置顯示所述至少一個分割參數。在一些實施方式中,所述至少一個分割參數可包括一個或多個極性、行細化、角度搜索範圍、傾斜搜索範圍、標準化模式、筆劃寬度、二值化閾值、邊界片段、像素數、片段對比度閾值、字符高度、字符寬度、字符間間隔、字符內間隔、與主行相距的片段距離、片段合併模式、最小字符縱橫比、字符寬度類型、分析模式、節距度量、節距類型、最小節距、空白插入、空白字符的寬度。該方法還可包括使用所述一個或多個計算裝置顯示至少一個經訓練的圖像。
[0007]在另一個實現方式中,提供了一種位於計算機可讀儲存介質上的電腦程式產品。該電腦程式產品可具有儲存在其上的多個指令,在由處理器執行時,這些指令促使該處理器執行操作。操作可包括使用一個或多個計算裝置接收圖像,該圖像具有包括一個或多個字符的字符串。操作還可包括使用所述一個或多個計算裝置接收識別所述一個或多個字符中的每個的字符串。操作還可包括使用所述一個或多個計算裝置自動生成至少一個分割參數。操作還可包括使用所述一個或多個計算裝置利用所述至少一個分割參數對具有字符串的圖像進行分割。操作還可包括使用所述一個或多個計算裝置確定所產生的分割是否滿足一個或多個標準,並且如果所產生的分割滿足所述一個或多個標準,則操作可包括選擇所述至少一個分割參數。操作還可包括在所述一個或多個計算裝置處顯示該圖像的至少一部分。
[0008]可包括一個或多個以下特徵。在一些實施方式中,操作可包括使用所述一個或多個計算裝置顯示與該分割相關的用戶可選的選項,所述用戶可選的選項被配置為允許用戶指出正確的分割或錯誤的分割。操作還可包括使用所述一個或多個計算裝置顯示用戶可選的選項,所述用戶可選的選項被配置為允許用戶手動生成經手動產生的分割。操作還可包括使用所述一個或多個計算裝置顯示所產生的分割。操作還可包括使用所述一個或多個計算裝置顯示所述至少一個分割參數。在一些實施方式中,所述至少一個分割參數可包括一個或多個極性、行細化、角度搜索範圍、傾斜搜索範圍、標準化模式、筆劃寬度、二值化閾值、邊界片段、像素數、片段對比度閾值、字符高度、字符寬度、字符間間隔、字符內間隔、與主行相距的片段距離、片段合併模式、最小字符縱橫比、字符寬度類型、分析模式、節距度量、節距類型、最小節距、空白插入、空白字符的寬度。操作還可包括使用所述一個或多個計算裝置顯示至少一個經訓練的圖像。
[0009]在另一個實現方式中,提供了一種具有一個或多個處理器的計算系統。所述一個或多個處理器可被配置為接收圖像,該圖像具有包括一個或多個字符的字符串。所述一個或多個處理器可被配置為接收識別所述一個或多個字符中的每個的字符串。所述一個或多個處理器可被配置為自動生成至少一個分割參數。所述一個或多個處理器可被配置為利用所述至少一個分割參數對具有字符串的圖像進行分割。所述一個或多個處理器可被配置為確定所產生的分割是否滿足一個或多個標準,並且如果所產生的分割滿足所述一個或多個標準,則所述一個或多個處理器可被配置為選擇至少一個分割參數。所述一個或多個處理器可被配置為在所述一個或多個計算裝置處顯示所述圖像的至少一部分。
[0010]可包括一個或多個以下特徵。在一些實施方式中,所述一個或多個處理器可被配置為顯示與該分割相關的用戶可選的選項,所述用戶可選的選項被配置為允許用戶指出正確的分割或錯誤的分割。所述一個或多個處理器可被配置為顯示用戶可選的選項,所述用戶可選的選項被配置為允許用戶手動生成經手動產生的分割。所述一個或多個處理器可被配置為顯示所產生的分割。所述一個或多個處理器可被配置為顯示所述至少一個分割參數。在一些實施方式中,所述至少一個分割參數可包括一個或多個極性、行細化、角度搜索範圍、傾斜搜索範圍、標準化模式、筆劃寬度、二值化閾值、邊界片段、像素數、片段對比度閾值、字符高度、字符寬度、字符間間隔、字符內間隔、與主行相距的片段距離、片段合併模式、最小字符縱橫比、字符寬度類型、分析模式、節距度量、節距類型、最小節距、空白插入、空白字符的寬度。所述一個或多個處理器可被配置為顯示至少一個經訓練的圖像。
[0011]下面在附圖以及說明書中闡明一個或多個實現方式的細節。通過說明書、示圖以及權利要求,其他特徵與優點顯而易見。
【專利附圖】

【附圖說明】
[0012]圖1為與分布式計算網絡耦接的成像過程的圖解視圖;
[0013]圖2為與圖1的成像過程的一個實施方式對應的系統示圖;
[0014]圖3為描述圖1的成像過程的一個實施方式的流程圖;
[0015]圖4為描述圖1的成像過程的一個實施方式的流程圖;
[0016]圖5為與圖1的成像過程的一個實施方式相關的圖像的圖解視圖;
[0017]圖6為與圖1的成像過程的一個實施方式相關的圖形用戶界面;
[0018]圖7為與圖1的成像過程的一個實施方式相關的圖像的圖解視圖;
[0019]圖8為與圖1的成像過程的一個實施方式相關的圖像的圖解視圖;
[0020]圖9為與圖1的成像過程的一個實施方式相關的圖像的圖解視圖;
[0021]圖10為與圖1的成像過程的一個實施方式相關的圖形用戶界面;
[0022]圖11為與圖1的成像過程的一個實施方式相關的圖像的圖解視圖;
[0023]圖12為與圖1的成像過程的一個實施方式相關的圖形用戶界面;
[0024]圖13為與圖1的成像過程的一個實施方式相關的圖形用戶界面;
[0025]圖14為與圖1的成像過程的一個實施方式相關的圖形用戶界面;
[0026]圖15為與圖1的成像過程的一個實施方式相關的圖形用戶界面;
[0027]圖16為與圖1的成像過程的一個實施方式相關的圖形用戶界面;
[0028]圖17為與圖1的成像過程的一個實施方式相關的圖形用戶界面;
[0029]圖18為與圖1的成像過程的一個實施方式相關的圖像的圖解視圖;
[0030]圖19為與圖1的成像過程的一個實施方式相關的圖形用戶界面;
[0031]圖20為與圖1的成像過程的一個實施方式相關的圖形用戶界面;
[0032]圖21為與圖1的成像過程的一個實施方式相關的圖像的圖解視圖;
[0033]圖22為與圖1的成像過程的一個實施方式相關的圖形用戶界面;
[0034]圖23為與圖1的成像過程的一個實施方式相關的圖像的圖解視圖;
[0035]圖24為與圖1的成像過程的一個實施方式相關的圖像的圖解視圖;
[0036]圖25為與圖1的成像過程的一個實施方式相關的圖像的圖解視圖;
[0037]圖26為與圖1的成像過程的一個實施方式相關的圖形用戶界面;
[0038]圖27為與圖1的成像過程的一個實施方式相關的圖形用戶界面;
[0039]圖28為與圖1的成像過程的一個實施方式相關的圖形用戶界面;
[0040]圖29為與圖1的成像過程的一個實施方式相關的圖形用戶界面;
[0041]圖30為與圖1的成像過程的一個實施方式相關的圖解視圖;
[0042]圖31為與圖1的成像過程的一個實施方式相關的圖解視圖;
[0043]圖32為與圖1的成像過程的一個實施方式相關的圖形用戶界面;[0044]圖33為與圖1的成像過程的一個實施方式相關的圖形用戶界面;
[0045]圖34為與圖1的成像過程的一個實施方式相關的圖形用戶界面;
[0046]圖35為與圖1的成像過程的一個實施方式相關的圖形用戶界面;
[0047]圖36為與圖1的成像過程的一個實施方式相關的圖形用戶界面;
[0048]圖37為與圖1的成像過程的一個實施方式相關的圖形用戶界面;
[0049]圖38為與圖1的成像過程的一個實施方式相關的圖形用戶界面;
[0050]圖39為與圖1的成像過程的一個實施方式相關的圖形用戶界面;
[0051]圖40為與圖1的成像過程的一個實施方式相關的圖像的圖解視圖;
[0052]圖41為與圖1的成像過程的一個實施方式相關的圖像的圖解視圖;
[0053]圖42為與圖1的成像過程的一個實施方式相關的圖形用戶界面;以及
[0054]圖43為與圖1的成像過程的一個實施方式相關的圖形用戶界面。
[0055]在不同的示圖中的相同的參考符號可表示相同的部件。
【具體實施方式】
[0056]系統概述:
[0057]本公開的實施方式可用於幫助用戶設置用於規定的應用程式(例如,機器視覺應用程式)的光學字符識別參數。通常,非常難以為應用程式設置OCR參數,尤其對於新用戶而言。例如,在用戶圍繞OCR字符串繪製區域並且分割處理未正確地找出字符時,用戶不能了解要進行的最佳方式。因此,在本文中所公開的實施方式可用於幫助用戶儘可能自動地設置OCR參數。在本文中所公開的實施方式包括為OCR選擇分割參數的交互式/遞增方法。在本文中所公開的實施方式還包括檢查分割結果的均勻性的能力,並且如果違反該一致性,則包括自動拒絕特定配置的能力。在本文中所公開的實施方式還允許根據好字符的特定統計性能自動選擇分割參數。
[0058]參照圖1,示出了可位於計算機12上並且可由計算機執行的成像過程10,該計算機可與網絡14 (例如,網際網路或區域網)連接。計算機12的實例可包括但不限於單個伺服器計算機、一系列伺服器計算機、單個個人計算機、一系列個人計算機、小型計算機、主機計算機或計算雲。計算機12的各種元件可執行一個或多個作業系統,這些作業系統的實例可包括但不限於:例如,Microsoft Windows Server tm ;Novell Netwaretm ;Redhat Linuxtm、Unix或定製作業系統。
[0059]可儲存在耦接至計算機12的存儲裝置16上的成像過程10的指令集與子程序可由包含在計算機12內的一個或多個處理器(未顯示)和一個或多個存儲器架構(未顯示)執行。存儲裝置16可包括但不限於:硬碟驅動器;閃盤驅動器、磁帶驅動器;光碟驅動器;RAID陣列;隨機存取存儲器(RAM);以及只讀存儲器(ROM)。
[0060]網絡14可連接至一個或多個二次網絡(例如,網絡18),該網絡的實例可包括但不限於:例如,區域網;廣域網;或內聯網。
[0061]通過客戶端應用程式22、24、26、28可訪問成像過程10。客戶端應用程式22、24、26、28的實例可包括但不限於標準的網頁瀏覽器、定製的網頁瀏覽器或自定義應用程式。可儲存在與客戶端電子裝置38、40、42、44 (分別)耦接的存儲裝置30、32、34、36 (分別)上的客戶端應用程式22、24、26、28的指令集與子程序可由一個或多個處理器(未顯示)和包含在客戶端電子裝置38、40、42、44 (分別)內的一個或多個存儲器架構(未顯示)執行。
[0062]存儲裝置30、32、34、36可包括但不限於:硬碟驅動器;閃盤驅動器、磁帶驅動器;光碟驅動器;RAID陣列;隨機存取存儲器(RAM);以及只讀存儲器(ROM)。客戶端電子裝置38、40、42、44的實例可包括但不限於個人計算機38、膝上型計算機40、智慧型電話42、筆記型計算機44、伺服器(未顯示)、啟用數據的蜂窩電話(未顯示)以及專用網絡裝置(未顯示)。
[0063]客戶端應用程式22、24、26、28中的一個或多個可被配置為實現成像過程10的一些或所有功能。因此,成像過程10可為由客戶端應用程式22、24、26、28和成像過程10中的一個或多個共同執行的單純的伺服器端應用程式、單純的客戶端應用程式或混合的伺服器端/客戶端應用程式。
[0064]用戶46、48、50、52可通過網絡14或者通過二次網絡18直接訪問計算機12和成像過程10。而且,計算機12可通過二次網絡18連接至網絡14,如幻象連結線54所示。
[0065]各種客戶端電子裝置可直接或間接耦接至網絡14 (網絡18)。例如,個人計算機38被顯示為通過硬接線網絡連接直接耦接至網絡14。而且,筆記型計算機44被顯示為通過硬接線網絡連接直接耦接至網絡18。膝上型計算機40被顯示為通過在膝上型計算機40和無線接入點(即,WAP) 58之間建立的無線通信信道56無線耦接至網絡14,該無線通信信道被顯示為直接耦接至網絡14。WAP58可為例如IEEE802.1la,802.1lb,802.llg,W1-Fi和/或能夠在膝上型計算機40和WAP58之間建立無線通信信道56的藍牙裝置。智慧型電話42被顯示為通過在智慧型電話42和蜂窩網絡/網橋62之間建立的無線通信信道60無線耦接至網絡14,該無線通信信道被顯示為直接耦接至網絡14。
[0066]在本技術中,眾所周知,所有的IEEE802.1lx規格可使用乙太網協議以及具避免碰撞的載波感測多重存取(即,CSMA/CA)來進行路徑共享。例如,各種IEEE802.1lx規格可使用相移鍵控(即,PSK)調製或互補碼鍵控(B卩,CCK)調製。在本技術中,眾所周知,藍牙為電信行業的規格,其允許例如行動電話、計算機以及智慧型電話使用短距離無線連接來互連。
[0067]客戶端電子裝置38、40、42、44均可執行作業系統,該作業系統的實例可包括但不限於 Apple iOStm> Microsoft Windowstm、Androidtm、Redhat Linuxtm 或自定義作業系統。
[0068]現在參照圖2,提供了一個示例性實施方式,其描述了被配置為供成像過程10使用的機器視覺系統100。應注意的是,在不背離本公開的範圍的情況下,在交替的實施方式中,可使用各種系統實現方式。下面會進一步詳細地進行描述,在本文中所描述的成像過程10的實施方式總體上可用於為與指定的字符串相關的一個或多個字符自動調諧分割參數。在檢查的過程中,可在任何合適的時間使用在本文中所描述的成像過程。例如,在一些實施方式中,在相對於對象的模式或訓練圖像對活動或運動時間對象圖像進行全球定位/配準之後,並且在檢查運行時間對象或功能之前、期間或之後,可產生成像過程的各方面。
[0069]在一些實施方式中,機器視覺系統100可包括成像裝置110,該成像裝置可為包括板上處理器(onboard processor)(未顯示)以及能夠運行機器視覺應用程式112的存儲器(未顯示)的攝像頭。合適的接口、警報以及信號可安裝在相機成像裝置110內和/或連接至該相機成像裝置,從而能夠對在檢查基礎對象120期間所檢測的感測故障做出響應。在該實施方式中,顯示包含多個物體(120)的輸送帶122。在檢查的過程中,這些物體可在成像裝置110的預定視場(FOV)內輪流通過。同樣,成像裝置110可獲取每個經觀察的物體120的至少一個圖像。[0070]在一些實施方式中,傳統的微型計算機130可為任何合適的計算裝置,例如,在圖1中所示的計算機12。計算機130可包括圖形用戶界面元件,例如,滑鼠132、鍵盤134以及顯示器136。在交替的實施方式中,也可使用其他類型的接口,例如,個人數字助理(PDA)。在一些實施方式中,成像裝置110可全天連接至計算機130,尤其在計算機執行圖象處理功能的情況下。此外和/或或者,在成像裝置內的處理器(例如,Insight?生產線的那些處理器)可允許獨立操作與遠程計算機自由互連的裝置。在該實施方式中,計算機130可連接至成像裝置110和/或與該成像裝置進行通信,用於對運行時間操作進行設備設置、測試以及分析。
[0071]在一些實施方式中,與模式或訓練圖像140有關的數據可與計算機130 —起儲存在磁碟儲存器142內,並且可儲存在成像裝置110的板上存儲器內。該數據可包括與成像過程10相關的數據,根據本公開的一個或多個實施方式,可使用該數據。
[0072]而且,參照圖3,並且下面會更詳細地進行討論,成像過程10可包括接收(302)圖像,該圖像具有包括一個或多個字符的字符串。成像過程10還可包括接收(304)識別所述一個或多個字符中的每個的字符串。成像過程10還可包括自動生成(306)至少一個分割參數。成像過程10可包括使用所述至少一個分割參數對具有字符串的圖像進行分割(308)。成像過程10還可包括確定(310)所產生的分割是否滿足一個或多個標準,並且如果所產生的分割滿足所述一個或多個標準,則選擇(312)所述至少一個分割參數。成像過程10還可包括在所述一個或多個計算裝置處顯示(314)該圖像的至少一部分。
[0073]在本文中所公開的實施方式致力於進行與機器視覺檢查相關的光學字符識別的計算機實現方法。在一些實施方式中,成像過程10可被配置為解決現有方法的很多限制。例如,一些現有方法通過預先訓練多個字體並且使OCR工具檢驗多個字體,以確定哪個字體正確,從而解決設置問題。然後,可估計其他參數,例如,用於分割參數的值。由於所選擇的字體不能完美地匹配,這可產生次佳的參數選擇,所以限制該方法。
[0074]現在參照圖4,提供了描述成像過程10的一個實施方式的流程圖400。如圖4中所示,成像過程10可利用具有自動分割以及自動調諧功能的遞增過程。在一些實施方式中,成像過程10可允許用戶使用用戶的最少信息反覆地設置OCR工具。最終結果是完全配置並訓練的OCR工具。因此,並且如圖4中所示,成像過程10可接收圖像402,該圖像具有包括一個或多個字符的字符串。成像過程10可通過Run OCR Max選項404為用戶提供繼續成像過程10的選項。成像過程10也可提供與分割相關的用戶可選的選項406。在一些實施方式中,用戶可選的選項可被配置為允許用戶指出正確的分割或錯誤的分割。如果該分割正確,則用戶可具有指示正確的分類或錯誤的分類的選項408。如果分類正確,則成像過程10可進入自動調諧414,下面會進一步詳細地進行討論。如果分類錯誤,則用戶可具有指定字符串的選項420。
[0075]在一些實施方式中,如果分割錯誤,則成像過程10可提供自動分割功能410,下面會進一步詳細地進行討論。在自動分割之後,用戶可具有通過選項412指出分割結果是否正確的選項。如果發現正確的分割,則成像過程10可進入自動調諧414。如果未發現正確的分割,則用戶可具有確定圖像是否差的選項。如果這樣的話,成像過程10可接收一個或多個額外的圖像,每個圖像具有一個額外的字符串。如果不是的話,成像過程10可為用戶提供用戶可選的選項424,該選項被配置為允許用戶手動生成分割。[0076]在一些實施方式中,成像過程10可用於生成至少部分使用第一字符串和額外的字符串中的一個或多個的字符資料庫。一旦成像過程10已經接收用於字符串的正確分割的指示,就可儲存這組相關的正確分割參數,以供將來使用。因此,成像過程10可將這組正確的分割參數應用於未來的字符串中。然後,可調諧這組正確的分割參數,並且可發現使用一個最佳分割參數值。然後,可提取新字體字符,並且訓練和使用分類器。通過這種方式,成像過程10可繼續,直到用戶確信完全訓練該字符並且當前的分割參數恰當地運行。可複製字體和分割參數,並且可繼續進行自動調諧處理。
[0077]在一些實施方式中,成像過程10可解決用戶在設置OCR工具時可面臨的很多問題。在操作期間,在用戶在圖像內的字符串周圍繪製區域並且默認分割參數未正確地運行時,一般用戶難以斷定改變哪個參數以進行正確分割。例如,在現有系統中,分割工具可包括各種分割參數,每個參數可需要手動變更。在圖5中所示的成像過程10示出了默認參數未正確分割字符的情況的實例。
[0078]現在參照圖6,提供根據成像過程10可使用的圖形用戶界面600的一個實施方式。在操作期間,用戶可規定使用文本欄位602的字符串。通過選擇自動分割功能604,GUI600可允許用戶調用自動分割算法。GUI600也可允許用戶通過手動分割功能606執行手動分割。
[0079]在一些實施方式中,通過各種分割參數組合,與成像過程10相關的自動分割算法可繼續進行,並且可探索多個分割參數以及發現與字符串長度相同的區段數的參數組合。下面進一步詳細討論分割參數。如在本文中所討論的,將至少一個分割參數應用於字符串的短語可表示使用至少一個分割參數在字符串的圖像上執行分割。
[0080]在一些實施方式中,除了確定正確數量的區段,成像過程10還可被配置為根據字符的不均勻性拒絕某些結果。例如,考慮到字符的ASCII表示,可確定字符串是否包含一個特別的字符,例如,窄、短或寬字符。在一些實施方式中,如果字符串不包含任何特別的字符,則所有區域寬度和高度需要具有相同的尺寸(或在預定的公差內),或者可拒絕該結果。如果字符串包含一個特別的字符,則可檢查單獨字符尺寸的均勻性。在圖7-9中示出了不均勻的並且遭拒絕的結果的幾個實例。
[0081]現在參照圖10,提供了描述圖形用戶界面1000與相關圖像的一個實施方式。因此,與成像過程10相關的自動分割算法可執行並生成一個或多個可能正確的結果,用於顯示給用戶,如圖10中所示。在操作期間,用戶可選擇看似正確的一個結果,並且選擇與GUI1000相關的OK圖標。現在,該算法的第二部分繼續進行。通過這種方式,自動調諧算法可為這個特定的圖像確定要運行的最佳和/或最優的分割參數。可將正確的記錄加入該模式中,可提取每個獨特的字符,並且可訓練字體,用於進行分類。在圖11中所描述的圖像顯示了通過正確分割並分類的字符在該操作之後運行成像過程10的結果。
[0082]現在參照圖12至圖14,提供了描述圖形用戶界面1200-1400的實施方式。⑶11200顯示了在成像過程10中已經為這個特定的字體提取的字符。如果在下一個圖像上分割失敗,則用戶可重複在上面確定的一個或多個操作,如圖13至圖14中所示。
[0083]現在參照圖15至圖16,提供了描述圖形用戶界面1500的一個實施方式。如圖15中所示,一旦將新記錄加入該模式中,除了新的記錄以外,所提取的最佳分割參數還可在先前的記錄上進行操作。如在該實例中所述,現在,字符包括如圖16中所示的字符「-」。[0084]在一些實施方式中,成像過程10可允許用戶手動編輯一個特定的字符串。在該特定的實例中,在編輯並且手動校正區域時,自動分割算法可根據所建立的正確字符區域進行操作。圖17顯示了所建立的分割參數未正確地分割字符『8』的一個實例。因此,用戶可選擇手動分割功能1706並調整在字符『8』周圍的區域,以封閉整個字符,如圖18中所示。在選擇OK之後,考慮到每個區段的正確位置和尺寸,可運行自動分割算法。因此,與成像過程10相關的自動分割算法可探索分割參數的不同組合,並且在當前記錄上應用該組合,如圖19至圖20中所示。對於所計算(正確地或錯誤地)的每個結果,可比較結果區域與所建立的正確區域。
[0085]一些可能的情況可包括但不限於確定在所建立的正確區域與結果區域之間的良好匹配在公差內(例如,默認80%的區域重疊)。在該特定的實例中,可為良好的部件提取各種不同類型的信息,例如,最小-最大、像素數、寬度、高度等。在某些情況下,在不存在於所建立的正確區域內的結果中,可具有一個區域。在該特定的實例中,可為額外的部件提取各種數據。此外和/或或者,在不存在於結果內的所建立的正確區域中,可具有一個區域。在該特定的實例中,可使用黃金區域為缺失的部件提取各種數據,並且可將各種數據加入良好的部件中。此外和/或或者,在這兩者之間可具有較差的匹配(例如,區域重疊可小於公差)。在該特定的實例中,可為良好的部件使用所建立的正確區域來提取各種數據。如果有的話,該統計數據可與在模式中的記錄的所有統計數據相結合。在一些實施方式中,可修改分割參數,以排除額外的部件並且包括良好的部件。對於某些分割參數組合,這可產生所有區域與所建立的正確區域匹配的結果。可選擇這個最佳匹配的結果,並且將該結果加入模式中。然後,除了字體字符,還可提前最正確的分割參數。
[0086]在一些實施方式中,隨著在該模式中的記錄數量的增加,可提取最佳數量的字體字符,以將在該模式中的記錄的所有字符成功地分類。如果由於字符的第二實例與經訓練的字符相差太大,從而未正確地將字符的第二實例分類,則可將該實例加入字體中。通過這種方式,用戶可確認他/她的字體在所有記錄上起作用。
[0087]如在本文中所討論的,成像過程10可包括一個或多個分割參數。一些分割參數可包括但不限於下面所討論的那些參數,僅僅通過實例提供這些參數,並且這些參數並非旨在作為詳細清單。
[0088]在一些實施方式中,分割參數可包括極性。例如,所有字符的極性在輸入圖像中。
[0089]在一些實施方式中,分割參數可包括例如行細化模式,該模式可規定要使用的行細化技術。行細化模式可為經典模式或標準。
[0090]在一些實施方式中,分割參數可包括例如角度搜索範圍,該範圍在程度上可與角度搜索範圍的一半對應。其為相對於搜索區域的角度在範圍上搜索的用於行的角度。
[0091]在一些實施方式中,分割參數可包括例如傾斜範圍,該範圍在程度上可與傾斜搜索範圍的一半對應。其為相對於搜索區域的傾斜在範圍上可搜索的用於行的傾斜。
[0092]在一些實施方式中,分割參數可包括例如標準化模式,該模式可規定用於使輸入圖像標準化的方法。可將其設置為全局閾值、局部閾值或局部先進。
[0093]在一些實施方式中,分割參數可包括例如筆劃寬度,該筆畫寬度可規定是否從標準化的圖像中去除看起來沒有與該圖像的剩餘部分相同的筆劃寬度的一切物體。如果例如字符看起來通過細小的噪聲條紋彼此連接,則這可較為有用。[0094]在一些實施方式中,分割參數可包括例如二值化閾值,該二值化閾值可在標準化的圖像中規定用於計算二值化閾值的修改器,該二值化閾值在前臺與後臺之間進行二值化。
[0095]在一些實施方式中,分割參數可包括例如邊界片段,該邊界片段可規定是否完全忽略觸及搜索區域的任何邊界的任何片段。
[0096]在一些實施方式中,分割參數可包括例如片段像素數,例如,字符片段可具有以便考慮可能包含在字符內的最小數量的前臺(例如,文本)像素。字符片段可為在二值化圖像中的二進位大對象。
[0097]在一些實施方式中,分割參數可包括例如字符必須具有以便記錄的最小數量的前臺(例如,文本)像素。
[0098]在一些實施方式中,分割參數可包括片段對比度閾值,例如,片段相對於二值化閾值必須具有以便考慮可能包含在字符內的最小程度的對比度(例如,具有標準化圖像的灰度等級)。
[0099]在一些實施方式中,分割參數可包括像素的字符高度,例如,字符必須具有以便記錄的字符的標記矩形的最小高度。分割參數也可包括是否將最小字符高度功能用於限制字符的最大高度和/或字符行。分割參數也可包括字符的標記矩形的像素的最大允許高度。
[0100]在一些實施方式中,分割參數可包括像素的字符寬度,例如,字符必須具有以便記錄的字符的標記矩形的最小寬度。分割參數也可包括字符的標記矩形的像素的最大允許寬度。可將比該值更寬的字符分成不太寬的幾塊。分割參數還可包括是否將最大字符寬度功能用於限制字符的最大寬度。
[0101]在一些實施方式中,分割參數可包括像素的字符間間隔,例如,可在兩個字符之間發生的最小間隔尺寸。如果在兩個片段之間的間隔小於該字符間間隔,則必須將其視為相同字符的一部分。
[0102]在一些實施方式中,分割參數可包括像素的字符內間隔,例如,可在單個字符內發生的最小間隔尺寸,甚至用於損壞的字符。例如,在點陣印記內的連續點列之間,或者在由劃痕損壞的兩塊連寫字符之間,可具有字符內間隔。可將大於該值的任何間隔解釋為在兩個單獨字符之間的中斷,然而,可將小於或等於該值的間隔解釋為在單獨字符之間的中斷或者在單個字符內的間隔。
[0103]在一些實施方式中,分割參數可包括與主要行相距的片段距離,例如,片段作為所估計的行高的百分比在字符的主要行外面可具有的最大距離。
[0104]在一些實施方式中,分割參數可包括字符片段合併模式,該模式可規定例如用於確定在組階段中是否將兩個片段合併到一個字符中的模式。該模式可被設為requireOverlap (例如,字符片段必須水平重疊至少一個像素,以合併)。還可將該模式規定為SpecifyMinIntercharacterGap (例如,其間具有水平間距的字符片段可合併,以形成字符,其中,可合併間距小於minlntercharacterGap的任何兩個片段)。還可將該模式規定為specifyGaps (例如,其間具有水平間距的字符片段可合併,以形成字符,決定根據minlntercharacterGap 與 maxIntracharacterGap 合併兩個片段X
[0105]在一些實施方式中,分割參數可包括最小字符縱橫比,該最小字符縱橫比例如可規定是否分割寬字符。[0106]在一些實施方式中,分割參數可包括字符寬度類型,該字符寬度類型例如可規定在字體中的字符寬度預期變化的方式。要注意的是,字符寬度為標記矩形(例如,油墨邊界框)而非單元矩形(其通常可包括在標記矩形周圍的襯墊)的寬度。可將寬度類型設為「未知」、「固定」或「可變」。
[0107]在一些實施方式中,分割參數可包括分析模式,該分析模式可規定例如是否進行「最小分析」或「標準分析」。最小分析可根據上述參數進行直接分割。標準分析可總體上對行(包括例如字符間距)進行分析,以確定最佳分割。
[0108]在一些實施方式中,分割參數可包括節距度量,該節距度量可用於例如規定字符間距。要注意的是,節距為在相鄰的字符上的(大致)相應點之間的距離,而非從一個字符的結尾到下一個字符的開頭的距離(稱為「字符間間隔」)。可將該節距設為「未知」、「 IeftToLeft 」 「centerToCenter」、「;rightToRight,,等。
[0109]在一些實施方式中,分割參數可包括節距類型,該節距類型可規定例如單獨的節距值預期變化的方式;如節距度量所規定的,測量該節距值。可將該節距類型設為「未知」、「固定」、「成比例」或「可變」。
[0110]在一些實施方式中,分割參數可包括像素的最小節距,該最小節距可規定例如在兩個字符之間可發生的最小節距,其中,如節距度量所規定的,計算該節距。
[0111]在一些實施方式中,分割參數可包括空白插入,該空白插入可規定例如處理空白字符插入在其他字符之間的間隔內的方式。可將該空白插入設置為「無空間」、「單個空間」、或「多個空間」。
[0112]在一些實施方式中,分割參數可包括像素的空白字符的寬度,該空白字符的寬度可規定例如空白字符的最小寬度。此外和/或或者,分割參數可包括空白字符的最大寬度,其規定例如像素的空白字符的最大寬度。
[0113]在一些實施方式中,分割參數可包括最小部分,兩個字符片段在X方向必須彼此重疊最小部分,以便將這兩個片段視為相同字符的一部分。
[0114]在一些實施方式中,分割參數可包括字符的最小允許縱橫比,其中,將該縱橫比定義為將整行字符的高度除以字符的標記矩形的寬度。將其縱橫比小於該值(例如,其寬度過大)的字符分成不太寬的塊體。
[0115]在一些實施方式中,成像過程10可包括僅僅自動分割規定的正確字符串並且拒絕不均勻的結果。成像過程10也可自動分割規定的字符串以及所建立的字符的正確區域。如在本文中所討論的,成像過程10可被配置為訓練模式記錄的規定的字體。
[0116]在一些實施方式中,成像過程10可包括接收包含一個實例字符串的一個新圖像,並且接收在該字符串中識別正確字符的字符串,而非字符串的正確分割區域。成像過程10可被配置為通過不同的分割參數組自動生成字符串的圖像的可能分割。成像過程10可在字符串的可能正確的分割之間進行選擇,每個分割具有與其相關的候選分割參數並且可使用字符串的所選擇的正確分割的分割參數來進行光學字符識別。
[0117]在一些實施方式中,成像過程10可包括接收包含一個實例字符串的一個新圖像,並且在該字符串中識別正確字符,而非字符串的正確分割。成像過程10可自動生成字符串的圖像的分割參數和分割結果的候選組。成像過程10可在字符串的可能正確的分割之間進行選擇,每個分割具有與其相關的候選分割參數,可搜索所有候選結果,比較這些分割區域與由用戶選擇的那個分割區域,並且識別在某個百分比內產生相似區域的分割參數。除了所發現的所有分割參數以外,成像過程10還可通過在模式內正確地分割字符串來儲存所選擇的圖像。成像過程10可重複進行在上面確定的操作,直到獨特地選擇或最佳地發現分割參數。
[0118]在一些實施方式中,成像過程10可包括接收包含一個實例字符串的一個新圖像,並且在該字符串中識別正確字符,而非字符串的正確分割。成像過程10可被配置為自動生成字符串的圖像的分割參數和分割結果的候選組。成像過程10可在字符串的可能正確的分割之間進行選擇,每個分割具有與其相關的候選分割參數。如果上述選擇都不正確,則成像過程10可提供字符串的正確分割並且根據字符串的正確分割自動確定分割參數。除了所發現的所有分割參數以外,成像過程10還可通過在模式內正確地分割字符串來儲存所選擇的圖像。成像過程10可重複進行以上操作,直到唯一地選擇或最佳地發現分割參數。
[0119]在一些實施方式中,成像過程10可包括嘗試不同的分割參數並且生成具有與字符串的長度相同的區段數的結果。考慮到字符在字符串中的ASCII表示,成像過程10可拒絕不滿足均勻性標準的可能結果。成像過程10可生成字符串的圖像的可能分割的向量以及相關的候選分割參數。
[0120]在一些實施方式中,除了先前發現的所有分割參數,成像過程10還可通過正確地分割字符串來接收圖像的向量。成像過程10可嘗試所有先前發現的分割參數,並且生成具有與字符串的長度相同的區段數的結果。考慮到字符在字符串中的ASCII表示,成像過程10可拒絕不滿足均勻性標準的可能結果。成像過程10可生成字符串的圖像的可能分割的向量以及相關的候選分割參數。
[0121]在一些實施方式中,除了先前發現的所有分割參數,成像過程10還可通過正確地分割字符串來接收圖像的向量。成像過程10可嘗試所有先前發現的分割參數,並且生成具有與字符串的長度相同的區段數的結果。如果任何分割參數未成功,則成像過程10可使用先前運行和重試的統計數據來通過反覆的方式調整參數。考慮到字符在字符串中的ASCII表示,成像過程10可拒絕不滿足均勻性標準的可能結果。成像過程10可通過正確的分割在圖像的向量上應用所儲存的分割參數,並且拒絕失敗的分割參數。成像過程可生成字符串的圖像的可能分割的向量以及相關的候選分割參數。
[0122]在一些實施方式中,成像過程10可通過正確分割字符串來接收圖像的向量。成像過程10可通過正確分割字符串來從圖像的向量中提取分割參數的範圍。一些實例可包括但不限於字符寬度、高度、片段與字符的像素數量、字符間與字符內間隔等的範圍。成像過程10可嘗試在所提取的範圍內的不同分割參數,並且生成具有與字符串的長度相同的區段數的結果。考慮到字符在字符串中的ASCII表示,成像過程10可拒絕不滿足均勻性標準的可能結果。成像過程10可通過正確的分割在圖像的向量上應用所儲存的分割參數,並且拒絕失敗的分割參數。成像過程10可生成字符串的圖像的可能分割的向量以及相關的候選分割參數。
[0123]在一些實施方式中,考慮到包含一個實例字符串的圖像、在該字符串中的正確字符以及字符串的正確分割,成像過程10可被配置為自動生成可能的分割參數。通過這種方式,成像過程10可通過正確分割字符串來提取分割參數的範圍。一些實例可包括但不限於字符寬度、高度、像素數量、節距以及字符間間隔的範圍。成像過程10可嘗試在所提取的範圍內的不同分割參數,並且僅僅保持具有與字符串的正確分割的區域幾乎(例如,在某個百分比內)匹配的區域的結果。成像過程10可生成字符串的圖像的正確分割的向量以及相關的正確分割參數。
[0124]在一些實施方式中,除了先前發現的所有分割參數,成像過程10還可被配置為通過正確地分割字符串來接收圖像的向量。成像過程10可嘗試所有先前發現的分割參數,並且僅僅保持具有與字符串的正確分割的區域幾乎(例如,在某個百分比內)匹配的區域的結果。成像過程10可生成字符串的圖像的可能分割的向量以及相關的候選分割參數。
[0125]在一些實施方式中,除了先前發現的所有分割參數,成像過程10還可被配置為通過正確地分割字符串來接收圖像的向量。成像過程10可被配置為通過正確分割字符串來提取分割參數的範圍。一些實例可包括但不限於字符寬度、高度、像素數量、節距以及字符間間隔的範圍。通過添加不同的分析與標準化模式、前臺閾值、寬度類型等,成像過程10可擴大所有先前發現的分割參數。成像過程10可擴大分割參數,並且僅僅保持具有與字符串的正確分割的區域幾乎(例如,在某個百分比內)匹配的區域的結果。成像過程10可生成字符串的圖像的可能分割的向量以及相關的候選分割參數。
[0126]在一些實施方式中,除了先前發現的所有分割參數,成像過程10還可通過正確地分割字符串來接收圖像的向量。成像過程10可被配置為通過正確分割字符串來提取分割參數的範圍。一些實例可包括但不限於字符寬度、高度、像素數量、節距以及字符間間隔的範圍。成像過程10可嘗試所有先前發現並擴大的分割參數,並且僅僅保持具有與字符串的正確分割的區域幾乎(例如,在某個百分比內)匹配的區域的結果。如果任何分割參數未成功,則成像過程10可使用先前運行和重試的統計數據來通過反覆的方式調整參數。成像過程10可通過正確的分割在圖像的向量上應用所儲存的分割參數,並且拒絕失敗的分割參數。成像過程10可生成字符串的圖像的可能分割的向量以及相關的候選分割參數。
[0127]在一些實施方式中,成像過程10可通過正確分割字符串來接收圖像的向量。成像過程10可被配置為通過正確分割字符串來提取分割參數的範圍。一些實例可包括但不限於字符寬度、高度、像素數量、節距以及字符間間隔的範圍。成像過程10可被配置為通過正確分割字符串來從圖像的向量中提取分割參數的範圍。一些實例可包括但不限於字符寬度、高度、片段與字符的像素數量、字符間與字符內間隔等的範圍。成像過程10可在所提取的範圍內應用不同的分割參數,並且僅僅保持具有與字符串的正確分割的區域幾乎(例如,在某個百分比內)匹配的區域的結果。成像過程10可通過正確的分割在圖像的向量上應用所儲存的分割參數,並且拒絕失敗的分割參數。成像過程10可生成字符串的圖像的可能分害I]的向量以及相關的候選分割參數。
[0128]在一些實施方式中,成像過程10可包括從分割算法之前的運行中使用統計數據來自動調整分割參數。成像過程10可包括接收包含一個實例字符串的一個新圖像,並且在該字符串中識別正確字符,而非字符串的正確分割。成像過程10可提供分割參數組,應用分割算法並且比較經分割的區域數量與字符串長度。如果經分割的區域數量少於字符串長度,則成像過程10可調整分割參數,以包括更多拒絕的部件。如果經分割的區域數量多於字符串長度,則可調整分割參數,以排除更多的經保持的部件。成像過程10可重複進行一些或所有上述操作,持續最大迭代次數,或者直到發現相同的數量的區段。
[0129]在一些實施方式中,成像過程10可包括接收包含一個實例字符串的一個新圖像,並且在該字符串中識別正確字符以及字符串的正確分割。成像過程10可提供分割參數組,應用分割算法並且比較經分割的區域與正確分割的區域。可為每個區段提取統計數據,包括寬度、高度、像素數、片段像素數、對比度等。用於缺失的區段(例如,在特定的位置中,在結果中不存在的區段)的統計數據可收集在一個組內。用於正確的區段(例如,重疊很好的區段)的統計數據可加入該組中。可通過正確分割字符串,提取用於錯誤結果(例如,重疊不太好的結果)的統計數據,並且將該統計數據添加到該組中。可單獨地收集用於額外區段(例如,在特定的位置中,在正確分割字符串時不存在的區段)的統計數據。可調節分割參數,以排除額外的區段,但是包括所有其他的區段。成像過程10可反覆地重複進行一個或多個上述操作,持續最大迭代次數,或者直到發現正確的分割。
[0130]現在參照圖21至圖43,提供了描述與成像過程10相關的各種圖形用戶界面的實施方式。應注意的是,在本文中所描述的各種實施方式旨在對成像過程10提供一般概述,僅僅通過實例提供特定的圖形用戶界面,並且這些圖形用戶界面在任何情況下都並非旨在限制本公開的範圍。
[0131]在一些實施方式中,通過加載當前的圖像,成像過程10可正常地運行,顯示分割以及分類結果。如果分割區域看起來不正確,則用戶可輸入字符串並且做出選擇,以固定分害I],從而將結果返回給用戶。用戶選擇正確的結果並且可選擇將當前的記錄加入自動調諧模式中的按鈕。用戶可加載另一個圖像。如果經分割的區域正確,並且將字符正確地分類,則用戶可具有接受變化的選項(分割參數或分割參數與字體)。
[0132]在一些實施方式中,通過加載當前的圖像,成像過程10可正常地運行,顯示分割以及分類結果。如果分割區域看起來不正確,則用戶可輸入字符串並且做出選擇,以固定分害I],從而將結果返回給用戶。用戶選擇正確的結果並且可選擇將當前的記錄加入自動調諧模式中的按鈕。用戶可加載另一個圖像。如果經分割的區域正確,但是未將字符正確地分類,則用戶可規定字符串並且做出選擇,以固定分類,並且將結果加入自動調諧模式中。用戶可加載另一個圖像。如果經分割的區域正確,並且將字符正確地分類,則用戶可具有接受變化的選項(分割參數或分割參數與字體)。
[0133]在一些實施方式中,通過加載當前的圖像,成像過程10可正常地運行,顯示分割以及分類結果。如果分割區域看起來不正確,則用戶可輸入字符串並且做出選擇,以固定分害I],從而將結果返回給用戶。用戶選擇正確的結果並且可選擇將當前的記錄加入自動調諧模式中的按鈕。用戶可加載另一個圖像。如果經分割的區域不正確,則用戶可重複一些或所有以上步驟,無需規定新區域。然後,用戶可加載另一個圖像。如果區域正確,並且將字符正確地分類,則用戶可進行選擇,接受變化(分割參數或分割參數與字體)。
[0134]在一些實施方式中,通過加載當前的圖像,成像過程10可正常地運行,顯示分割以及分類結果。如果分割區域看起來不正確,則用戶可輸入字符串並且做出選擇,以固定分害I],從而將結果返回給用戶。如果結果不正確並且需要調整分割區域,則用戶可調整分割區域並且做出選擇,以便將記錄加入自動調諧模式中。用戶可加載另一個圖像,如果區域正確,並且將字符正確地分類,則用戶可決定接受變化(分割參數或分割參數與字體)。
[0135]在一些實施方式中,通過加載當前的圖像,成像過程10可正常地運行,顯示分割以及分類結果。如果分割區域看起來不正確,則用戶可輸不正確並且做出選擇,以固定分害I],從而將結果返回給用戶。用戶可選擇正確的結果並且決定將記錄加入自動調諧模式中。然後,用戶可加載另一個圖像,如果經分割的區域正確,並且將字符正確地分類,則用戶可選擇「拒絕」按鈕,以拒絕自動調諧參數。
[0136]在一些實施方式中,通過加載當前的圖像,成像過程10可正常地運行,顯示分割以及分類結果。如果分割區域看起來不正確,則用戶可輸不正確並且做出選擇,以固定分害I],從而將結果返回給用戶。用戶可選擇正確的結果並且做出選擇,以將記錄加入自動調諧模式中。用戶可加載另一個圖像。如果經分割的區域正確,並且將字符正確地分類,則用戶可決定沒有時間完成自動調諧數據,從而可提供「保存」按鈕,以保存自動調諧數據。
[0137]在一些實施方式中,通過加載當前的圖像,成像過程10可正常地運行,顯示分割以及分類結果。如果分割區域看起來不正確,則用戶可輸入字符串並且做出選擇,以固定分害I],從而將結果返回給用戶。用戶可選擇正確的結果並且點擊將記錄加入自動調諧模式中的按鈕。用戶可加載另一個圖像,如果經分割的區域看起來不正確,則用戶可輸入字符串並且做出選擇,以固定分割。可將結果返回給用戶。用戶可選擇正確的結果並且做出選擇,以將記錄加入自動調諧模式中。如果現在在自動調諧模式中的第一記錄失敗,具有新分割參數,則用戶可選擇在自動調諧模式中的最後的自動調諧記錄並選擇「刪除」按鈕。可自動重新調諧自動調諧模式,並計算新分割參數。用戶可加載另一個圖像。如果經分割的區域正確,並且將字符正確地分類,則用戶可做出選擇,以接受變化(分割參數或分割參數與字體)。
[0138]現在參照圖21,在用戶處於「重新調諧」模式中時,成像過程10的實施方式可正常地運行,進行分割和分離。因此,成像過程10顯示分割與分類圖形,如圖21中所示。如果分割區域或分類不正確,則在用戶處於「重新調諧」模式中時,該行為改變。如圖22中所示,通過按鈕或其他合適的選項,可啟動自動調諧。如圖23中所示,在用戶希望看到診斷圖形時,根據正在顯示的信息,會看到裝有不同的有色矩形的圖像。例如,並且如圖23中所示,在拒絕的片段周圍的區域可顯示為黃色,並且字符的主行可顯示為藍色(未顯示)。圖24描述了拒絕的字符。此外和/或或者,並且如圖25中所示,在保持的片段周圍的區域可顯示為藍綠色,並且字符的主行可顯示為藍色。在不背離本公開的範圍的情況下,可使用大量其他設置與方法。
[0139]在一些實施方式中,在位於新的診斷選項卡中時,成像過程可向用戶顯示與行數據、保持的片段、拒絕的片段、保持的字符以及拒絕的字符有關的信息。例如,行數據可包括但不限於角度、傾斜、最小/最大字符間間隔(像素)、最小/最大字符內間隔(像素)、最小/最大節距。保持的片段可包括但不限於最小/最大尺寸(像素)、最小/最大對比度(%)以及MaxDistanceToMainLine (%)。拒絕的片段可包括但不限於最小/最大尺寸(像素)、最小/最大對比度(%)以及MaxDistanceToMainLine (%)。保持的字符可包括但不限於最小/最大字符寬度(像素)、最小/最大字符高度(像素)以及最小/最大字符尺寸(像素)。拒絕的字符可包括但不限於最小/最大字符寬度(像素)、最小/最大字符高度(像素)以及最小/最大字符尺寸(像素)。
[0140]現在參照圖26,顯示了描述圖形用戶界面2600的一個實施方式。界面2600可包括顯示診斷文本數據的選項卡。在一些實施方式中,可添加下拉式菜單,以規定顯示哪個診斷圖形。在一些實施方式中,「顯示診斷」下拉式菜單可與「顯示」下拉式菜單一起起作用。在位於屬性表內時,如果將「顯示診斷」設為非「全部隱藏」,則就僅僅可顯示診斷圖形。在位於屬性表內部時,如果將「顯示診斷」設為「全部隱藏」,則顯示正常的圖形。在位於屬性表外部時,如果將「顯示」下拉式屬性設為「全部顯示」或「僅僅顯示結果圖形」,則顯示正常的圖形以及「顯示診斷」所設定的任何物體。在位於屬性表外部時,如果將「顯示」下拉設為「全部隱藏」,則圖形為在用戶打開屬性表時圖形的樣子。
[0141]在本文中所描述的成像過程的實施方式可使用各種分類算法。這些分類算法中的一些算法可包括但不限於用於將字符分類的基本分類算法、用於將字符分類的位於基本的驗證程序之前的基本分類算法以及具有積極性流線型算法的用於將字符分類的基本分類算法。在一些實施方式中,可使用各種默認分類算法。例如,通過在圖27中所示的「跳過額外字符驗證」複選框可選擇一種特定的模式。在一些實施方式中,如果作業文件為比固件更舊的版本,則固件可根據一個特定的參數自動設置分類。此外和/或或者,如果作業文件為比固件更新的版本,則固件可根據一個合適的參數自動設置分類。
[0142]在一些實施方式中,在處於自動調諧模式中時,在操作期間可進行分割和分類。隨後,用戶可希望添加選項,以便每當加載圖像並且執行處理時不進行分類。在完成自動調諧並且用戶認為分割參數或分割參數與訓練良好時,可提交這些更改。
[0143]本公開的實施方式可利用各種文庫以及與那些文庫連通的相關固件。在本文中所描述的成像過程可被配置為將各種信息顯示給一個或多個圖形用戶界面。因此,可具有將信息從文庫中一直記錄到特定的用戶界面中的幾條消息。例如,該消息在自動調諧模式中將有關每個記錄的記錄信息一直發送給一個特定的用戶界面,該用戶界面可被配置為顯示該信息。此外和/或或者,一些消息可被配置為將自動調諧圖形與圖像發送給一個特定的用戶界面,用於進行顯示。一些消息可被配置為促使自動調諧會話結束,並且可更新分割參數,文庫計算這些分割參數,用於隨後向用戶顯示。
[0144]在一些實施方式中,用戶可啟動自動調諧功能,並且可使用一個或多個圖像進行訓練。對於每個圖像,用戶可決定是否正確地將字符分割與分類。如果不是的話,訓練失敗的圖像,並且該算法會找出正確地分割該圖像以及先前訓練的圖像的分割設置。由於訓練更多的圖像,所以自動調諧算法可變得更可靠更精確。在滿足用戶時,可應用新分割設置,並且可通過最近訓練的字符更新字體。在自動調諧的過程中訓練的字符具有多個優點,其中的一些優點可包括但不限於用戶不需要通過一組圖像循環兩次(一次用於進行分割,一次用於訓練字符),而且由於可使用從調諧處理中獲得的分割參數,自動訓練字符,所以提高了閱讀的精確性。
[0145]在本文中所使用的短語「字符分割」可表示在檢查區域內發現每個字符的界限(頂部、左邊、底部、右邊邊緣)的處理或行為。可使用在本文中所描述的一個或多個算法進行字符分割。短語「自動調諧記錄」可由圖像、訓練字符串以及字符在圖像內的用戶驗證位置構成。短語「自動調諧模式」可表示總共零個或多個自動調諧記錄,外加最佳地正確分割所有記錄的配置設置。
[0146]在本文中所討論的自動調諧的概念可表示用於識別最佳分割參數的引導過程。在該過程完成之後,可更新分割參數。在一些實施方式中,自動調諧處理要求多個圖像成功。用戶界面可被配置為通過獲取圖像以及評估結果的處理引導用戶。因此,用戶不應面對壓倒性數量的要選擇的結果。這些結果應不同並且在數量上進行限制。應提示用戶將自動調諧會話保存到磁碟中,以便防止浪費精力。可由用戶界面自動恢復最後保存的會話。[0147]在一些實施方式中,自動調諧處理可需要大量CPU與存儲器資源。一旦該處理完成並且更新設置和字體,就不再需要這些資源,並且可釋放這些資源。在一些實施方式中,關鍵是儘快釋放資源。一旦自動調諧處理完成(即,用戶接受設置或取消),就可釋放所有自動調諧資源。跨過會話,未在資源之間(例如,訓練的圖像等)保持信息。如果期望操作進行兩秒鐘,則可顯示進度條。不可使用進度反饋(完成47%),因此,進度條僅僅表示操作依然積極。沒有取消操作的機構。
[0148]在一些實施方式中,在訓練期間,用戶按壓屬性表或設置面板的自動調諧。用戶面對自動調諧對話框,並且可獲得一個新圖像。然後,用戶可訓練該新圖像,進入另一個步驟或者選擇OK以退出。更新新的分割參數,並且更新字體。
[0149]在一些實施方式中,在通過自動字符分割訓練圖像時,用戶可決定未適當地分割圖像並且然後可輸入訓練的字符串。用戶可選擇自動分割按鈕。用戶面對狀態條並且等待完成自動分割。用戶面對一系列自動分割結果,並且可通過在其上進行點擊來檢查每個結果。選擇結果,可更新在圖像上的分割標記。用戶選擇最佳結果並選擇『0K』。產生一個新的自動調諧記錄,並且使用新的自動調諧設置來更新該圖像。使用最近訓練的字符來更新字體。
[0150]在一些實施方式中,在通過手動字符分割訓練圖像時,用戶可決定未適當地分割圖像。此時,用戶可輸入訓練的字符串並選擇手動分割按鈕。隱藏自動調諧對話框,並且顯示控制面對在訓練字符串中用於每個字符的可編輯區域。然後,用戶可定位每個區域並調整其大小。用戶在工具條上點擊OK(或雙擊圖像)。現在,用戶可面對狀態條並且等待完成分割設置。該處理完成,並且狀態條關閉。產生一個新的自動調諧記錄,並且使用新的自動調諧設置來更新該圖像。使用最近訓練的字符來更新字體。
[0151]在一些實施方式中,用戶可決定適當地分割圖像,但是錯誤地識別字符。然後,用戶輸入訓練的字符串並點擊『訓練字體』按鈕。使用最近訓練的字符來更新字體。
[0152]在一些實施方式中,用戶可決定適當地分割圖像,並且正確地識別字符。此為與其他圖像差別不大的測試圖像。不需要用戶活動。
[0153]在一些實施方式中,用戶可決定適當地分割圖像,並且正確地識別字符。用戶確定該圖像為在進行自動調諧時應考慮的重要圖像,並且可選擇『產生記錄』按鈕。使用當前的圖像與當前的分割區域來產生新的自動調諧記錄。
[0154]在一些實施方式中,自動調諧為多圖像處理,該處理在工具內設置分割參數並且可選地重新訓練字符。在自動調諧處理活動時,要求用戶加載圖像並為每個圖像評估結果。用戶在視覺上確定是否正確地分割字符以及是否正確地識別字符。如果未正確地分割或識別字符,則自動調諧算法試圖進行糾正。隨著處理的繼續,這些結果變得更加可靠精確。在滿足用戶時,應用新的分割設置,並且使用最近訓練的字符更新字體。
[0155]在一些實施方式中,自動調諧處理跨越多個圖像。用戶能夠加載圖像並且調整檢查區域,無需關閉自動調諧對話框。在本文中所描述的實施方式可為用戶提供通過播放控制加載圖像、從磁碟中加載圖像或者通過現場採集加載圖像的方法,無需關閉自動調諧對話框。實施方式也可為用戶提供編輯嵌入式區域的方法,無需關閉自動調諧對話框。
[0156]在一些實施方式中,在自動調諧處理起作用時,用戶評估在每個圖像中的字符分害I]。如果未正確地分割字符,則自動調諧算法試圖進行糾正。自動調諧處理可需要處理與文本有關的信息,並且提供一些性能(速度與精度)調整。
[0157]在本文中所公開的實施方式可為用戶提供多個自動調諧選項。一些選項包括但不限於鎖定的參數列表,該列表可規定不應由自動調諧修改的一組分割參數。未默認鎖定任何參數。圖像解析度:例如,可通過全解析度或通過子採樣解析度分割字符。可設置默認值。結果數量:可識別要生成並且呈現給用戶的最大數量的候選結果。參數步驟:例如,試圖用於每個分割參數的迭代次數。如果在連結選項卡中連結相關的工具輸入,則自動鎖定參數。
[0158]在一些實施方式中,在當前的圖像未正確分割時,用戶可選擇運行自動分割算法。自動分割算法搜索並返回一系列分割配置,這些分割配置正確地分割當前的圖像以及在這系列自動調諧記錄中的圖像。將這系列返回的配置呈現給用戶,並且用戶選擇最佳分割字符的配置。如果由用戶選擇滿意的配置,則將該驗證的結果作為新的自動調諧記錄儲存,並且所選擇的配置用於分割以後的圖像。此外,通過最近訓練的字符,更新字體。如果沒有令人滿意的配置,則用戶可選擇:修改自動分割輸入並且重新運行自動分割功能,或者通過圖形手動分割字符。
[0159]在本文中公開的實施方式可為用戶提供用於啟動自動分割操作的命令。這並非明確的命令;根據用戶在當前圖像內將分割分級的方式,可調用該命令。用戶必須提供訓練的
字符串。
[0160]在本文中公開的實施方式可提供狀態指示器,以通知用戶自動分割處理正在進行並且一切進展順利。此外和/或或者,在本文中所公開的實施方式可提供在用戶手動分割字符之後取消正在進行的自動分割操作的方式。一旦完成取消,用戶就應返回到交互式圖形顯示器中,並且分割圖形位於用戶放置的位置。
[0161]在本文中公開的實施方式可為用戶提供用於從自動分割結果中選擇最佳分割配置的選項。此外和/或或者,一些實施方式可為用戶提供一種裝置,該裝置對著用於每個候選配置的當前圖像在視覺上檢查分割結果。
[0162]如果當前圖像未正確分割並且自動分割結果不令人滿意,則用戶可選擇通過圖形手動分割字符。手動放置的區域可儲存在新的自動調諧記錄內。在試圖找出滿足手動放置的區域的分割配置時,自動分割程序可在內部運行。根據由用戶提供的區域,可自動選擇最佳配置;用戶不需要從一系列配置中進行選擇。通過最近訓練的字符,可更新字體。
[0163]此外和/或可選地,在本文中公開的實施方式可為用戶提供手動定位每個分割區域的能力。用戶必須能夠設置每個字符的位置、尺寸、角度以及傾斜。區域的數量可由訓練字符串決定,該系統不需要為用戶提供增加或去除字符區域的能力。
[0164]一些實施方式可被配置為提供狀態指示符,以通知用戶該工具正在搜索配置,該處理正在進行,並且一切進展順利。此外和/或或者,一些實施方式可提供在用戶手動分割字符之後取消正在進行的搜索操作的方式。一旦完成取消,用戶就應返回到交互式圖形顯示器中,並且分割圖形位於用戶放置的位置。
[0165]如上所述,在一些實施方式中,在自動調諧的過程中,訓練字符。在自動分割命令之後,自動進行字體訓練。如果分割較好,但是錯誤識別字符,則也可由用戶開始字體訓練。字體訓練選項適用於這兩種情況。
[0166]在本文中公開的實施方式可需要與管理經訓練的字符的方式有關的某些信息,並且可為用戶提供大量字體訓練選項,包括但不限於每個字符的最大實例,這可限制要訓練的字符的實例數量。在本文中公開的實施方式也可為用戶選擇提供用於重新訓練字符的選項,無需執行自動分割命令。用戶必須提供訓練的字符串,並且產生自動調諧記錄。在稍後的時間,可輸出並恢復自動調諧模式數據。這就允許用戶訓練一組基本圖像,隨後在遇到新的有問題的圖像時,將這些基本圖像加入數據集中。用戶能夠選擇保存位置或加載位置。用戶可具有將活動會話保持到在任何合適的計算裝置上的用戶指定的位置的能力。用戶能夠選擇保存位置。用戶也可具有恢復先前保存的會話的能力,重寫當前的活動會話。用戶能夠選擇加載的位置。在某些情況下,用戶希望放棄當前的進度並且重新開始自動調諧處理。用戶可具有將自動調諧模式重新設置為新的空狀態的能力。
[0167]在一些實施方式中,在訓練操作期間,通常自動產生自動調諧記錄。如果用於產生記錄的圖像具有較差的質量並且造成自動調諧機構的問題,則可用於刪除該記錄。可由用戶查看記錄。可通過兩種方式標記在記錄中的圖像:標有訓練的區段區域或者標有使用當前的分割設置生成的區段區域。如果當前的分割設置比用於訓練該圖像的設置更精確地分割記錄圖像,則用戶可通過當前的分割結果選擇更新記錄。
[0168]一些實施方式可為用戶提供用於產生記錄的圖像,該圖像標有驗證(訓練時間)的分割區域。實施方式可為用戶提供用於產生記錄的圖像,該圖像標有使用當前的設置來生成的分割區域。用戶可面對用於產生記錄的文本。
[0169]在一些實施方式中,用戶可通過當前的分割結果刪除和/或更新自動調諧記錄。此外和/或或者,自動調諧對話框可為用戶提供以下選項:οκ-全部提交:用戶可具有關閉對話框的選項,接受分割參數以及經訓練的字體字符。複製分割參數,並且使用經訓練的字符更新字體。
[0170]現在參照圖28至圖29,提供了與本公開的教導內容一致的圖形用戶界面的實施方式。在該特定的實施方式中,在圖28中所示的性能表上的自動調諧按鈕可用於激活自動調諧功能。此外和/或或者,如圖29中所示,在引用外部設置單元時,可禁用自動調諧按鈕。
[0171]現在參照圖30至31,提供了描述工具條圖形用戶界面的本公開的實施方式。一些工具條命令可包括但不限於圖像採集命令、檢查區域編輯命令、輸出命令、輸入命令以及清除模型命令。在按壓OK或取消按鈕時,自動調諧對話框關閉。如果選擇0Κ,則相關單元會發生這些變化。
[0172]現在參照圖32至圖34,在一些實施方式中,可包括一個或多個選項卡頁面。選項卡頁面可包括但不限於自動調諧(在圖32中所示)、設置、記錄以及字體。自動調諧選項卡可提供自動分割命令、手動分割命令以及訓練字體命令。設置選項卡可提供到自動調諧設置的訪問以及到字體訓練選項的訪問。如圖33中所示,記錄選項卡可提供到查看記錄、刪除記錄以及更新記錄的訪問。在一些實施方式中,選擇「查看記錄」按鈕,會打開以下模式對話框,這允許查看記錄並且更新記錄。
[0173]如圖35至圖36所示,在進行一個處理時,會出現模式彈出式窗口。這可提供自動分割進度、配置搜索進度、取消自動分割操作以及取消配置搜索。
[0174]在一些實施方式中,在選擇在圖34中所示的查看記錄選項時,可生成模式對話框,這可允許顯示和/或更新記錄。圖37描述了顯示這種配置的圖形用戶界面3700。如圖37中所示,圖形用戶界面3700可包括均可顯示的經訓練的功能以及當前的設置功能。也可提供保存當前結果的選項。
[0175]如圖38至圖39所示,在一些實施方式中,在自動分割處理完成之後,出現模式對話框。對話框可允許用戶選擇最佳分割配置。在選擇『編輯結果』按鈕時,通過將當前的選擇用作起始點,用戶能夠手動標記字符區段圖形。在選擇『0K』按鈕時,根據當前的選擇更新自動調諧模式,並且對話框關閉。如果在列表中選擇一個項目,則僅僅啟動OK按鈕。
[0176]在一些實施方式中,在手動編輯字符區段時,可使用平行四邊形圖形。平行四邊形圖形可包括多個功能。例如,在將滑鼠放置在平行四邊形的內部內時,移動功能會將光標變成標準的移動光標(4個箭頭)。然後,通過點擊和拖動圖形,可移動平行四邊形。在將滑鼠放置在平行四邊形的邊緣上時,調整大小的功能會將光標變成標準的調整大小光標(2個箭頭)。然後,通過點擊和拖動邊緣,可調整平行四邊形的尺寸。在將滑鼠放置在平行四邊形的左上角上時,傾斜功能會將光標變成標準的十字型光標。然後,通過點擊和拖動該點,可改變平行四邊形的內部角度。在將滑鼠放置在平行四邊形的底部的旋轉圖標上時,旋轉功能(見圖40)會將滑鼠光標變成旋轉光標。然後,通過點擊和拖動該點,可修改平行四邊形的旋轉。允許鍵盤編輯。除了現有的移動、調整大小以及旋轉模式,還可使用傾斜模式。傾斜模式在I度增量(左箭頭-1,右箭頭+1)中調整平行四邊形的內角,如圖41中所示。在頂部箭頭的頂部,拖動在平行四邊形的底部邊緣和左邊緣之間的以角度表示的角。
[0177]現在參照圖42,提供與本公開的一個實施方式一致的圖形用戶界面4200。在該特定的實例中,分割選項卡可包括用戶可選的按鈕,該按鈕稱為:「輸出到單元」。如果如圖43中所示,已經設置外部設置引用,則可禁用輸出命令。
[0178]在自動調諧會話的範圍內可發生自動調諧功能,部分原因在於自動調諧的高存儲器與處理器要求。在會話結束時,釋放存儲器,並且提交或丟棄結果。會話為不能暴露給用戶的幾乎整個內部實現細節。對用戶的影響在於,在會話之間未保存中間訓練數據(例如,自動調諧記錄)。可由用戶輸入與輸出會話數據。在執行任何自動調諧功能之前,在本文中所公開的實施方式可開始新的自動調諧會話。該操作對於用戶是透明的,並且在打開自動調諧對話框時,可自動進行該操作。在本文中公開的實施方式可退出每個活動的自動調諧會話。該操作對於用戶可為透明的,並且在關閉自動調諧對話框時,可自動進行該操作。
[0179]該方法還可包括使用一個或多個計算裝置,根據設置為閾值或優化值的標準,確定所產生的分割是否滿足一個或多個標準。該方法還可包括使用所述一個或多個計算裝置生成至少部分使用第一字符串和額外的字符串中的一個或多個的字符資料庫。該方法還可包括使用一個或多個計算裝置接收用於具有一組正確的分割參數的字符串的正確分割的指示。該方法還可包括使用一個或多個計算裝置將這組正確的分割參數應用於第二字符串中。在一些實施方式中,識別可包括識別與ASCII均勻性標準的符合性。
[0180]操作還可包括使用一個或多個計算裝置,根據設置為閾值或優化值的標準,確定所產生的分割是否滿足一個或多個標準。操作還可包括使用所述一個或多個計算裝置生成至少部分使用第一字符串和額外的字符串中的一個或多個的字符資料庫。該方法還可包括使用一個或多個計算裝置接收用於具有一組正確的分割參數的字符串的正確分割的指示。該方法還可包括使用一個或多個計算裝置將這組正確的分割參數應用於第二字符串中。在一些實施方式中,識別可包括識別與ASCII均勻性標準的符合性。在一些實施方式中,所述至少一個分割參數可包括一個或多個極性、行細化、角度搜索範圍、傾斜搜索範圍、標準化模式、筆劃寬度、二值化閾值、邊界片段、像素數、對比度閾值、字符高度、字符寬度、字符間間隔、字符內間隔、字符片段距離、字符片段合併模式、寬字符分割、最小字符縱橫比、字符寬度類型、分析模式、節距度量、節距類型、最小節距、空白插入、空白刻痕、空白字符的最小寬度以及空白字符的最大寬度。
[0181]所述一個或多個處理器可進一步被配置為接收至少一個額外的圖像,每個圖像具有一個額外的字符串。所述一個或多個處理器可進一步被配置為生成至少部分使用第一字符串和額外的字符串中的一個或多個的字符資料庫。所述一個或多個處理器可進一步被配置為接收用於具有一組正確的分割參數的字符串的正確分割的指示。所述一個或多個處理器可進一步被配置為將這組正確的分割參數應用於第二字符串中。在一些實施方式中,識別可包括識別與ASCII均勻性標準的符合性。在一些實施方式中,所述至少一個分割參數可包括一個或多個極性、行細化、角度搜索範圍、傾斜搜索範圍、標準化模式、筆劃寬度、二值化閾值、邊界片段、像素數、對比度閾值、字符高度、字符寬度、字符間間隔、字符內間隔、字符片段距離、字符片段合併模式、寬字符分割、最小字符縱橫比、字符寬度類型、分析模式、節距度量、節距類型、最小節距、空白插入、空白刻痕、空白字符的最小寬度以及空白字符的最大寬度。
[0182]本領域的技術人員會理解的是,本公開可體現為一種方法、系統或電腦程式產品。因此,本公開可採用以下形式:完全硬體實施方式、完全軟體實施方式(包括固件、常駐軟體、微碼等)或使在本文中均可總體上稱為「電路」、「模塊」或「系統」的軟體與硬體方面相結合的實施方式。而且,本公開可採用以下形式:在計算機可用儲存介質上的電腦程式產品,該產品具有在該介質內體現的計算機可用程序代碼。
[0183]可利用任何合適的計算機可用或計算機可讀介質。計算機可用或計算機可讀介質可為例如但不限於電子、磁性、光學、電磁、紅外或半導體系統、設備、裝置或傳播介質。計算機可讀介質的更具體的實例(並非詳盡的列表)包括以下元件:具有一條或多條電線的電連接、可攜式電腦磁碟、硬碟、隨機存取存儲器(RAM)、只讀存儲器(ROM)、可擦除可編程只讀存儲器(EPROM或閃速存儲器)、光纖、可攜式光碟只讀存儲器(⑶ROM)、光存儲裝置、傳輸介質(例如,支持網際網路或內聯網的傳輸介質)或磁存儲裝置。要注意的是,由於通過例如光學掃描紙張或其他介質,可通過電子的方式捕捉程序,然後如有必要,通過一種合適的方式,編譯、解釋或另外處理該程序,並且然後將該程序儲存在計算機存儲器內,所以計算機可用或計算機可讀介質甚至可為在其上列印程序的紙張或另一種合適的介質。在本文的背景中,計算機可用或計算機可讀介質可為可包含、儲存、傳送、傳播或輸送供指令執行系統、設備、或裝置使用或者與其連接的程序的任何介質。計算機可用介質可包括在基帶內或者作為載波的一部分與計算機可用程序代碼一起實現的傳播數據信號。使用任何合適的介質(包括但不限於網際網路、鋼絲繩、光纖電纜、射頻等),可傳輸計算機可用程序代碼。
[0184]可用面向對象的程式語言(例如,Java、Smalltalk、C++等),編寫用於執行本公開的操作的電腦程式代碼。然而,也可用傳統的程序程式語言(例如,「C」程式語言或相似的程式語言),編寫用於執行本公開的操作的電腦程式代碼。程序代碼可完全在用戶的計算機上,部分在用戶的計算機上,作為獨立軟體包,部分在用戶的計算機上並且部分在遠程計算機上,或者完全在遠程計算機或伺服器上執行。在後一種情況下,遠程計算機可通過區域網(LAN)或廣域網(WAN)連接至用戶的計算機,或者可連接至外部計算機(例如,使用網際網路服務提供商通過網際網路)。
[0185]下面根據本公開的實施方式,參照流程圖插圖和/或方法、設備(系統)以及電腦程式產品的框圖,描述本公開。要理解的是,流程圖插圖和/或方框圖的每個方框以及在流程圖插圖和/或方框圖中的方框的組合可由電腦程式指令實現。可將這些電腦程式指令提供給通用計算機、專用計算機或其他可編程的數據處理設備的處理器,以製造機器,從而這些指令通過計算機或其他可編程的數據處理設備的處理器執行時,產生用於實現在流程圖和/或方框圖的一個或多個方框中規定的功能/行為的裝置。
[0186]這些電腦程式指令也可儲存在計算機可讀存儲器內,該存儲器可引導計算機或其他可編程的數據處理設備通過一種特定的方式運行,從而儲存在計算機可讀存儲器內的指令產生製品,該製品包括實現在流程圖和/或方框圖的一個或多個方框中規定的功能/行為的指令裝置。
[0187]也可在計算機或其他可編程的數據處理設備上加載電腦程式指令,以促使在計算機或其他可編程的設備上執行一系列操作步驟,以產生計算機實現處理,從而在計算機或其他可編程的設備上執行的指令提供用於實現在流程圖和/或方框圖的一個或多個方框中規定的功能/行為的步驟。
[0188]在視圖中的流程圖和方框圖根據本公開的各種實施方式示出了系統、方法以及電腦程式產品的可能的實現方式的架構、功能以及操作。就這一點而言,在流程圖或方框圖中的每個方框可表示代碼的模塊、區段或部分,其包括用於實現規定的邏輯功能的一個或多個可執行的指令。還應注意的是,在一些替換的實現方式中,在方框中記錄的功能可按照與在圖中記錄的順序不同的順序發生。例如,根據有關功能,實際上可基本上同時地執行連續顯示的兩個方框,或者有時可按照相反的順序執行這些方框。還要注意的是,方框圖和/或流程圖插圖的每個方框以及在方框圖和/或流程圖插圖中的方框的組合可由基於專用硬體的系統實現,這些系統執行規定的功能或行為或專用硬體與計算機指令的組合。
[0189]在本文中所使用的術語用於僅僅描述特定的實施方式,並非旨在限制本公開。在本文中所使用的單數形式「a」、「an」以及「the」旨在也包括複數形式,除非上下文另有明確說明。進一步要理解的是,在用於本說明書中時,術語「comprises」和/或「comprising」規定具有所陳述的功能、整體、步驟、操作、部件和/或元件,但是不排除具有或添加一個或多個其他功能、整體、步驟、操作、部件、元件和/或其組。
[0190]根據特別的要求,在下面權利要求中的所有裝置或步驟加功能部件的相應結構、材料、行為以及等同物旨在包括用於與其他所要求的部件相結合地執行功能的任何結構、材料或行為。為了進行說明和描述,已經提供了本公開的說明書,但是本說明書在所公開的形式上並非旨在具有詳盡性或限於本公開。在不背離本公開的範圍和精神的情況下,很多修改與變化對於本領域的技術人員顯而易見。選擇並描述該實施方式,以便最佳地解釋本公開的原理與實際應用,並且由於各種實施方式進行適合於預期的特定使用的各種修改,從而使本領域的其他技術人員能夠理解本公開。
[0191]已經這樣詳細地描述本申請的公開內容,並且通過引用其實施方式,在不背離在所附權利要求內定義的本公開的範圍的情況下,顯然能夠進行修改與變更。
【權利要求】
1.一種用於選擇至少一個分割參數以進行光學字符識別的計算機實現方法包括: 使用一個或多個計算裝置接收圖像,所述圖像具有包括一個或多個字符的字符串; 使用所述一個或多個計算裝置接收識別所述一個或多個字符中的每一個的字符串; 使用所述一個或多個計算裝置自動生成至少一個分割參數; 使用所述一個或多個計算裝置通過利用所述至少一個分割參數對具有所述字符串的所述圖像進行分割; 使用所述一個或多個計算裝置確定所產生的分割是否滿足一個或多個標準; 如果所產生的所述分割滿足所述一個或多個標準,則選擇所述至少一個分割參數;以及 在所述一個或多個計算裝置顯示所述圖像的至少一部分。
2.根據權利要求1所述的計算機實現方法,還包括: 使用所述一個或多個計算裝置顯示與所述分割相關的用戶可選的選項,所述用戶可選的選項被配置為允許用戶指出正確的分割或錯誤的分割。
3.根據權利要求1所述的計算機實現方法,還包括: 使用所述一個或多個計算裝置顯示用戶可選的選項,所述用戶可選的選項被配置為允許用戶手動生成經手 動產生的分割。
4.根據權利要求1所述的計算機實現方法,還包括: 使用所述一個或多個計算裝置顯示所產生的所述分割。
5.根據權利要求1所述的計算機實現方法,還包括: 使用所述一個或多個計算裝置顯示所述至少一個分割參數。
6.根據權利要求5所述的計算機實現方法,其中,所述至少一個分割參數包括一個或多個極性、行細化、角度搜索範圍、傾斜搜索範圍、標準化模式、筆劃寬度、二值化閾值、邊界片段、像素數、片段對比度閾值、字符高度、字符寬度、字符間間隔、字符內間隔、與主行相距的片段距離、片段合併模式、最小字符縱橫比、字符寬度類型、分析模式、節距度量、節距類型、最小節距、空白插入、空白字符的寬度。
7.根據權利要求1所述的計算機實現方法,還包括: 使用所述一個或多個計算裝置顯示至少一個經訓練的圖像。
8.一種位於計算機可讀儲存介質上的電腦程式產品,所述電腦程式產品具有儲存在其上的多個指令,並在由處理器執行時使所述處理器執行包括以下項的操作: 使用一個或多個計算裝置接收圖像,所述圖像具有包括一個或多個字符的字符串; 使用所述一個或多個計算裝置接收識別所述一個或多個字符中的每一個的字符串; 使用所述一個或多個計算裝置自動生成至少一個分割參數; 使用所述一個或多個計算裝置利用所述至少一個分割參數對具有所述字符串的圖像進行分割; 使用所述一個或多個計算裝置確定所產生的分割是否滿足一個或多個標準; 如果所產生的所述分割滿足所述一個或多個標準,則選擇至少一個分割參數;以及 在所述一個或多個計算裝置顯示所述圖像的至少一部分。
9.根據權利要求8所述的電腦程式產品,還包括: 使用所述一個或多個計算裝置顯示與所述分割相關的用戶可選的選項,所述用戶可選的選項被配置為允許用戶指出正確的分割或錯誤的分割。
10.根據權利要求8所述的電腦程式產品,還包括: 使用所述一個或多個計算裝置顯示用戶可選的選項,所述用戶可選的選項被配置為允許用戶手動生成經手動產生的分割。
11.根據權利要求8所述的電腦程式產品,還包括: 使用所述一個或多個計算裝置顯示產生的所述分割。
12.根據權利要求8所述的電腦程式產品,還包括: 使用所述一個或多個計算裝置顯示所述至少一個分割參數。
13.根據權利要求12所述的電腦程式產品,其中,所述至少一個分割參數包括一個或多個極性、行細化、角度搜索範圍、傾斜搜索範圍、標準化模式、筆劃寬度、二值化閾值、邊界片段、像素數、片段對比度閾值、字符高度、字符寬度、字符間間隔、字符內間隔、與主行相距的片段距離、片段合併模式、最小字符縱橫比、字符寬度類型、分析模式、節距度量、節距類型、最小節距、空白插入、空白字符的寬度。
14.根據權利要求8所述的電腦程式產品,還包括: 使用所述一個或多個計算裝置顯示至少一個經訓練的圖像。
15.一種被配置為選 擇至少一個分割參數以進行光學字符識別的計算系統,包括: 一個或多個處理器,被配置為接收具有包括一個或多個字符的字符串的圖像,所述一個或多個處理器進一步被配置為接收識別所述一個或多個字符中的每一個的字符串,所述一個或多個處理器進一步被配置為自動生成至少一個分割參數,所述一個或多個處理器進一步被配置為使用所述至少一個分割參數對具有所述字符串的所述圖像進行分割,所述一個或多個處理器進一步被配置為確定所產生的分割是否滿足一個或多個標準,並且如果所產生的分割滿足所述一個或多個標準,則所述一個或多個處理器進一步被配置為選擇所述至少一個分割參數,所述一個或多個處理器進一步被配置為在所述一個或多個計算裝置顯示所述圖像的至少一部分。
16.根據權利要求15所述的計算系統,還包括: 使用所述一個或多個計算裝置顯示與所述分割相關的用戶可選的選項,所述用戶可選的選項被配置為允許用戶指出正確的分割或錯誤的分割。
17.根據權利要求15所述的計算系統,還包括: 使用所述一個或多個計算裝置顯示用戶可選的選項,所述用戶可選的選項被配置為允許用戶手動生成經手動產生的分割。
18.根據權利要求15所述的計算系統,還包括: 使用所述一個或多個計算裝置顯示所產生的所述分割。
19.根據權利要求15所述的計算系統,還包括: 使用所述一個或多個計算裝置顯示所述至少一個分割參數。
20.根據權利要求19所述的計算系統,其中,所述至少一個分割參數包括一個或多個極性、行細化、角度搜索範圍、傾斜搜索範圍、標準化模式、筆劃寬度、二值化閾值、邊界片段、像素數、片段對比度閾值、字符高度、字符寬度、字符間間隔、字符內間隔、與主行相距的片段距離、片段合併模式、最小字符縱橫比、字符寬度類型、分析模式、節距度量、節距類型、最小節距、空白插入、空白字符的寬度。
【文檔編號】G06K9/20GK103778422SQ201310485567
【公開日】2014年5月7日 申請日期:2013年10月16日 優先權日:2012年10月17日
【發明者】阿里·扎德, 約翰·佩特裡, 金·瑪麗·施泰納, 史蒂文·派屈克·舒曼 申請人:柯耐克斯公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀