用於識別光學字符的系統和方法
2023-08-04 09:02:41
專利名稱:用於識別光學字符的系統和方法
技術領域:
本發明總的構思涉及光學字符識別(OCR),具體上涉及一種用於通過減 少獲得OCR文件的現有複雜操作的數量而識別光學字符(optical character)以 優化OCR功能的使用的系統和方法。
背景技術:
近來,隨著數字文件變得更加重要,已經增加了光學字符識別的必要性。 OCR功能方便地將大量的文件轉換為數字文件。即,OCR功能是其中通過計 算機來識別列印或者手寫的字符並且將其存儲在計算機中的功能。OCR功能 伴隨諸如掃描文本、 一次一個字符地分析文本、以及將字符圖像轉換為字符 代碼(如ASCII之類)的操作,以便可以執行一般的數據處理。
現在說明OCR的操作。
首先,執行OCR功能。其次,設置掃描驅動程序。第三,使用掃描驅動 程序來掃描列印件,由此獲得圖像。第四,分析所述圖像並且將其轉換為OCR 文件。第五,修改OCR文件的布局。第六,將經修改的OCR文件轉換為所 需要的文件格式(例如MS-Word的格式)。第七,執行對應於所述文件格式 的應用程式(例如MS-Word)。第八,使用相應的應用程式來打開經轉換的 OCR文件,並且修改必要的事項。
但是,如上所述,存在不便之處應當執行多個操作以便獲得OCR文件。 另外,因為僅僅在新文件中產生OCR文件,因此當用戶在諸如MS-Word之 類的應用程式中利用預先存在的文件工作的同時要插入OCR文件時,必須執 行複雜的操作,諸如執行附加的相應應用程式,並且然後打開和編輯OCR文 件。在使用傳統的光學字符識別系統和方法的過程中也存在不便。
發明內容
本發明總的構思提供了 一種用於識別光學字符的系統及方法,在所述系
統和方法中,最小化了用於獲得OCR列印件的現有複雜操作的數量。
本發明總的構思的其他方面和優點將部分地在後面的說明中給出,並且 部分地由所述說明而顯而易見,或者可以通過對本發明總的構思的實踐來了解。
本發明總的構思的上述和/或其他方面以及效果可以通過提供一種用於 識別光學字符的系統來實現,所述系統包括光學字符識別(OCR)單元,用 於執行OCR;以及具有用於驅動OCR單元的驅動模塊的應用組件。
本發明總的構思的上述和/或其他方面以及效果也可以通過提供一種用 於在具有驅動^^莫塊的應用組件中識別光學字符的方法來實現,其中所述驅動 模塊用於驅動光學字符識別(OCR)單元以執行OCR,所述方法包括使用所 述驅動模塊來驅動OCR單元。
本發明總的構思的上述和/或其他方面以及效果也可以通過提供一種使 用光學字符識別(OCR)單元來識別光學字符的方法而實現,所述方法包括 通過設置信息輸入模塊來接收設置信息;通過使用驅動模塊來驅動OCR單元 以識別由OCR單元讀取的文件上的數據;通過使用應用組件來讀取被讀入到 OCR單元的數據;以及操縱由所述應用組件讀取的數據。
本發明總的構思的上述和/或其他方面以及效果也可以通過提供一種用 於識別光學字符的系統來實現,所述系統包括光學字符識別(OCR)單元, 用於接收文件和對所述文件執行OCR功能;驅動模塊,用於指令所述OCR 單元執行OCR功能;以及應用組件,其具有設置信息輸入模塊,用於驅動驅 動模塊。
通過下面結合附圖對實施例所做的詳細說明,本發明總的構思的這些和/ 或其他方面以及優點將變得更加清楚和更容易明白,其中
圖1是圖解根據本發明總的構思的一個實施例的、用於識別光學字符的 系統的方框圖2圖解了用於識別在應用組件上顯示的光學字符的模塊的一個示例;
和
圖3是圖解根據本發明總的構思的一個實施例的、用於識別光學字符的 方法的流程圖。
具體實施例方式
現在詳細說明本發明總的構思的實施例,其示例被圖解在附圖中,其中, 在全部附圖中,類似的附圖標號表示類似的元件。通過參見附圖來說明所述 實施例,以便解釋本發明總的構思。
圖1是圖解按照本發明總的構思的一個實施例的用於識別光學字符的系
統的方框圖。在圖1中圖解的用於識別光學字符的系統包括應用組件ioo和
OCR單元200。在此,應用組件100包括處理字符的應用程式,諸如MS-Word。 應用組件100包括驅動模塊110,用於驅動OCR單元200。在此,驅動模塊 110指令OCR單元200在應用組件100上執行OCR功能。具體上,驅動模 塊110使用插件來驅動OCR單元200。插件是向較大的系統增加特定特徵或 者服務的硬體或者軟體模塊,具體上,如果一個應用組件在一個功能上欠缺, 則可以通過連接程序來加強它以補充所述欠缺的功能。在此,所述插件使得 應用組件100能夠通過使用驅動模塊來驅動OCR單元200,然後產生由OCR 單元200執行的OCR功能。
驅動模塊110^L^示為在應用組件100的模塊上的圖標。圖2圖解了用 於指示在應用組件上的光學字符的應用組件100的模塊的示例。在圖2中圖 解的應用組件的附圖標號300表示用於表示驅動模塊110的圖標。如果在圖 2中選擇了用於表示驅動模塊110的圖標300,則通過所選擇的驅動模塊110 來驅動OCR單元200。
應用組件100可以包括設置信息輸入模塊120,其中向所述設置信息輸 入模塊輸入OCR的設置信息。設置信息輸入模塊120顯示對話窗口,其中通 過所述對話窗口來輸入操作OCR所需要的設置信息。設置信息輸入模塊120 通過所顯示的對話窗口來識別由用戶輸入的設置信息。通過設置信息輸入模 塊120的設置信息包括關於掃描解析度、用於識別字符的語言的類型和是否 顯示除所檢測的字符之外的圖像的信息。使用關於掃描解析度的信息來設置 表示將以特定解析度來掃描要掃描的文件的設置信息,使用關於用於識別字 符的語言的類型的信息來指令用戶指定將如何識別要掃描的文件、將使用哪 些字符和諸如英語、韓語、日語、漢語、法語和德語之類的語言的類型。是 否顯示除所檢測的字符之外的圖像是用於設置是僅僅顯示所檢測的字符還是 顯示所檢測的字符和圖像的信息。
設置信息輸入模塊120也被表示為在應用組件100上的圖標。在圖2中 圖解的應用組件的附圖標號310表示用於表示設置信息輸入模塊120的圖標。 如果選擇了在圖2中圖解的設置信息輸入模塊120的圖標,則顯示將通過其 來輸入設置信息的對話窗口 ,並且通過所述對話窗口的設置信息被識別為 OCR的設置信息。
OCR單元200對包括關於列印或者手寫字符的信息的文件執行OCR功 能。OCR單元200由在應用組件100上的驅動模塊來驅動,並且執行OCR 功能。OCR單元200可以按照通過設置信息輸入模塊120而設置的設置信息 來執行掃描列印件、分析掃描結果、以及將字符圖像轉換為諸如ASCII碼之 類的字符代碼的操作,以便可以執行數據處理。OCR單元200然後向應用組 件100發送已經被執行OCR功能的數據。
應用組件100讀取已被執行OCR功能的數據,將所識別的數據轉換為兼 容於應用組件100的形式,並且在應用組件100的屏幕上顯示所轉換的數據。 用戶可以編輯所顯示的數據,或者可以通過列印裝置來列印所顯示的lt據。
現在將參照圖3來說明用於識別光學字符的方法。
圖3是圖解根據本發明總的構思的一個實施例的用於識別光學字符的方 法的流程圖。在步驟400,在具有設置信息輸入;f莫塊120(其中向其輸入用於 識別光學字符的設置信息)的應用組件100中,通過設置信息輸入模塊120來 輸入設置信息,設置信息輸入模塊120顯示對話窗口,其中在其上輸入OCR 所需的設置信息。設置信息輸入模塊120通過所顯示的對話窗口來識別由用 戶輸入的設置信息。可以通過設置信息輸入模塊120輸入的設置信息包括掃 描解析度和用於識別字符的語言的類型,在執行了步驟400後,在具有用於 驅動OCR單元200以執行OCR功能的驅動模塊的應用組件100中,在步驟 402由所述驅動模塊來驅動OCR單元200。具體上,使用插件來驅動OCR單 元200。更具體而言,應用組件IOO使用驅動模塊來驅動OCR單元200,以 便提供由OCR單元200執行的OCR功能。在執行了步驟402後,應用組件 100在步驟404讀取由OCR單元200識別的數據。在應用組件100的屏幕上 顯示所讀取的ll據,並且用戶可以編輯或者列印所顯示的lt據。
本發明總的構思也可以體現為在計算機可讀記錄介質上的計算機可讀代 碼。所述計算機可讀記錄介質是可以存儲數據的任何數據存儲裝置,所述數 據其後可以由計算機系統讀取。所述計算機可讀記錄介質的示例包括只讀存
儲器(ROM)、隨機存取存儲器(RAM)、 CD-ROM、磁帶、軟盤、光學數據存 儲器和栽波(諸如通過網際網路的數據傳輸)。所述計算機可讀記錄介質也可以分 布在網絡耦接的計算機系統上,以便以分布方式來存儲和執行所述計算機可 讀代碼。而且,本發明所屬的領域內的熟練程式設計師可以容易地分析用於實現 本實施例的功能程序、代碼和代碼段。
如上所述,在根據本發明總的構思的用於識別光學字符的所述系統和方 法中,最小化了用於獲得OCR文件的現有複雜操作的數量,以便增加使用 OCR單元的用戶方便性。
雖然已經示出和說明了本發明總的構思的一些實施例,但是本領域內的 技術人員可以明白,可以在不脫離本發明總的構思的原理和精神的情況下在 這些實施例中進行改變,在所附權利要求書及其等價內容中限定本發明總的 構思的範圍。
本申請要求於2006年6月30日在韓國知識產權局提交的韓國專利申請 第10-2006-0060684號的優先權,其公開通過引用被整體包含在此。
權利要求
1.一種用於識別光學字符的系統,所述系統包括光學字符識別OCR單元,用於執行OCR;以及具有用於驅動所述OCR單元的驅動模塊的應用組件。
2. 按照權利要求l的系統,其中,所述驅動模塊通過使用插件來驅動所 述OCR單元。
3. 按照權利要求l的系統,其中,所述驅動模塊被表示為在所述應用組 件上的圖標。
4. 按照權利要求l的系統,其中,所述應用組件還包4封殳置信息輸入模 塊,其中向其輸入OCR的設置信息。
5. 按照權利要求4的系統,其中,所述設置信息輸入模塊被表示為在所 述應用組件上的圖標。
6. 按照權利要求1的系統,其中,所述應用組件轉換和指示由所述OCR 單元識別的數據。
7. —種用於在具有驅動模塊的應用組件中識別光學字符的方法,其中所 述驅動模塊用於驅動光學字符識別OCR單元以執行OCR,所述方法包括 使用所述驅動^f莫塊來驅動所述OCR單元。
8. 按照權利要求7的方法,其中,通過使用插件來驅動所述OCR單元。
9. 按照權利要求7的方法,還包括使用在具有設置信息輸入模塊的應 用組件中的所述設置信息輸入模塊來輸入設置信息,其中向所述設置信息輸 入模塊輸入OCR的設置信息。
10. 按照權利要求7的方法,還包括轉換和指示由所述OCR單元識別 的數據。
11. 一種計算機可讀記錄介質,其上記錄有程序,所述程序用於執行下 述方法,所述方法用於在具有用於驅動光學字符識別OCR單元以執行OCR 的驅動模塊的應用組件中識別光學字符,所述方法包括使用所述驅動模塊 來驅動所述OCR單元。
12. —種用於使用光學字符識別OCR單元來識別光學字符的方法,所述 方法包括通過設置信息輸入模塊來接收設置信息; 通過^f吏用驅動才莫塊來驅動所述OCR單元以識別由所述OCR單元讀取的 文件上的數據;通過使用應用組件來讀取被讀入到所述OCR單元中的數據;以及操縱由所述應用組件讀取的數據。
13. —種用於識別光學字符的系統,所述系統包括光學字符識別OCR單元,用於接收文件和對於所述文件執行OCR功能;驅動模塊,用於指令所述OCR單元執行OCR功能;以及應用組件,具有設置信息輸入模塊,用於驅動所述驅動模塊。
全文摘要
一種用於識別光學字符的系統和方法。所述用於識別光學字符的系統包括光學字符識別(OCR)單元,用於執行OCR;以及應用組件,具有用於驅動OCR單元的驅動模塊。因此,可以最小化用於獲得OCR列印件的複雜操作的數量。
文檔編號G06K9/20GK101097518SQ200710005900
公開日2008年1月2日 申請日期2007年2月28日 優先權日2006年6月30日
發明者金養文 申請人:三星電子株式會社