使用照相機自動調整字符大小的裝置和方法
2023-10-30 14:06:57 4
專利名稱:使用照相機自動調整字符大小的裝置和方法
技術領域:
本發明一般涉及使用照相機的字符識別,具體地說,涉及一種通過調整由照相機
接收的圖像中的字符大小來優化用戶視圖的裝置和方法。
背景技術:
基於照相機的光學字符識別(OCR)可以分為快照OCR(基於要被拍攝圖像的視圖 的OCR)和預覽OCR(基於預覽圖像或取景器圖像的OCR)。在快照OCR中,根據與用於獲取 拍攝圖像的通常方法相同的方法來獲取圖像。圖像獲取過程順次包括通過照相機拍攝所 希望的字符;對所拍攝的字符執行字符識別處理;以及向輸出單元輸出識別結果。
與之相反地,在預覽OCR中,以預設的每秒幀(FPS)速度輸入圖像。因此,在預覽 OCR中,字符識別可實時進行。通常,預覽OCR的圖像獲取過程包括由用戶通過照相機掃 描字符;以及利用照相機中的識別器對通過照相機接收的圖像連續執行識別操作。
快照OCR和預覽OCR之間最大的區別在於要被識別圖像的解析度。預覽OCR識別 四分之一視頻圖形陣列(QVGA ;320X240)的小圖像以用於實時識別,而快照OCR識別1兆 像素或更多像素的圖像,因此比預覽OCR需要更長的識別時間。由於高解析度圖像的使用, 快照OCR在字符識別能力上遠優於預覽OCR。近來,隨著照相機性能的提高以及精確識別變 得越來越重要,快照OCR已經變得比預覽OCR運用得更廣泛。 快照OCR可以識別輸入圖像中的所有字符或者輸入圖像中的所有字符中與特定 區域對應的字符。因此,用戶可以對在照相機的液晶顯示(LCD)屏幕上顯示的圖像執行全 面識別,或者對指定的特定區域執行部分識別。
圖1圖示了識別圖像中的字符的傳統過程。 在步驟101中,移動終端使用照相機模塊接收帶有字符的圖像。在步驟103中,該 移動終端可以使用自動聚焦(Auto-Focus)技術從所接收的圖像中獲取聚焦圖像。在步驟 105中,該移動終端在分離存儲器中存儲所獲取的聚焦圖像。在步驟107中,該移動終端識 別所存儲的圖像中的字符。該移動終端可識別圖像中的所有字符或者僅僅識別由用戶選擇 的圖像的區域中的字符。在步驟109中,該移動終端在其顯示器上顯示識別結果。
與傳統的名片(name-card)識別不同,因為快照OCR對用戶所希望的可識別距離 沒有限制,所以輸入圖像中的字符可以改變大小。例如,當在LCD上重新調整其中以不同方 式包含很大字符和很小字符的圖像的大小時,所顯示的字符的大小也與實際圖像成比例地 顯得很小和很大。在LCD上顯示的字符的過於大或過於小的大小可能降低識別效率或導致 識別失敗。
發明內容
本發明的一個方面是解決至少上面所提及的問題和/或缺點,並且提供至少以下 所述的優點。因此,本發明的一個方面提供這樣一種裝置和方法,當圖像中的字符大小沒有 落入預定範圍內時,使用照相機的縮放(zoom)功能自動調節縮放比來優化圖像中的字符大小。 根據本發明的一個方面,提供了一種使用照相機來自動調整字符大小的方法。該 方法包括接收包含字符的圖像;調整圖像的焦距並檢測圖像中的字符的區域和大小;確 定圖像中的字符大小是否落入預設範圍;如果字符大小落入預設範圍,則識別圖像中的字 符並顯示識別結果;以及如果字符大小沒有落入預設範圍內,則自動調整圖像的縮放比並 識別重新調整大小後的圖像中的字符。 根據本發明的另一方面,提供了一種使用照相機自動調整字符大小的裝置。該裝 置包括照相機模塊,用於接收包含字符的圖像,發送所接收的圖像,並且如果字符大小沒 有落入預設範圍內,則自動調整縮放比;識別器模塊,用於在發送從照相機模塊接收的圖像 之後,發送所接收的字符識別結果;光學字符識別(OCR)識別引擎模塊,用於確定在從識別 器模塊接收的圖像中的字符大小是否落入預設範圍內;和字典模塊,用於提供從識別器模 塊接收的所識別字符的字典定義。
通過下面結合附圖進行的描述,本發明的一些實施例的上述和其它方面、特徵和 優點將變得更加明顯,其中 圖1是圖示識別圖像中的字符的傳統過程的流程圖; 圖2是圖示根據本發明的實施例的用於識別字符的移動終端的內部結構的示意 圖; 圖3是圖示根據本發明的實施例的識別圖像中的字符的過程的流程圖;並且
圖4和圖5是圖示根據本發明的實施例的使用縮放功能放大圖像中的字符大小的 過程的流程圖。
具體實施例方式
提供在說明書中限定的主題、諸如詳細結構和元件用於幫助全面理解本發明的實 施例。因此,本領域普通技術人員應該認識到,在不背離本發明的範圍和精神的情況下,可 以對此處所描述的實施例做出各種變化和變型。而且,為了清晰和簡明起見,省略了對公知 功能和結構的描述。 因為用於識別圖像中的字符的傳統移動終端對用戶所希望的可識別距離沒有限 制,所以輸入圖像中過於大或過於小大小的字符在字符識別過程中可能不能被正確識別 出。為了解決這些和其它問題和/或缺點,本發明提供一種通過縮放功能接收具有適當大 小的字符的圖像的裝置和方法,用於這些字符準確識別。通過描述本發明的一些實施例,本 發明的特徵會更加清楚。 圖2圖示根據本發明的一個實施例的用於識別字符的移動終端的內部結構。該移 動終端包括識別器模塊207、 OCR識別引擎模塊209、照相機模塊201、顯示模塊203和字典 模塊205。 參考圖2,類似於照相機的字符識別,作為用於控制被稱為快照OCR的應用的整體 操作的模塊的識別器模塊207主要發起和終止用於識別圖像中的字符的應用。根據本發明 的一個實施例,識別器模塊207實現預識別,包括調整從照相機模塊201接收的圖像的大小,以用於圖像中的字符的識別。 OCR識別弓I擎模塊209從識別器模塊207接收具有字符的圖像,對所接收的圖像執 行字符識別,並且將識別結果發送回識別器模塊207。關於用於識別字符的標準,OCR識別 引擎模塊209確定字符大小是否落入可識別字符大小的預設範圍內,並將確定結果發送回 識別器模塊207。 照相機模塊201通過驅動和控制照相機來接收具有字符的圖像。在接收圖像的過 程中,照相機模塊201使用自動聚焦功能來捕獲清晰圖像,並且如果圖像中的字符大小過 於大或者過於小,則使用縮放功能來捕獲具有用戶希望大小的字符的圖像。自動聚焦是用 於增加圖像識別率的重要功能,其用來提高輸入圖像的解析度。 顯示模塊203在屏幕上輸出照相機預覽圖像、拍攝圖像和字符識別結果中的至少 一個。 字典模塊205基於字典搜索界面功能提供由OCR識別引擎模塊209識別的字符的
字典定義。字典模塊205中的各種信息被存儲在移動終端中的資料庫(DB)中。然而,如果
移動終端的DB中沒有存儲所需信息,則字典模塊205可以從伺服器中的DB接收所需信息。
將在下面描述使用前述結構來識別圖像中的字符的過程。 圖3圖示根據本發明實施例的識別圖像中的字符的過程。 參考圖3,在步驟301中,移動終端使用照相機模塊接收具有字符的圖像。所接收 的圖像可以被顯示以便用戶觀看。在步驟303中,移動終端通過使用自動聚焦技術調整所 接收的圖像的焦點來獲取聚焦圖像。在步驟305中,移動終端通過字符大小測量器來檢測 所獲取的圖像內的字符區域,然後通過使用閾值沿X和Y軸檢測字符存在於其上的線來檢 測字符區域內的字符大小,並且計算該線上的字符的平均大小。 在步驟307中,移動終端將所測量的字符大小與可識別字符大小的預設範圍進行 比較,並且確定所測量的字符大小是否落入可識別字符大小的範圍內。如果所測量的字符 大小沒有落入該範圍內,則在步驟309中移動終端自動調整縮放比或縮放幅度,以使得所 測量的字符大小落入該範圍內,然後接收調整大小後的圖像。執行步驟309後,該方法返回 到步驟303,其中移動終端調整縮放圖像的焦點,然後重新執行步驟305中的字符區域和大 小檢測。 如果在步驟307中所測量的字符大小落入可識別字符大小的範圍內,則在步驟 311中,移動終端存儲圖像,以用於精確的字符識別。在步驟313中,移動終端識別所存儲的 圖像中的字符,並且在步驟315中在顯示器上顯示與用戶期望的信息對應的識別結果。
在圖3中,當所測量的字符大小沒有落入可識別字符大小的範圍內時,字符大小 可能過於大或過於小。當字符大小過於大時,移動終端可簡單地減小縮放比並且接收調整 大小後的圖像。但是,如果字符大小過於小並且縮放比已經增加到最大縮放比,則增加後的 字符大小可能仍未落入可識別字符大小範圍內。在這種情況下,可以如下識別圖像中的字 符。 圖4和圖5圖示根據本發明實施例使用縮放功能放大圖像中的字符大小的過程。 作為示例,圖4圖示用於僅僅支持光學縮放功能的移動終端的方法,而圖5圖示用於支持光 學縮放功能和數字圖像縮放功能二者的移動終端的方法。在圖4和圖5中,移動終端首先 使用光學縮放功能,其不會影響圖像質量。在圖5中,當移動終端僅僅利用光學縮放功能不
6能識別字符時,移動終端使用數字圖像縮放功能。 參考圖4,在步驟401中,移動終端使用照相機模塊接收具有字符的圖像。所接收 的圖像可以被顯示以便用戶觀看。在步驟403中,移動終端使用自動聚焦技術通過調整所 接收的圖像的焦點來獲取聚焦圖像。在步驟405中,移動終端通過字符大小測量器來從所 獲取的圖像中檢測字符區域,然後檢測字符區域內的字符大小。 在步驟407中,移動終端確定檢測到的字符大小是否大於可區分字符的預定最小 大小。如果所測量的字符大小大於該最小大小,則在步驟409中,移動終端存儲圖像以用於 精確的字符識別,在步驟411中,識別所存儲的圖像中的字符,並且在步驟413中在顯示器 上顯示與用戶期望的信息對應的識別結果。 然而,如果在步驟407中所測量的字符大小小於最小可區分字符大小,則在步驟 415中,移動終端自動調整縮放比。在步驟417中,移動終端確定調整後的縮放比是否是最 大縮放比。如果調整後的縮放比不是最大縮放比,則在步驟419中,移動終端重新接收以調 整後的縮放比放大的圖像。然而,如果調整後的縮放比是最大縮放比,則因為移動終端不能 進一步增加縮放比,從而移動終端不能識別所檢測的字符。因此,在步驟421中,移動終端 在輸出單元或者顯示器上對用戶顯示手動動作請求消息,向用戶通知無法區分當前位置處 的所檢測的字符。在這種情況下,用戶可通過將移動終端移動得靠近具有字符的目標來獲 取期望的字符大小。 參考圖5,在步驟501中,移動終端使用照相機模塊接收具有字符的圖像。所接收 的圖像可被顯示以便用戶觀看。在步驟503中,移動終端使用自動聚焦技術通過調整所接 收的圖像的焦點來獲取聚焦圖像。在步驟505中,移動終端通過字符大小測量器從所獲取 的圖像中檢測字符區域,然後檢測字符大小。 在步驟507中,移動終端確定檢測到的字符大小是否大於可區分字符的預定最小 大小。如果所測量的字符大小大於該最小大小,則在步驟509中,移動終端存儲圖像以用於 精確的字符識別。在步驟511中,移動終端識別所存儲的圖像中的字符,並且在步驟513中, 在它的顯示器上顯示與用戶所期望的信息對應的識別結果。 如果在步驟507中所測量的字符大小小於最小可區分字符的大小,則在步驟515 中移動終端自動調整縮放比。在步驟517中,移動終端確定調整後的縮放比是否是最大縮 放比。如果調整後的縮放比不是最大縮放比,則在步驟519中,移動終端重新接收以調整後 的縮放比放大的圖像。然而,如果調整後的縮放比是最大縮放比,則在步驟521中移動終端 向用戶提供指示字符大小對於識別來說太小的消息,並且存儲該圖像。該消息被顯示在移 動終端的輸出單元或顯示器上。在步驟523中,移動終端使用數字圖像縮放功能放大與所 存儲的圖像中的字符對應的區域。此後,在步驟509中,移動終端使用圖像縮放識別放大圖 像中的字符,並且在步驟513中顯示識別結果。 通過前面所述顯而易見的是,本發明的實施例可以最優圖像中的字符大小,使得 用戶能夠容易地對LCD上的圖像中的字符執行區分和識別操作,因此增加了字符識別率。
儘管已經參照本發明的一些實施例示出並描述了根據本發明的使用照相機來調 整字符大小的裝置和方法,但是本領域技術人員應當明白,在不背離由所附權利要求及其 等價物限定的本發明的精神的範圍的情況下,可以在這裡做出各種形式上和細節上的改 變。
權利要求
一種使用照相機自動調整字符大小的方法,包括接收包含字符的圖像;調整所述圖像的焦點並且檢測所述圖像中的字符的區域和大小;確定所述圖像中的字符大小是否落入預設範圍內;如果所述字符大小落入預設範圍內,則識別所述圖像中的字符並且顯示識別結果;以及如果所述字符大小沒有落入預設範圍內,則自動調整所述圖像的縮放比並且識別調整大小後的圖像中的字符。
2. 如權利要求1所述的方法,其中,接收圖像的步驟包括使用自動聚焦技術來調整所 述圖像的焦點。
3. 如權利要求1所述的方法,其中,調整焦點包括 沿X和Y軸檢測圖像中的字符存在於其上的線;並且其中,檢測字符的區域和大小的步驟包括通過計算在所述線上的字符的高度和長度來 檢測字符的區域和大小。
4. 如權利要求1所述的方法,其中,如果所述字符大小沒有落入預設範圍內,則識別字 符的步驟包括如果字符大小大於可識別字符大小範圍的上限,則自動減小縮放比並重新獲取調整大 小後的圖像;禾口如果字符大小小於可識別字符大小範圍的下限,則自動增加縮放比並重新獲取調整大 小後的圖像。
5. 如權利要求l所述的方法,進一步包括如果字符大小小於預設範圍的下限,並且如 果補償所述圖像所需的縮放比高於最大縮放比,則向用戶提供手動動作請求消息。
6. 如權利要求1所述的方法,進一步包括如果字符大小小於預設範圍的下限,並且如果補償所述圖像所需的縮放比高於最大縮 放比,則產生用戶通知用於告知用戶字符大小對於識別來說太小,並且顯示圖像。 使用數字圖像縮放功能放大與所存儲的圖像中的字符對應的區域;禾口 識別放大區域中的字符並顯示識別結果。
7. 如權利要求6所述的方法,其中,產生所述通知的步驟包括輸出指示字符大小對於 識別來說太小的消息。
8. —種使用照相機自動調整字符大小的裝置,包括照相機模塊,用於接收包含字符的圖像,發送所接收的圖像,以及如果字符大小沒有落 入預設範圍內則自動調整縮放比;識別器模塊,用於在發送從所述照相機模塊接收到的圖像之後發送接收到的字符識別 結果;光學字符識別(OCR)識別引擎模塊,用於確定從所述識別器模塊接收的圖像中的字符 大小是否落入預設範圍內;禾口字典模塊,用於提供從所述識別器模塊接收到的識別字符的字典定義。
9. 如權利要求8所述的裝置,進一步包括顯示模塊,用於在屏幕上輸出照相機預覽圖 像、拍攝圖像、以及字符識別結果中的至少一個。
10. 如權利要求8所述的裝置,其中,所述照相機模塊使用自動聚焦技術來調整所接收 的圖像的焦點。
11. 如權利要求8所述的裝置,其中,所述識別器模塊發起和終止用於執行字符識別 的模式,並基於從所述OCR識別引擎模塊接收的縮放比調整信號來調整照相機模塊的縮放 比。
12. 如權利要求11所述的裝置,其中,如果字符大小沒有落入預設範圍內,則所述OCR 識別弓I擎模塊向所述識別器模塊發送縮放比調整信號。
全文摘要
提供了一種使用照相機自動調整字符大小的方法。該方法包括接收具有字符的圖像;調整具有字符的圖像的焦點並且檢測所述圖像中的字符的區域和大小;確定所述圖像中的字符大小是否落入預設範圍內;如果所述字符大小落入預設範圍內,則識別所述圖像中的字符並且顯示識別結果;以及如果所述字符大小沒有落入預設範圍內,則自動調整所述圖像的縮放比並且識別調整大小後的圖像中的字符。
文檔編號H04N5/232GK101753846SQ20091100005
公開日2010年6月23日 申請日期2009年12月7日 優先權日2008年12月5日
發明者吳尚昱, 金尚鎬, 金成喆, 金玄水, 黃星澤 申請人:三星電子株式會社