新四季網

識別設備和識別方法

2023-07-17 19:25:06 2

專利名稱:識別設備和識別方法
技術領域:
本發明涉及識別處理,更具體地說,本發明涉及一種識別設備和識別方法,其能夠 更加準確地進行識別處理。
背景技術:
在識別圖像時,尤其是識別例如手寫漢字圖像時,因為手 寫的漢字往往會出現連 筆的情況,識別非常困難。因此有必要提高識別的準確度。

發明內容
鑑於上述情況,本發明提出一種識別設備及其識別方法,其能夠更加準確地進行 識別處理。根據本發明的一個方面,提供一種識別設備,該識別設備包括第一識別裝置,被 配置為對第一圖像進行識別,以得到第一圖像識別結果;第二識別結果預選裝置,被配置為 根據所述第一圖像識別結果確定候選第二圖像識別結果;和第二識別裝置,被配置為基於 候選第二圖像識別結果對第二圖像進行識別,以得到第二圖像識別結果。上述第一圖像與 所述第二圖像具有對應關係。可選地,第二圖像是字符圖像,第一圖像是該字符圖像對應的注音圖像,並且注音 圖像包括一個或多個注音元素圖像,第一識別裝置被配置為對注音圖像進行識別以得到一 個或多個候選注音,第二識別結果預選裝置被配置為基於候選注音確定一個或多個候選字 符,並且第二識別裝置被配置為基於候選字符對字符圖像進行識別。可選地,上述第一識別裝置包括注音元素識別單元,被配置為基於注音元素集對 注音圖像中的每個注音元素圖像進行識別,以得到針對每個注音元素圖像的一個或多個候 選注音元素;注音元素組合單元,被配置為針對每個注音元素圖像選取任一個候選注音元 素進行組合以得到一個或多個注音元素組合;和候選注音確定單元,被配置為從注音元素 組合中選擇合法的注音作為候選注音。可選地,注音元素識別單元被配置為計算注音元素集中的每個注音元素相對於注 音元素圖像的相似度,並從注音元素集中選取所有的相似度高於或等於預定閾值的注音元 素作為候選注音元素,或者從注音元素集中選取預定數目的注音元素作為候選注音元素, 該預定數目的注音元素的相似度高於或等於注音元素集中的其他注音元素的相似度。可選地,注音元素識別單元還被配置為根據注音元素圖像在注音圖像中的位置而 在識別該注音元素圖像時從注音元素集中去除不合法的注音元素。可選地,候選注音確定單元還被配置為將合法的注音所對應的容錯注音作為候選 注音。可選地,第二識別裝置被配置為計算每個候選字符相對於字符圖像的相似度。可選地,第二識別裝置還被配置為從候選字符中選取所有的相似度高於或等於預 定閾值的候選字符作為字符圖像的識別結果,或者從候選字符中選取預定數目的候選字符作為字符圖像的識別結果,該預定數目的候選字符的相似度高於或等於其他候選字符的相 似度。 可選地,第二識別裝置還被配置為將候選注音的每個注音元素的相似度進行結合 以得到候選注音的相似度,將候選注音的相似度與對應的候選字符的相似度相結合以得到 候選字符的結合相似度,並且選取所有的結合相似度高於或等於預定閾值的候選字符作為 字符圖像的識別結果,或者選取預定數目的候選字符作為字符圖像的識別結果,該預定數 目的候選字符的結合相似度高於或等於其他候選字符的結合相似度。可選地,候選注音確定單元被配置為將合法的注音中的每個注音元素的相似度相 結合以得到合法的注音的相似度,並選取所有的相似度高於或等於預定閾值的合法的注音 作為候選注音,或者選取預定數目的合法的注音作為候選注音,該預定數目的合法的注音 的相似度高於或等於其他合法的注音的相似度。可選地,第二識別裝置被配置為將由第一識別裝置的候選注音確定單元所得到的 候選注音的相似度與對應的候選字符的相似度相結合以得到候選字符的結合相似度,並且 選取所有的結合相似度高於或等於預定閾值的候選字符作為字符圖像的識別結果,或者選 取預定數目的候選字符作為字符圖像的識別結果,該預定數目的候選字符的結合相似度高 於或等於其他候選字符的結合相似度。可選地,第一識別裝置和第二識別裝置是同一裝置。根據本發明的另一個方面,提供了一種識別方法,該方法包括對第一圖像進行識 另|J,以得到第一圖像識別結果;根據第一圖像識別結果確定候選第二圖像識別結果;和基 於候選第二圖像識別結果對第二圖像進行識別,以得到第二圖像識別結果;其中,第一圖像 與第二圖像具有對應關係。可選地,第二圖像是字符圖像,第一圖像是該字符圖像對應的注音圖像,並且注音 圖像包括一個或多個注音元素圖像,對第一圖像進行識別的步驟包括對注音圖像進行識別 以得到一個或多個候選注音,確定候選第二圖像識別結果的步驟包括基於候選注音確定一 個或多個候選字符,並且對第二圖像進行識別的步驟包括基於候選字符對字符圖像進行識 別。可選地,對第一圖像進行識別的步驟包括基於注音元素集對注音圖像中的每個 注音元素圖像進行識別,以得到針對每個注音元素圖像的一個或多個候選注音元素;針對 每個注音元素圖像選取任一個候選注音元素進行組合以得到一個或多個注音元素組合;以 及從注音元素組合中選擇合法的注音作為候選注音。可選地,對注音元素圖像進行識別的步驟包括計算注音元素集中的每個注音元 素相對於注音元素圖像的相似度;以及從注音元素集中選取所有的相似度高於或等於預定 閾值的注音元素作為候選注音元素,或者從注音元素集中選取預定數目的注音元素作為候 選注音元素,該預定數目的注音元素的相似度高於或等於注音元素集中的其他注音元素的 相似度。可選地,對注音元素圖像進行識別的步驟還包括為根據注音元素圖像在注音圖像 中的位置而在識別該注音元素圖像時從注音元素集中去除不合法的注音元素。可選地,選擇合法的注音作為候選注音的步驟還包括將合法的注音所對應的容錯 注音作為候選注音。
可選地,對第二圖像進行識別的步驟包括計算每個候選字符相對於字符圖像的相 似度。 可選地,對第二圖像進行識別的步驟還包括選取所有的相似度高於或等於預定閾 值的候選字符作為字符圖像的識別結果,或者選取預定數目的候選字符作為字符圖像的識 別結果,該預定數目的候選字符的相似度高於或等於其他候選字符的相似度。可選地,對第二圖像進行識別的步驟包括將候選注音的每個注音元素的相似度 進行結合以得到候選注音的相似度;將候選注音的相似度與對應的候選字符的相似度相結 合以得到候選字符的結合相似度;以及選取所有的結合相似度高於或等於預定閾值的候選 字符作為字符圖像的識別結果,或者選取預定數目的候選字符作為字符圖像的識別結果, 該預定數目的候選字符的結合相似度高於或等於其他候選字符的結合相似度。可選地,選擇合法的注音作為候選注音的步驟包括將合法的注音中的每個注音 元素的相似度相結合以得到合法的注音的相似度;以及選取所有的相似度高於或等於預定 閾值的合法的注音作為候選注音,或者選取預定數目的合法的注音作為候選注音,該預定 數目的合法注音的相似度高於或等於其他合法的注音的相似度。可選地,對第二圖像進行識別的步驟包括將在選擇合法的注音作為候選注音的 步驟中所得到的候選注音的相似度與對應的候選字符的相似度相結合以得到候選字符的 結合相似度;以及選取所有的結合相似度高於或等於預定閾值的候選字符作為字符圖像的 識別結果,或者選取預定數目的候選字符作為字符圖像的識別結果,該預定數目的候選字 符的結合相似度高於或等於其他候選字符的結合相似度。另外,本發明還提供用於實現上述識別方法的電腦程式。此外,本發明也提供至少計算機可讀介質形式的電腦程式產品,其上記錄有用 於實現上述識別方法的電腦程式代碼。本發明的實施例可以提高識別的準確度。


參照下面結合附圖對本發明實施例的說明,會更加容易地理解本發明的以上和其 它目的、特點和優點。在附圖中,相同的或對應的技術特徵或部件將採用相同或對應的附圖 標記來表示。附圖中圖1示出手寫字符及其對應的注音的示例;圖2示出可用於實現本發明的實施例的數據處理系統;圖3示出根據本發明的實施例的識別設備的框圖;圖4示出根據本發明的實施例的識別設備的第一識別裝置的框圖;圖5示出了根據本發明的實施例的識別方法;圖6示出了根據本發明的一個實施例的識別方法中對第一圖像進行識別的處理 過程; 圖7示出了根據本發明的一個實施例的識別方法中選取候選注音元素的處理過 程;圖8示出了根據本發明的一個實施例的識別方法中選取候選注音元素的處理過 程;
圖9示出了根據本發明的一個實施例的識別方法中基於候選字符識別字符圖像 的處理過程;以及圖10示出了根據本發明的一個實施例的識別方法中基於候選字符識別字符圖像 的處理過程。
具體實施例方式下面參照附圖來說明本發明的實施例。應當注意,為了清楚的目的,附圖和說明中 省略了與本發明無關的、本領域普通技術人員已知的部件和處理的表示和描述。在識別處理領域,經常會涉及對具有對應關係的兩個圖像進行識別的情況。例如, 在許多重要的中文表格例如信用卡申請表格中,對於一些重要的區域比如籤名的區域,通 常需要用戶籤署中文字符及其相應的中文拼音(下文中有時稱作注音),如圖1所示。
單獨識別手寫字符尤其是手寫中文字符非常困難,這是因為中文的手寫字符往往 會出現連筆的情況。由於這兩種類型的手寫體針對同一內容,因此為將手寫字符的識別和 對應的注音的識別相結合,從而進一步提高手寫字符的準確度提供了可能性。現在參考圖2,舉例說明可用於實現本發明的實施例的數據處理系統的框圖。數據 處理系統250使用外圍組件互聯(PCI)本地總線結構。雖然所描述的例子使用PCI總線, 其他總線結構,如微通道和ISA,也可被使用。處理器252和主內存254通過PCI橋258被 連接到PCI本地總線256。對於處理器252,PCI橋258也可包括集成的內存控制器和高速 緩存器。對PCI本地總線256的另外的連接可通過組件互聯或通過內插板來接通。在所描述的例子中,區域網(LAN)適配器260、SCSI主機總線適配器262以及擴 展總線接口 264通過組件連接被連接到PCI本地總線256。相比之下,音頻適配器266、圖 形適配器268以及音頻/視頻適配器(A/V) 269通過插入擴展槽的內插板,被連接到PCI本 地總線256。擴展總線接口 264為鍵盤和滑鼠適配器270、數據機272以及另外的內存 274提供連接。在所描述的例子中,SCSI主機總線適配器262為硬碟276、磁帶278 WD-ROM 280以及DVD 282提供連接。典型的PCI本地總線實現將支持三個或四個PCI擴展槽或內 插連接器。圖3示出了根據本發明的實施例的識別設備300的框圖。識別設備300包括第一 識別裝置302,被配置為對第一圖像進行識別,以得到第一圖像識別結果;第二識別結果預 選裝置304,被配置為根據第一圖像識別結果確定候選第二圖像識別結果;和第二識別裝 置306,被配置為基於候選第二圖像識別結果對第二圖像進行識別,以得到第二圖像識別結 果。上述第一圖像與第二圖像具有對應關係。在一個實施例中,第二圖像是字符圖像,例如圖1所示的《[^,,第一圖像是該字
—I,
符圖像對應的注音圖像,例如圖ι所示的「| y 111 υ | & | 該注音圖像包括一個或多個 注音元素圖像,例如圖1中的注音圖像包括四個注音元素圖像《[^],,U[Y] 「問,, 和《「^!,,第一識別裝置302被配置為對注音圖像進行識別以得到一個或多個候選注音。第
_I O
二識別結果預選裝置304被配置為基於候選注音確定一個或多個候選字符。第二識別裝置306被配置為基於候選字符對字符圖像進行識別。例如,第一識別裝置302可以對圖1所示 的注音圖像進行識別,得到「feng」、「ying」和「xing」等候選注音。第二識別結果預選裝置 304根據候選注音確定出「feng」所對應的「風」、「鋒」等,「ying」所對應的「應」、「英」等, 「xing」所對應的「行」、「興」等作為候選字符。第二識別裝置306可以基於上述候選字符對 字符圖像進行識別,最終得到「應」作為識別結果。在本發明的一個實施例中,第一識別裝置302對注音圖像的識別可以採用整體識 別的方法,也就是說把注音圖像作為一個整體與拼音集中的每個合法的拼音進行對比、分 類,以得出識別結果。在本發明的另一個實施例中,第一識別裝置302可以對注音圖像中的每個注音 元素圖像分別進行識別,然後再進行組合,這在如圖1所示注音圖像已經被明顯地區分為 多個注音元素圖像的情況下尤其適用。在注音圖像沒有被明確地區分為多個注音元素 圖像的情況下,可以參照發明名稱為「字符識別裝置及其字符識別方法」的專利申請CN 200910006036. X中記載的方法對各個注音元素圖像進行識別。例如,可以先確定一系列候 選切分點,根據候選切分點,將注音圖像切分為一個或多個候選注音元素切分塊。接著對每 一個候選注音元素切分塊進行單個注音元素識別,輸出一個或多個候選注音元素並給出對 應的相似度,從而形成識別樹的第一層。如果識別結果不理想,即相似度較低,而且將候選 注音元素切分塊與其前後相鄰的候選注音元素切分塊合併可能不會超出一個注音元素的 最大寬度,則對其進行合併以得到新的候選注音元素切分塊,並再次進行識別,得到新的相 似度。由此形成識別樹的第二層。上述過程可以重複進行,直到達到理想的識別結果,從而 可以得出一個或多個候選注音元素及其相似度。下面詳細地介紹第一識別裝置302在對注音圖像中的每個注音元素圖像分別進 行識別的情況下的結構和操作。在該實施例中,如圖4所示,第一識別裝置302包括注音元 素識別單元3022、注音元素組合單元3024和候選注音確定單元3026。注音元素識別單元 3022被配置為基於注音元素集對注音圖像中的每個注音元素圖像進行識別,以得到針對每 個注音元素圖像的一個或多個候選注音元素。例如,注音元素識別單元3022對圖1中的注 音圖像的第一注音元素圖像進行識別,可以得到「Y」、「X」等候選注音元素,對第二注音元 素圖像進行識別,可以得到「Ι」、「Ζ」等候選注音,對第三注音元素圖像進行識別,可以得到 「N」、「U」等候選注音,對第四注音元素圖像進行識別,可以得到「G」、「E」等候選注音。注音 元素組合單元3024被配置為針對每個注音元素圖像選取任一個候選注音元素進行組合以 得到一個或多個注音元素組合。例如,注音元素組合單元3024針對每個注音元素圖像選取 任一個候選注音進行組合,可以得到「YING」、「YINE」、「XING」等注音元素組合。候選注音確 定單元3026被配置為從注音元素組合中選擇合法的注音作為候選注音。例如,候選注音確 定單元3026從上述注音組合中選擇出「YING」和「XING」等作為候選注音。在注音元素識別單元3022對注音元素進行識別時,還可以利用相關的規律排除一些不可能的注音元素,從而提高識別準確度,並減少識別處理的計算量。在一個實施例 中,在對注音圖像的第一個注音元素圖像進行識別的時候,可以根據注音元素圖像在注音 圖像中的位置而在識別該注音元素圖像時從注音元素集中去除不合法的注音元素。例如, 在漢語拼音的情況下,在對注音圖像的第一個注音元素圖像進行識別時,可以從注音元素 集中將「V」等不可能出現的注音元素去除。
人們經常會把一些拼音混淆,例如把「feng」與「fen」混淆,把「zhang」與「zhan」 混淆等。考慮到這種情況,在本發明的一個實施例中,候選注音確定單元3026在選擇合法 的注音作為候選注音後,還把可能與候選注音混淆的其他注音(這裡將其稱為該合法的注 音所對應的容錯注音)也作為候選注音。這可以防止在書寫的拼音不準確的情況造成的漢 字識別錯誤。在本發明的一個實施例中,第一識別裝置302可以對識別出的候選注音的數量進 行限制。例如,可以計算注音集中的每個注音相對於注音圖像的相似度,並從注音集中選取 所有的相似度高於或等於預定閾值的注音作為候選注音。或者,可以從注音集中選取預定 數目的注音作為候選注音,該預定數目的注音的相似度高於或等於注音集中的其他注音的 相似度。相似度可以是概率(即將圖像識別為某結果的概率),置信度(即將圖像識別為某 結果的置信度)。另外,在圖像識別領域,也用到「距離」這個概念。在對圖像進行識別時, 可以用距離來表示相似度,距離越大,相似度越小。在實踐中,也可以取距離的倒數來表示 相似度。另外,也可以用排序來表示相似度,也就是說,在計算出概率或置信度等之後,對概 率或相似度進行排序,以序號來表示相似度,序號越大,相似度越小。在實踐中,也可以取序 號的倒數來表示相似度。對於上述相似度的具體計算方法可以採用本領域公知的方法來進 行,這裡不再詳細描述。在第一識別裝置302對注音圖像進行整體識別的情況下,注音相對於注音圖像的 相似度可以根據上面的描述容易地確定。在第一識別裝置302對注音圖像中的每個注音元素圖像分別進行識別,然後再進 行組合的情況下,注音相對於注音圖像的相似度可以是該注音的各個注音元素相對於注音 元素圖像的相似度的組合。例如,注音的相似度可以是該注音的各個注音元素的相似度的 和、加權和、平均值或者乘積等。具體地,在注音元素識別單元3022對注音元素進行識別時 可以獲得每個候選注音元素相對於注音元素圖像的相似度。候選注音確定單元3026可以 在選擇出合法的注音後,通過上述方法計算每個合法的注音的相似度。另外,注音元素識別單元3022也可以對識別出的候選注音元素的數量進行限制。 例如,注音元素識別單元3022可以計算注音元素集中的每個注音元素相對於注音元素圖 像的相似度,並從注音元素集中選取所有的相似度高於或等於預定閾值的注音元素作為候 選注音元素,或者從注音元素集中選取預定數目的注音元素作為候選注音元素,該預定數 目的注音元素的相似度高於或等於注音元素集中的其他注音元素的相似度。在本發明的一個實施例中,第二識別裝置306被配置為計算每個候選字符相對於 字符圖像的相似度。例如,第二識別裝置306可以對「feng」所對應的「風」、「鋒」等,「ying」 所對應的「應」、「英」等,「xing」所對應的「行」、「興」等候選字符分別計算其相對於字符圖 像的相似度。然後第二識別裝置306可以從候選字符中選取所有的相似度高於或等於預定 閾值的候選字符作為字符圖像的識別結果,或者從候選字符中選取預定數目的候選字符作 為字符圖像的識別結果,該預定數目的候選字符的相似度高於或等於其他候選字符的相似 度。這裡所稱的候選字符的相似度,與上文所述類似,可以使用概率、置信度、距離、序號等 來表示。作為選擇,第二識別裝置可以在給出候選字符的同時給出相似度,或者將候選字符 按照相似度排序顯示。
在本發明的另一個實施例中,第二識別裝置306不是直接利用候選字符的相似度 來進行字符識別,而是利用候選字符的相似度以及其所對應的注音的相似度相結合來進行 字符識別。也就是說,第二識別裝置306可以被配置為將候選注音的相似度與對應的候選 字符的相似度相結合以得到候選字符的結合相似度,並且選取所有的結合相似度高於或等 於預定閾值的候選字符作為字符圖像的識別結果,或者選取預定數目的候選字符作為字符 圖像的識別結果,該預定數目的候選字符的結合相似度高於或等於其他候選字符的結合相 似度。這裡所稱的結合相似度可以是候選注音的相似度與對應的候選字符的相似度的和、 加權和、平均值或者乘積等。應注意,如果採用距離或序號來表示候選注音的相似度及候選 字符的相似度,則二者結合後所得的值越大,其所表示的結合相似度越小。在計算候選字符 的結合相似度的過程中所用到的候選注音的相似度可以是第二識別裝置306直接計算的, 也可以是第一識別裝置302計算的。例如,在第一識別裝置302採用整體識別的方法對注 音圖像進行識別的情況下,一般要涉及對注音的相似度的計算。另外,在第一識別裝置302 對注音圖像中的每個注音元素圖像分別進行識別,然後再進行組合的情況下,如果要對識 別出的候選注音的數量進行限制,第一識別裝置302中的候選注音確定單元3026也會獲取 候選注音的相似度。在以上兩種情況下,第二識別裝置306都可以直接利用第一識別裝置 302的計算結果,而不必重複計算候選注音的相似度。在本發明的實施例中,第一識別裝置302和第二識別裝置306本質上都是對字符 進行識別的裝置,因此他們可以是類似或者同樣的裝置,甚至是同一裝置。尤其是,在對拼 音進行整體識別的情況下,第一識別裝置302和第二識別裝置306可以是同一裝置。在首先 單獨識別注音元素的情況下,注音元素識別單元可以與第一識別裝置類似、相同或者同一。下面結合圖5至圖10描述根據本發明的實施例的識別方法。圖5示出了根據本發明的實施例的識別方法。在步驟502中,對第一圖像進行識 另IJ,以得到第一圖像識別結果。在步驟504中,根據第一圖像識別結果確定候選第二圖像識 別結果。在步驟506中,基於候選第二圖像識別結果對第二圖像進行識別,以得到第二圖像 識別結果。上述第一圖像與第二圖像具有對應關係。在本發明的一個實施例中,第二圖像可以是字符圖像,第一圖像可以是該字符圖 像對應的注音圖像。該注音圖像包括一個或多個注音元素圖像。步驟502包括對注音圖像 進行識別以得到一個或多個候選注音。步驟504包括基於候選注音確定一個或多個候選字 符。步驟506包括基於候選字符對字符圖像進行識別。在步驟502、步驟504和步驟506中所執行的處理分別與參照圖3描述的第一識別 裝置302、第二識別結果預選裝置304和第二識別裝置306中進行的處理類似,因此在此略 去其詳細描述。圖6示出了根據本發明的一個實施例的識別方法中對第一圖像進行識別的處理 過程。在步驟602中,基於注音元素集對注音圖像中的每個注音元素圖像進行識別,以得到 針對每個注音元素圖像的一個或多個候選注音元素。在步驟604中,針對每個注音元素圖 像選取任一個候選注音元素進行組合以得到一個或多個注音元素組合。在步驟606中,從 注音元素組合中選擇合法的注音作為候選注音。在一個示例中,在步驟606中,還可以將合 法的注音所對應的容錯注音也作為候選注音。在步驟602、步驟604和步驟606中所執行的 處理分別與參照圖4描述的注音元素識別單元3022、注音元素組合單元3024和候選注音確定單元3026進行的處理類似,因此在此略去其詳細描述。圖7示出了根據本發明的一個實施例的識別方法中選取候選注音元素的處理過 程。在步驟702中,計算注音元素集中的每個注音元素相對於注音元素圖像的相似度。在 步驟704中,從注音元素集中選取所有的相似度高於或等於預定閾值的注音元素作為候選 注音元素,或者從注音元素集中選取預定數目的注音元素作為候選注音元素,該預定數目 的注音元素的相似度高於或等於注音元素集中的其他注音元素的相似度。在步驟702、步驟 704中所執行的處理與參照圖4描述的注音元素識別單元3022進行的處理類似,因此在此 略去其詳細描述。圖8示出了根據本發明的一個實施例的識別方法中選取候選注音元素的處理過 程。在步驟802中,根據注音元素在注音圖像中的位置而從注音元素集中去除不合法的注 音元素。在步驟804中,計算已經去除了不合法的注音元素的注音元素集中的每個注音元 素相對於注音元素圖像的相似度。在步驟806中,從已經去除了不合法的注音元素的注音 元素集中選取所有的相似度高於或等於預定閾值的注音元素作為候選注音元素,或者從已 經去除了不合法的注音元素的注音元素集中選取預定數目的注音元素作為候選注音元素, 該預定數目的注音元素的相似度高於或等於注音元素集中的其他注音元素的相似度。步驟 802、步驟804、步驟806中所執行的處理與參照圖4描述的注音元素識別單元3022進行的 處理類似,因此在此略去其詳細描述。
圖9示出了根據本發明的一個實施例的識別方法中基於候選字符識別字符圖像 的處理過程。在步驟902中,計算每個候選字符相對於字符圖像的相似度。在步驟904中, 選取所有的相似度高於或等於預定閾值的候選字符作為字符圖像的識別結果,或者選取預 定數目的候選字符作為字符圖像的識別結果,該預定數目的候選字符的相似度高於或等於 其他候選字符的相似度。步驟902、步驟904中所執行的處理與參照圖3描述的第二識別裝 置306進行的處理類似,因此在此略去其詳細描述。圖10示出了根據本發明的一個實施例的識別方法中基於候選字符識別字符圖像 的處理過程。在步驟1002中,計算每個候選字符相對於字符圖像的相似度。在步驟1004中, 將候選注音的每個注音元素的相似度進行結合以得到候選注音的相似度。在步驟1006中, 將候選注音的相似度與對應的候選字符的相似度相結合以得到候選字符的結合相似度。在 步驟1008中,選取所有的結合相似度高於或等於預定閾值的候選字符作為字符圖像的識 別結果,或者選取預定數目的候選字符作為字符圖像的識別結果,該預定數目的候選字符 的結合相似度高於或等於其他候選字符的結合相似度。步驟1002、步驟1004、步驟1006、步 驟1008中所執行的處理與參照圖3描述的第二識別裝置306進行的處理類似,因此在此略 去其詳細描述。下面以對圖1中的圖像進行識別為例結合具體的計算結果對本發明的實施例進 行說明。首先,對注音圖像中的每個注音元素圖像進行識別。計算注音元素集中的每個注 音元素的相似度(這裡採用概率),並且選取前10個相似度高的注音元素作為候選注音元 素。結果如下(注音元素後的數字為概率)第一注音元素圖像Y 0. 932325 V 0. 021750 T 0. 020985 X 0. 011169 F 0. 005957 P 0. 002840 J 0. 002106
N 0. 000984 W 0. 000745 I 0. 000377第二注音元素圖像I 0. 814618 Z 0. 138768 J 0. 017321 E 0. 014568 L 0. 007601 S 0. 002312 X 0.001982F 0. 000565 T 0. 000500 D 0. 000473第三注音元素圖像N 0. 335248 V 0.265071 U 0. 248211 W 0. 051623 0 0. 028040 D 0. 024599 H 0. 018230Q 0. 006844 M 0. 006726 Y 0. 003370第四注音元素圖像G 0. 890855 E 0. 033782 C 0. 029569 Q 0. 019166 S 0. 008134 B 0. 005179 L 0. 0041680 0. 002517 A 0. 001815 U 0. 001562對以上候選注音元素進行組合後可以得到11個候選注音FENG、JING、NENG、 NING、PENG、PING、TENG, TING、WENG, XING、YING。對每個候選注音,將其注音元素的相似度 取平均值得到候選注音的相似度。並且,對候選注音對應的每個漢字計算其相對於字符圖 像的相似度。下面以FENG和YING為例列出候選注音的相似度計算結果以及候選注音對應 的漢字的計算結果(注音後的數字為注音的相似度,漢字後的數字為漢字的相似度)。FENG 0. 311657風0. 117357 鋒 0. 000023 烽 0. 000016 楓 0. 001678 蜂 0. 000054 灃 0. 000437瘋0.026599 豐 0. 006637 峰 0.000371 封 0.002521 馮 0. 000625 逢 0. 000697縫0.001039 諷 0. 000749 鳳 0. 042763 奉 0.001017 俸 0. 000018YING 0. 743261瓔0.000182 櫻 0. 000002 纓 0.000051 鶯 0. 000233 膺 0.001110 應 0. 293743鷹0.001562 嬰 0. 000305 瑛 0. 000269 英 0. 010325 楹 0. 000018 瑩 0. 000219螢0. 000070 營 0. 000029 熒 0. 002770 蠅 0. 000054 迎 0. 000272 盈 0. 000248瀛0.036341 贏 0. 031832 羸 0.013215 潁 0. 000845 郢 0. 000242 影 0. 025796穎0.001680 映 0. 000073 硬 0. 000470將候選注音的相似度與對應的候選漢字的相似度相加得到候選漢字的結合相似度。最終可以得出「應」的結合相似度最高,從而將「應」作為識別結果。在上面的示例中,如果採用現有技術的直接基於漢字集對字符圖像進行識別,則 識別的結果是「丸」,而「應」的相似度只排在38位。可見本發明的實施例提高了字符識別 的準確度。另外,本發明的實施例有效地利用了注音的識別結果,可以將6000多個漢字的 漢字集縮小為100多個漢字的候選字符集,大大減少了計算量。本發明不僅可以用於對漢字和對應的漢字的注音進行識別,也可以應用於例如對 日文漢字和對應的假名進行識別,以及其他任何類似於中文、日文具有書寫字符和注音兩 套系統的文字。此外,在某些特定應用中,尤其是表格填寫中,還可能存在其他對應關係,即 不是文字和注音的對應關係,而是文字和文字的對應關係,例如一個欄位中的文字縮小了 另一個欄位中的文字的選擇範圍。對於這種情況,同樣可以應用本發明。在這種情況下,如前文已經討論的,第一識別裝置和第二識別裝置可以完全是相同的識別裝置。以上結合具體實施例描述了本發明的基本原理,但是,需要指出的是,對本領域的 普通技術人員而言,能夠理解本發明的方法和裝置的全部或者任何步驟或者部件,可以在 任何計算裝置(包括處理器、存儲介質等)或者計算裝置的網絡中,以硬體、固件、軟體或者 它們的組合加以實現,這是本領域普通技術人員在閱讀了本發明的說明的情況下運用他們 的基本編程技能就能實現的。因此,本發明的目的還可以通過在任何計算裝置上運行一個程序或者一組程序來 實現。所述計算裝置可以是公知的通用裝置。因此,本發明的目的也可以僅僅通過提供包 含實現所述方法或者裝置的程序代碼的程序產品來實現。也就是說,這樣的程序產品也構 成本發明,並且存儲有這樣的程序產品的存儲介質也構成本發明。顯然,所述存儲介質可以 是任何公知的存儲介質或者將來所開發出來的任何存儲介質。在通過軟體和/或固件實現本發明的實施例的情況下,從存儲介質或網絡向具有 專用硬體結構的計算機安裝構成該軟體的程序,該計算機在安裝有各種程序時,能夠執行 各種功能等等。還需要指出的是,在本發明的裝置和方法中,顯然,各部件或各步驟是可以分解和 /或重新組合的。這些分解和/或重新組合應視為本發明的等效方案。並且,執行上述系列 處理的步驟可以自然地按照說明的順序按時間順序執行,但是並不需要一定按照時間順序 執行。某些步驟可以並行或彼此獨立地執行。
雖然已經詳細說明了本發明及其優點,但是應當理解在不脫離由所附的權利要求 所限定的本發明的精神和範圍的情況下可以進行各種改變、替代和變換。而且,本申請的術 語「包括」、「包含」或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要 素的過程、方法、物品或者裝置不僅包括那些要素,而且還包括沒有明確列出的其他要素, 或者是還包括為這種過程、方法、物品或者裝置所固有的要素。在沒有更多限制的情況下,
由語句「包括一個......」限定的要素,並不排除在包括所述要素的過程、方法、物品或者裝
置中還存在另外的相同要素。
權利要求
一種識別設備,包括第一識別裝置,被配置為對第一圖像進行識別,以得到第一圖像識別結果;第二識別結果預選裝置,被配置為根據所述第一圖像識別結果確定候選第二圖像識別結果;和第二識別裝置,被配置為基於所述候選第二圖像的識別結果對第二圖像進行識別,以得到第二圖像識別結果,其中,所述第一圖像與所述第二圖像具有對應關係。
2.如權利要求1所述的識別設備,其中所述第二圖像是字符圖像,第一圖像是該字符 圖像對應的注音圖像,並且所述注音圖像包括一個或多個注音元素圖像,第一識別裝置被 配置為對所述注音圖像進行識別以得到一個或多個候選注音,第二識別結果預選裝置被配 置為基於所述候選注音確定一個或多個候選字符,並且所述第二識別裝置被配置為基於所 述候選字符對所述字符圖像進行識別。
3.如權利要求2所述的識別設備,其中所述第一識別裝置包括注音元素識別單元,被配置為基於注音元素集對所述注音圖像中的每個注音元素圖像 進行識別,以得到針對每個注音元素圖像的一個或多個候選注音元素;注音元素組合單元,被配置為針對所述每個注音元素圖像選取任一個候選注音元素進 行組合以得到一個或多個注音元素組合;和候選注音確定單元,被配置為從所述注音元素組合中選擇合法的注音作為候選注音。
4.如權利要求3所述的識別設備,其中所述注音元素識別單元被配置為計算所述注音 元素集中的每個注音元素相對於所述注音元素圖像的相似度,並從注音元素集中選取所有 的相似度高於或等於預定閾值的注音元素作為候選注音元素,或者從注音元素集中選取預 定數目的注音元素作為候選注音元素,該預定數目的注音元素的相似度高於或等於所述注 音元素集中的其他注音元素的相似度。
5.如權利要求4所述的識別設備,其中所述注音元素識別單元還被配置為根據注音元 素圖像在注音圖像中的位置而在識別該注音元素圖像時從所述注音元素集中去除不合法 的注音元素。
6.如權利要求4所述的識別設備,其中所述候選注音確定單元還被配置為將合法的注 音所對應的容錯注音作為候選注音。
7.如權利要求4-6中任一個所述的識別設備,其中所述第二識別裝置被配置為計算每 個候選字符相對於所述字符圖像的相似度。
8.如權利要求7所述的識別設備,其中所述第二識別裝置還被配置為從候選字符中選 取所有的相似度高於或等於預定閾值的候選字符作為字符圖像的識別結果,或者從候選字 符中選取預定數目的候選字符作為字符圖像的識別結果,該預定數目的候選字符的相似度 高於或等於其他候選字符的相似度。
9.如權利要求7所述的識別設備,其中所述第二識別裝置還被配置為將候選注音的每 個注音元素的相似度進行結合以得到候選注音的相似度,將候選注音的相似度與對應的候 選字符的相似度相結合以得到候選字符的結合相似度,並且選取所有的結合相似度高於或 等於預定閾值的候選字符作為字符圖像的識別結果,或者選取預定數目的候選字符作為字 符圖像的識別結果,該預定數目的候選字符的結合相似度高於或等於其他候選字符的結合相似度。
10.如權利要求4-6中任一個所述的識別設備,其中所述候選注音確定單元被配置為 將合法的注音中的每個注音元素的相似度相結合以得到合法的注音的相似度,並選取所有 的相似度高於或等於預定閾值的合法的注音作為候選注音,或者選取預定數目的合法的注 音作為候選注音,該預定數目的合法的注音的相似度高於或等於其他合法的注音的相似度。
11.如權利要求10所述的識別設備,其中所述第二識別裝置被配置為將由所述第一識 別裝置的候選注音確定單元所得到的候選注音的相似度與對應的候選字符的相似度相結 合以得到候選字符的結合相似度,並且選取所有的結合相似度高於或等於預定閾值的候選 字符作為字符圖像的識別結果,或者選取預定數目的候選字符作為字符圖像的識別結果, 該預定數目的候選字符的結合相似度高於或等於其他候選字符的結合相似度。
12.如權利要求1或2所述的識別設備,其中所述第一識別裝置和第二識別裝置是同一裝置ο
13.一種識別方法,包括對第一圖像進行識別,以得到第一圖像識別結果;根據所述第一圖像識別結果確定候選第二圖像識別結果;以及基於所述候選第二圖像識別結果對第二圖像進行識別,以得到第二圖像識別結果,其中,所述第一圖像與所述第二圖像具有對應關係。
14.如權利要求13所述的識別方法,其中所述第二圖像是字符圖像,第一圖像是該字 符圖像對應的注音圖像,並且所述注音圖像包括一個或多個注音元素圖像,所述對第一圖 像進行識別的步驟包括對所述注音圖像進行識別以得到一個或多個候選注音,所述確定候 選第二圖像識別結果的步驟包括基於所述候選注音確定一個或多個候選字符,並且對第二 圖像進行識別的步驟包括基於所述候選字符對所述字符圖像進行識別。
15.如權利要求14所述的識別方法,其中所述對第一圖像進行識別的步驟包括基於注音元素集對所述注音圖像中的每個注音元素圖像進行識別,以得到針對每個注 音元素圖像的一個或多個候選注音元素;針對所述每個注音元素圖像選取任一個候選注音元素進行組合以得到一個或多個注 音元素組合;以及從所述注音元素組合中選擇合法的注音作為候選注音。
16.如權利要求15所述的識別方法,其中所述對注音元素圖像進行識別的步驟包括 計算所述注音元素集中的每個注音元素相對於所述注音元素圖像的相似度;以及 從注音元素集中選取所有的相似度高於或等於預定閾值的注音元素作為候選注音元素,或者從注音元素集中選取預定數目的注音元素作為候選注音元素,該預定數目的注音 元素的相似度高於或等於所述注音元素集中的其他注音元素的相似度。
17.如權利要求16所述的識別方法,其中所述對注音元素圖像進行識別的步驟還包括 為根據注音元素圖像在注音圖像中的位置而在識別該注音元素圖像時從所述注音元素集 中去除不合法的注音元素。
18.如權利要求16所述的識別方法,其中所述選擇合法的注音作為候選注音的步驟還 包括將合法的注音所對應的容錯注音作為候選注音。
19.如權利要求16-18中任一個所述的識別方法,其中所述對第二圖像進行識別的步 驟包括計算每個候選字符相對於所述字符圖像的相似度。
20.如權利要求19所述的識別方法,其中所述對第二圖像進行識別的步驟還包括選取 所有的相似度高於或等於預定閾值的候選字符作為字符圖像的識別結果,或者選取預定數 目的候選字符作為字符圖像的識別結果,該預定數目的候選字符的相似度高於或等於其他 候選字符的相似度。
21.如權利要求19所述的識別方法,其中所述對第二圖像進行識別的步驟包括將候選注音的每個注音元素的相似度進行結合以得到候選注音的相似度;將候選注音的相似度與對應的候選字符的相似度相結合以得到候選字符的結合相似 度;以及選取所有的結合相似度高於或等於預定閾值的候選字符作為字符圖像的識別結果,或 者選取預定數目的候選字符作為字符圖像的識別結果,該預定數目的候選字符的結合相似 度高於或等於其他候選字符的結合相似度。
22.如權利要求16-18中任一個所述的識別方法,其中所述選擇合法的注音作為候選 注音的步驟包括將合法的注音中的每個注音元素的相似度相結合以得到合法的注音的相似度;以及選取所有的相似度高於或等於預定閾值的合法的注音作為候選注音,或者選取預定數 目的合法的注音作為候選注音,該預定數目的合法注音的相似度高於或等於其他合法的注 音的相似度。
23.如權利要求22所述的識別方法,其中所述對第二圖像進行識別的步驟包括將在所述選擇合法的注音作為候選注音的步驟中所得到的候選注音的相似度與對應的候選字符的相似度相結合以得到候選字符的結合相似度;以及選取所有的結合相似度高於或等於預定閾值的候選字符作為字符圖像的識別結果,或 者選取預定數目的候選字符作為字符圖像的識別結果,該預定數目的候選字符的結合相似 度高於或等於其他候選字符的結合相似度。
全文摘要
本發明公開了一種識別設備和識別方法。該識別設備包括第一識別裝置,被配置為對第一圖像進行識別,以得到第一圖像識別結果;第二識別結果預選裝置,被配置為根據第一圖像識別結果確定候選第二圖像識別結果;和第二識別裝置,被配置為基於候選第二圖像識別結果對第二圖像進行識別,以得到第二圖像識別結果,其中,第一圖像與第二圖像具有對應關係。可選地,第二圖像是字符圖像,第一圖像是該字符圖像對應的注音圖像。本發明可以提高識別的準確度。
文檔編號G06K9/00GK101819625SQ20091000469
公開日2010年9月1日 申請日期2009年2月27日 優先權日2009年2月27日
發明者於浩, 堀田悅伸, 孫俊, 皆川明洋, 直井聰, 鄭大念 申請人:富士通株式會社

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀