新四季網

光學字符識別方法及裝置製造方法

2023-06-08 23:30:36

光學字符識別方法及裝置製造方法
【專利摘要】本公開提供了一種光學字符識別方法及裝置。其中,光學字符識別方法包括:從原始圖像中提取字符塊;基於筆畫寬度變換,確定所述字符塊中斷裂的筆畫;對所述斷裂的筆畫補齊得到準識別圖像;對所述準識別圖像進行字符識別,得到所述準識別圖像中的文本信息。本公開能夠利用筆畫寬度變換對字符中筆畫出現的斷裂進行補齊,提高了光學字符識別的識別準確率。
【專利說明】光學字符識別方法及裝置

【技術領域】
[0001] 本公開涉及圖像處理領域,具體而言,涉及光學字符識別方法及裝置。

【背景技術】
[0002] OCR (Optical Character Recognition,光學字符識別)技術在圖像處理領域佔有 重要地位,在信息自動化和辦公自動化中具有廣泛的應用。OCR是指對文本資料、卡片等的 圖像文件進行分析識別處理,獲取文字及版面信息的過程。
[0003] 提高識別準確率是OCR技術中很重要的課題。在實際應用中,需要進行光學字符 識別的原始圖像中經常會存在字符中筆畫出現斷裂的情況,例如,在充值卡中,用戶在掛掉 塗層的時候,經常會有殘留,導致充值卡的密碼被遮擋,從而導致比劃斷裂。相關技術的OCR 容易將斷裂的筆畫識別為兩個筆畫,導致識別準確率降低。


【發明內容】

[0004] 本公開的目的在於提供光學字符識別方法及裝置,以解決上述的問題。
[0005] 根據本公開實施例的第一方面,本公開提供了一種光學字符識別方法,包括:
[0006] 從原始圖像中提取字符塊;
[0007] 基於筆畫寬度變換,確定所述字符塊中斷裂的筆畫;
[0008] 對所述斷裂的筆畫補齊得到準識別圖像;
[0009] 對所述準識別圖像進行字符識別,得到所述準識別圖像中的文本信息。
[0010] 本公開的實施例提供的技術方案,能夠利用筆畫寬度變換對字符中筆畫出現的斷 裂進行補齊,提高了光學字符識別的識別準確率。
[0011] 上述光學字符識別方法還可以包括如下特點,所述基於筆畫寬度變換,確定所述 字符塊中斷裂的筆畫包括:
[0012] 設置斷裂長度閾值;
[0013] 確定所述字符塊的筆畫區域像素點所在筆畫的方向;
[0014] 判斷在所述筆畫區域像素點所在筆畫的方向上,所述筆畫區域像素點與其下一個 筆畫區域像素點之間是否存在筆畫寬度突變區域,且所述筆畫寬度突變區域的長度小於所 述斷裂長度閾值,所述筆畫寬度突變區域為空白區域、筆畫寬度增大值大於設定第一寬度 變化閾值或筆畫寬度減小值大於設定第二寬度變化閾值的區域;
[0015] 當存在所述筆畫寬度突變區域時,確定所述筆畫區域像素點所在筆畫為斷裂的筆 畫,確定所述筆畫寬度突變區域為所述斷裂的筆畫中的斷裂區域。
[0016] 本公開的實施例提供的技術方案,利用筆畫寬度變換確定斷裂的筆畫,可以準確 地找到斷裂區域,為補齊斷裂的筆畫提供基礎,有助於提高字符識別的識別準確率。
[0017] 上述光學字符識別方法還可以包括如下特點,所述對所述斷裂的筆畫補齊包括:
[0018] 設所述斷裂的筆畫中的斷裂區域沿其所在筆畫的方向與其所在筆畫的交界像素 點分別為第一交界點和第二交界點,將所述第一交界點和所述第二交界點之間沿所述第一 交界點的筆畫方向、寬度等於所述第一交界點的筆畫寬度值和所述第二交界點的筆畫寬度 值的平均值的區域設置為準筆畫區域,其中,所述第一交界點的筆畫寬度值和所述第二交 界點的筆畫寬度值通過筆畫寬度變換算法獲得;
[0019] 將所述準筆畫區域的灰度值設置為與所述字符塊中筆畫區域的灰度值一致的值。
[0020] 本公開的實施例提供的技術方案,通過將準筆畫區域的灰度值設置為與字符塊中 筆畫區域的灰度值一致的值這種方式對斷裂的筆畫進行補齊,能夠有效消除斷裂筆畫,有 助於提高字符識別的識別準確率。
[0021] 上述光學字符識別方法還可以包括如下特點,所述對所述斷裂的筆畫補齊還包 括:
[0022] 當所述斷裂區域為所述斷裂的筆畫中的筆畫寬度顯著增大區域時,將所述斷裂區 域中處於所述準筆畫區域之外的筆畫區域的灰度值設置為與所述字符塊中背景區域的灰 度值一致的值。
[0023] 本公開的實施例提供的技術方案,在進行筆畫補齊的同時還可以進一步去除噪 聲,有助於提高字符識別的識別準確率。
[0024] 上述光學字符識別方法還可以包括如下特點,在所述對所述準識別圖像進行字符 識別之前,還包括:
[0025] 基於筆畫寬度變換,檢測所述字符塊中的噪聲;
[0026] 消除所述噪聲。
[0027] 本公開的實施例提供的技術方案,不僅能夠對字符中筆畫出現的斷裂進行補齊, 還能夠利用筆畫寬度變換進一步去除噪聲,進一步提高了字符識別的識別準確率。
[0028] 上述光學字符識別方法還可以包括如下特點,所述基於筆畫寬度變換,檢測所述 字符塊中的噪聲包括:
[0029] 確定所述字符塊的筆畫寬度W,字符塊i的筆畫寬度等於第一寬度平均值與第二 寬度平均值之和的二分之一,所述第一寬度平均值為字符塊i的平均筆畫寬度值,字符塊i 的平均筆畫寬度值等於字符塊i中所有筆畫區域像素點的筆畫寬度值的平均值,所述第二 寬度平均值為從所述原始圖像中提取出的所有字符塊的平均筆畫寬度值的平均值,i為自 然數,筆畫區域像素點的筆畫寬度值通過筆畫寬度變換算法獲得;
[0030] 設置字符筆畫寬度誤差d ;
[0031] 判斷所述字符塊中筆畫寬度處於區間[W_d,W+d]之外的筆畫區域是否滿足如下 成噪條件之一:所述筆畫區域的設定範圍內沒有與所述筆畫方向相符合的筆畫、沿所述筆 畫區域的筆畫寬度變化波動值大於設定波動閾值或者所述筆畫區域的筆畫長度小於設定 長度閾值;
[0032] 當所述字符塊中筆畫寬度處於區間[W_d,W+d]之外的筆畫區域滿足所述成噪條 件之一時,判定所述字符塊中筆畫寬度處於區間[w-d,w+d]之外的筆畫區域為噪聲。
[0033] 本公開的實施例提供的技術方案,利用筆畫寬度變換檢測出字符塊中的噪聲,為 消除噪聲提供基礎,有助於提高字符識別的識別準確率。
[0034] 上述光學字符識別方法還可以包括如下特點,所述消除所述噪聲包括:
[0035] 將所述噪聲的灰度值設置為與所述字符塊中背景區域的灰度值一致的值。
[0036] 本公開的實施例提供的技術方案,能夠有效地消除字符塊中的噪聲,有助於提高 字符識別的識別準確率。
[0037] 上述光學字符識別方法還可以包括如下特點,所述筆畫寬度變換算法包括:
[0038] 對所述字符塊進行邊緣檢測,找到邊緣像素點,所述邊緣像素點具有一個方向梯 度值;
[0039] 按照任一邊緣像素點p的梯度方向dp沿路線r查找與邊緣像素點p相匹配的邊 緣像素點q,邊緣像素點q的梯度方向d q與邊緣像素點p的梯度方向dp相反,其中,r = p+n*dp, η大於或等於0 ;
[0040] 當查找到所述邊緣像素點q時,指定所述邊緣像素點ρ與所述邊緣像素點q的連 線上每個像素點的筆畫寬度值為所述邊緣像素點P與所述邊緣像素點q之間的歐式距離。
[0041] 本公開的實施例提供的技術方案,能夠有效確定筆畫寬度值,為補齊斷裂的筆畫 提供基礎。
[0042] 根據本公開實施例的第二方面,本公開提供了一種光學字符識別裝置,包括:
[0043] 提取模塊,用於從原始圖像中提取字符塊;
[0044] 確定模塊,用於基於筆畫寬度變換,確定所述字符塊中斷裂的筆畫;
[0045] 補齊模塊,用於對所述斷裂的筆畫補齊得到準識別圖像;
[0046] 識別模塊,用於對所述準識別圖像進行字符識別,得到所述準識別圖像中的文本 信息。
[0047] 本公開的實施例提供的技術方案,能夠利用筆畫寬度變換對字符中筆畫出現的斷 裂進行補齊,提高了光學字符識別的識別準確率。
[0048] 上述光學字符識別裝置還可以包括如下特點,所述確定模塊包括:
[0049] 閾值設置單元,用於設置斷裂長度閾值;
[0050] 筆畫方向確定單元,用於確定所述字符塊的筆畫區域像素點所在筆畫的方向;
[0051] 突變判斷單元,用於判斷在所述筆畫區域像素點所在筆畫的方向上,所述筆畫區 域像素點與其下一個筆畫區域像素點之間是否存在筆畫寬度突變區域,且所述筆畫寬度突 變區域的長度小於所述斷裂長度閾值,所述筆畫寬度突變區域為空白區域、筆畫寬度增大 值大於設定第一寬度變化閾值或筆畫寬度減小值大於設定第二寬度變化閾值的區域;
[0052] 斷裂筆畫確定單元,用於當存在所述筆畫寬度突變區域時,確定所述筆畫區域像 素點所在筆畫為斷裂的筆畫,確定所述筆畫寬度突變區域為所述斷裂的筆畫中的斷裂區 域。
[0053] 本公開的實施例提供的技術方案,利用筆畫寬度變換確定斷裂的筆畫,可以準確 地找到斷裂區域,為補齊斷裂的筆畫提供基礎,有助於提高字符識別的識別準確率。
[0054] 上述光學字符識別裝置還可以包括如下特點,所述補齊模塊包括:
[0055] 準筆畫區域設置單元,設所述斷裂的筆畫中的斷裂區域沿其所在筆畫的方向與其 所在筆畫的交界像素點分別為第一交界點和第二交界點,所述準筆畫區域設置單元用於將 所述第一交界點和所述第二交界點之間沿所述第一交界點的筆畫方向、寬度等於所述第一 交界點的筆畫寬度值和所述第二交界點的筆畫寬度值的平均值的區域設置為準筆畫區域, 其中,所述第一交界點的筆畫寬度值和所述第二交界點的筆畫寬度值通過筆畫寬度變換單 元獲得;
[0056] 第一灰度調整單元,用於將所述準筆畫區域的灰度值設置為與所述字符塊中筆畫 區域的灰度值一致的值。
[0057] 本公開的實施例提供的技術方案,通過將準筆畫區域的灰度值設置為與字符塊中 筆畫區域的灰度值一致的值這種方式對斷裂的筆畫進行補齊,能夠有效消除斷裂筆畫,有 助於提高字符識別的識別準確率。
[0058] 上述光學字符識別裝置還可以包括如下特點,所述補齊模塊還包括:
[0059] 第二灰度調整單元,用於當所述斷裂區域為所述斷裂的筆畫中的筆畫寬度顯著增 大區域時,將所述斷裂區域中處於所述準筆畫區域之外的筆畫區域的灰度值設置為與所述 字符塊中背景區域的灰度值一致的值。
[0060] 本公開的實施例提供的技術方案,在進行筆畫補齊的同時還可以進一步去除噪 聲,有助於提高字符識別的識別準確率。
[0061] 上述光學字符識別裝置還可以包括如下特點,在所述識別模塊之前,還包括:
[0062] 噪聲檢測模塊,用於基於筆畫寬度變換,檢測所述字符塊中的噪聲;
[0063] 消除模塊,用於消除所述噪聲檢測模塊檢測出的噪聲。
[0064] 本公開的實施例提供的技術方案,不僅能夠對字符中筆畫出現的斷裂進行補齊, 還能夠利用筆畫寬度變換進一步去除噪聲,進一步提高了字符識別的識別準確率。
[0065] 上述光學字符識別裝置還可以包括如下特點,所述噪聲檢測模塊包括:
[0066] 筆畫寬度確定單元,用於確定所述字符塊的筆畫寬度W,字符塊i的筆畫寬度等於 第一寬度平均值與第二寬度平均值之和的二分之一,所述第一寬度平均值為字符塊i的平 均筆畫寬度值,字符塊i的平均筆畫寬度值等於字符塊i中所有筆畫區域像素點的筆畫寬 度值的平均值,所述第二寬度平均值為從所述原始圖像中提取出的所有字符塊的平均筆畫 寬度值的平均值,i為自然數,筆畫區域像素點的筆畫寬度值通過筆畫寬度變換單元獲得; [0067] 誤差設置單元,用於設置字符筆畫寬度誤差d ;
[0068] 成噪判斷單元,用於判斷所述字符塊中筆畫寬度處於區間[W_d,W+d]之外的筆畫 區域是否滿足如下成噪條件之一:所述筆畫區域的設定範圍內沒有與所述筆畫方向相符合 的筆畫、沿所述筆畫區域的筆畫寬度變化波動值大於設定波動閾值或者所述筆畫區域的筆 畫長度小於設定長度閾值;
[0069] 判定單元,用於當所述字符塊中筆畫寬度處於區間[W_d,W+d]之外的筆畫區域滿 足所述成噪條件之一時,判定所述字符塊中筆畫寬度處於區間[w-d,w+d]之外的筆畫區域 為噪聲。
[0070] 本公開的實施例提供的技術方案,利用筆畫寬度變換檢測出字符塊中的噪聲,為 消除噪聲提供基礎,有助於提高字符識別的識別準確率。
[0071] 上述光學字符識別裝置還可以包括如下特點,所述消除模塊包括:
[0072] 灰度除噪單元,用於將所述噪聲的灰度值設置為與所述字符塊中背景區域的灰度 值一致的值。
[0073] 本公開的實施例提供的技術方案,能夠有效地消除字符塊中的噪聲,有助於提高 字符識別的識別準確率。
[0074] 上述光學字符識別裝置還可以包括如下特點,所述筆畫寬度變換單元包括:
[0075] 邊緣檢測子單元,用於對所述字符塊進行邊緣檢測,找到邊緣像素點,所述邊緣像 素點具有一個方向梯度值;
[0076] 匹配子單元,用於按照任一邊緣像素點p的梯度方向dp沿路線r查找與邊緣像素 點P相匹配的邊緣像素點q,邊緣像素點q的梯度方向d q與邊緣像素點p的梯度方向dp相 反,其中,r = p+n*dp, η大於或等於0 ;
[0077] 指定子單元,用於當查找到所述邊緣像素點q時,指定所述邊緣像素點ρ與所述邊 緣像素點q的連線上每個像素點的筆畫寬度值為所述邊緣像素點P與所述邊緣像素點q之 間的歐式距離。
[0078] 本公開的實施例提供的技術方案,能夠有效確定筆畫寬度值,為補齊斷裂的筆畫 提供基礎。
[0079] 根據本公開實施例的第三方面,提供一種光學字符識別裝置,包括:
[0080] 處理器;
[0081] 用於存儲處理器可執行指令的存儲器;
[0082] 其中,所述處理器被配置為執行如下指令:
[0083] 從原始圖像中提取字符塊;
[0084] 基於筆畫寬度變換,確定所述字符塊中斷裂的筆畫;
[0085] 對所述斷裂的筆畫補齊得到準識別圖像;
[0086] 對所述準識別圖像進行字符識別,得到所述準識別圖像中的文本信息。
[0087] 應當理解的是,以上的一般描述和後文的細節描述僅是示例性的,並不能限制本 公開。

【專利附圖】

【附圖說明】
[0088] 圖1是根據一示例性實施例示出的一種光學字符識別方法的流程圖之一;
[0089] 圖2是根據一示例性實施例示出的一種光學字符識別方法的流程圖之二;
[0090] 圖3是根據一示例性實施例示出的一種光學字符識別裝置的結構框圖之一; [0091] 圖4是根據一示例性實施例示出的一種光學字符識別裝置中確定模塊20的一種 結構框圖;
[0092] 圖5是根據一示例性實施例示出的一種光學字符識別裝置中補齊模塊30的結構 框圖之一;
[0093] 圖6是根據一示例性實施例示出的一種光學字符識別裝置中補齊模塊30的結構 框圖之二;
[0094] 圖7是根據一示例性實施例示出的一種光學字符識別裝置中提取模塊10的結構 框圖;
[0095] 圖8是根據一示例性實施例示出的一種光學字符識別裝置的結構框圖之二; [0096] 圖9是根據一示例性實施例示出的一種光學字符識別裝置中噪聲檢測模塊50的 結構框圖;
[0097] 圖10是根據一示例性實施例示出的一種光學字符識別裝置中消除模塊60的結構 框圖;
[0098] 圖11是根據一示例性實施例示出的一種光學字符識別裝置中筆畫寬度變換單元 70的結構框圖;
[0099] 圖12是根據一示例性實施例示出的一種裝置的框圖。
[0100] 此處的附圖被併入說明書中並構成本說明書的一部分,示出了符合本發明的實施 例,並與說明書一起用於解釋本發明的原理。

【具體實施方式】
[0101] 下面通過具體的實施例子並結合附圖對本公開做進一步的詳細描述。
[0102] 圖1是根據一示例性實施例示出的一種光學字符識別方法的流程圖之一。如圖1 所示,本實施例中,光學字符識別方法的流程可以包括如下步驟:
[0103] 在步驟S101中,從原始圖像中提取字符塊;
[0104] 提取出的字符塊包括筆畫區域和背景區域。本公開中,可以將筆畫區域的像素點 的灰度值設為〇,將背景區域的灰度值設為255,也可以將筆畫區域的像素點的灰度值設為 255,將背景區域的灰度值設為0。
[0105] 其中,步驟S101可以採用如下的子步驟(步驟all至步驟dll)來實現:
[0106] all,對原始圖像進行灰度化處理後濾波,獲得原始圖像的第一預處理結果圖;
[0107] bll,對第一預處理結果圖進行二值化處理後濾波,獲得原始圖像的第二預處理結 果圖;
[0108] cll,定位和提取第二預處理結果圖中的文本信息;
[0109] dll,對第二預處理結果圖中的文本信息按行進行字符分割,得到字符塊,該字符 塊即為從原始圖像中提取出的字符塊。
[0110] 步驟all至步驟dll在進行字符塊提取的過程中同時去除噪聲,有助於提高字符 識別的識別準確率。
[0111] 在步驟S102中,基於筆畫寬度變換,確定該字符塊中斷裂的筆畫;
[0112] 其中,步驟S102可以採用如下的子步驟(步驟al2至步驟dl2)來實現:
[0113] 在步驟al2中,設置斷裂長度閾值;
[0114] 在步驟bl2中,確定字符塊的筆畫區域像素點所在筆畫的方向;
[0115] 在步驟cl2中,判斷在筆畫區域像素點所在筆畫的方向上,筆畫區域像素點與其 下一個筆畫區域像素點之間是否存在筆畫寬度突變區域,且該筆畫寬度突變區域的長度小 於斷裂長度閾值,其中,筆畫寬度突變區域可以為空白區域、筆畫寬度顯著增大區域或筆畫 寬度顯著減小區域;其中,筆畫寬度顯著增大區域是指筆畫寬度增大值大於設定第一寬度 變化閾值的區域,筆畫寬度顯著減小區域是指筆畫寬度減小值大於設定第二寬度變化閾值 的區域。
[0116] 在步驟dl2中,當存在筆畫寬度突變區域時,確定筆畫區域像素點所在筆畫為斷 裂的筆畫,確定筆畫寬度突變區域為斷裂的筆畫中的斷裂區域。
[0117] 利用筆畫寬度變換確定斷裂的筆畫,可以準確地找到斷裂區域,為補齊斷裂的筆 畫提供基礎,有助於提商字符識別的識別準確率。
[0118] 在步驟S103中,對斷裂的筆畫補齊得到準識別圖像;
[0119] 其中,步驟S103可以採用如下的子步驟(步驟al3至步驟bl3)來實現:
[0120] 在步驟al3中,設斷裂的筆畫中的斷裂區域沿其所在筆畫的方向與其所在筆畫的 交界像素點分別為第一交界點和第二交界點,將第一交界點和第二交界點之間沿第一交界 點的筆畫方向、寬度等於第一交界點的筆畫寬度值和第二交界點的筆畫寬度值的平均值的 區域設置為準筆畫區域,其中,第一交界點的筆畫寬度值和第二交界點的筆畫寬度值通過 筆畫寬度變換算法獲得;
[0121] 在步驟bl3中,將準筆畫區域的灰度值設置為與字符塊中筆畫區域的灰度值一致 的值。
[0122] 步驟al3至步驟bl3通過將準筆畫區域的灰度值設置為與字符塊中筆畫區域的灰 度值一致的值這種方式對斷裂的筆畫進行補齊,能夠有效消除斷裂筆畫,有助於提高字符 識別的識別準確率。
[0123] 在本公開實施例中,步驟S103還可以包括子步驟cl3 :
[0124] 在步驟cl3中,當斷裂區域為斷裂的筆畫中的筆畫寬度顯著增大區域時,將斷裂 區域中處於準筆畫區域之外的筆畫區域的灰度值設置為與字符塊中背景區域的灰度值一 致的值。這樣,在進行筆畫補齊的同時還可以進一步去除噪聲,有助於提高字符識別的識別 準確率。
[0125] 在步驟S104中,對準識別圖像進行字符識別,得到該準識別圖像中的文本信息。
[0126] 這裡,說明一下筆畫寬度變換算法。筆畫寬度變換算法可以包括如下步驟(步驟 a00至步驟c00):
[0127] 在步驟a00中,對字符塊進行邊緣檢測,找到邊緣像素點,邊緣像素點具有一個方 向梯度值;
[0128] 在步驟b00中,按照任一邊緣像素點p的梯度方向dp沿路線r查找與邊緣像素點 P相匹配的邊緣像素點q,邊緣像素點q的梯度方向dq與邊緣像素點p的梯度方向dp相反, 其中,r = p+n*dp, η大於或等於0 ;
[0129] 在步驟c00中,當查找到邊緣像素點q時,指定邊緣像素點ρ與邊緣像素點q的連 線上每個像素點的筆畫寬度值為邊緣像素點p與邊緣像素點q之間的歐式距離。邊緣像素 點P與邊緣像素點q之間的歐式距離表示為I |p_q| I。
[0130] 該筆畫寬度變換算法能夠有效確定筆畫寬度值,為補齊斷裂的筆畫提供基礎。
[0131] 本實施例示出的光學字符識別方法,能夠利用筆畫寬度變換對字符中筆畫出現的 斷裂進行補齊,提高了光學字符識別的識別準確率。
[0132] 圖2是根據一示例性實施例示出的一種光學字符識別方法的流程圖之二。如圖2 所示,本實施例中,光學字符識別方法的流程可以包括如下步驟:
[0133] 在步驟S201中,從原始圖像中提取字符塊;
[0134] 在步驟S202中,基於筆畫寬度變換,確定字符塊中斷裂的筆畫;
[0135] 在步驟S203中,基於筆畫寬度變換,檢測字符塊中的噪聲;
[0136] 其中,步驟S203可以採用如下的子步驟(步驟a23至步驟d23)來實現:
[0137] 在步驟a23中,確定字符塊的筆畫寬度W,字符塊i的筆畫寬度等於第一寬度平均 值與第二寬度平均值之和的二分之一,其中,第一寬度平均值為字符塊i的平均筆畫寬度 值,字符塊i的平均筆畫寬度值等於字符塊i中所有筆畫區域像素點的筆畫寬度值的平均 值,第二寬度平均值為從原始圖像中提取出的所有字符塊的平均筆畫寬度值的平均值,i為 自然數,筆畫區域像素點的筆畫寬度值通過筆畫寬度變換算法獲得;
[0138] 設字符塊i的筆畫寬度為I,第一寬度平均值為Wn,第二寬度平均值為Wa,那麼, Wa的表達式如公式(1)所示:

【權利要求】
1. 一種光學字符識別方法,其特徵在於,包括: 從原始圖像中提取字符塊; 基於筆畫寬度變換,確定所述字符塊中斷裂的筆畫; 對所述斷裂的筆畫補齊得到準識別圖像; 對所述準識別圖像進行字符識別,得到所述準識別圖像中的文本信息。
2. 根據權利要求1所述的光學字符識別方法,其特徵在於,所述基於筆畫寬度變換,確 定所述字符塊中斷裂的筆畫包括: 設置斷裂長度閾值; 確定所述字符塊的筆畫區域像素點所在筆畫的方向; 判斷在所述筆畫區域像素點所在筆畫的方向上,所述筆畫區域像素點與其下一個筆畫 區域像素點之間是否存在筆畫寬度突變區域,且所述筆畫寬度突變區域的長度小於所述斷 裂長度閾值,所述筆畫寬度突變區域為空白區域、筆畫寬度增大值大於設定第一寬度變化 閾值或筆畫寬度減小值大於設定第二寬度變化閾值的區域; 當存在所述筆畫寬度突變區域時,確定所述筆畫區域像素點所在筆畫為斷裂的筆畫, 確定所述筆畫寬度突變區域為所述斷裂的筆畫中的斷裂區域。
3. 根據權利要求1所述的光學字符識別方法,其特徵在於,所述對所述斷裂的筆畫補 齊包括: 設所述斷裂的筆畫中的斷裂區域沿其所在筆畫的方向與其所在筆畫的交界像素點分 別為第一交界點和第二交界點,將所述第一交界點和所述第二交界點之間沿所述第一交界 點的筆畫方向、寬度等於所述第一交界點的筆畫寬度值和所述第二交界點的筆畫寬度值的 平均值的區域設置為準筆畫區域,其中,所述第一交界點的筆畫寬度值和所述第二交界點 的筆畫寬度值通過筆畫寬度變換算法獲得; 將所述準筆畫區域的灰度值設置為與所述字符塊中筆畫區域的灰度值一致的值。
4. 根據權利要求3所述的光學字符識別方法,其特徵在於,所述對所述斷裂的筆畫補 齊還包括: 當所述斷裂區域為所述斷裂的筆畫中的筆畫寬度顯著增大區域時,將所述斷裂區域中 處於所述準筆畫區域之外的筆畫區域的灰度值設置為與所述字符塊中背景區域的灰度值 一致的值。
5. 根據權利要求1所述的光學字符識別方法,其特徵在於,在所述對所述準識別圖像 進行字符識別之前,還包括: 基於筆畫寬度變換,檢測所述字符塊中的噪聲; 消除所述噪聲。
6. 根據權利要求5所述的光學字符識別方法,其特徵在於,所述基於筆畫寬度變換,檢 測所述字符塊中的噪聲包括: 確定所述字符塊的筆畫寬度W,字符塊i的筆畫寬度等於第一寬度平均值與第二寬度 平均值之和的二分之一,所述第一寬度平均值為字符塊i的平均筆畫寬度值,字符塊i的平 均筆畫寬度值等於字符塊i中所有筆畫區域像素點的筆畫寬度值的平均值,所述第二寬度 平均值為從所述原始圖像中提取出的所有字符塊的平均筆畫寬度值的平均值,i為自然數, 筆畫區域像素點的筆畫寬度值通過筆畫寬度變換算法獲得; 設置字符筆畫寬度誤差d; 判斷所述字符塊中筆畫寬度處於區間[w-d,w+d]之外的筆畫區域是否滿足如下成噪 條件之一:所述筆畫區域的設定範圍內沒有與所述筆畫方向相符合的筆畫、沿所述筆畫區 域的筆畫寬度變化波動值大於設定波動閾值或者所述筆畫區域的筆畫長度小於設定長度 閾值; 當所述字符塊中筆畫寬度處於區間[w-d,w+d]之外的筆畫區域滿足所述成噪條件之 一時,判定所述字符塊中筆畫寬度處於區間[w-d,w+d]之外的筆畫區域為噪聲。
7. 根據權利要求5所述的光學字符識別方法,其特徵在於,所述消除所述噪聲包括: 將所述噪聲的灰度值設置為與所述字符塊中背景區域的灰度值一致的值。
8. 根據權利要求3或6所述的光學字符識別方法,其特徵在於,所述筆畫寬度變換算法 包括: 對所述字符塊進行邊緣檢測,找到邊緣像素點,所述邊緣像素點具有一個方向梯度 值; 按照任一邊緣像素點P的梯度方向dp沿路線r查找與邊緣像素點p相匹配的邊緣像素 點q,邊緣像素點q的梯度方向dq與邊緣像素點p的梯度方向dp相反,其中,r = p+n*dp,η 大於或等於〇 ; 當查找到所述邊緣像素點q時,指定所述邊緣像素點Ρ與所述邊緣像素點q的連線上 每個像素點的筆畫寬度值為所述邊緣像素點P與所述邊緣像素點q之間的歐式距離。
9. 一種光學字符識別裝置,其特徵在於,包括: 提取模塊,用於從原始圖像中提取字符塊; 確定模塊,用於基於筆畫寬度變換,確定所述字符塊中斷裂的筆畫; 補齊模塊,用於對所述斷裂的筆畫補齊得到準識別圖像; 識別模塊,用於對所述準識別圖像進行字符識別,得到所述準識別圖像中的文本信息。
10. 根據權利要求9所述的光學字符識別裝置,其特徵在於,所述確定模塊包括: 閾值設置單元,用於設置斷裂長度閾值; 筆畫方向確定單元,用於確定所述字符塊的筆畫區域像素點所在筆畫的方向; 突變判斷單元,用於判斷在所述筆畫區域像素點所在筆畫的方向上,所述筆畫區域像 素點與其下一個筆畫區域像素點之間是否存在筆畫寬度突變區域,且所述筆畫寬度突變區 域的長度小於所述斷裂長度閾值,所述筆畫寬度突變區域為空白區域、筆畫寬度增大值大 於設定第一寬度變化閾值或筆畫寬度減小值大於設定第二寬度變化閾值的區域; 斷裂筆畫確定單元,用於當存在所述筆畫寬度突變區域時,確定所述筆畫區域像素點 所在筆畫為斷裂的筆畫,確定所述筆畫寬度突變區域為所述斷裂的筆畫中的斷裂區域。
11. 根據權利要求9所述的光學字符識別裝置,其特徵在於,所述補齊模塊包括: 準筆畫區域設置單元,設所述斷裂的筆畫中的斷裂區域沿其所在筆畫的方向與其所 在筆畫的交界像素點分別為第一交界點和第二交界點,所述準筆畫區域設置單元用於將所 述第一交界點和所述第二交界點之間沿所述第一交界點的筆畫方向、寬度等於所述第一交 界點的筆畫寬度值和所述第二交界點的筆畫寬度值的平均值的區域設置為準筆畫區域,其 中,所述第一交界點的筆畫寬度值和所述第二交界點的筆畫寬度值通過筆畫寬度變換單元 獲得; 第一灰度調整單元,用於將所述準筆畫區域的灰度值設置為與所述字符塊中筆畫區域 的灰度值一致的值。
12. 根據權利要求11所述的光學字符識別裝置,其特徵在於,所述補齊模塊還包括: 第二灰度調整單元,用於當所述斷裂區域為所述斷裂的筆畫中的筆畫寬度顯著增大區 域時,將所述斷裂區域中處於所述準筆畫區域之外的筆畫區域的灰度值設置為與所述字符 塊中背景區域的灰度值一致的值。
13. 根據權利要求9所述的光學字符識別裝置,其特徵在於,在所述識別模塊之前,還 包括: 噪聲檢測模塊,用於基於筆畫寬度變換,檢測所述字符塊中的噪聲; 消除模塊,用於消除所述噪聲檢測模塊檢測出的噪聲。
14. 根據權利要求13所述的光學字符識別裝置,其特徵在於,所述噪聲檢測模塊包括: 筆畫寬度確定單元,用於確定所述字符塊的筆畫寬度W,字符塊i的筆畫寬度等於第一 寬度平均值與第二寬度平均值之和的二分之一,所述第一寬度平均值為字符塊i的平均筆 畫寬度值,字符塊i的平均筆畫寬度值等於字符塊i中所有筆畫區域像素點的筆畫寬度值 的平均值,所述第二寬度平均值為從所述原始圖像中提取出的所有字符塊的平均筆畫寬度 值的平均值,i為自然數,筆畫區域像素點的筆畫寬度值通過筆畫寬度變換單元獲得; 誤差設置單元,用於設置字符筆畫寬度誤差d ; 成噪判斷單元,用於判斷所述字符塊中筆畫寬度處於區間[W-d,W+d]之外的筆畫區域 是否滿足如下成噪條件之一:所述筆畫區域的設定範圍內沒有與所述筆畫方向相符合的筆 畫、沿所述筆畫區域的筆畫寬度變化波動值大於設定波動閾值或者所述筆畫區域的筆畫長 度小於設定長度閾值; 判定單元,用於當所述字符塊中筆畫寬度處於區間[W-d,W+d]之外的筆畫區域滿足所 述成噪條件之一時,判定所述字符塊中筆畫寬度處於區間[W-d,W+d]之外的筆畫區域為噪 聲。
15. 根據權利要求13所述的光學字符識別裝置,其特徵在於,所述消除模塊包括: 灰度除噪單元,用於將所述噪聲的灰度值設置為與所述字符塊中背景區域的灰度值一 致的值。
16. 根據權利要求11或14所述的光學字符識別裝置,其特徵在於,所述筆畫寬度變換 單元包括: 邊緣檢測子單元,用於對所述字符塊進行邊緣檢測,找到邊緣像素點,所述邊緣像素點 具有一個方向梯度值; 匹配子單元,用於按照任一邊緣像素點P的梯度方向4沿路線r查找與邊緣像素點p 相匹配的邊緣像素點q,邊緣像素點q的梯度方向dq與邊緣像素點p的梯度方向dp相反, 其中,r = p+n*dp, η大於或等於0 ; 指定子單元,用於當查找到所述邊緣像素點q時,指定所述邊緣像素點Ρ與所述邊緣像 素點q的連線上每個像素點的筆畫寬度值為所述邊緣像素點P與所述邊緣像素點q之間的 歐式距離。
17. -種光學字符識別裝置,其特徵在於,包括: 處理器; 用於存儲處理器可執行指令的存儲器; 其中,所述處理器被配置為執行如下指令: 從原始圖像中提取字符塊; 基於筆畫寬度變換,確定所述字符塊中斷裂的筆畫; 對所述斷裂的筆畫補齊得到準識別圖像; 對所述準識別圖像進行字符識別,得到所述準識別圖像中的文本信息。
【文檔編號】G06K9/54GK104112130SQ201410299362
【公開日】2014年10月22日 申請日期:2014年6月26日 優先權日:2014年6月26日
【發明者】陳志軍, 張祺深, 臧虎 申請人:小米科技有限責任公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀