新四季網

用於圖像文字識別的字符圖片自動切分系統的製作方法

2023-06-26 18:01:01


本發明圖像識別領域,特別涉及用於圖像文字識別的字符圖片自動切分系統。



背景技術:

隨著社會的發展和科技的進步,人類創造的知識正以指數級的數量增加,在電子書籍出現之前,大部分的知識是以圖書的方式進行傳承,中華上下五千年,產生了大量優秀書籍,這些書籍在歷史的長河中,或多或少都遭到了不同程度的損壞,因此對這些書籍進行數位化存儲迫在眉睫;在圖書管理領域,書籍內容的快速搜索對於快速定位書籍很有幫助,而由於書籍數量太多,加上早期印刷的圖書沒有作者的電子文稿,因此紙質書籍的電子化很有必要。

光學字符識別軟體就是處理這種紙質圖書到電子文檔轉化的利器,其主要利用大量的字符樣本,經過複雜網絡的學習,生成相應的模型文件,從而達到識別圖片中字符的目的。

光學字符識別軟體主要功能是識別拍攝、掃描圖片中的字符,現有技術中在進行圖像中文字的識別時,首先需要將圖像中的字符串切分開,形成包含單個文字的小圖片,然後使用一定的方法對切分後的文字進行識別。而進行文字切分最常用的方法為投影法,即是將圖像文字二值化處理後,通過垂直投影法找到兩個文字之間的分界線,根據分界線將文字切分開來。然而當圖像中的文字之間具有粘連,且圖像中包含左右結構的漢字時,簡單的投影方法就很難實現較好的切分效果;正是因為這個原因使得切分一直是OCR識別的難點,切分的質量將直接影響到文字的識別效果。現有技術缺乏能實現自動圖像文字切分的相關工具。



技術實現要素:

本發明的目的在於克服現有技術中所存在的上述不足,提供用於圖像文字識別的字符圖片自動切分系統,使用投影法確定初始切分位置進行切分,對經過切分後的子圖片進行判斷和再次切分和合併,切分點的確定在字符圖片列投影幅值的基礎上引入修正值,使得切分點的判斷更加合理準確,本發明系統對粘連的漢字具有很好的切分效果。

為了實現上述發明目的,本發明提供了以下技術方案:用於圖像文字識別的字符圖片自動切分系統,包含圖像輸入模塊,二值化轉化模塊和字符切分模塊;圖像輸入模塊將需要識別的圖像輸入到二值化轉化模塊中進行二值化轉化後輸入字符切分模塊中;

所述字符切分模塊在進行字符切分時包含以下實現過程:

(1)使用投影法待識別圖像文字進行切分,切分成子圖片序列;將其中的數字、字母和標點符號標記出來;

(2)對未標記的子圖片進行判斷:是否滿足L≤M*h,L為子圖片字符投影的寬度,M為係數,h為行高;

對於不滿足條件的子圖片進行切分,切分位置根據以下公式進行確定:

f(x)=g(x)t(x)

重複執行步驟(2),直到序列中未標記的子圖片均滿足條件:L≤M*h;

(3)對於序列中數字、字母和標點字圖片以外的相鄰兩子圖片的總寬度進行判斷:是否滿足L合≤M*h;

如果滿足,依序對滿足條件的相鄰子圖片進行合併;

重複執行步驟(3)直到除數字、字母和標點以外的相鄰子圖片總寬度均不滿足L合≤M*h;

(4)對序列中未標記的子圖片進行判斷:如果序列中存在三個相鄰的子圖片,且三個子圖片滿足:第一子圖片和第三子圖片的寬度L≤0.5h,且中間子圖片的寬度L≥h,則將中間子圖片根據公式:

f(x)=g(x)t(x)

所確定的切分點進行切分;根據確定的切分點,將中間子圖片切分成第一中間子圖片和第二中間子圖片;

將第一子圖片和第一中間子圖片合併;

將第二中間子圖片和第二中間圖片合併。

進一步的,0.95≤M≤1.3。

作為一種優選:M=1.2。

作為一種優選,

所述步驟(1)中使用以下規則來判斷所切分出的子圖片是否屬於數字、字母和標點:

A:子圖片滿足:L≤0.4h;

B:子圖片的像素高寬比大於1.2。

進一步的,所述系統為加載有上述字符圖片自動切分功能程序的計算機或者伺服器。

與現有技術相比,本發明的有益效果:本發明提供用於圖像文字識別的字符圖片自動切分系統,包含圖像輸入模塊,二值化轉化模塊和字符切分模塊;所述圖像輸入模塊將需要識別的圖像輸入到二值化轉化模塊中進行二值化轉化後輸入字符切分模塊中,所述字符切分模塊在進行字符切分時,採用層層判斷過濾切分的方式,對於粘連的字符和左右結構的字符進行自動判斷和切分,在進行粘連字符切分時,將切分位置與字符邊緣的距離作為了確定切分點的考慮因素;切分的準確率更高;對於左右結構的漢字字符本發明系統能夠自動進行識別和合併,字符的切分結果更加合理準確。在使用時,用戶自需要將待識別字符輸入本系統中,就能完成圖像文字字符的自動切分,為圖像文字識別和處理,提供有力工具。

附圖說明:

圖1為本發明系統實現過程示意圖。

圖2為本發明系統實現步驟示意圖。

圖3為待識別圖像樣例圖。

圖4為粘連文字圖像樣例圖。

圖5為修正值g(x)的分布示意圖。

圖6為圖4中字符的幅值分布示意圖。

具體實施方式

下面結合試驗例及具體實施方式對本發明作進一步的詳細描述。但不應將此理解為本發明上述主題的範圍僅限於以下的實施例,凡基於本發明內容所實現的技術均屬於本發明的範圍。

本發明系統提供用於圖像文字識別的字符圖片自動切分系統,用於圖像文字識別的字符圖片自動切分系統如圖1所示,包含圖像輸入模塊,二值化轉化模塊和字符切分模塊;所述圖像輸入模塊可以是掃描儀、和圖像存儲設備;所述圖像輸入模塊將需要識別的圖像輸入到二值化轉化模塊中進行二值化轉化(將256個亮度等級的灰度圖像通過適當的閾值選取而獲得仍然可以反映圖像整體和局部特徵的二值化圖像)後輸入字符切分模塊中;

所述字符切分模塊在進行字符切分時包含如圖2所示的以下實現步驟:

(1)使用投影法待識別圖像文字進行切分,切分成子圖片序列;將其中的數字、字母和標點符號標記出來;

(2)對未標記的子圖片進行判斷:是否滿足L≤M*h,L為子圖片字符投影的寬度,M為係數,h為行高;

對於不滿足條件的子圖片進行切分,切分位置根據以下公式進行確定:

f(x)=g(x)t(x)

式中f(x)為幅值,x為列投影點在行方向上的坐標,h為當前字符的行高,g(x)為修正值,t(x)為行投影值,兩者共同決定投影點的幅值,當幅值最小時,即為兩個字符之間的切割點;經過g(x)的修正所找到最小幅值點作為切分點,相比於簡單的最小行投影值,本系統中所尋找的切分點,引入了切分點位置與字符邊緣距離的考量因素,因此具有更高的準確性,而且當遇到特殊結構字符時出現多個較小值,或者極值點時,通過本公式可以快速的找出最優化的切分點,增加了切分的準確性,提高了切分的效率。

重複執行步驟(2),直到序列中未標記的子圖片均滿足條件:L≤M*h;經過循環執行本步驟,將序列中明顯過大的字圖片進行細切分,直到全部滿足單個字符的條件,相當於對所以子圖片進行了層層篩濾,並不滿足條件的子圖片進行了層層切分,這樣,將字符間相互粘連的字符圖片切分開來。

(3)對於序列中數字、字母和標點字圖片以外的相鄰兩子圖片的總寬度進行判斷:是否滿足L合≤M*h;

如果滿足,依序對滿足條件的相鄰子圖片進行合併;

重複執行步驟(3)直到除數字、字母和標點以外的相鄰子圖片總寬度均不滿足L合≤M*h;

漢字字符中包含大量的左右結構的字符,使用投影法進行切分時,由於左右結構的字體的部首之間是相互分離的,很大的可能會將左右的部首切分開,在進行識別時,需要將這些分離的部首進行重新的合併,使用本步驟實現分離字符的合併直到沒有可合併的字符時結束;

(4)對序列中未標記的子圖片進行判斷:如果序列中存在三個相鄰的子圖片,且三個子圖片滿足:第一子圖片和第三子圖片的寬度L≤0.5h,且中間子圖片的寬度L≥h,則將中間子圖片根據公式:

f(x)=g(x)t(x)

所確定的切分點進行切分;根據確定的切分點,將中間子圖片切分成第一中間子圖片和第二中間子圖片;

將第一子圖片和第一中間子圖片合併;

將第二中間子圖片和第二中間圖片合併。

在某些情況下:連續的兩個左右結構的字符圖片,中間具有粘連,那麼在利用投影法進行切分時,可能將前後字符中間的部首切開,但是對於兩個字符之間粘連的部首識別不了,而當成一個字符切分出來的情況;本發明系統對於這種情況有較好的處理效果,對於粘連的中間部分通過上述公式尋找到最佳的切分點,並將切分後的前後字符的部首進行重新的整合,達到了較好的切分效果。

在使用時,用戶自需要將待識別字符輸入本系統中,就能完成圖像文字字符的自動切分,為圖像文字識別和處理,提供有力工具。

進一步的,0.95≤M≤1.3。

作為一種優選:M=1.2。

作為一種優選,

所述步驟(1)中使用以下規則來判斷所切分出的子圖片是否屬於數字、字母和標點:

A:子圖片滿足:L≤0.4h;

B:子圖片的像素高寬比大於1.2。

進一步的,所述系統為加載有上述字符圖片自動切分功能程序的計算機或者伺服器。

實施例1

如圖所示3,用戶在進行對圖像中的文字進行識別時,將圖像輸入本發明系統中,所述二值化處理模塊對圖像文字進行二值化處理後將圖像輸入到字符切分模塊中,所述字符切分模塊經過行投影,將圖像中的文字行切分出來,對每一行文字圖像進行列投影,找出初始切分點,根據初始切分對文字圖片進行初步的切分,形成子圖片,切分成的子圖片中的數字、字母和標點子圖片標記出來。

在此基礎上,對數字、字母和標點以外的文字字符子圖片進行判斷和處理,(切分後的子圖片可能將相互粘連的字符切分到一起(粘連切分後字符如圖4所示)),判斷過程如下:序列中未標記的子圖片寬度是否滿足L≤1.2h?對於不滿足上述條件的子圖片進行切分:使用以下公式來進行切分點的判斷:

f(x)=g(x)t(x)

如圖4所示的子圖片,經過投影后像素的幅值分布為圖5所示,可以發現當x點與行高h相距為0時,其修正值g(x)(分布如圖6所示)最小,為0.5,當x與h相距越大,修正越大,由於本文假設字符的寬度與行高相當,因此可以理解為字符投影點越靠近該字符所處的寬度處時,其修正值越小,這樣可以避免幅值出現多個極值點。本子圖片中字符的幅值在x=19和20處出現極小值,該子圖片字符的行高為19,經g(x)的修正,可以得出f(19)=0.5000,f(20)=0.5025;x=19時f(x)的值最小,x=19確定為切分點,並根據該切分點,將子圖片字符切分出來。

在上述處理的基礎上,對於序列中切分滿足總寬度L合≤M*h相鄰子圖片進行合併,直到沒有滿足合併條件的子圖片為止。

對於序列中的子圖片進行再次判斷,將滿足三個子圖片滿足:第一子圖片和第三子圖片的寬度L≤0.5h,且中間子圖片的寬度L≥h,使用步驟(4)中的公式進行再次切分;將切分後的前後字符兩兩合併;直到沒有滿足條件的子圖片為止;完成了所有子圖片的切分,並將切分後的子圖片按照序列順序輸入。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀