一種紙類字符識別方法及相關裝置的製作方法
2023-07-02 22:24:21 1
專利名稱:一種紙類字符識別方法及相關裝置的製作方法
技術領域:
本發明涉及圖像處理領域,尤其涉及一種紙類字符識別方法及相關裝置。
背景技術:
隨著經濟和社會的發展,紙幣越來越多,流通也越來越頻繁。紙幣是一種重要的票據,真鈔的號碼具有唯一性,是國家紙幣印刷數量的標誌,因此可以作為紙幣的身份證明。目前市場上存在的具有紙幣號碼識別功能的機具,其識別的準確率都不能達到金融機構的要求,金融機構在處理業務時,最終需採用手工抄寫紙幣號碼的方法來輔助識別假幣。因此需在紙幣處理機具上開發一種高效率、高準確率的紙幣號碼自動識別記錄系統,一旦出現異常情況(如ATM機收取假幣或從ATM中取出假幣等),就可以通過自動記錄的紙幣號碼進行跟蹤定位。
紙幣號碼識別系統主要分兩部分,字符定位和字符識別。而字符定位的準確度直接影響字符的識別結果。由於鈔票本身新舊程度及圖像採集設備打光值的影響,字符定位主要存在以下問題字符在整幅圖像中的相對位置有一定的浮動,一方面由於紙幣印刷時字符的相對位置會有一定的浮動;另一方面圖像採集時,傾斜角度的大小也後造成字符相對位置有一定的浮動;由於上述原因,使得字符定位容易出現偏差,從而導致識別設備無法精確的識別出紙幣號碼。
發明內容
本發明實施例提供了一種紙類字符識別方法及相關裝置,用於準確的進行輸入紙類中字符串的識別。本發明提供的紙類字符識別方法,包括獲取輸入紙類的圖像數據;對所述圖像數據進行傾斜校正;對所述圖像數據的目標字符串進行初步定位,獲取所述目標字符串的初步區域;定位所述初步區域內像素點的灰度值之和最小的區域;獲得所述目標字符串的全區域;對所述全區域內的目標字符串進行字符識別。可選的,所述對圖像數據進行傾斜校正,包括提取所述圖像數據的邊緣點;對所述邊緣點進行直線擬合;獲取所述直線擬合後的邊緣點的傾斜角度;根據所述傾斜角度調整所述圖像數據。可選的,所述對圖像數據的目標字符串進行初步定位之前,包括對所述圖像數據進行預處理,所述預處理包括為幣種識別,面值識別及方向識別中任意一種或兩種以上的組合。可選的,所述對圖像數據的目標字符串進行初步定位,具體為根據所述預處理的結果獲取所述目標字符串的目標區域;所述初步區域為所述目標字符串在所述目標區域內的最大範圍信息,所述最大範圍信息包括所述目標區域的最大高度H和最大寬度W。可選的,所述根據初步區域進行所述目標字符串的頂點定位之前,包括去除所述初步區域中的噪聲數據。
可選的,所述對全區域內的目標字符串進行字符識別,包括確定所述目標字符串中各個字符的上下邊界和左右邊界,得到各個單字符區域;分別識別所述單字符區域內的字符。可選的,所述確定所述目標字符串中各個字符的上下邊界和左右邊界,包括獲取所述目標字符串中的字符像素點閾值;根據所述字符像素點閾值確定連續的字符像素點,將所述連續的字符像素點垂直方向上的起點坐標和終點坐標作為上下邊界,將所述連續的字符像素點水平方向上的起點坐標和終點坐標作為左右邊界。可選的,所述得到各個單字符區域之後,包括根據相鄰兩個字符之間的間距判斷所述兩個字符是否為斷裂字符,若是,則對所述兩個字符的單字符區域進行合併。
可選的,所述得到各個單字符區域之後,包括根據單個字符的字符寬度判斷所述單個字符是否為粘連字符,若是,則對所述單個字符的單字符區域進行分離。可選的,所述根據單個字符的字符寬度判斷所述單個字符是否為粘連字符,包括判斷所述單個字符的字符寬度是否大於寬度閾值,若是,則所述單個字符為粘連字符;所述對單個字符的單字符區域進行分離,包括重新對所述單個字符進行左右邊界的確定,若所述單個字符在水平方向上連續的字符像素點滿足預置字符寬度,則確認所述滿足預置字符寬度內的區域為被分離的第一個單字符區域,並從所述第一個單字符區域的下一點開始作為被分離字符的左邊界,原所述單個字符的右邊界為所述被分離字符的右邊界。可選的,所述得到各個單字符區域之後,包括判斷所述單字符區域是否滿足邊界閾值,若否,則根據所述邊界閾值對所述單字符區域進行縮放。可選的,所述確定目標字符串中各個字符的上下邊界,包括從所述全區域的中間像素點開始,往上搜索,若連續兩個像素點都不滿足所述字符像素點閾值,則所述兩個像素點之前的像素點作為作為上邊界;往下搜索,若連續兩個像素點都不滿足所述字符像素點閾值,則所述兩個像素點之前的像素點作為作為下邊界。本發明提供的紙類字符識別方法,包括獲取字符串的目標區域;確定所述目標區域中各個字符的上下邊界和左右邊界,得到各個單字符區域;根據相鄰兩個字符之間的間距判斷所述兩個字符是否為斷裂字符,若是,則對所述兩個字符的單字符區域進行合併;分別識別所述單字符區域內的字符。可選的,所述確定所述字符串中各個字符的上下邊界和左右邊界,包括獲取所述字符串中的字符像素點閾值;根據所述字符像素點閾值確定連續的字符像素點,將所述連續的字符像素點垂直方向上的起點坐標和終點坐標作為上下邊界,將所述連續的字符像素點水平方向上的起點坐標和終點坐標作為左右邊界。可選的,所述得到各個單字符區域之後,包括根據單個字符的字符寬度判斷所述單個字符是否為粘連字符,若是,則對所述單個字符的單字符區域進行分離。可選的,所述根據單個字符的字符寬度判斷所述單個字符是否為粘連字符,包括判斷所述單個字符的字符寬度是否大於寬度閾值,若是,則所述單個字符為粘連字符;所述對單個字符的單字符區域進行分離,包括重新對所述單個字符進行左右邊界的確定,若所述單個字符在水平方向上連續的字符像素點滿足預置字符寬度,則確認所述滿足預置字符寬度內的區域為被分離的第一個單字符區域,並從所述第一個單字符區域的下一點開始作為被分離字符的左邊界,原所述單個字符的右邊界為所述被分離字符的右邊界。可選的,所述得到各個單字符區域之後,包括判斷所述單字符區域是否滿足邊界閾值,若不,則根據所述邊界閾值對所述單字符區域進行縮放。
可選的,所述確定字符串中各個字符的上下邊界,包括從所述全區域的中間像素點開始,往上搜索,若連續兩個像素點都不滿足所述字符像素點閾值,則所述兩個像素點之前的像素點作為作為上邊界;從所述全區域的中間像素點開始,往下搜索,若連續兩個像素點都不滿足所述字符像素點閾值,則所述兩個像素點之前的像素點作為作為下邊界。本發明提供的紙類字符識別裝置,包括數據獲取單元,用於獲取輸入紙類的圖像數據;傾斜校正單元,用於對所述圖像數據進行傾斜校正;初步定位單元,用於對所述圖像數據的目標字符串進行初步定位,獲取所述目標字符串的初步區域;全區域定位單元,用於定位所述初步區域內像素點的灰度值之和最小的區域;獲得所述目標字符串的全區域;字符識別單元,用於對所述全區域內的目標字符串進行字符識別。可選的,所述傾斜校正單元包括邊緣提取模塊,用於提取所述圖像數據的邊緣點;直線擬合模塊,用於對所述邊緣點進行直線擬合;傾斜角度獲取模塊,用於獲取所述直線擬合後的邊緣點的傾斜角度;調整模塊,用於根據所述傾斜角度調整所述圖像數據。本發明提供的紙類字符識別裝置,包括目標獲取單元,用於獲取字符串的目標區域;邊界定位單元,用於確定所述目標區域中各個字符的上下邊界和左右邊界,得到各個單字符區域;合併單元,用於根據相鄰兩個字符之間的間距判斷所述兩個字符是否為斷裂字符,若是,則對所述兩個字符的單字符區域進行合併;識別單元,用於分別識別所述單字符區域內的字符。可選的,所述裝置還包括粘連判定單元,用於根據單個字符的字符寬度判斷所述單個字符是否為粘連字符,若是,則對所述單個字符的單字符區域進行分離。從以上技術方案可以看出,本發明實施例具有以下優點本發明在對輸入紙類的圖像數據進行字符定位時,對先對圖像數據進行傾斜校正,使得字符的分割和定位更加準確;並且,根據目標字符串的全區域相對背景區域灰度值較小這個特點,可以對初步定位後的字符串區進行頂點定位,更加精確地確定目標字符串所在的位置,進一步的提聞了字符串識別的精確度。
圖I是本發明實施例紙類字符識別方法的一個流程示意圖;圖2是本發明實施例紙類字符識別方法的另一個流程示意圖3是本發明實施例紙類字符識別裝置的一個邏輯結構示意圖;圖4是本發明實施例紙類字符識別裝置的另一個邏輯結構示意圖。
具體實施例方式本發明實施例提供了一種紙類字符識別方法及相關裝置,用於準確的進行輸入紙類中字符串的識別。 請參閱圖1,本發明實施例中輸入紙類識別方法的一個實施例包括101、獲取輸入紙類的圖像數據;字符識別裝置獲取輸入紙類的圖像數據;具體的,具體的,所述輸入紙類數據可以為紙幣;所述圖像數據包括像素點,以及像素點的灰度值數據。優選的,字符識別裝置可以獲取白光灰度的圖像數據,以減小數據處理的複雜度;可選的,字符識別裝置也獲取可以獲取彩色的圖像數據,以豐富輸入紙類識別的特徵(一些紙幣有特定的顏色,彩色數據有助於直接識別幣種);具體獲取圖像數據的類型可以根據實際需求而定,此處不作限定。102、對所述圖像數據進行傾斜校正;字符識別裝置對所述圖像數據進行傾斜校正。由於通過圖像採集設備獲取到的採集圖像不可避免的會發生傾斜,因此,在進行字符定位之前,需要先進行傾斜校正。103、對所述圖像數據的目標字符串進行初步定位;字符識別裝置對所述圖像數據的目標字符串進行初步定位,獲取所述目標字符串的初步區域。具體的,目標字符串的類型可以根據實際的識別需求而定,如,需要對紙幣的唯一性進行識別,則所述目標字符串可以為紙幣的冠字號碼。具體的,所述初步區域可以包括該區域的寬帶和高度信息。可選的,初步定位可以通過輸入紙類數據的經驗值判定來完成,如,可以先對該輸入紙類的類型進行識別,確定類型後,字符識別裝置則可以大致知道所需要識別的目標字符串在該輸入紙類的哪一個區域,該區域的面積大概有多少。具體的,若所述輸入紙類為非對稱圖形(即左右或正反的圖案或字符不一致),則在進行初步定位之前,還需要確定該輸入紙類的方向(正反及圖案的朝向)。104、定位所述初步區域內像素點的灰度值之和最小的區域;字符識別裝置定位所述初步區域內像素點的灰度值之和最小的區域,獲得所述目標字符串的全區域。在實際應用中,由於紙幣上的字符區域的灰度值一般會低於所在區域的其他位置的灰度值,且某一幣種、某一面值的目標字符串所佔大小固定,因此,字符識別裝置可以定位所述初步區域內像素點的灰度值之和最小的區域,以進一步縮小初步區域的範圍,排除噪聲的幹擾。在步驟103中完成了對目標字符串的初步定位,為了排除噪聲的幹擾,提高字符識別的精確度,需要對目標字符串進行二次定位。105、對所述全區域內的目標字符串進行字符識別。字符識別裝置對所述全區域內的目標字符串進行字符識別。
具體的,可以根據經驗值先對所述全區域內的目標字符串進行單字符分割,再使用人工神經網絡進行單個字符的識別。上述僅以一些例子對本發明實施例中字符識別的方法進行了說明,可以理解的是,在實際應用中,還可以有其它的字符識別方法,具體此處不作限定。本發明在對輸入紙類的圖像數據進行字符定位時,對先對圖像數據進行傾斜校正,使得字符的分割和定位更加準確;並且,根據目標字符串的全區域相對背景區域灰度值較小這個特點,可以對初步定位後的字符串區進行頂點定位,更加精確地確定目標字符串所在位置,進一步的提聞了字符串識別的精確度。下面對本發明輸入紙類識別方法進行詳細描述,請參閱圖2,本發明實施例中輸入紙類識別方法的另一個實施例包括201、獲取輸入紙類的圖像數據;字符識別裝置獲取輸入紙類的圖像數據;具體的,具體的,所述輸入紙類數據可以為紙幣;所述圖像數據包括像素點,以及像素點的灰度值數據。優選的,字符識別裝置獲取可以獲取白光灰度的圖像數據,以減小數據處理的複雜度;可選的,字符識別裝置也獲取可以獲取彩色的圖像數據,以豐富輸入紙類識別的特徵(一些紙幣有特定的顏色,彩色數據有助於直接識別幣種);具體獲取圖像數據的類型可以根據實際需求而定,此處不作限定。202、提取所述圖像數據的邊緣點;字符識別裝置提取所述圖像數據的邊緣點。由於採集得到圖像數據的背景單一,且輸入紙類的邊界有明顯的灰度差,可以利用這點來搜索圖像數據中的邊緣點。203、對所述邊緣點進行直線擬合;字符識別裝置對所述邊緣點進行直線擬合。204、獲取所述直線擬合後的邊緣點的傾斜角度;字符識別裝置獲取所述直線擬合後的邊緣點的傾斜角度。可選的,上述邊緣點進行直線擬合後,還可以獲得所述圖像數據的邊界長度(即獲知所述輸入紙類的大小),有助於後續進行幣種和面值的識別。205、根據所述傾斜角度調整所述圖像數據;字符識別裝置根據所述傾斜角度調整所述圖像數據,使得所述圖像數據的上下邊界平行於水平面。如,若所述輸入紙類的圖像數據順時針傾斜了 30度,則字符識別裝置將所述圖像數據逆時針往回調整30度。206、對所述圖像數據進行預處理;字符識別裝置對所述圖像數據進行預處理,所述預處理包括為幣種識別,面值識別及方向識別中任意一種或兩種以上的組合。在實際應用中,幣種識別和面值識別有助於字符識別裝置大致確認所需要識別的目標字符串在該輸入紙類的哪一個區域,該區域的面積大概有多少。而在實際的輸入紙類的掃描過程中,輸入紙類放置的正反和方向皆有不同,因此,還需要對輸入紙類進行方向識別。具體的,幣種識別和面值識別可以通過模式識別方法,或圖像處理方法實現;可選的,若經過面值識別之後確定所述輸入紙類為面值100元人民幣,則通過對特定位置的圖像識別(如,識別頭像的位置),可以判別出所述100元人民幣的正反;進一步的,對數額所在的為位置進行識別,若識別出「001」,則可以確認所述100元人民幣被倒置。可選的,也可以不基於幣種識別和面值識別的結果進行方向識別,只要基於一些圖像的正反及朝向的特徵進行判別即可。207、對圖像數據的目標字符串進行初步定位;字符識別裝置根據所述預處理的結果獲取所述目標字符串的目標區域,獲取所述目標字符串在所述目標區域內的最大範圍信息,所述最大範圍信息包括所述目標區域的最大高度H和最大寬度W。具體的,所述圖像數據進行預處理之後,可以根據輸入紙類的幣種、面值及方向信息獲知所述目標字符串的目標區域及所述目標字符串在所述目標區域內的最大範圍信息(字符識別裝置中預置的映射關係)。208、去除所述初步區域中的噪聲數據; 可選的,在完成對圖像數據的目標字符串進行初步定位之後,字符識別裝置去除所述初步區域中的噪聲數據。具體的,字符識別裝置可以預設噪聲閾值,若所述圖像數據中的像素點的灰度值滿足噪聲閾值,則被判定為噪聲,去除所述噪聲的數據。209、定位所述初步區域內像素點的灰度值之和最小的區域;字符識別裝置定位所述初步區域內像素點的灰度值之和最小的區域,獲得所述目標字符串的全區域。在實際應用中,由於紙幣上的字符區域的灰度值一般會低於所在區域的其他位置的灰度值,且某一幣種、某一面值的目標字符串所佔大小固定,因此,字符識別裝置可以定位所述初步區域內像素點的灰度值之和最小的區域,以進一步縮小初步區域的範圍,排除噪聲的幹擾。具體的,可以通過對所述目標字符串進行頂點定位實現。所述頂點定位為確定所述目標字符串所在的最小區域中,確定四個頂點中任意一個頂點的坐標;在獲知該頂點坐標之後,根據輸入紙類類型的經驗值,即可所述目標字符串的寬度和高度信息。以左上角頂點定位為例,cw和ch分別為目標字符串的寬度和高度,只要定位到以(cw, ch)為特徵塊的灰度和最小區域,既為目標字符串所在區域坐標,計算方法如下式所示
j+ch +cw
(xSiarl,yS(an) = min(^ V f(x^y))J e (OJF -γμ.), / e (0, H-ch),其中 W,和"為初步定
位字符所在區域的寬皮和高度,CM,和d 為字符實際寬度和高度。{xStart,yStarf)為字符區域的起始坐標。同理,橫縱坐標從不同方向累加,分別可以得到其他三個頂點,計算方法如下所示右上頂點,
j+ch i-cw
{xEnd ,ySlari.) - rniii(^ V I (λ*,, g (^ ~ ,- (0, ^ _ ;左下頂點,(xSiar/.yl'juf) = min( ^ ^ I (.v, y))^ / e (Or W - cw) J -\,ch);右下頂點,{xlind,ylind) - ηι η( ^ 乞 I(x, y)),/ e (W -1,cw), / e (// - L ch)。
/=Ji-I /=FF-I
210、確定所述目標字符串中各個字符的上下邊界和左右邊界;字符識別裝置確定所述目標字符串中各個字符的上下邊界和左右邊界,得到各個單字符區域。
具體的,字符識別裝置可以先獲取所述目標字符串中的字符像素點閾值;再根據所述字符像素點閾值確定連續的字符像素點,將所述連續的字符像素點垂直方向上的起點坐標和終點坐標作為上下邊界,將所述連續的字符像素點水平方向上的起點坐標和終點坐標作為左右邊界。可選的,確定上下邊界的方法可以為從所述全區域的中間像素點開始,往上搜索,若連續兩個像素點都不滿足所述字符像素點閾值,則所述兩個像素點之前的像素點作為作為上邊界;往下搜索,若連續兩個像素點都不滿足所述字符像素點閾值,則所述兩個像素點之前的像素點作為作為下邊界。211、根據相鄰兩個字符之間的間距判斷所述兩個字符是否為斷裂字符;可選的,為了進一步提高字符識別的精確度,所述得到各個單字符區域之後,字符識別裝置可以根據相鄰兩個字符之間的間距判斷所述兩個字符是否為斷裂字符(對於一已知的幣種和面值來說,每個字符的寬度是預先知道的),若是,則執行步驟212對所述兩個字符的單字符區域進行合併;若否,則執行步驟213。 212、對所述兩個字符的單字符區域進行合併;字符識別裝置對所述兩個字符的單字符區域進行合併。即將第一字符的左邊界作為合併後字符的左邊界,第二個字符的右邊界作為合併後字符的右邊界。213、根據單個字符的字符寬度判斷所述單個字符是否為粘連字符;可選的,為了進一步提高字符識別的精確度,所述得到各個單字符區域之後,字符識別裝置可以根據單個字符的字符寬度判斷所述單個字符是否為粘連字符,若是,則執行步驟214對所述單個字符的單字符區域進行分離;若否,則執行步驟215。具體的,字符識別裝置可以判斷所述單個字符的字符寬度是否大於寬度閾值,若是,則所述單個字符為粘連字符。214、對單個字符的單字符區域進行分離;字符識別裝置對單個字符的單字符區域進行分離。示例性的,字符識別裝置重新對所述單個字符進行左右邊界的確定,若所述單個字符在水平方向上連續的字符像素點滿足預置字符寬度,則確認所述滿足預置字符寬度內的區域為被分離的第一個單字符區域,並從所述滿足預置字符寬度點的下一點開始作為第二個被分離字符的左邊界,原所述單個字符的右邊界為所述第二個被分離字符的右邊界。215、判斷所述單字符區域是否滿足邊界閾值;可選的,在得到各個單字符區域之後,字符識別裝置可以判斷所述單字符區域是否滿足邊界閾值,若不,則執行步驟216根據所述邊界閾值對所述單字符區域進行縮放;若否,則執行步驟217。216、根據所述邊界閾值對所述單字符區域進行縮放;字符識別裝置根據所述邊界閾值對所述單字符區域進行縮放,將單字符區域歸一化到相同的大小,以便後續識別。217、對所述全區域內的目標字符串進行字符識別。字符識別裝置對所述全區域內的目標字符串進行字符識別。具體的,可以根據經驗值先對所述全區域內的目標字符串進行單字符分割,再使用人工神經網絡進行單個字符的識別。上述僅以一些例子對本發明實施例中字符識別的方法進行了說明,可以理解的是,在實際應用中,還可以有其它的字符識別方法,具體此處不作限定。為了便於理解,下面以一具體應用場景對上述的實施例中描述的紙類字符識別方法再進行詳細描述,具體為在準確地獲得目標字符串的全區域後,需要進一步進行單字符分割,即找到每一個字符的準確位置。為了保證算法準確性和快速性,本實例採用分別對水平和垂直方向做二值投影法確定每個單字符的左右和上下邊界。由於受到噪聲,傾斜,打光等原因的影響,二值化閾值過高容易出現字符粘連,閾值低又會出現字符斷裂。基於以上問題,這裡採用對字符區域求最大方差閾值作為二值化投影的閾值,並且儘量選擇一個相對較低的閾值,這樣可以去除更多的噪聲點,減少字符發生粘連的概率。而過低閾值易造成字符的斷裂,所以定位每個字符時,還要把斷裂的字符進行合併。同時對於一些無損的情況,會出現字符粘連現在,字符定位時要將其分割成兩個字符。a)單字符左右邊界定位;(xStart, yStart)為字符區域的起始坐標,首先做垂直方向投影,垂直方向投影值為錯誤!未找到引用源。,其中cw是字符實際寬度,η是將左右邊界各向兩側擴的值,本實例η=3,這可以避免左右點解定位一些小的偏差帶來的影響;
權利要求
1.一種紙類字符識別方法,其特徵在於,包括 獲取輸入紙類的圖像數據; 對所述圖像數據進行傾斜校正; 對所述圖像數據的目標字符串進行初步定位,獲取所述目標字符串的初步區域; 定位所述初步區域內像素點的灰度值之和最小的區域;獲得所述目標字符串的全區域; 對所述全區域內的目標字符串進行字符識別。
2.根據權利要求I的方法,其特徵在於,所述對圖像數據進行傾斜校正,包括 提取所述圖像數據的邊緣點; 對所述邊緣點進行直線擬合; 獲取所述直線擬合後的邊緣點的傾斜角度; 根據所述傾斜角度調整所述圖像數據。
3.根據權利要求I的方法,其特徵在於,所述對圖像數據的目標字符串進行初步定位之前,包括 對所述圖像數據進行預處理,所述預處理包括為幣種識別,面值識別及方向識別中任意一種或兩種以上的組合。
4.根據權利要求3的方法,其特徵在於,所述對圖像數據的目標字符串進行初步定位,具體為 根據所述預處理的結果獲取所述目標字符串的目標區域; 所述初步區域為所述目標字符串在所述目標區域內的最大範圍信息,所述最大範圍信息包括所述目標區域的最大高度H和最大寬度W。
5.根據權利要求I的方法,其特徵在於,所述根據初步區域進行所述目標字符串的頂點定位之前,包括 去除所述初步區域中的噪聲數據。
6.根據權利要求I的方法,其特徵在於,所述對全區域內的目標字符串進行字符識別,包括 確定所述目標字符串中各個字符的上下邊界和左右邊界,得到各個單字符區域; 分別識別所述單字符區域內的字符。
7.根據權利要求6的方法,其特徵在於,所述確定所述目標字符串中各個字符的上下邊界和左右邊界,包括 獲取所述目標字符串中的字符像素點閾值; 根據所述字符像素點閾值確定連續的字符像素點,將所述連續的字符像素點垂直方向上的起點坐標和終點坐標作為上下邊界,將所述連續的字符像素點水平方向上的起點坐標和終點坐標作為左右邊界。
8.根據權利要求6的方法,其特徵在於,所述得到各個單字符區域之後,包括 根據相鄰兩個字符之間的間距判斷所述兩個字符是否為斷裂字符,若是,則對所述兩個字符的單字符區域進行合併。
9.根據權利要求6的方法,其特徵在於,所述得到各個單字符區域之後,包括 根據單個字符的字符寬度判斷所述單個字符是否為粘連字符,若是,則對所述單個字符的單字符區域進行分離。
10.根據權利要求9的方法,其特徵在於,所述根據單個字符的字符寬度判斷所述單個字符是否為粘連字符,包括 判斷所述單個字符的字符寬度是否大於寬度閾值,若是,則所述單個字符為粘連字符; 所述對單個字符的單字符區域進行分離,包括 重新對所述單個字符進行左右邊界的確定,若所述單個字符在水平方向上連續的字符像素點滿足預置字符寬度,則確認所述滿足預置字符寬度內的區域為被分離的第一個單字符區域,並從所述第一個單字符區域的下一點開始作為被分離字符的左邊界,原所述單個字符的右邊界為所述被分離字符的右邊界。
11.根據權利要求6的方法,其特徵在於,所述得到各個單字符區域之後,包括 判斷所述單字符區域是否滿足邊界閾值,若否,則根據所述邊界閾值對所述單字符區域進行縮放。
12.根據權利要求6的方法,其特徵在於,所述確定目標字符串中各個字符的上下邊界,包括 從所述全區域的中間像素點開始,往上搜索,若連續兩個像素點都不滿足所述字符像素點閾值,則所述兩個像素點之前的像素點作為作為上邊界;往下搜索,若連續兩個像素點都不滿足所述字符像素點閾值,則所述兩個像素點之前的像素點作為作為下邊界。
13.—種紙類字符識別方法,其特徵在於,包括 獲取字符串的目標區域; 確定所述目標區域中各個字符的上下邊界和左右邊界,得到各個單字符區域; 根據相鄰兩個字符之間的間距判斷所述兩個字符是否為斷裂字符,若是,則對所述兩個字符的單字符區域進行合併; 分別識別所述單字符區域內的字符。
14.根據權利要求13的方法,其特徵在於,所述確定所述字符串中各個字符的上下邊界和左右邊界,包括 獲取所述字符串中的字符像素點閾值; 根據所述字符像素點閾值確定連續的字符像素點,將所述連續的字符像素點垂直方向上的起點坐標和終點坐標作為上下邊界,將所述連續的字符像素點水平方向上的起點坐標和終點坐標作為左右邊界。
15.根據權利要求13的方法,其特徵在於,所述得到各個單字符區域之後,包括 根據單個字符的字符寬度判斷所述單個字符是否為粘連字符,若是,則對所述單個字符的單字符區域進行分離。
16.根據權利要求15的方法,其特徵在於,所述根據單個字符的字符寬度判斷所述單個字符是否為粘連字符,包括 判斷所述單個字符的字符寬度是否大於寬度閾值,若是,則所述單個字符為粘連字符; 所述對單個字符的單字符區域進行分離,包括 重新對所述單個字符進行左右邊界的確定,若所述單個字符在水平方向上連續的字符像素點滿足預置字符寬度,則確認所述滿足預置字符寬度內的區域為被分離的第一個單字符區域,並從所述第一個單字符區域的下一點開始作為被分離字符的左邊界,原所述單個字符的右邊界為所述被分離字符的右邊界。
17.根據權利要求13的方法,其特徵在於,所述得到各個單字符區域之後,包括 判斷所述單字符區域是否滿足邊界閾值,若不,則根據所述邊界閾值對所述單字符區域進行縮放。
18.根據權利要求13的方法,其特徵在於,所述確定字符串中各個字符的上下邊界,包括 從所述全區域的中間像素點開始,往上搜索,若連續兩個像素點都不滿足所述字符像素點閾值,則所述兩個像素點之前的像素點作為作為上邊界; 從所述全區域的中間像素點開始,往下搜索,若連續兩個像素點都不滿足所述字符像素點閾值,則所述兩個像素點之前的像素點作為作為下邊界。
19.一種紙類字符識別裝置,其特徵在於,包括 數據獲取單元,用於獲取輸入紙類的圖像數據; 傾斜校正單元,用於對所述圖像數據進行傾斜校正; 初步定位單元,用於對所述圖像數據的目標字符串進行初步定位,獲取所述目標字符串的初步區域; 全區域定位單元,用於定位所述初步區域內像素點的灰度值之和最小的區域;獲得所述目標字符串的全區域; 字符識別單元,用於對所述全區域內的目標字符串進行字符識別。
20.根據權利要求19的裝置,其特徵在於,所述傾斜校正單元包括 邊緣提取模塊,用於提取所述圖像數據的邊緣點; 直線擬合模塊,用於對所述邊緣點進行直線擬合; 傾斜角度獲取模塊,用於獲取所述直線擬合後的邊緣點的傾斜角度; 調整模塊,用於根據所述傾斜角度調整所述圖像數據。
21.一種紙類字符識別裝置,其特徵在於,包括 目標獲取單元,用於獲取字符串的目標區域; 邊界定位單元,用於確定所述目標區域中各個字符的上下邊界和左右邊界,得到各個單字符區域; 合併單元,用於根據相鄰兩個字符之間的間距判斷所述兩個字符是否為斷裂字符,若是,則對所述兩個字符的單字符區域進行合併; 識別單元,用於分別識別所述單字符區域內的字符。
22.根據權利要求21的裝置,其特徵在於,所述裝置還包括 粘連判定單元,用於根據單個字符的字符寬度判斷所述單個字符是否為粘連字符,若是,則對所述單個字符的單字符區域進行分離。
全文摘要
本發明實施例公開了一種紙類字符識別方法及相關裝置,用於準確的進行輸入紙類中字符串的識別。方法包括獲取輸入紙類的圖像數據;對所述圖像數據進行傾斜校正;對所述圖像數據的目標字符串進行初步定位,獲取所述目標字符串的初步區域;定位所述初步區域內像素點的灰度值之和最小的區域;獲得所述目標字符串的全區域;對所述全區域內的目標字符串進行字符識別。
文檔編號G06K9/32GK102779275SQ20121023090
公開日2012年11月14日 申請日期2012年7月4日 優先權日2012年7月4日
發明者關玉萍, 向拓聞, 徐朝陽 申請人:廣州廣電運通金融電子股份有限公司