新四季網

一種票據字符校正的方法及裝置與流程

2023-12-04 10:53:06 2


本發明屬於票據圖像識別技術領域,尤其涉及一種票據字符校正的方法及裝置。



背景技術:

票據票面上的字符是記錄、分析信息的一種重要標記和可靠途徑。有價票據、尤其是銀行票據作為一種廣泛使用的結算方式,其票面字符的自動化識別尤為重要,OCR(Optical Character Recognition,光學字符識別)處理技術作為文字識別和文檔分析領域的一個研究熱點在有價票據字符識別中的廣泛應用也印證了這點。

有價票據文件的字符識別一般包括圖像預處理、傾斜校正、字符定位和字符識別等過程。

票據圖像採集中會出現整行字符的整體傾斜,傾斜後整體還在一條直線上,所有字符的傾斜角度一樣,利用如上特徵,通過對整幅票據圖像進行校正可以解決字符傾斜的問題。

發明人發現票據圖像採集過程中,由於運動、擠壓等原因造成票據字符發生不同程度傾斜,而且每個字符的傾斜程度均不同。



技術實現要素:

本發明實施例提供一種票據字符校正的方法,旨在解決上述現有字符傾斜校正方法用於「票據字符發生不同程度傾斜,而且每個字符的傾斜程度均不同」的這種情況對傾斜字符進行整體校正時,一方面某些字符依舊傾斜嚴重,另一方面整幅票據圖像進行校正,增加了算法時間複雜度,降低了算法效率的問題。

本發明實施例的第一方面,提供一種票據字符校正的方法,所述方法包括:

檢測票面圖像中的單個字符;

確定所述單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域;

計算所述最小外接矩形外側預設緩衝區範圍內的矩形區域相對於票據對稱軸的傾斜角度或計算所述最小外接矩形外側預設緩衝區範圍內的矩形區域相對於交於所述對稱軸上預設點的直線的傾斜角度,所述直線相對於所述對稱軸的傾斜角度在預設範圍內;

根據所述傾斜角度校正所述最小外接矩形外側預設緩衝區範圍內的矩形區域。

本發明實施例的第二方面,提供一種票據字符校正的裝置,所述裝置包括:

檢測模塊,用於檢測票面圖像中的單個字符;

確定模塊,用於確定所述單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域;

計算模塊,計算所述最小外接矩形外側預設緩衝區範圍內的矩形區域相對於票據對稱軸的傾斜角度或計算所述最小外接矩形外側預設緩衝區範圍內的矩形區域相對於交於所述對稱軸上預設點的直線的傾斜角度,所述直線相對於所述對稱軸的傾斜角度在預設範圍內;

校正模塊,用於根據所述傾斜角度校正所述最小外接矩形外側預設緩衝區範圍內的矩形區域。

本發明實施例與現有技術相比存在的有益效果是:提供一種票據校正的方法,檢測票面中的單個字符;確定所述單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域;計算所述最小外接矩形外側預設緩衝區範圍內的矩形區域相對於票據對稱軸的傾斜角度或計算所述最小外接矩形外側預設緩衝區範圍內的矩形區域相對於交於所述對稱軸上預設點的直線的傾斜角度,所述直線相對於所述對稱軸的傾斜角度在預設範圍內;根據所述傾斜角度校正所述最小外接矩形外側預設緩衝區範圍內的矩形區域。相對於現有技術整幅票據圖像進行校正來解決字符傾斜,本技術方案對於每個字符單獨進行傾斜校正,可使每個字符相對於票據來說,傾斜角度控制在不影響字符識別的範圍內,可提高字符自動識別的效率,而且避免了對整幅票據圖像進行旋轉校正,降低了算法的時間複雜度。

附圖說明

為了更清楚地說明本發明實施例中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。

圖1-1是本發明實施例一提供的票據字符校正的方法實現流程圖;

圖1-2是本發明實施例一提供的單個字符的最小外接矩形示意圖;

圖1-3是本發明實施例一提供的單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域示意圖;

圖1-4是本發明實施例一提供的計算最小外接矩形外側預設緩衝區範圍內的矩形區域相對於票據對稱軸的傾斜角度和計算最小外接矩形外側預設緩衝區範圍內的矩形區域相對於交於所述對稱軸上預設點的直線的傾斜角度,所述直線與所述對稱軸的夾角在預設範圍內的示意圖;

圖2是本發明實施例二提供的票據字符校正的裝置結構示意圖;

圖3是本發明實施例三提供的票據字符校正的裝置結構示意圖;

圖4-1是本發明實施例四提供的票據字符校正的裝置結構示意圖;

圖4-2是本發明實施例四提供的票據字符校正的裝置結構示意圖。

具體實施方式

為了使本發明的目的、技術方案及優點更加清楚明白,以下結合附圖及實施例,對本發明進行進一步詳細說明。

以下描述中,為了說明而不是為了限定,給出了諸多技術特徵的說明示意圖,以便透切理解本發明實施例。然而,本領域的技術人員應當清楚,在沒有這些具體細節的其它實施例中也可以實現本發明。在其它情況中,省略對眾所周知的裝置以及方法的詳細說明,以免不必要的細節妨礙本發明的描述。

實施例一:

票據包括各種有價證券和憑證,例如股票、國庫券、企業債券、發票、提單等,其形狀絕大部分是對稱形狀,尤其是矩形。

為了有效解決現有字符傾斜校正方法用於「票據字符發生不同程度傾斜,而且每個字符的傾斜程度均不同」的這種情況對傾斜字符進行整體校正時,一方面某些字符依舊傾斜嚴重,另一方面整幅票據圖像進行校正,增加了算法時間複雜度,降低了算法效率的問題。本實施例提供的票據字符校正的方法包括:檢測票面圖像中的單個字符;確定所述單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域;計算所述最小外接矩形外側預設緩衝區範圍內的矩形區域相對於票據對稱軸的傾斜角度或計算所述最小外接矩形外側預設緩衝區範圍內的矩形區域相對於交於所述對稱軸上預設點的直線的傾斜角度,所述直線相對於所述對稱軸的傾斜角度在預設範圍內;根據所述傾斜角度校正所述最小外接矩形外側預設緩衝區範圍內的矩形區域。

圖1-1示出了本發明實施例一提供的票據字符校正的方法實現流程圖,為了便於說明,圖1-1僅示出了與本實施例相關的部分,其過程詳述如下:

在步驟S101中,檢測票面圖像中的單個字符。

優選的是,票面中的單個字符可以是世界各個國家或地區或民族用的文字、數字的各種字體的印刷體或手寫體,例如阿拉伯數字、漢語拼音字母、漢字、大小英文字母等。

優選的是,根據字符在票據票面中的特徵,例如字符區域與背景像素亮度值明顯不同或字符輪廓或多個字符組成一串的連續性的特徵,對票據票面進行二值化後,進行單個字符檢測,此方法簡單高效。

優選的是,可以根據每種票據中字符所處的位置在票據票面預設的區域內進行單個字符的檢測,此方法檢測範圍固定,目標性強,可提高檢測效率。

需要說明的是,本實施例檢測票面中的單個字符,指出了處理對象是針對單個字符,為後續其它技術特徵奠定了基礎,也是本申請核心要點,這不同於現有技術中對整幅票據圖像進行處理,提高了處理效率。

在步驟S102中,確定所述單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域。

鑑於最小外接矩形可能存在兩種不同定義,第一種定義為最小面積矩形,第二種定義為以二維坐標表示的若干二維形狀(例如點、直線、多邊形)的最大範圍,即以給定的二維形狀各頂點中的最大橫坐標、最小橫坐標、最大縱坐標、最小縱坐標定下邊界的矩形。

本實施例中的最小外接矩形指最小面積外接矩形,圖1-2中示出了本實施例中提供的單個字符的最小外接矩形示意圖。為了便於理解,建立輔助直角坐標系xoy,字母「O」被對齊標註短邊長度尺寸9.35和長邊長度尺寸14.76的矩形,即第一種定義的矩形和對齊標註短邊長度尺寸9.49和長邊長度尺寸14.73的矩形,即第二種定義的矩形所框定,從圖中示例的長度尺寸也可知第一種定義的矩形,即最小面積外接矩形面積要小於第二種定義的矩形。若從圖1-2中來看,則對齊標註短邊長度尺寸9.35和長邊長度尺寸14.76的矩形為本申請所指的最小外接矩形。

最小外接矩形外側預設緩衝區範圍內的矩形指在最小外接矩形邊線封閉區域外部的預設緩衝區範圍內的矩形,且其面積大於最小外接面積矩形。圖1-3中示出了本實施例中提供的單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域示意圖,為了便於理解,建立輔助直角坐標系xoy,圖中矩形abcd為所述的單個字符的最小外接矩形,矩形a'b'c'd'為以矩形abcd各邊或各邊的預設段為基準在矩形abcd封閉區域外部以預設的距離作緩衝區形成的,如圖1-3中的矩形a1b1c1d1為最小外接矩形外側預設緩衝區範圍內的矩形的一種示例,a1b1c1d1的邊處在矩形abcd以外且矩形a'b'c'd'以內的圖1-3中陰影部分中,圖1-3中的陰影部分只是一種示例,陰影部分也可能是一種不規則形狀。

需要說明的是,本實施例中最小外接矩形外側預設緩衝區範圍,可以是通過大樣本後得到的經驗值範圍。

優選的是,本發明實施例中,確定所述單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域可由如下步驟S1021、步驟S1022實現:

步驟S1021,查找所述單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域。

需要說明的是,單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域為無數個,對於每一個字符只要查到合理數量個數(例如1個)的最小外接矩形外側預設緩衝區範圍內的矩形區域,就進行查找下一個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域,此方法可根據需要,靈活查找需要個數的最小外接矩形外側預設緩衝區範圍內的矩形區域。

步驟S1022,排除誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域。

優選的是,所述誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域為在檢測票面中的單個字符過程中,把票面中的其部分圖像誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域。

優選的是,排除誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域可以是根據預設的字符高度、寬度、及高度、寬度的比值的範圍中至少一個,排除誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域;根據所述單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域中心的預設範圍,排除誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域;根據所述誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域與其它所述單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域形成重疊區域的情形,排除所述誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域中至少一個。

因為字符、尤其是印刷體字符的高度和寬度及二者的比值有約定俗成的書寫規範,票據中字符更是有比較嚴格的規定,故字符的高度和寬度及二者的比值均在一定範圍內,根據預設的字符高度、寬度、及高度、寬度的比值的範圍中至少一個,所述預設的字符高度、寬度、及高度、寬度的比值的範圍是通過大樣本計算後得到的,排除誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域當然可行。

因為字符、尤其是印刷體字符在票據中的位置相對有固定的範圍,因此字符的中心聚集在相對有固定的範圍,故單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域中心的聚集區域也有其相對有固定的範圍,可以採用聚類的方法通過大樣本計算求取此範圍,而後判斷當前查找到的單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域是否在此範圍內,如果在此範圍,則說明是查找到的矩形內是字符,不排除,否則,進行排除。票據中字符更是有比較嚴格的規定,例如即使是手寫體,一般在銀行辦理票據單中有規定的方格或橫線來引導和規範書寫,故根據所述單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域中心的預設範圍,排除誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域當然可行。

若遇到被誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域與其它所述單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域形成重疊區域的情形,排除所述誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域。

優選的是,所述情形為所述重疊區域的形狀和/或測量的所述重疊區域的尺寸和/或面積,即可根據重疊區域的形狀和/或測量的重疊區域的尺寸和/或面積,排除誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域。

需要說明的是,到底重疊區域的尺寸和/或面積為多少時,進行排除這也是通過大樣本計算求取的經驗值。

進一步需要說明的是,因為票據中可能存在類似於字符的圖像區域,但是在步驟S101中運用的算法或者考慮到在步驟S101中字符檢測時要儘量不遺漏檢測字符等諸多原因沒有判別出其不是字符,排除誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域,減少了查找到的單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域,提高後續處理的效率,排除了汙損,非字符等幹擾,提高後續處理的精度。

在步驟S103中,計算所述最小外接矩形外側預設緩衝區範圍內的矩形區域相對於票據對稱軸的傾斜角度或計算所述最小外接矩形外側預設緩衝區範圍內的矩形區域相對於交於所述對稱軸上預設點的直線的傾斜角度,所述直線與所述對稱軸的夾角在預設範圍內。

計算所述最小外接矩形外側預設緩衝區範圍內的矩形區域相對於票據對稱軸的傾斜角度。

需要說明的是,票據對稱軸可以等同於平行於票據對稱軸所有直線,包括票據的長邊和短邊。本實施例中,一條直線相對於另外一條直線的傾斜角度在[0,π/2]範圍。

圖1-4中示出了本實施例中提供的計算最小外接矩形外側預設緩衝區範圍內的矩形區域相對於票據對稱軸的傾斜角度的示意圖,為了便於理解和說明原理,建立輔助直角坐標系xoy,而且採用了稍微誇張點的畫法,圖1-4中,假設矩形MNPQ為票據,矩形a1b1c1d1為最終確定的最小外接矩形外側預設緩衝區範圍內的矩形,但實際上一般情況下,最小外接矩形外側預設緩衝區範圍內的矩形相對於票據來說沒有這麼大。HH'為票據的一個對稱軸,為了方便,在圖1-4中畫成了直線段,其等同於平行於其所有直線,包括票據的長邊和短邊。在圖1-4中,計算最小外接矩形外側預設緩衝區範圍內的矩形區域a1b1c1d1相對於票據對稱軸HH'為計算矩形a1b1c1d1對稱軸的平行線KK'相對於票據對稱軸HH'的傾斜角度。為了方便,在圖1-4中KK'畫成了直線段,其等同於平行於其所有直線,包括a1b1c1d1的長邊和短邊。在圖1-4中傾斜角度大小為HH'與KK'的夾角,這個夾角可以等同於其補角,故也可以求取HH'與KK'的夾角的補角大小作為所述最小外接矩形外側預設緩衝區範圍內的矩形區域相對於票據對稱軸的傾斜角度。

計算所述最小外接矩形外側預設緩衝區範圍內的矩形區域相對於交於票據對稱軸上預設點的直線的傾斜角度,所述直線相對於所述對稱軸的傾斜角度在預設範圍內。

圖1-4中示出了本實施例中提供的計算最小外接矩形外側預設緩衝區範圍內的矩形區域相對於交於所述對稱軸上預設點的直線的傾斜角度,所述直線相對於所述對稱軸的傾斜角度在預設範圍內,此範圍可通過大樣本計算求取。交於票據對稱軸HH'上預設點S的直線為JJ',直線JJ'與對稱軸HH'的夾角α在預設範圍內,角β或其補角的值為計算最小外接矩形外側預設緩衝區範圍內的矩形區域a1b1c1d1相對於交於對稱軸HH'上預設點S的直線JJ'的傾斜角度的示例。

步驟S104中,根據所述傾斜角度校正所述最小外接矩形外側預設緩衝區範圍內的矩形區域。

優選的是,本發明實施例中,根據所述傾斜角度校正所述最小外接矩形外側預設緩衝區範圍內的矩形區域可由如下步驟S1041、步驟S1042實現:

步驟S1041,將所述傾斜角度與預設角度範圍進行比較。

優選的是,預設角度範圍可以分成多個相互連續的區間,例如三個相互連續的區間。

如圖1-4中,比較傾斜角度β是否在預設角度範圍,例如是否在開區間(5π/12,19π/40)、閉區間[0,5π/12]、閉區間[19π/40,π/2]範圍內。

步驟S1042,若所述傾斜角度屬於預設角度範圍,則對所述最小外接矩形外側預設緩衝區範圍內的矩形區域進行順時針或逆時針旋轉。

如圖1-4中,若傾斜角度β在開區間(5π/12,19π/40)範圍內,則對最小外接矩形外側預設緩衝區範圍內的矩形區域a1b1c1d1進行逆時針旋轉。

而傾斜角度β在[0,5π/12]或[19π/40,π/2]範圍內,則不對矩形區域a1b1c1d1進行旋轉。

不對旋轉角度β在[19π/40,π/2]範圍內的矩形區域a1b1c1d1旋轉,原因是此時字符已經相對於票據不傾斜或傾斜角度在預設範圍內,不影響後續字符識別,不需要進行傾斜校正,減少了需要校正的矩形個數,降低了算法時間複雜度,提高運算效率。

不對旋轉角度β在[0,5π/12]範圍內的矩形區域a1b1c1d1旋轉,原因是此時a1b1c1d1內很可能不是字符,故需謹慎,不進行旋轉,從而也減少了需要校正的矩形個數,降低了算法時間複雜度,提高運算效率。

需要說明的是,以上具體角度區間只是示例,實際中此區間可通過大樣本計算求取。逐個字符進行校正,則全部檢測為單個字符相應圖像會進行旋轉,進行旋轉是指旋轉到字符相對於票據不傾斜或傾斜角度在預設範圍內,不影響後續字符識別等即可,而且在某些情況下,也會發生順時針旋轉。

本發明實施例提供一種票據校正的方法,對於每個字符單獨進行傾斜校正,可使每個字符相對於票據來說,傾斜角度控制在不影響字符識別的範圍內,本發明實施例避免了對整幅票據圖像進行校正造成大多數字符原有特徵信息丟失的情況,從這個角度來看也可以說能解決「整幅票據圖像進行校正造成大多數字符原有特徵信息丟失的問題」,從而最大程度地保留了每個字符原有特徵信息,降低了後續字符定位、自動識別的難度,提高票據字符自動識別的成功率,而且避免了對整幅票據圖像進行旋轉校正,降低了算法的時間複雜度,提高了字符自動識別的效率。

實施例二:

圖2示出了本發明第二實施例提供的票據字符校正的裝置結構示意圖。為了便於說明,圖2僅示出了與本發明實施例相關的部分。圖2示例的票據字符校正的裝置包括檢測模塊201、確定模塊202、計算模塊203和校正模塊204,其中:

檢測模塊201,用於檢測票面圖像中的單個字符。

優選的是,票面中的單個字符可以世界各個國家或地區或民族用的文字、數字的各種字體的印刷體或手寫體,例如阿拉伯數字、漢語拼音字母、漢字、大小英文字母等。

優選的是,根據字符在票據票面中的特徵,例如字符區域與背景像素亮度值明顯不同或字符輪廓或多個字符組成一串的連續性的特徵,對票據票面進行二值化後,進行單個字符檢測,此方法簡單高效。

優選的是,可以根據每種票據中字符所處的位置在票據票面預設的區域內進行單個字符的檢測,此方法檢測範圍固定,目標性強,可提高檢測效率。

需要說明的是,本實施例檢測票面中的單個字符,指出了處理對象是針對單個字符,為後續其它技術特徵奠定了基礎,也是本申請核心要點,這不同於現有技術中對整幅票據圖像進行處理,提高了處理效率。

確定模塊202,用於確定所述單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域。

鑑於最小外接矩形可能存在兩種不同定義,第一種定義為最小面積矩形,第二種定義為以二維坐標表示的若干二維形狀(例如點、直線、多邊形)的最大範圍,即以給定的二維形狀各頂點中的最大橫坐標、最小橫坐標、最大縱坐標、最小縱坐標定下邊界的矩形。

本實例中與第一實施例中部分內容相同,故借用第一實施例中圖1-2和圖1-3進行描述。

本實施例中的最小外接矩形指最小面積外接矩形,且其面積大於最小外接面積矩形。圖1-2中示出了本實施例中提供的單個字符的最小外接矩形示意圖,為了便於理解,建立輔助直角坐標系xoy,字母O被對齊標註短邊長度尺寸9.35和長邊長度尺寸14.76的矩形,即第一種定義的矩形和對齊標註短邊長度尺寸9.49和長邊長度尺寸14.73的矩形,即第二種定義的矩形所框定,從圖中示例的長度尺寸也可知第一種定義的矩形,即最小面積外接矩形面積要小於第二種定義的矩形。若從圖1-2中來看,則對齊標註短邊長度尺寸9.35和長邊長度尺寸14.76的矩形為本申請所指的最小外接矩形。

最小外接矩形外側預設緩衝區範圍內的矩形指在最小外接矩形邊線封閉區域外部的預設緩衝區範圍內的矩形,圖1-3中示出了本實施例中提供的單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域示意圖,為了便於理解,建立輔助直角坐標系xoy,圖中矩形abcd為所述的單個字符的最小外接矩形,矩形a'b'c'd'為以矩形abcd各邊或各邊的預設段為基準在矩形abcd封閉區域外部以預設的距離作緩衝區形成的,如圖1-3中的矩形a1b1c1d1為最小外接矩形外側預設緩衝區範圍內的矩形的一種示例,a1b1c1d1的邊處在矩形abcd以外且矩形a'b'c'd'以內的圖1-3中陰影部分中,圖1-3中的陰影部分只是一種示例,陰影部分也可能是一種不規則形狀。

需要說明的是,本實施例中最小外接矩形外側預設緩衝區範圍,可以是通過大樣本後得到的經驗值範圍。

需要說明的是,因為票據中可能存在類似於字符的圖像區域,但是在步驟S101中運用的算法或者考慮到在步驟S101中字符檢測時要儘量不遺漏檢測字符等諸多原因沒有判別出其不是字符,排除誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域,減少了查找到的單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域,提高後續處理的效率,排除了汙損,非字符等幹擾,提高後續處理的精度。

計算模塊203,用於計算所述最小外接矩形外側預設緩衝區範圍內的矩形區域相對於票據對稱軸的傾斜角度或計算所述最小外接矩形外側預設緩衝區範圍內的矩形區域相對於交於所述對稱軸上預設點的直線的傾斜角度,所述直線相對於所述對稱軸的傾斜角度在預設範圍內。

計算所述最小外接矩形外側預設緩衝區範圍內的矩形區域相對於票據對稱軸的傾斜角度。

需要說明的是,票據對稱軸可以等同於平行於票據對稱軸所有直線,包括票據的長邊和短邊。本實施例中,一條直線相對於另外一條直線的傾斜角度在[0,π/2]範圍內。

本實例中與第一實施例中部分內容相同,故借用第一實施例中圖1-4進行描述。

圖1-4中示出了本實施例中提供的計算最小外接矩形外側預設緩衝區範圍內的矩形區域相對於票據對稱軸的傾斜角度的示意圖,為了便於理解和說明原理,建立輔助直角坐標系xoy,而且採用了稍微誇張點的畫法,圖1-4中,假設矩形MNPQ為票據,矩形a1b1c1d1為最終確定的最小外接矩形外側預設緩衝區範圍內的矩形,但實際上一般情況下,最小外接矩形外側預設緩衝區範圍內的矩形相對於票據來說沒有這麼大。HH'為票據的一個對稱軸,為了方便,在圖1-4中畫成了直線段,其等同於平行於其所有直線,包括票據的長邊和短邊。在圖1-4中,計算最小外接矩形外側預設緩衝區範圍內的矩形區域a1b1c1d1相對於票據對稱軸HH'為計算矩形a1b1c1d1對稱軸的平行線KK'相對於票據對稱軸HH'的傾斜角度。為了方便,在圖1-4中KK'畫成了直線段,其等同於平行於其所有直線,包括a1b1c1d1的長邊和短邊。在圖1-4中傾斜角度大小為HH'與KK'的夾角,這個夾角可以等同於其補角,故也可以求取HH'與KK'的夾角的補角大小作為所述最小外接矩形外側預設緩衝區範圍內的矩形區域相對於票據對稱軸的傾斜角度。

計算所述最小外接矩形外側預設緩衝區範圍內的矩形區域相對於交於票據對稱軸上預設點的直線的傾斜角度,所述直線相對於所述對稱軸的傾斜角度在預設範圍內。

圖1-4中示出了本實施例中提供的計算最小外接矩形外側預設緩衝區範圍內的矩形區域相對於交於所述對稱軸上預設點的直線的傾斜角度,所述直線相對於所述對稱軸的傾斜角度在預設範圍內,此範圍可通過大樣本計算求取。交於票據對稱軸HH'上預設點S的直線為JJ',直線JJ'與對稱軸HH'的夾角α在預設範圍內,角β或其補角的值為計算最小外接矩形外側預設緩衝區範圍內的矩形區域a1b1c1d1相對於交於對稱軸HH'上預設點S的直線JJ'的傾斜角度的示例。

校正模塊204,用於根據所述傾斜角度校正所述最小外接矩形外側預設緩衝區範圍內的矩形區域。

需要說明的是,若傾斜角度在預設的角度區間,則校正最小外接矩形外側預設緩衝區範圍內的矩形區域,實際中此區間可通過大樣本計算求取。逐個字符進行校正,則全部檢測為單個字符相應圖像會進行校正,使得字符相對於票據不傾斜或傾斜角度在預設範圍內,不影響後續字符識別等即可。

需要說明的是,以上圖2示出的本發明第二實施例提供的貨幣面向識別裝置的實施方式中,為描述的方便和簡潔,僅以上述各功能單元、模塊的劃分進行舉例說明,實際應用中可以根據需要,例如相應硬體的配置要求或者軟體的實現的便利考慮,而將上述功能分配由不同的功能模塊完成,即將票據字符校正的裝置的內部結構劃分成不同的功能模塊,以完成以上描述的全部或者部分功能。而且,實際應用中,本實施例中的相應的功能模塊可以是由相應的硬體實現,也可以由相應的硬體執行相應的軟體完成,例如,檢測模塊,可以是具有執行檢測票面中的單個字符的硬體,例如檢測器,也可以是能夠執行相應電腦程式從而完成檢測功能的一般處理器或者其他硬體設備。另外,各功能單元、模塊的具體名稱也只是為了便於相互區分,並不用於限制本申請的保護範圍。(本說明書提供的各個實施例都可應用上述描述原則)。

實施例三:

圖2示出的確定模塊202可以包括查找單元301、排除單元302,如圖3中示出了本發明第三實施例提供的票據字符校正的裝置結構示意圖。其中:

查找單元301,用於查找所述單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域。

需要說明的是,單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域為無數個,對於每一個字符只要查到合理數量個數(例如1個)的最小外接矩形外側預設緩衝區範圍內的矩形區域,就進行查找下一個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域,此方法可根據需要,靈活查找需要個數的最小外接矩形外側預設緩衝區範圍內的矩形區域。

排除單元302,用於排除誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域。

優選的是,所述誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域為在檢測票面中的單個字符過程中,把票面中的其部分圖像誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域。

優選的是,所述排除單元302,包括:第一排除子單元,用於根據預設的字符高度、寬度、及高度、寬度的比值的範圍中至少一個,排除誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域;第二排除子單元,用於根據所述單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域中心的預設範圍,排除誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域;第三排除子單元,用於根據所述誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域與其它所述單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域形成重疊區域的情形,排除所述誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域中至少一個。

因為字符,尤其是印刷體字符的高度和寬度及二者的比值有約定俗成的書寫規範,票據中字符更是有比較嚴格的規定,故字符的高度和寬度及二者的比值均在一定範圍內,根據預設的字符高度、寬度、及高度、寬度的比值的範圍中至少一個,所述預設的字符高度、寬度、及高度、寬度的比值的範圍是通過大樣本計算後得到的,故用第一排除單元排除誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域當然可行。

因為字符,尤其是印刷體字符在票據中的位置相對有固定的範圍,因此字符的中心聚集在相對有固定的範圍,故單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域中心的聚集區域也有其相對有固定的範圍,可以採用聚類的方法通過大樣本計算求取此範圍,而後判斷當前查找到的單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域是否在此範圍內,如果在此範圍,則說明是查找到的矩形內是字符,不排除,否則,進行排除。票據中字符更是有比較嚴格的規定,例如即使是手寫體,一般在銀行辦理票據單中有規定的方格或橫線來引導和規範書寫,故根據所述單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域中心的預設範圍,故用第二排除單元排除誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域當然可行。

若遇到被誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域與其它所述單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域形成重疊區域的情形,可用第三排除單元排除所述誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域。

優選的是,所述情形為所述重疊區域的形狀和/或測量的所述重疊區域的尺寸和/或面積,即可根據重疊區域的形狀和/或測量的重疊區域的尺寸和/或面積,排除誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域。

需要說明的是,到底重疊區域的尺寸和/或面積為多少時,進行排除這也是通過大樣本計算求取的經驗值。

進一步需要說明的是,因為票據中可能存在類似於字符的圖像區域,但是在檢測模塊201中運用的算法或者考慮到檢測模塊201中字符檢測時要儘量不遺漏檢測字符等諸多原因沒有判別出其不是字符,排除誤檢測為單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域,減少了查找到的單個字符的最小外接矩形外側預設緩衝區範圍內的矩形區域,提高後續處理的效率,排除了汙損,非字符等幹擾,提高後續處理的精度。

實施例四:

圖2或圖3示出的校正模塊204可以包括比較單元401和旋轉單元402,如圖4-1或圖4-2中示出了本發明第四實施例提供的票據字符校正的裝置結構示意圖。其中:

本實例中與第一實施例中部分內容相同,故借用第一實施例中圖1-4進行描述。

比較單元401,用於將所述傾斜角度與預設角度範圍進行比較。

優選的是,預設角度範圍可以分成多個相互連續的區間,例如三個相互連續的區間。

如圖1-4中,比較傾斜角度β是否在預設角度範圍,例如是否在開區間(5π/12,19π/40)、閉區間[0,5π/12]、閉區間[19π/40,π/2]範圍內。

旋轉單元402,用於若所述傾斜角度屬於預設角度範圍,則對所述最小外接矩形外側預設緩衝區範圍內的矩形區域進行順時針或逆時針旋轉。

如圖1-4中,若傾斜角度β在開區間(5π/12,19π/40)範圍內,則對最小外接矩形外側預設緩衝區範圍內的矩形區域a1b1c1d1進行逆時針旋轉。

而傾斜角度β在[0,5π/12]或[19π/40,π/2]範圍內,則不對矩形區域a1b1c1d1進行旋轉。

不對旋轉角度β在[19π/40,π/2]範圍內的矩形區域a1b1c1d1旋轉,原因是此時字符已經相對於票據不傾斜或傾斜角度在預設範圍內,不影響後續字符識別,不需要進行傾斜校正,減少了需要校正的矩形個數,降低了算法時間複雜度,提高運算效率。

不對旋轉角度β在[0,5π/12]範圍內的矩形區域a1b1c1d1旋轉,原因是此時a1b1c1d1內很可能不是字符,故需謹慎,不進行旋轉,從而也減少了需要校正的矩形個數,降低了算法時間複雜度,提高運算效率。

需要說明的是,以上具體角度區間只是示例,實際中此區間可通過大樣本計算求取。逐個字符進行校正,則全部檢測為單個字符相應圖像會進行旋轉,進行旋轉是指旋轉到字符相對於票據不傾斜或傾斜角度在預設範圍內,不影響後續字符識別等即可,而且在某些情況下,也會發生順時針旋轉。

需要說明的是,實施例二、三、四中各模塊/單元之間的信息交互、執行過程等內容及實施例整體內容,由於與本發明方法實施例基於同一構思,其帶來的技術效果與本發明方法實施例相同,具體內容可參見本發明方法實施例中的敘述,此處不再贅述。

需要說明的是,本發明所有實施例中涉及「第一」、「第二」、「第三」等詞,例如第一排除單元、第二排除單元等在此僅為表述和指代的方便,並不意味著在本發明的具體實現方式中一定會有與之對應的第一排除單元和第二排除單元。

本領域普通技術人員還可以理解,實現上述實施例方法中的全部或部分步驟是可以通過程序來指令相關的硬體來完成,所述的程序可以在存儲於一計算機可讀取存儲介質中,所述的存儲介質,包括ROM/RAM、磁碟、光碟等。

以上內容是結合具體的優選實施方式對本發明原理及實施方式所作的進一步詳細說明,不能認定本發明的具體實施只局限於這些說明,只是用於幫助理解本發明的方法及其核心思想;同時,對於本發明所屬技術領域的普通技術人員來說,在不脫離本發明構思的前提下做出若干等同替代或明顯變型,而且性能或用途相同,都應當視為屬於本發明由所提交的權利要求書確定的專利保護範圍。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀