手寫體數字識別方法及裝置的製作方法
2023-06-05 01:02:36 1
專利名稱:手寫體數字識別方法及裝置的製作方法
技術領域:
本發明涉及手寫體數字識別技術領域,特別是涉及一種手寫體數字識別方法及裝置。
背景技術:
作為世界各國通用符號的阿拉伯數字的手寫體頻繁出現在郵政系統、銀行支票、工業應用等各領域中。而隨著計算機技術和數字圖像處理技術的飛速發展,手寫體數字識別技術得到了廣泛應用,給人們的工作帶來了極大的方便。由於數字在各個領域中往往代表精確的數值,微小的錯誤很可能帶來不可預知的後果,因此,具有較高正確率的簡單高效的手寫體數字識別方法一直是重要的研究方向。而隨著機器學習技術的普及應用,很多物理學家和化學家開始廣泛使用李群理論研究相關領域的數據;相應的,在手寫體數字識別技術領域,李群結構數據以其良好的數學結構已被廣泛應用。其中,李群Means 是由 J.A.Hartigan 等人在文章 「A K-Means ClusteringAlgorithm」中提出的一種簡單有效的分類方法,然而其梯度下降法找到的解只是局部極小值,而不一定是全局最小值,在處理多分類問題時性能欠佳。2011年,高聰等人提出了李群Fisher學習算法,該方法在處理多類問題時的效果也不是很好。而2006年,Tuzel 0,Porikli F7Meer P等人提出的李群KNN方法中,將區域圖像的協方差作為李群KNN分類問題的特徵;但是,對於手寫體數字識別而言,能夠體現空間信息的筆畫位置可以有助於識別手寫體數字,也就是,像素點的灰度值有助於識別手寫體數字,因此,基於李群KNN方法,直接利用依據區域圖像確定的特徵的手寫體數字識別會損失空間信息,影響手寫體數字識別的準確性。
發明內容
為解決上述技術問題,本發明實施例提供了一種手寫體數字識別方法及裝置,以提高手寫體數字的識別準確性,技術方案如下:—方面,本發明實施例提供了一種手寫體數字識別方法,包括:確定待識別圖像,所述待識別圖像中包含手寫體形式的待識別數字類別標籤;依據像素點的灰度值,確定所述待識別圖像中的特定的像素點的像素特徵;依據所述特定的像素點的像素特徵,確定所述待識別圖像的協方差;基於李群KNN算法,依據預設的訓練圖像集合中的各訓練圖像的協方差和所述待識別圖像的協方差,確定所述待識別圖像的近鄰標籤集;其中,每一訓練圖像中包含一手寫體形式的數字類別標籤,所述訓練圖像集合所包含的數字類別標籤涉及所有的數字類別,並且,所述待識別圖像的協方差與所述近鄰標籤集中各數字類別標籤對應協方差的距離不大於其與所述訓練圖像集合相應的剩餘任意一協方差之間的距離;將所述近鄰標籤集中個數最多的數字類別標籤確定為所述待識別數字類別標籤。
其中,所述基於李群KNN算法,依據預設的訓練圖像集合中的各訓練圖像的協方差和所述待識別圖像的協方差,確定所述待識別圖像的近鄰標籤集,包括:分別計算所述待識別圖像的協方差與預設的訓練圖像集合中的各訓練圖像的協方差之間的距離;選擇第一數量的距離作為近鄰距離,其中,所述近鄰距離不大於剩餘的任意一距離;將所述近鄰距離對應的訓練圖像的數字類別標籤構成所述待識別圖像的近鄰標籤集。其中,所述確定所述待識別圖像中的特定的像素點的像素特徵所依據的計算公式包括:
權利要求
1.一種手寫體數字識別方法,其特徵在於,包括: 確定待識別圖像,所述待識別圖像中包含手寫體形式的待識別數字類別標籤; 依據像素點的灰度值,確定所述待識別圖像中的特定的像素點的像素特徵; 依據所述特定的像素點的像素特徵,確定所述待識別圖像的協方差; 基於李群KNN算法,依據預設的訓練圖像集合中的各訓練圖像的協方差和所述待識別圖像的協方差,確定所述待識別圖像的近鄰標籤集;其中,每一訓練圖像中包含一手寫體形式的數字類別標籤,所述訓練圖像集合所包含的數字類別標籤涉及所有的數字類別,並且,所述待識別圖像的協方差與所述近鄰標籤集中各數字類別標籤對應協方差的距離不大於其與所述訓練圖像集合相應的剩餘任意一協方差之間的距離; 將所述近鄰標籤集中個數最多的數字類別標籤確定為所述待識別數字類別標籤。
2.根據權利要求1所述的方法,其特徵在於,所述基於李群KNN算法,依據預設的訓練圖像集合中的各訓練圖像的協方差和所述待識別圖像的協方差,確定所述待識別圖像的近鄰標籤集,包括: 分別計算所述待識別圖像的協方差與預設的訓練圖像集合中的各訓練圖像的協方差之間的距離; 選擇第一數量的距離作為近鄰距離,其中,所述近鄰距離不大於剩餘的任意一距離; 將所述近鄰距離對應的訓練圖像的數字類別標籤構成所述待識別圖像的近鄰標籤集。
3.根據權利要求2所述的方法,其特徵在於,所述確定所述待識別圖像中的特定的像素點的像素特徵所依據的計算公式包括:
4.根據權利要求3所述的方法,其特徵在於,所述確定所述待識別圖像的協方差所依據的計算公式包括:
5.根據權利要求4所述的方法,其特徵在於,計算所述待識別圖像的協方差與預設訓練圖像集合中的各個訓練圖像的協方差之間的距離所依據的計算公式包括:
6.根據權利要求2所述的方法,其特徵在於,所述待識別圖像中的特定的像素點包括: 所述待識別圖像中的所有像素點; 或者, 所述待識別圖像中的部分像素點,且所述部分像素點為所述待識別圖像中的手寫區域的像素點,所述手寫區域為所述待識別圖像中的一部分圖像區域。
7.一種手寫體數字識別裝置,其特徵在於,包括: 待識別圖像確定模塊,用於確定待識別圖像,所述待識別圖像中包含手寫體形式的待識別數字類別標籤; 像素特徵確定模塊,用於依據像素點的灰度值,確定所述待識別圖像中的特定的像素點的像素特徵; 協方差確定模塊,用於依據所述特定的像素點的像素特徵,確定所述待識別圖像的協方差; 近鄰確定模塊,用於基於李群KNN算法,依據預設的訓練圖像集合中的各訓練圖像的協方差和所述待識別圖像的協方差,確定所述待識別圖像的近鄰標籤集;其中,每一訓練圖像中包含一手寫體形式的數字類別標籤,所述訓練圖像集合所包含的數字類別標籤涉及所有的數字類別,並且,所述待識別圖像的協方差與所述近鄰標籤集中各數字類別標籤對應協方差的距離不大於其與所述訓練圖像集`合相應的剩餘任意一協方差之間的距離; 待識別標籤確定模塊,用於將所述近鄰標籤集中個數最多的數字類別標籤確定為所述待識別數字類別標籤。
全文摘要
本發明公開了一種手寫體數字識別方法及裝置。該手寫體數字識別方法,包括確定待識別圖像,該待識別圖像中包含手寫體形式的待識別數字類別標籤;依據像素點的灰度值,確定該待識別圖像中的特定的像素點的像素特徵;依據該特定的像素點的像素特徵,確定該待識別圖像的協方差;基於李群KNN算法,依據預設的訓練圖像集合中的各訓練圖像的協方差和該待識別圖像的協方差,確定該待識別圖像的近鄰標籤集;將該近鄰標籤集中個數最多的數字類別標籤確定為該待識別數字類別標籤。可見,與現有技術相比,本方案中,作為分類問題的特徵的協方差依據特定的像素點的灰度值獲得,有效利用了待識別圖像的空間信息,因此,提高了手寫體數字的識別準確性。
文檔編號G06K9/20GK103164701SQ201310123349
公開日2013年6月19日 申請日期2013年4月10日 優先權日2013年4月10日
發明者何書萍, 張莉, 王曉乾, 王邦軍, 楊季文, 李凡長 申請人:蘇州大學