一種二值工程圖中的字符檢測方法
2023-05-05 02:27:56 2
專利名稱:一種二值工程圖中的字符檢測方法
技術領域:
本發明涉及圖像字符檢測領域,特別是一種方便快捷準確的二值工程圖中的字符檢測方法。
背景技術:
在自然場景圖像中進行字符檢測對於各類計算機視覺問題有著重要的作用,並可在此基礎上探索自動導航、圖像檢索、基於內容的視頻摘要等研究。此外,在基於內容的圖像檢索技術中,字符檢測算法也扮演著重要的角色。傳統的二值工程圖中的字符檢測方法有著對圖元和圖元之間粘連相交情況,或者字符串方向的限制,而且為了檢測字符單元會進行耗時的非字符單元檢測與移除工作。因此如何解決實際中存在的大量噪音和各種退化情況以及基於內容檢索的實際需要,已成為進一步擴展各類基於字符檢測應用的瓶頸之一。
發明內容
發明目的本發明所要解決的技術問題是針對現有技術的不足,提供一種二值工程圖中的字符檢測方法。為了實現本發明所述的目的,本發明提供的一種二值工程圖中的字符檢測方法, 其特徵是,包含以下步驟(1)提取二值工程圖中的局部一致性單元(local consecutive segment簡稱LCQ,得到局部一致性單元集合,所述局部一致性單元為一段方向和寬度不變的線段;(2)對局部一致性單元集合進行篩選,得到字符型局部一致性單元,並根據鄰接性歸併字符型局部一致性單元;(3)根據幾何特徵對字符型局部一致性單元中的字符區域進行篩選,得到字符塊;(4)對所述字符塊通過霍夫(Hough)變換找到字符串。本發明步驟(1)中,提取二值工程圖的局部一致性單元包括以下步驟逐行掃描二值工程圖,對於掃描過程中遇到的黑色行程r,進行以下步驟,所述黑色行程為一行的連續黑色像素尋找所有和黑色行程r鄰接的局部一致性單元;遍歷鄰接的局部一致性單元,計算歸屬函數e (r,S),若歸屬函數e (r,S)等於1則將黑色行程r加入局部一致性單元S,否則創建一個新的局部一致性單元Smw,並將黑色行程r放入其中;歸屬函數e(r,S)的計算方法如下式
權利要求
1.一種二值工程圖中的字符檢測方法,其特徵在於,包含以下步驟(1)提取二值工程圖中的局部一致性單元,得到局部一致性單元集合,所述局部一致性單元為一段方向和寬度不變的線段;(2)對局部一致性單元集合進行篩選,得到字符型局部一致性單元,並根據鄰接性歸併字符型局部一致性單元;(3)根據幾何特徵對字符型局部一致性單元中的字符區域進行篩選,得到字符塊;(4)對所述字符塊通過霍夫變換找到字符串。
2.如權利要求1所述的一種二值工程圖中的字符檢測方法,其特徵是,步驟(1)中,提取二值工程圖的局部一致性單元包括以下步驟逐行掃描二值工程圖,對於掃描過程中遇到的黑色行程r,進行以下步驟,所述黑色行程為一行的連續黑色像素尋找所有和黑色行程r鄰接的局部一致性單元;遍歷鄰接的局部一致性單元,計算歸屬函數e (r, S),若歸屬函數e (r,S)等於1則將黑色行程r加入局部一致性單元S,否則創建一個新的局部一致性單元Snrat,並將黑色行程r放入其中;歸屬函數e(r,S)的計算方法如下式
3.如權利要求1所述的一種二值工程圖中的字符檢測方法,其特徵在於,步驟O)中, 包括以下步驟採用下式計算局部一致性單元的數值Size (S)
4.如權利要求3所述的一種二值工程圖中的字符檢測方法,其特徵在於,步驟(3)中, 根據幾何特徵對所得到的候選字符區進行篩選包括以下步驟對於候選字符區域包圍盒CC,若滿足以下三項的任意一項,則判定是非字符區域,並排除A)WBRatio Tb, HWRatio表示候選字符區域包圍盒CC的高寬比OMaxLength < Tc, MaxLength表示候選字符區域包圍盒CC的最長邊;Ta、Tb、T。為的設定閾值。
5.如權利要求1所述的一種二值工程圖中的字符檢測方法,其特徵在於,步驟中, 對所述字符塊通過霍夫變換找到字符串包括以下步驟步驟(41),將所有距離小於值Td的相鄰的字符塊歸併入一個連通集合中,Td使用如下公式計算Td - 0.5 xmax(^,>v). 其中h表示包圍盒的高度,W表示包圍盒的寬度,Z和。分別代表兩個字符塊包圍盒的平均高度和寬度;步驟(42),以所述連通集合為單位進行霍夫變換,從中找到分布在一條直線上的字符塊區域,將字符塊區域中具有相同參數的候選字符區域進行合併,得到共線而且相鄰的字符,從而得到字符串區域。
全文摘要
本發明提供了一種二值工程圖中的字符檢測方法,包括如下步驟對二值的線條圖紙首先進行LCS單元提取,得到LCS集合;排除掉噪音型LCS及長直線條型LCS;對剩下的LCS進行歸併,得到候選字符區域;對候選字符區域進行幾何特徵分析,從而進行篩選與排除;對得到的可信字符塊進行Hough得到字符串。本發明的有益效果在於輸入一張二值線條圖紙,可自動定位到其中的字符區域,該區域可用於進一步的OCR過程等。該方法可節省大量人工讀圖的時間開銷,得到的結果可以直觀反應圖紙中的文字內容。
文檔編號G06T7/00GK102289662SQ20111021339
公開日2011年12月21日 申請日期2011年7月28日 優先權日2011年7月28日
發明者張振宇, 趙妍, 路通 申請人:南京大學