新四季網

灰度字符的精確分割裝置及方法

2023-07-17 16:38:46

專利名稱:灰度字符的精確分割裝置及方法
技術領域:
本發明涉及一種灰度字符的分割裝置及方法,具體地,涉及在經過粗略分割的低解析度灰度文本行圖像中對單個字符進行精確分割的方法和裝置。
背景技術:
字符分割是字符識別的在先步驟之一,現在已有許多與該技術相關的論文和專利。比如Y.Lu,「Machine Printed Character Segmentation-An Overview」.Pattern Recognition,Vol.28,no.1,pp.67-80,Jan,1995;S.W.Lee,D.J.Lee,H.S.Park,「A New Methodology for Gray-ScaleCharacter Segmentation and Recognition」.IEEE transaction on patternanalysis and machine intelligence,Vol.18,no.10,pp.1045-1050,Oct,1996;Kamitani的美國專利No.6,327,385「Character segmentation deviceand character segmentation system」;Hanson的美國專利No.5,692,069「Apparatus for performingcharacter segmentation using slant histograms」;以及Tan的美國專利No.5,172,422「Fast character segmentation ofskewed text lines for optical character recognition」等。
以上論文和專利講的都是如何處理互相接觸的字符,其中許多方法都應用二值的字符圖像,這些方法應用在低解析度圖像中會引起很多分割誤差。目前,沒有一篇論文或一項專利涉及低解析度灰度字符的分割。
低解析度字符的識別相當困難,而灰度特徵法是可能的解決方法之一。但是如果字符未經過精確分割,那麼從圖像中提取的特徵的效果會很差。所以,對低解析度字符進行精確分割是成功提取灰度特徵的必要步驟。
低解析度字符的圖像尺寸一般小於20*20象素,且字符的真實邊界往往位於一個象素點以內。因此,對真實字符的邊界進行精確定位對於之後的特徵提取模塊至關重要。很顯然,需要一種能夠對低解析度的灰度字符圖像進行精確分割的方法和裝置。

發明內容
本發明鑑於現有技術的上述缺點產生,目的是提供一種灰度字符的精確分割裝置及方法。
根據本發明的一個方面,本發明提供了一種灰度字符精確分割裝置,包括調整分割單元,用於對輸入的經粗略分割的低解析度灰度文本行圖像中的單個字符圖像進行調整分割,從而產生經調整分割的字符圖像;字符圖像二值化單元,用於根據輸入的所述經調整分割的字符圖像生成二值字符圖像;消噪單元,用於消除所述字符圖像二值化單元生成的二值字符圖像中的噪聲信息;最終字符圖像分割單元,用於根據被消除了噪聲信息的所述二值字符圖像產生精確分割的字符圖像。
優選地,還包括放大單元,設置在所述調整分割單元和所述字符圖像二值化單元之間,用於在所述調整分割單元產生的經調整分割的字符圖像輸入所述字符圖像二值化單元之前,放大所述經調整分割的字符圖像。
優選地,還包括字符圖像增強單元,設置在所述調整分割單元和所述字符圖像二值化單元之間,用於在所述調整分割單元產生的經調整分割的字符圖像輸入所述字符圖像二值化單元之前,對所述經調整分割的字符圖像進行字符圖像增強,使所述字符圖像中的字符的筆畫更加清晰。
優選地,還包括字符圖像增強單元,設置在所述放大單元和所述字符圖像二值化單元之間,用於在被所述放大單元放大了的所述經調整分割的字符圖像輸入所述字符圖像二值化單元之前,對被放大了的所述經調整分割的字符圖像進行字符圖像增強,使所述字符圖像中的字符的筆畫更加清晰。
優選地,所述調整分割單元包括文本行方向檢測單元,用於檢測所述文本行圖像中文本行的方向;字符圖像大小計算單元,用於計算字符圖像的大小;字符圖像調整單元,根據所述文本行方向檢測單元的檢測結果和所述字符圖像大小計算單元的計算結果,對字符圖像進行調整,使字符圖像包括字符的全部筆畫。
優選地,所述字符圖像增強單元包括背景象素值估算單元,用於估算所述字符圖像的背景象素值;背景消除單元,用於根據所述背景象素值估算單元的估算結果消除所述字符圖像的背景;象素值增強單元,用於增強消除背景之後的字符圖像的象素值。
優選地,所述背景象素值估算單元使用直方圖法估算背景象素值。
優選地,所述象素值增強單元使用S型函數增強消除背景之後的字符圖像的象素值。
優選地,所述消噪單元包括連接組件分析單元,用於對所述二值字符圖像中的連接組件進行分析,找出每個連接組件包含的象素點,計算所述二值字符圖像中的連接組件的個數;噪聲連接組件判斷單元,用於判斷一連接組件是否為噪聲連接組件;噪聲連接組件消除單元,用於消除所述二值字符圖像中的被所述噪聲連接組件判斷單元判斷為噪聲連接組件的連接組件。
優選地,所述噪聲連接組件判斷單元根據以下條件判斷一連接組件是否為噪聲連接組件連接組件的尺寸<所述二值字符圖像的尺寸/比例尺度;連接組件的邊界距所述二值字符圖像邊界的距離<閾值;如果所述連接組件同時滿足這兩個條件,則判斷該連接組件是噪聲連接組件。
優選地,所述比例尺度為3或4。
根據本發明的另一方面,還提供了一種對經粗略分割的文本行圖像中的單個灰度字符進行精確分割的方法,包括以下步驟調整分割步驟,用於對輸入的經粗略分割的低解析度灰度文本行圖像中的單個字符圖像進行調整分割,從而產生經調整分割的字符圖像;字符圖像二值化步驟,用於對所述調整分割步驟處理過的字符圖像進行二值化;消噪步驟,用於消除經所述二值化步驟生成的二值字符圖像中的噪聲信息;最終字符圖像分割步驟,用於從被消除了噪聲信息的所述二值字符圖像中產生精確分割的字符圖像。
優選地,包括放大步驟,用於放大所述分割調整步驟產生的經調整分割的字符圖像。
優選地,包括字符圖像增強步驟,用於對經所述放大步驟放大了的所述經調整的字符圖像進行字符圖像增強,使所述字符圖像中的字符的筆畫更加清晰。
其中,所述調整分割步驟包括文本行方向檢測步驟,用於檢測文本行的方向;字符圖像大小計算步驟,用於計算字符圖像的大小;字符圖像調整步驟,根據所述文本行方向檢測步驟的檢測結果和所述字符圖像大小計算步驟的計算結果,對字符圖像進行調整,使字符圖像包括字符的全部筆畫。
其中,所述字符圖像增強步驟包括背景象素值估算步驟,用於估算字符圖像的背景象素值;背景消除步驟,用於根據所述背景象素值估算步驟的估算結果消除所述字符圖像的背景;象素值增強步驟,用於增強消除背景之後的字符圖像的象素值。
其中,在所述背景象素值估算步驟中使用直方圖法估算背景象素值。
其中,在所述象素值增強步驟中使用S型函數來增強消除背景之後的字符圖像的象素值。
其中,所述消噪步驟包括連接組件分析步驟,用於對所述二值字符圖像中的連接組件進行分析,找出每個連接組件包含的象素點,計算所述二值字符圖像中的連接組件中的個數;噪聲連接組件判斷步驟,用於判斷一連接組件是否為噪聲連接組件;消除步驟,消除所述二值字符圖像中被所述噪聲連接組件判斷步驟判斷為噪聲連接組件的連接組件。
其中,在所述噪聲連接組件判斷步驟中根據以下條件判斷一連接組件是否為噪聲連接組件連接組件的尺寸<所述二值字符圖像的尺寸/比例尺度;連接組件的邊界距所述二值字符圖像邊界的距離<閾值;如果所述連接組件同時滿足這兩個條件,則判斷該連接組件是噪聲連接組件。
本發明能夠精確得到低解析度字符圖像中字符的邊界,從而可以有效地進行字符圖像的分割,為有效進行字符識別的後續步驟(例如字符特徵提取)提供保證。


圖1是本發明的灰度字符精確分割裝置的示意方框圖;圖2是圖1中的調整分割放大單元的工作流程圖;圖3是圖1中的字符圖像增強及二值化單元的工作流程圖;圖4是圖1中的消噪單元的詳細工作流程圖;圖5是最終字符圖像分割單元的詳細工作流程圖;圖6-1示出了所輸入的粗略分割的字符圖像;圖6-2是粗略分割調整的結果;圖6-3是消除背景象素的結果;圖6-4是二值化的結果;圖6-5是消噪後的結果;圖6-6是最終經過分割的字符圖像結果。
具體實施例方式
下面結合附圖詳細說明本發明的原理和優選實施例。
本發明用於在已知一幅低解析度的文本行圖像以及該文本行圖像中各個字符的粗略分割結果後,對各個字符進行精確的分割。經過這樣分割的字符可以用於字符識別中的特徵提取。粗略分割可以由手工大致框定字符的邊界來完成,也可以利用圖像的二值化結果來自動得到。這個框定的邊界有可能包含很多背景區域,也可能把一個字符的部分邊界分割開來。精確分割就是精確找到一個字符的上下左右邊界。
圖1是本發明的灰度字符精確分割裝置的示意方框圖。如圖1所示,根據本發明的灰度字符精確分割裝置包括調整分割放大單元102、字符圖像增強及二值化單元103、消噪單元104、最終字符圖像分割單元105。其輸入為經粗略分割的低解析度灰度文本行圖像101,其輸出為經過精確分割的字符圖像106。應該注意到,上述的單元只是示例性的,不是對本發明的限制,調整分割放大單元102可進一步細分為調整分割單元以及放大單元,而字符圖像增強及二值化單元103也可進一步細分為字符圖像增強單元和字符圖像二值化單元,並且,字符圖像增強單元還可進一步細分為背景象素值估算單元、背景象素值消除單元和象素值增強單元。另外,調整分割放大單元可由文本行方向檢測單元、字符大小計算單元、字符圖像調整單元等構成。消噪單元可進一步分成連接組件分析單元、噪聲連接組件判斷單元和噪聲連接組件消除單元。
如上所述,字符圖像的粗略分割可以通過手工或者利用現有技術通過對二值化後的圖像自動分割得到。隨後調整分割放大單元102對所輸入的低解析度文本行圖像的粗略分割的結果進行調整,然後由字符圖像增強及二值化單元103進行字符圖像增強及二值化,並由消噪單元104進行消噪,以生成無噪聲的二值字符圖像。最後,由最終字符圖像分割單元105進行最終字符圖像分割,找出在消噪單元104中生成的二值字符圖像的字符的邊界,在放大的灰度圖像中顯示出真正的字符邊界,並進行提取。最終字符圖像分割單元105的輸出結果即是經過精確分割的字符圖像106。
下面結合圖2到圖5詳細說明上述各單元102-105中的操作。
在調整分割放大單元102中,首先利用所輸入的文本行圖像中各個字符的前後字符的粗略分割結果(參見圖6-1),對該字符的邊界範圍進行調整,然後對經過調整的圖像內容進行提取(分割)和放大,從而真實字符的圖像全部落在輸出的已放大的灰度字符圖像中。
圖2示出了圖1中的調整分割放大單元102的具體工作流程。該調整分割放大單元的輸入是經粗略分割的低解析度灰度文本行圖像101。具體地,包括經粗略分割的當前字符圖像之前的字符圖像S201、當前字符圖像S202和當前字符圖像S202之後的字符圖像S203。由於一個字符圖像的邊界調整涉及到其前一個字符圖像和後一個字符圖像的邊界,因而首先由調整放大單元102的文本行方向檢測單元(未示出)進行文本行方向檢測(步驟S204)。如果是橫向的文本行,在調整字符圖像的左右邊界時,調整以後的邊界不應該過多超過其左右字符圖像的邊界範圍。如果是縱向的文本行,在調整上下邊界時,調整以後的邊界不應該過多超過上下字符圖像的邊界範圍。文本行方向檢測的檢測方法為1)利用所述文本行(例如上述三個字符)的粗略分割結果確定該文本行的邊界框。上述的粗略分割的結果就是各字符圖像的邊界框(可參見圖6-1),由一個矩形的框來代表,寬度就是矩形的寬度,高度就是矩形的高度。可以利用現有的技術,通過找出這些字符(例如該三個字符)的邊界框的最左、最右、最上、最下的坐標,而限定新的邊界框。該邊界框就是文本行邊界框。
2)計算文本行邊界框的寬度和高度。
3)如果寬度>高度,則該文本行為水平文本行,反之為垂直文本行。
在判斷出文本行圖像中的文本行的方向之後,在優選實施例中,隨即確定文本行的調整順序。如果文本行方向為水平方向,即輸入的是水平文本行,則先進行左右順序的字符邊界調整,然後進行上下順序的字符調整。如果文本行方向不是水平方向,即輸入的是垂直文本行,則先進行上下順序的字符邊界調整,再進行左右順序的字符調整。應該注意到,上述的調整順序是可以改變的。
接著由調整分割放大單元的字符圖像大小計算單元(未示出)計算字符圖像的大小。設當前字符圖像之前的字符圖像經粗略分割的左、右、上、下邊界為xs_p,xe_p,ys_p,ye_p,當前字符圖像經粗略分割的左、右、上、下邊界為xs_c,xe_c,ys_c,ye_c,當前字符圖像之後的字符圖像經粗略分割的左、右、上、下邊界為xs_n,xe_n,ys_n,ye_n.;當前字符圖像經粗略分割的寬和高分別為width_c,height_c,當前字符的尺寸為size_c(即imagesize)。則如果width_c>height_c則size_c=width_c否則size_c=height_c隨後由調整分割放大單元102的字符圖像調整單元對字符圖像的邊界進行調整。此處再假定當前字符圖像經過邊界調整的左、右、上、下邊界為xs_cl,xe_cl,ys_cl,ye_cl。
調整的原則是對於水平文本行,將一個字符圖像的左邊界和右邊界進行擴大,但不能過多包括其左右兩側的字符。上下邊界的範圍也要放寬一定程度以防止粗略分割把一個字符切成了2部分。放寬的程度根據字符尺寸size_c的一定比例決定。對於垂直文本行,將一個字符圖像的上下邊界進行擴大,但也不要過多包括其上下兩側的字符圖像,並且其左右邊界的範圍也要放寬一定程度以防止粗略分割把一個字符切成了2部分。最後要求的效果是,即使粗略分割把一個字符的一部分誤分在粗分割的範圍之外,經過調整以後的分割結果也能夠完整地包含該字符的所有部分。
如果文本行經檢測為水平文本行,則進行字符左邊界調整(步驟S206)、字符右邊界調整(步驟S207)、字符上邊界調整(步驟S208)和下字符邊界調整(步驟S209)對當前字符的左、右、上、下邊界進行調整。在下面的描述中,假設圖像的左上角是坐標的原點,y的方向是沿坐標原點向下的方向,x的方向是沿坐標原點向右的方向。
步驟S206的字符圖像左邊界的調整規則為如果xe_p<=xs_c則xs_cl=xe_p否則xs_cl=xs_c步驟S207的字符圖像右邊界的調整規則為如果xe_c<xs_n則xe_cl=xs_n否則xe_cl=xe_c步驟S208的字符圖像上邊界的調整規則為如果ys_c-r*size_c>=0則ys_cl=ys_c-r*size_c否則
ys_cl=0S209單元的字符圖像下邊界的調整規則為如果ye_c+r*size_c<=文本行的高度則ye_cl=ye_c+r*size_c否則ye_cl=文本行的高度在S208和S209單元中,r是控制調整的參數。比如r可以取值為0.2。
類似地,如果文本行經檢測為豎直文本行,則進行字符上邊界調整(步驟S210)、字符下邊界調整(步驟S211)、字符左邊界調整單元(步驟S212)和字符右邊界調整(步驟S213)對當前字符的上、下、左、右邊界進行調整。
步驟S210的調整規則為如果ye_p<ys_c則ys_cl=ye_p否則ys_cl=ys_c步驟S211的調整規則為如果ye_c<ys_n則ye_cl=ys_n否則ye_cl=ye_c步驟S212的調整規則為如果xs_c-r*size_c>0則xs_cl=xs_c-r*size_c否則xs_cl=0步驟S213的調整規則為如果xe_c+r*size_c<文本行寬度則xe_cl=xe_c+r*size_c否則xe_cl=文本行寬度在步驟S212和S213中,r是控制調整的參數。比如r可以取值為0.2。
經過調整之後,由xs_cl,xe_cl,ys_cl和ye_cl所界定的字符圖像的圖像內容被從文本行中切割出來(步驟S214)。這4個值確定了一個矩形的左右上下邊界,文本圖像中用這個矩形定義的邊界就是所需要的部分,把這個部分的內容拷貝下來就是切割的過程。然後切割出來的字符圖像將被放大到原尺寸的N倍(步驟S215)。圖像放大算法可以參見岡薩雷斯,《數字圖像處理(第二版)》,阮秋琦,阮宇智等譯。電子工業出版社,2003年3月第一版,第50頁。例如,N可以取值為4。調整分割放大的輸出就是經過放大的灰度字符圖像S216(可參見圖6-3)。
應該注意上述的調整方法只是示例性的,也可以採用本領域技術人員所知的其它調整方法,只要這些方法可以使字符的真正邊界全部落入調整以後的字符邊界框內部。
圖3是圖1中的字符圖像增強及二值化單元的工作流程圖。字符圖像增強的目的是為了讓字符圖像中的低解析度下模糊的字符筆畫變得清晰,如果不進行字符圖像增強,後續的識別效果不好。如圖3所示,在字符圖像增強和二值化單元中,首先由背景象素值估算單元來估算背景象素值(S301)。這可以使用經過放大的字符圖像S216的灰度直方圖來獲得。圖像中灰度直方圖的計算方法可以參照章毓晉編著,「圖像處理和分析」,清華大學出版社,1991年3月。該直方圖中的最大值對應的象素值就作為背景象素值。然後在步驟S302中由背景消除單元來消除背景。如果假設字符象素點的理想像素值是255的話,消除背景就是找出所有的背景象素點,並把背景象素點的象素值設置成0。具體地,假設該背景象素值為Vbk,例如在背景色較亮的情況下,檢查輸入的圖像中的所有的象素點,如果一個象素點的灰度值大於Vbk,那麼把該象素點的灰度值設置為Vbk,如果一個象素點的灰度值小於Vbk,那麼該點的灰度值不變。前面假設的情況是字符的象素值低於背景的象素值,如果背景象素點的象素值低於字符象素點的象素值,即在背景色較暗的情況下,也可採用類似的處理,將灰度值小於Vbk的象素點的灰度值設置為Vbk,而保留灰度值大於Vbk的象素點,從而消除背景(S302)(參見圖6-3)。之後,通過一個S型函數來增強消除了背景的灰度圖像的象素值(S303),增強的算法如下1、假設一個象素點的灰度值是g,首先對一幅圖像中的每一個象素點的灰度進行如下的變換f(g)=(exp((g-off)/t)-1)/(exp((g-off)/t)+1);其中off和t是變換的參數,比如可以取off=0,t=96。
由於這個函數的形狀是S形,因此又叫作S型函數。
2、找出經過變換以後的函數值的最大值和最小值max,min。
3、對每一個點的函數值進行如下操作g1=(f(g)-min)*255/(max-min);然後取g1的整數值,這個整數值就是經過圖像增強以後的新的圖像中該點的灰度值。
在字符增強之後,根據一個給定的閾值Th,將被增強的灰度圖像二值化(步驟S304)。首先產生一幅新的圖像,該圖像的大小和原灰度圖像是一致的,新圖像象素點的取值由如下規則決定對經過增強以後的圖像中的每一個象素點的灰度值進行判斷,如果灰度值大於Th,把新圖像中對應點的灰度值設置為255,反之設置為0。由於新圖像象素點的取值只可能有2種選擇0或者255,因此這個過程叫做二值化。二值化的結果是得出一幅二值字符圖像S305(參見圖6-4)。
通常,二值字符圖像在字符邊界附近會存在一些噪聲部分,它們可能是背景象素,或者是因不精確的前後字符粗略分割而誤划進來的字符筆畫。本發明的方法要進行消噪處理,將這些噪聲消除。也就是說,經過分割調整以後,雖然字符本身完全被包含在了調整的邊界以內,但是這個邊界內可能還包含相鄰字符的部分筆畫。這些筆畫是噪聲信息,因此需要消去噪聲。
圖4是圖1中消噪單元104的消噪處理的詳細流程圖。如圖4所示,首先由消噪單元的連接組件分析單元對輸入的二值字符圖像(S305)的連接組件(CC)進行分析。找出每個連接組件包含的象素點,得到連接組件的總數(S401)。連接組件就是一幅二值圖像中彼此相連的象素的集合,比如「二」字裡面有2個連接組件。圖像中連接組件分析算法可以參見岡薩雷斯,《數字圖像處理(第二版)》,第435頁,阮秋琦,阮宇智等譯。電子工業出版社,2003年3月第一版。
隨後由噪聲連接組件判斷單元對各連接組件是否為噪聲連接組件進行判斷。在進行是否為噪聲連接組件的判斷時,首先要計算連接組件的尺寸及其與字符邊界的距離。具體地,首先設置i=0(S402),其中i表示圖像中連接組件的索引號,i=0代表從第1個連接組件開始。然後從該第一個連接組件開始,獲得各個連接組件的外邊界框。連接組件中所有象素點的上下左右邊界就是連接組件的外邊界框。然後估計連接組件的尺寸Size,即取該連接組件的外邊界框的寬度值和高度值中的較大者(S403)。並得到第i個連接組件(ith CC)的外邊界框與字符圖像邊界(即xs_cl,xe_cl,ys_cl和ye_cl)之間的距離,將其規定為Distance(S404)。另外,假定字符圖像的大小為imagesize,即上文的字符圖像的尺寸,也就是字符圖像的寬度值和高度值中的較大者。然後對該連接組件進行是否為噪聲連接組件的判斷(S405),並在被判斷為噪聲連接組件的情況下,消除該連接組件(S406)。即如果一個連接組件滿足了如下兩個條件,那麼該連接組件就被認為是一個噪聲連接組件,將被從二值字符圖像中消除。
兩個條件如下1、Size<imagesize/N12、Distance<N2其中,N1是一個比例尺度,比如N1=3,N2是距離的一個閾值。即如果一個連接組件尺度很小(例如小於字符圖像尺寸的1/3),本身距離字符邊界的距離小於一定的閾值,那麼這個組件就是噪聲連接組件。
由噪聲連接組件消除單元來消除噪聲連接組件,消除噪聲連接組件的方法如下1、創建一個新的和原來二值圖像一樣大小的圖像,把新圖像中所有象素點的值都設置為0。
2、對於原來二值圖像中的非噪聲連接組件(包括尚未判斷的連接組件)中的每一個象素點,把新的圖像中對應象素點的灰度值設置為255。
新的圖像就是消除了該噪聲連接組件的字符圖像。
二值字符圖像中所有的連接組件都要進行上述的尺寸計算、距離估算、噪聲連接組件判斷並在被判斷為噪聲連接組件時進行消除等步驟,最終輸出二值化的無噪聲字符圖像S409(參見圖6-5)。
具體地,噪聲連接組件的判斷和噪聲連接組件的消除的步驟為在步驟S403中估算連接組件的尺寸,在步驟S404中估算該連接組件與邊界的距離,然後在步驟S405中對連接組件是否滿足上述兩個條件進行判斷,如果不滿足這兩個條件,則過程進入步驟S407,通過將i值加1來指定下一連接組件,並進入步驟S408。如果滿足了這兩個條件,則判斷這個連接組件為噪聲連接組件,並在步驟S406中將其消除,隨後再進入步驟S407,指定下一連接組件,並進入步驟S408。在步驟S408中,判斷是否已分析完所有的連接組件(圖中的nCC表示組件總數),如果未分析完,則進入步驟S403,從步驟S403開始進行所指定的連接組件的分析,如果分析完了所有的連接組件,則輸出經過消噪的二值字符圖像(S409)。
圖5示出了最終字符圖像分割單元105的詳細工作流程圖。首先輸入經過消噪的二值字符圖像(S409),並設置i=0(S501),其中i表示圖像中連接組件的索引號,i=0代表從第1個連接組件開始。然後求出該連接組件的外邊界框(S502),即找出該連接組件的所有象素點的最上,最左,最右和最下邊界。隨後判斷i是否等於0(步驟S503),如果等於0(步驟S503中的是),則將該連接組件的外邊界框設置為暫定字符邊界框(步驟S504)。否則(步驟S503中的否),在步驟S505中將該連接組件的邊界框與暫定字符邊界框進行合併。也就是說,最初始的暫定字符邊界框就是第一個連接組件的外邊界框,從第二個連接組件開始,進行的操作是合併2個邊界框,一個是當前的所有組件的外邊界框(從第一個到當前連接組件的前一個的組合,即暫定字符邊界框),一個是當前連接組件的外邊界框,從而得到新的暫定字符邊界框。合併步驟是找到2個邊界框的最上,最下,最左,和最右邊界。就是合併以後的外邊界框。然後在步驟S506中,通過將i值加1來指定下一連接組件,並在步驟S507中,判斷是否已處理完所有的連接組件,如為處理完,則過程返回步驟S502,重複以上步驟,直至處理完所有的連接組件,這時得到的暫定字符邊界框即所需的字符邊界框。然後,在已放大的灰度字符圖像S216中,提取出由該字符邊界框所框定的灰度內容(S508),即用該字符邊界框定義的範圍從放大灰度圖像中把框定的圖像拷貝出來。即經過精確分割的字符圖像,這就是本發明的最終輸出(參見圖6-6)。
圖6-1~6-6顯示出以上各單元的輸出結果圖6-1示出了所輸入的粗略分割;圖6-2是調整分割放大之後的結果;圖6-3是消除背景象素之後的結果;圖6-4是二值化之後的結果;圖6-5消噪之後的結果;圖6-6是最終經過分割的字符圖像。
本發明能夠精確得到低解析度圖像中字符的邊界,從而有效進行字符的分割,為字符識別的後續步驟,比如字符特徵提取的有效性提供保證。
本領域的技術人員應明白,在不脫離本發明的精神和範圍的情況下,可以對本發明進行各種修改和變化。因而本發明覆蓋了落入所附的權利要求及其等同範圍內的對本發明的所有修改和變化。
權利要求
1.一種灰度字符精確分割裝置,其特徵在於,包括調整分割單元,用於對輸入的經粗略分割的低解析度灰度文本行圖像中的單個字符圖像進行調整分割,從而產生經調整分割的字符圖像;字符圖像二值化單元,用於根據輸入的所述經調整分割的字符圖像生成二值字符圖像;消噪單元,用於消除所述字符圖像二值化單元生成的二值字符圖像中的噪聲信息;最終字符圖像分割單元,用於根據被消除了噪聲信息的所述二值字符圖像產生精確分割的字符圖像。
2.根據權利要求1所述的灰度字符精確分割裝置,其中,還包括放大單元,設置在所述調整分割單元和所述字符圖像二值化單元之間,用於在所述調整分割單元產生的經調整分割的字符圖像輸入所述字符圖像二值化單元之前,放大所述經調整分割的字符圖像。
3.根據權利要求1所述的灰度字符精確分割裝置,其中,還包括字符圖像增強單元,設置在所述調整分割單元和所述字符圖像二值化單元之間,用於在所述調整分割單元產生的經調整分割的字符圖像輸入所述字符圖像二值化單元之前,對所述經調整分割的字符圖像進行字符圖像增強,使所述字符圖像中的字符的筆畫更加清晰。
4.根據權利要求2所述的灰度字符精確分割裝置,其中,還包括字符圖像增強單元,設置在所述放大單元和所述字符圖像二值化單元之間,用於在被所述放大單元放大了的所述經調整分割的字符圖像輸入所述字符圖像二值化單元之前,對被放大了的所述經調整分割的字符圖像進行字符圖像增強,使所述字符圖像中的字符的筆畫更加清晰。
5.根據權利要求1到4任一項所述的灰度字符精確分割裝置,其中,所述調整分割單元包括文本行方向檢測單元,用於檢測所述文本行圖像中文本行的方向;字符圖像大小計算單元,用於計算字符圖像的大小;字符圖像調整單元,根據所述文本行方向檢測單元的檢測結果和所述字符圖像大小計算單元的計算結果,對字符圖像進行調整,使所述經調整分割的字符圖像中包括字符的全部筆畫。
6.根據權利要求3或4所述的灰度字符精確分割裝置,其中,所述字符圖像增強單元包括背景象素值估算單元,用於估算所輸入字符圖像的背景象素值;背景消除單元,用於根據背景象素值估算單元估算出的背景象素值來消除背景;象素值增強單元,用於增強消除背景之後的字符圖像的象素值。
7.根據權利要求6所述的灰度字符精確分割裝置,其中,所述背景象素值估算單元使用直方圖法估算所述背景象素值。
8.根據權利要求6所述的灰度字符精確分割裝置,其中,所述象素值增強單元使用S型函數增強所述象素值。
9.根據權利要求1到4任一項所述的灰度字符精確分割裝置,其中,所述消噪單元包括連接組件分析單元,用於對所述二值字符圖像中的連接組件進行分析,找出每個連接組件包含的象素點,計算所述二值字符圖像中的連接組件的個數;噪聲連接組件判斷單元,用於判斷一連接組件是否為噪聲連接組件;噪聲連接組件消除單元,用於消除所述二值字符圖像中被所述噪聲連接組件判斷單元判斷為噪聲連接組件的連接組件。
10.根據權利要求9所述的灰度字符精確分割裝置,其中,所述噪聲連接組件判斷單元根據以下條件判斷一連接組件是否為噪聲連接組件連接組件的尺寸<所述二值字符圖像的尺寸/比例尺度連接組件的邊界距所述二值字符圖像邊界的距離<閾值如果所述連接組件同時滿足這兩個條件,則判斷該連接組件是噪聲連接組件。
11.根據權利要求10所述的灰度字符精確分割裝置,其中,所述比例尺度為3或4。
12.一種對經粗略分割的文本行圖像中的單個灰度字符進行精確分割的方法,包括以下步驟調整分割步驟,用於對輸入的經粗略分割的低解析度灰度文本行圖像中的單個字符圖像進行調整分割,從而產生經調整分割的字符圖像;字符圖像二值化步驟,用於對所述調整分割步驟處理過的字符圖像進行二值化;消噪步驟,用於消除經所述二值化步驟生成的二值字符圖像中的噪聲信息;最終字符圖像分割步驟,用於從被消除了噪聲信息的所述二值字符圖像中產生精確分割的字符圖像。
13.根據權利要求12所述的方法,還包括放大步驟,用於在所述調整分割步驟產生的經調整分割的字符圖像進行所述字符圖像二值化步驟之前,放大所述經調整分割的字符圖像。
14.根據權利要求13所述的方法,還包括字符圖像增強步驟,在所述字符圖像二值化步驟之前,用於對經所述放大步驟放大了的所述經調整的字符圖像進行字符圖像增強,使所述字符圖像中的字符的筆畫更加清晰。
15.根據權利要求12所述的方法,其中,所述調整分割的步驟包括文本行方向檢測步驟,用於檢測文本行的方向;字符圖像大小計算步驟,用於計算字符圖像的大小;字符圖像調整步驟,根據所述文本行方向檢測步驟的判斷結果和所述字符圖像大小計算步驟的計算結果,對字符圖像進行調整,使字符圖像包括字符的全部筆畫。
16.根據權利要求14所述的方法,其中,所述字符圖像增強步驟包括背景象素值估算步驟,用於估算字符圖像的背景象素值;背景消除步驟,用於根據背景象素值估算步驟估算出的背景象素值來消除背景;象素值增強步驟,用於增強消除背景之後的字符圖像的象素值。
17.根據權利要求16所述的方法,其中,在所述背景象素值估算步驟中使用直方圖法估算所述背景象素值。
18.根據權利要求16所述的方法,其中,在所述象素值增強步驟中使用S型函數來增強消除背景之後的字符圖像的象素值。
19.根據權利要求12到18中任一項所述的方法,其中,所述消噪的步驟包括連接組件分析步驟,用於對所述二值字符圖像中的連接組件進行分析,找出每個連接組件包含的象素點,計算所述二值字符圖像中的連接組件的個數;噪聲連接組件判斷步驟,用於判斷一連接組件是否為噪聲連接組件;噪聲連接組件消除步驟,用於消除所述二值字符圖像中被所述噪聲連接組件判斷步驟判斷為噪聲連接組件的連接組件。
20.根據權利要求19所述的方法,其中,在所述噪聲連接組件判斷步驟中根據以下條件判斷一連接組件是否為噪聲連接組件連接組件的尺寸<所述二值字符圖像的尺寸/比例尺度連接組件的邊界距所述二值字符圖像邊界的距離<閾值如果所述連接組件同時滿足這兩個條件,則判斷該連接組件是噪聲連接組件。
全文摘要
灰度字符精確分割裝置及方法。灰度字符精確分割裝置包括調整分割單元,用於對輸入的經粗略分割的低解析度文本行圖像進行調整分割,從而產生經調整的字符圖像;字符圖像二值化單元,用於根據輸入於其中的字符圖像生成二值字符圖像;消噪單元,用於消除所述二值化單元生成的二值字符圖像中的噪聲信息;最終字符圖像分割單元,用於從被消除了噪聲的所述二值字符圖像中產生精確分割的字符圖像。
文檔編號G06K9/34GK1822027SQ20051000851
公開日2006年8月23日 申請日期2005年2月18日 優先權日2005年2月18日
發明者孫俊, 堀田悅伸, 勝山裕, 直井聰 申請人:富士通株式會社

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀