一種數字圖像中提取文本區域的方法
2023-05-03 14:14:11 1
專利名稱:一種數字圖像中提取文本區域的方法
技術領域:
本發明涉及一種數字圖像處理方法,特別是涉及一種數字圖像中提取文本區域的方法。
背景技術:
在很多內容豐富的數字圖像中,一幅圖通常都同時包括圖形區域、文本區域、連續的圖像區域等。在對數字圖像進行處理時,針對不同的區域,通常會有不同的處理方式。圖形與文本一般都要求具有較清晰的邊緣,特別是文本區域,具有較清晰的邊緣才能較容易地識別出其中的文字內容,而圖像區域則更注重內容,例如在列印的時候如果選用節約碳粉的列印方式,則將整幅圖都進行淡化處理,這樣圖像、圖形、文字同時被淡化,雖然對圖像的處理效果比較明顯,但是不能區別對待文字和圖形的邊緣和內部,因為文字和圖形的列印結果只需要知道位置和形狀就可以,用戶更關心輪廓邊緣,輪廓內部的可以不要或更淡。
又如在數字複印機中,文件首先通過一個掃描單元進行掃描,經過掃描單元處理之後,文件轉換為灰度圖像或RGB彩色圖像。圖像根據例如一位驅動或多位驅動的驅動形式進一步處理。如果數字複印機是一個彩色複印機,則必須執行一個過網(Screen)功能,將8位灰度圖像或8位RGB圖像轉換為1位或多位圖像的步驟,彩色匹配步驟必須在過網功能之前執行,一些產品通過有規律的矩陣執行過網操作,另一些產品使用誤差混淆來消除波紋幹擾。雖然執行點陣過網中的半色調對於表現連續的色調源文件具有比較好的處理效果,但是會降低文本與圖形的質量,使文本或圖線的邊緣更加平滑,從而導致邊緣不夠清晰。
因此,當前急需一種自動識別圖像中的文本區域,從而可對文本區域進行區別處理,使文本或圖形區域獲得清晰、尖銳的邊緣,但對於其它連續的色調圖像與半色調圖像,通過平滑過濾使整個圖像更加光滑。
發明內容
本發明所要解決的技術問題在於提供一種數字圖像中提取文本區域的方法,主要的目的在於提取圖像中的文本區域,從而可以對文本區域進行區別處理。
為了實現上述目的,本發明提供了一種數字圖像中提取文本區域的方法,其特點在於,該方法包括如下步驟掃描該數字圖像,獲得該圖像的亮度值;平滑過濾該數字圖像;將圖像劃分為多個塊;計算各塊中水平方向以及豎直方向的邊緣個數;及根據該邊緣個數確定文本塊。
上述數字圖像中提取文本區域的方法,其特點在於,若該數字圖像為彩色圖像,則還包括將圖像轉換為灰度圖像的步驟。
上述數字圖像中提取文本區域的方法,其特點在於,該平滑過濾該數字圖像的步驟,是用高斯過濾器對圖像進行平滑過濾。
上述數字圖像中提取文本區域的方法,其特點在於,將圖像劃分為多個塊的步驟,是按照每塊包括N*N個像素進行劃分。
上述數字圖像中提取文本區域的方法,其特點在於,N的個數包括10、16、32或64。
上述數字圖像中提取文本區域的方法,其特點在於,該邊緣為一邊的像素與另一邊的像素與其有明顯的灰度差別的像素集。
上述數字圖像中提取文本區域的方法,其特點在於,該計算各塊中邊緣的個數的步驟,還包括如下步驟微分該塊中的像素值;根據該微分數據,標記該塊的正向峰值以及負向峰值;累加該峰值個數,根據該峰值個數確定邊緣個數。
上述數字圖像中提取文本區域的方法,其特點在於,該塊的正向峰值以及負向峰值的步驟,還包括如下步驟確定該微分數據中數字符號發生變化的像素點分別累計該微分數據中正數和以及負數和;將該正數和以及該負數和的絕對值與一第一基準值進行比較;及根據該比較結果標記該正向峰值以及該負相峰值。
上述數字圖像中提取文本區域的方法,其特點在於,該第一基準值為70。
上述數字圖像中提取文本區域的方法,其特點在於,根據該比較結果標記該正向峰值以及該負相峰值的步驟,還包括若該正數和大於基準值,則標記正向峰值;及若該負數和的絕對值大於基準值,則標記負向峰值。
上述數字圖像中提取文本區域的方法,其特點在於,根據該邊緣個數確定文本塊的步驟,是若該邊緣個數大於一第二基準值,則將該塊標記為文本塊。
上述數字圖像中提取文本區域的方法,其特點在於,該第二基準值為40。
本發明的功效,在於運用關係像素間的區別,簡單有效地提取數字圖像中的文本區域,在降低成本的同時得到了比較好的處理效果,同時提高了標記文本區域的準確性。
以下結合附圖和具體實施例對本發明進行詳細描述,但不作為對本發明的限定。
圖1為本發明所提數字圖像中提取文本區域的方法的總體流程圖;圖2為本發明實施例的運作流程圖;圖3為本發明實施例塊區域中的像素值示意圖;圖4為本發明實施例塊區域中的像素值經過微分後的示意圖;圖5為本發明實施例塊區域中峰值標記的示意圖;圖6為本發明實施例塊區域中標記峰值過程的示意圖;及圖7A~7I為本發明實施例增強文本區域效果的處理示意圖。
其中,附圖標記步驟110-掃描該數字圖像,獲得該圖像的亮度值步驟120-平滑過濾該數字圖像步走130-將圖像劃分為多個塊步驟140-計算各塊中邊緣的個數步驟150-根據該邊緣個數確定文本塊步驟2010-掃描圖像,獲得圖像的亮度值步驟2020-平滑過濾該數字圖像步驟2030-將圖像劃分為多個塊步驟2040-微分該塊中的像素值步驟2050-確定該微分數據中數字符號發生變化的像素點,分別累計該微分數據中正數和以及負數和步驟2060-正數和的絕對值是否大於70?步驟2070-負數和的絕對值是否大於70?步驟2080-標記正向峰值步驟2090-標記負相峰值步驟2100-累加峰值個數步驟2110-累加橫向以及縱向的峰值總數步驟2120-峰值總數是否大於40?步驟2130-將該塊標記為文本塊具體實施方式
本發明為一種數字圖像中提取文本區域的方法,首先由圖1說明本發明的系統,該圖為本發明的數字圖像中提取文本區域的方法的總體流程圖,說明如下步驟110,首先掃描該數字圖像,獲得該圖像的亮度值;步驟120,然後平滑過濾該數字圖像;步驟130,將圖像劃分為多個塊;步驟140,計算各塊中水平方向以及豎直方向的邊緣個數;步驟150,最後根據該邊緣個數確定文本塊。
接著,通過圖2來進一步說明本發明的流程,該圖為本發明實施例的運作流程圖,說明如下步驟2010,首先掃描圖像,獲得圖像的亮度值,如果由掃描儀得到的圖像是單色圖像,那麼該提取圖像亮度值得步驟可以跳過,如果由掃描儀獲得的圖像是包含有RGB色彩值的彩色圖像,則需要提取圖像的亮度值,將圖像轉換為灰度圖像。如果圖像是RGB格式的,則圖像的亮度值為Lightness=R*0.30+G*0.59+B*0.11如果原始圖像是其它格式的,可以將其轉換為GRB格式,再提取亮度值。從RGB色彩空間到其它如YcbCr或Lab色彩空間的轉換算法有很多,用戶可以使用3-D查表或通過公式計算。
步驟2020,然後對圖像進行預處理,對於圖像中的每一個像素,使用平滑過濾對圖像進行預處理,來消除對原始圖像半色調(Halftone)處理而導致的調節誤差。這種平滑處理並不會影響原始圖像。在本實施例中,用高斯過濾器用作平滑過濾器。
步驟2030,再將圖像劃分為多個塊,每一塊具有N*N個像素,N可以為10、16、32或64。本實施例中N=10。請參考圖3,經過劃分某一塊(10*10)的數據如圖所示。
對於每一塊,計算具有在水平與垂直方向上劃分大的對比區域的邊緣的個數,根據預先定義的第一基準值來判斷當前塊是否為文本區域。邊緣為一邊的像素與另一邊的像素與其有明顯的灰度差別的像素集。如果當前塊的邊緣個數較多的塊,則該塊為文本區域。
步驟2040,具體做法為微分當前塊中的像素值,微分後得到的數據如圖4所示。
步驟2050,確定該微分數據中數字符號發生變化的像素點,分別累計該微分數據中正數和以及負數和;步驟2060、2070,再判斷正數和以及負數和的絕對值是否大於一第一基準值,本實施例中第一基準值優選為70,當符號由正數到負數改變時,如果在符號改變之前,持續正向之和大於或等於70,步驟2080,則將其標記為正向峰值;當符號由負數到正數改變,如果在符號改變之前,持續負向之和小於或等於-70,步驟2090,則將其標記為負向峰值。也就是將正數和與負數和的絕對值與70進行比較,根據比較結果進行標記,標記後的塊數據如圖5所示。
具體計算示意圖請參見圖6。例如,對於第一個微分序列[-5-40-46-10 2754 17 11 9 1],其中第5個元素為(27),之後的元素都為正數,負數的和為sum=-5-40-46-10=-101<=-70,因此這裡峰值個數count=count+1;相應的,最後一個元素1,雖然正負號沒有改變,正數的和sum=27+54+17+11+9=118>=70,因此峰值個數count=count+1,如果符號在此處發生改變,則和大於或等於70,因此將其累加。
步驟2100,然後計算正向峰值與負向峰值數量的和。垂直方向微分步驟與上述類似,步驟2110,累計水平方向與垂直方向的峰值總和。再根據該總和進行判斷,步驟2120,判斷峰值個數是否大於一第二基準值,本實施例中第二基準值為40。如果垂直峰值數+水平峰值數的總和大於等於40,步驟2130,則將當前塊標記為文本區域。
採用上述方法對所有塊進行處理,從而將整幅圖像的所有文本區域都標記出來。然後可以有針對性地對文本區域進行處理。例如對文字點的平滑、填充、消除鋸齒等,從而使文字及其邊緣更加清晰,增強了數字圖像的效果。具體做法請參見圖7A~7I,根據圖中的方法增強文本區域的效果。
當然,本發明還可有其他多種實施例,在不背離本發明精神及其實質的情況下,熟悉本領域的技術人員可根據本發明作出各種相應的改變和變形,但這些相應的改變和變形都應屬於本發明權利要求的保護範圍。
權利要求
1.一種數字圖像中提取文本區域的方法,其特徵在於,該方法包括如下步驟掃描該數字圖像,獲得該圖像的亮度值;平滑過濾該數字圖像;將圖像劃分為多個塊;計算各塊中水平方向以及豎直方向的邊緣個數;及根據該邊緣個數確定文本塊。
2.根據權利要求1所述的數字圖像中提取文本區域的方法,其特徵在於,若該數字圖像為彩色圖像,則還包括將圖像轉換為灰度圖像的步驟。
3.根據權利要求1所述的數字圖像中提取文本區域的方法,其特徵在於,該平滑過濾該數字圖像的步驟,是用高斯過濾器對圖像進行平滑過濾。
4.根據權利要求1所述的數字圖像中提取文本區域的方法,其特徵在於,將圖像劃分為多個塊的步驟,是按照每塊包括N*N個像素進行劃分。
5.根據權利要求4所述的數字圖像中提取文本區域的方法,其特徵在於,N的個數包括10、16、32或64。
6.根據權利要求1所述的數字圖像中提取文本區域的方法,其特徵在於,該邊緣為一邊的像素與另一邊的像素與其有明顯的灰度差別的像素集。
7.根據權利要求1所述的數字圖像中提取文本區域的方法,其特徵在於,該計算各塊中邊緣的個數的步驟,還包括如下步驟微分該塊中的像素值;根據該微分數據,標記該塊的正向峰值以及負向峰值;累加該峰值個數,根據該峰值個數確定邊緣個數。
8.根據權利要求7所述的數字圖像中提取文本區域的方法,其特徵在於,該塊的正向峰值以及負向峰值的步驟,還包括如下步驟確定該微分數據中數字符號發生變化的像素點分別累計該微分數據中正數和以及負數和;將該正數和以及該負數和的絕對值與一第一基準值進行比較;及根據該比較結果標記該正向峰值以及該負相峰值。
9.根據權利要求8所述的數字圖像中提取文本區域的方法,其特徵在於,該第一基準值為70。
10.根據權利要求8所述的數字圖像中提取文本區域的方法,其特徵在於,根據該比較結果標記該正向峰值以及該負相峰值的步驟,還包括若該正數和大於基準值,則標記正向峰值;及若該負數和的絕對值大於基準值,則標記負向峰值。
11.根據權利要求1所述的數字圖像中提取文本區域的方法,其特徵在於,根據該邊緣個數確定文本塊的步驟,是若該邊緣個數大於一第二基準值,則將該塊標記為文本塊。
12.根據權利要求8所述的數字圖像中提取文本區域的方法,其特徵在於,該第二基準值為40。
全文摘要
本發明涉及一種數字圖像中提取文本區域的方法,該方法包括如下步驟掃描該數字圖像,獲得該圖像的亮度值;平滑過濾該數字圖像;將圖像劃分為多個塊;計算各塊中水平方向以及豎直方向的邊緣個數;及根據該邊緣個數確定文本塊。本發明運用關係像素間的區別,簡單有效地提取數字圖像中的文本區域,在降低成本的同時得到了比較好的處理效果,同時提高了標記文本區域的準確性。
文檔編號G06K9/60GK1755708SQ20041008040
公開日2006年4月5日 申請日期2004年9月29日 優先權日2004年9月29日
發明者周興平 申請人:德鑫科技股份有限公司