基於Haar特徵匹配的數字圖像內容搜索方法
2023-05-27 21:17:46 1
專利名稱:基於Haar特徵匹配的數字圖像內容搜索方法
技術領域:
本發明涉及一種數字圖像內容搜索方法。
背景技術:
現今,各種與圖像相關的研究與應用領域都在快速發展,例如可視化娛樂、 教育、生物醫學、犯罪預防和圖像資料庫。這些大規模用數字信息存儲的數據給 基於內容的圖像索引和搜索帶來了挑戰性的搜索問題。
現在對數字圖像的檢索方法都是通過關鍵字來實現的,即對通過與該數字圖 像相關的文字描述內容來標定該圖像內容的特徵,從而加以分類和判別。在搜索 過程中,人們首先輸入所要搜索的圖像的內容關鍵字信息,然後搜索系統根據這 些關鍵字信息,到圖像庫中的圖像信息描述中進行查找,如果有與所輸入的關鍵 字所匹配的描述信息,則認為該圖像內容就是所要找的內容,將其返回給用戶。 隨著圖像庫的不斷增大,以及圖像內容的不斷複雜,基於關鍵字的圖像內容搜索 方式逐漸無法滿足對圖像內容搜索的需要。因此,研發一種新的能夠對數字圖像 內容進行描述和搜索的方式就顯得非常必要了。
近些年來,對基於內容的圖像搜索領域的研究開始變得非常活躍。簡單來說, 基於內容的圖像搜索還是一種在理論上探討的技術,其應當能夠根據圖像的可視 內容來協助管理數字圖像庫。在基於內容的圖像搜索的研究中包含了很多不同的 領±或,例如計算機視覺、機器學習、信息獲取、人機互動、數據挖掘、資料庫管 理、信息理論等等。
儘管已經有了大量的相關論文、原型和一些商用解決方案,但是圖像內容搜索的核心問題至今還未得到解決。這裡面有一些開放性的問題,例如在用圖像處 理算法所提取的圖像特徵與相關語義概念之間的鴻溝。早期的圖像內容搜索研究 都是以提取圖像的全局特徵為主的,但是這些方法都不如基於對象的方法效果 好。在很多情況下,用戶是要搜索圖像中感興趣的部分或者對象。這使得現在的 研究者不再把圖像作為一個整體,而是將圖像分為局部或一些感興趣的對象來處 理。在具體的搜尋引擎實現方面,GOOGLE,微軟,BAIDU等國內外大公司都 在該方面投入了巨大的人力物力,但是現在所開發的系統均還不能達到實用的程 度。
在邊沿檢測中,常用的一種模板是Sobel算子。Sobel算子有兩個, 一個是 檢測水平邊沿的;另一個是檢測垂直平邊沿的。由於Sobel算子是濾波算子的形 式,用於提取邊緣,可以利用快速巻積函數,簡單有效,因此應用廣泛。
發明內容
為了克服現有的基於關鍵字描述的圖像搜索方式的搜索方式不直觀、搜索效 果有效性差的不足,本發明提供一種搜索方式直觀、搜索結果有效性好的基於 Haar特徵匹配的數字圖像內容搜索方法。
本發明解決其技術問題所採用的技術方案是
一種基於Haar特徵匹配的數字圖像內容搜索方法,包括以下步驟-(1)初始化特徵模板與數字圖庫
(1.1)初始化Haar匹配模板庫;
(1. 2)從初始化後的模板庫中載入預定義Haar模板,載入後的模板集合 為模板集P;
(1. 3)確認並初始化待搜索的數字圖像庫Y; (1. 4)用戶給出並指定待搜索的原始圖像T;(2) 對給定原始圖像進行預處理
(2. 1)原始圖像T為RGB位圖,以每個像素點的紅、綠、藍三色的平均 值作為該像素點的灰度值,轉換原始圖像T為其灰度圖G;
(2. 2)統計灰度圖G中所有像素點灰度的平均值,以該平均值為參照, 凡是灰度大於平均值的像素點設置為黑色,灰度小於等於平均值的像素點設置為 白色,則得到灰度圖G的二值化圖I;
(2. 3)採用Sobel邊界算子對二值化圖I進行處理,使得二值化圖I中僅 保留邊界位置的像素點;
(3) 對原始圖進行Haar特徵統計
(3. 1)從Haar模板集P中依次取Pi,其中i=l..n,將圖I中的像素點逐個 與模板集中的Pi進行匹配;
(3. 2)統計在圖I中,所有模板P,匹配成功的總次數R;
(4) 在圖庫中搜索與原始圖相似的圖像
(4. 1)依次取圖庫中的圖像Yk,其中k^.,n,並遍歷所有的圖像;
(4. 2)圖像Yk為RGB位圖,以每個像素點的紅、綠、藍三色的平均值作
為該像素點的灰度值,轉換圖像Yk為灰度圖Kk;
(4. 3)統計灰度圖Kk中所有像素點灰度的平均值,以該平均值為參照, 凡是灰度大於平均值的像素點設置為黑色,灰度小於等於平均值的像素點設置為
白色,得到灰度圖Kk的二值化圖Zk;
(4. 4)採用Sobel邊界計算方法處理圖Zk,使得二值化圖Zk中僅保留邊 界位置的像素點;
(4. 5)從Haar模板集P中依次取Pi,其中i=l..n,對圖Zk中的像素點逐 個與模板集中的P,進行匹配;(4. 5)統計在圖Zk中,所有模板Pj匹配成功的總次數R';
(4. 6)依據判別式Abs(R-R')/IK10。/。來判別原始圖像T與圖庫中的圖像 Yk是否相似,其中函數Abs表示取絕對值,如果判別式為成立,表示相似,輸
出圖像Yk;如果判別式不成立,則表示不相似;
(4. 7)循環以上步驟,得到並輸出圖庫中所有與用戶給定原始圖像相似的 圖形,得到搜索結果。
本發明的工作原理是現今各種與圖像相關的研究與應用領域都在快速發
展,這些大規模用數字信息存儲的數據給基於內容的圖像索引和搜索帶來了挑戰 性的搜索問題。現在對數字圖像的檢索方法都是通過關鍵字來實現的,即對通過 與該數字圖像相關的文字描述內容來標定該圖像內容的特徵,從而加以分類和判 別。基於關鍵字的圖像搜索方式存在比較大的弊端,即用戶很難用語言來精確描 述所需查找的圖像的特徵。而且,隨著圖像庫的不斷增大,以及圖像內容的不斷 複雜,基於關鍵字的圖像內容搜索方式逐漸無法滿足對圖像內容搜索的需要。因 此,研發一種新的能夠對數字圖像內容進行描述和搜索的方式就顯得非常必要
了。本發明將Haar特徵匹配應用於圖像內容搜索中,利用Haar特徵的簡易操作 特性,為原始圖像和搜索圖像的相似性計算提供了可能。
Haar特徵是一組基礎的分類器模板,用於對特定信息內容按照預定義的模 板來進行匹配。Haar特徵是一種非常基礎的匹配模板,但是其具有計算速度上 的優勢。Haar特徵分為三類邊緣特徵、線性特徵、中心特徵和對角線特徵, 組合成特徵模板。特徵模板內有白色和黑色兩種矩形,並定義該模板的特徵值為 白色矩形像素和減去黑色矩形像素和。在確定了特徵形式後Haar特徵的數量就 取決於訓練樣本圖像矩陣的大小,特徵模板在子窗口內任意放置, 一種形態稱為 一種特徵。本發明提出一種基於Haar特徵匹配的數字圖像內容搜索方法,在圖像內容 搜索中引入了基於Haar特徵,並給出了如何依據原始圖像在圖庫中進行相似圖 像查找的過程。該方法能夠對用戶輸入的原始圖像進行分析,提取原始圖像的內 容特徵,並採用預定義的各類Haar特徵來對原始圖像進行匹配成功次數統計, 找到與用戶所提供的原始圖像相似或者包含原始圖像的數字圖像搜索結果。該發 明能夠有效的解決數字圖像內容搜索中現有方法的缺陷,能夠使用戶無需用文字 來對所要搜素的圖像內容進行文字抽象描述,從而使得搜索過程更加自然和直 觀,而且能夠提供更好的搜索結果。
本發明的有益效果主要表現在1、搜索方式直觀;2、搜索結果有效;3、 過程實現方便。
圖1是基於Haar特徵匹配的數字圖像內容搜索方法的流程圖。 圖2是基於Haar特徵匹配的數字圖像內容搜索系統的結構圖。
具體實施例方式
下面結合附圖對本發明作進一歩描述。
參照圖l,基於Haar特徵匹配的數字圖像內容搜索方法,包括以下歩驟 第一步初始化Haar匹配模板庫,確認模板庫可用。
第二步從初始化後的模板庫中載入預定義Haar模板,載入後的模板集合 為模板集P。
第三步確認並初始化待搜索的數字圖像庫Y,為之後對圖像庫的遍歷做好 準備。
第四步用戶給出並指定待搜索的原始圖像T。
第五步原始圖像T為RGB位圖,以每個像素點的紅、綠、藍三色的平均值作為該像素點的灰度值,轉換原始圖像T為其灰度圖G。
第六步統計灰度圖G中所有像素點灰度的平均值,以該平均值為參照,
凡是灰度大於平均值的像素點設置為黑色,灰度小於等於平均值的像素點設置為
白色,則得到灰度圖G的二值化圖I。
第七步採用Sobel邊界算子對二值化圖I進行處理,使得二值化圖I中僅
保留邊界位置的像素點。
第八步從模板集P中依次取Pi (i=l..n)。
第九步將圖I中的像素點逐個與模板集中的P,進行匹配。
第十步判別模板庫中的Haar模板是否已經全部遍歷,如果還未遍歷完, 則跳轉至第八步。
第十一歩統計在圖I中,所有模板P,匹配成功的總次數R。
第十二步依次取圖庫中的圖像Yk (i=l..n)。
第十三歩圖像Yk為RGB位圖,以每個像素點的紅、綠、藍三色的平均值 作為該像素點的灰度值,轉換圖像Yk為灰度圖Kk。
第十四歩統計灰度圖Kk中所有像素點灰度的平均值,以該平均值為參照,
凡是灰度大於平均值的像素點設置為黑色,灰度小於等於平均值的像素點設置為
白色,則得到灰度圖Kk的二值化圖Zk。
第十五步採用Sobel邊界計算方法處理圖Zk,使得二值化圖Zk中僅保留
邊界位置的像素點。
第十六步從Haar模板集P中依次取Pi (i=l..n)。
第十七步對圖Zk中的像素點逐個與模板集中的Pj進行匹配。
第十八步判別模板庫中的Haar模板是否已經全部遍歷,如果還未遍歷完,
則跳轉至第十六步。第十九步統計在圖Zk中,所有模板P,匹配成功的總次數R'。
第二十步依據判別式"Abs(R-R')/R<10%"來判別原始圖像T與圖庫中的 圖像Yk是否相似。如果判別式為假,則跳轉至第二十二步。(注函數Abs表
示取絕對值)。
第二十一步輸出圖像Yk。
第二十二步判別是否己經遍歷完圖庫中的所有待搜索圖像,如果還未遍歷 完,則跳轉至第十二步。
第二十三步搜索結束。
參照圖2,應用本方法實現的一種基於Haar特徵匹配的數字圖像內容搜索
系統,主要包括內容搜索子系統、用戶接口子系統。 所述的內容搜索子系統包括
(1) 圖像庫管理模塊圖像庫管理模塊用於與現有圖像庫系統接口,能夠 從現有圖像庫中讀取圖像列表信息和指定的圖像內容。
(2) 圖像預處理模塊對用戶輸入圖像與圖像庫中的圖像進行預處理,為 內容搜索工作做基礎準備。
(3) Haar模板管理模塊存儲、讀入和初始化Haar模板的模塊。
(4) 內容搜索模塊對已經預處理好的原始圖像和圖像庫中的圖像進行比 對,査找相似的圖像。
所述的用戶接口子系統包括
(1) 原始圖像輸入模塊給用戶輸入和指定原始圖像的接口,允許用戶提 供自定義的原始圖像。
(2) 搜索結果圖像顯示模塊將搜索到的相似圖像顯示出來,包括圖像名 稱、大小、建立日期等。
權利要求
1、一種基於Haar特徵匹配的數字圖像內容搜索方法,其特徵在於所述數字圖像內容搜索方法包括以下步驟(1)初始化特徵模板與數字圖庫(1.1)初始化Haar匹配模板庫;(1.2)從初始化後的模板庫中載入預定義Haar模板,載入後的模板集合為模板集P;(1.3)確認並初始化待搜索的數字圖像庫Y;(1.4)用戶給出並指定待搜索的原始圖像T;(2)對給定原始圖像進行預處理(2.1)原始圖像T為RGB位圖,以每個像素點的紅、綠、藍三色的平均值作為該像素點的灰度值,轉換原始圖像T為其灰度圖G;(2.2)統計灰度圖G中所有像素點灰度的平均值,以該平均值為參照,凡是灰度大於平均值的像素點設置為黑色,灰度小於等於平均值的像素點設置為白色,則得到灰度圖G的二值化圖I;(2.3)採用Sobel邊界算子對二值化圖I進行處理,使得二值化圖I中僅保留邊界位置的像素點;(3)對原始圖進行Haar特徵統計(3.1)從Haar模板集P中依次取Pi,其中i=1..n,將圖I中的像素點逐個與模板集中的Pi進行匹配;(3.2)統計在圖I中,所有模板Pi匹配成功的總次數R;(4)在圖庫中搜索與原始圖相似的圖像(4.1)依次取圖庫中的圖像Yk,其中k=1..n,並遍歷所有的圖像;(4.2)圖像Yk為RGB位圖,以每個像素點的紅、綠、藍三色的平均值作為該像素點的灰度值,轉換圖像Yk為灰度圖Kk;(4.3)統計灰度圖Kk中所有像素點灰度的平均值,以該平均值為參照,凡是灰度大於平均值的像素點設置為黑色,灰度小於等於平均值的像素點設置為白色,得到灰度圖Kk的二值化圖Zk;(4.4)採用Sobel邊界計算方法處理圖Zk,使得二值化圖Zk中僅保留邊界位置的像素點;(4.5)從Haar模板集P中依次取Pi,其中i=1..n,對圖Zk中的像素點逐個與模板集中的Pi進行匹配;(4.5)統計在圖Zk中,所有模板Pi匹配成功的總次數R』;(4.6)依據判別式Abs(R-R』)/R<10%來判別原始圖像T與圖庫中的圖像Yk是否相似,其中函數Abs表示取絕對值,如果判別式為成立,表示相似,輸出圖像Yk;如果判別式不成立,則表示不相似;(4.7)循環以上步驟,得到並輸出圖庫中所有與用戶給定原始圖像相似的圖形,得到搜索結果。
全文摘要
一種基於Haar特徵匹配的數字圖像內容搜索方法,包括以下步驟(1)初始化特徵模板與數字圖庫;(2)對給定原始圖像進行預處理;(3)對原始圖進行Haar特徵統計;(4)在圖庫中搜索與原始圖相似的圖像。對用戶輸入的原始圖像進行分析,提取原始圖像的內容特徵,並採用預定義的各類Haar特徵來對原始圖像進行匹配成功次數統計,找到與用戶所提供的原始圖像相似或者包含原始圖像的數字圖像搜索結果。本發明搜索方式直觀、搜索結果有效性好。
文檔編號G06F17/30GK101539944SQ20091009761
公開日2009年9月23日 申請日期2009年4月10日 優先權日2009年4月10日
發明者翊 王, 王萬良, 蔣一波, 鄭建煒, 陳偉傑 申請人:浙江工業大學