新四季網

圖像層次分類法的製作方法

2023-06-01 04:53:41

專利名稱:圖像層次分類法的製作方法
技術領域:
本發明屬於圖像處理與分析技術領域,是通過給出圖像顏色或亮度(灰度)均衡化分布因子的計算方法,來描述圖像這一特性,從而用此特性對圖像進行分類。
背景技術:
網際網路上圖像的大規模湧現,使得圖像的整理、索引、檢索技術為大家所關注。但是,目前圖像分類與檢索主要採用關鍵字匹配(圖像名匹配,如Google的圖像檢索引擎;或圖像網頁周邊文字抽取出的關鍵字)來進行分類;或以圖像顏色的分布來檢索和分類圖像。前者沒有將圖像內容進行理解,是基於網頁製作者或圖片的拍攝、製作者對圖片的理解來進行定義和分類的;後者企圖通過對圖像內容的分析來進行分類,但目前這類技術的分析方法很有限,只能按顏色或亮度(灰度)的多少、位置分布的相似程度分出某類和非某類,這樣做會出現顏色、亮度(灰度)分布近似但不同類圖像被誤分成一類的情況,使網際網路的檢索工具(搜尋引擎)檢索出的結果表示顯得多且雜,很難一下鎖定到要檢索的目標。為了使圖像的檢索結果表示得更加有序,分類顯示結果是很必要的。但是仍然用這種傳統的所謂基於圖像內容的檢索方法去分類顯示圖像,必然還出現那種混雜圖像類的結果,同時也只能出現兩類,不助於按圖像的另外一些自然特性自動地分成若干類。

發明內容
本發明提出了一種解決圖像分類的新思路,即將圖像按顏色或亮度(灰度)均勻分布程度的自然特性,對圖像特點進行刻畫,根據該刻畫值的不同來表達圖像的不同類型,達到對圖像進行層次豐富度聚類的目的。該方法可用於各類圖像搜索工具或搜尋引擎對圖像檢索結果進行初級分類,有助於將關注的目標鎖定在相應的一類圖像中,有效地縮小搜索範圍。如果與以圖像名或圖像網頁相關主題詞的關鍵字類檢索方法相結合,可產生更好的聚類結果,即每一個專門主題下的圖像層次性的聚類結果,對圖像檢索結果分類表示提供一種有效的解決途徑。
本發明的技術方案如下圖像層次分類法,其特徵在於所述圖像層次分類法被開發成軟體程序,並存儲在計算機中,當需要對待處理圖像進行分類時,所述程序依次執行以下步驟1)分別讀取每幅待處理圖像中每一個像素的顏色值或灰度值,然後統計每幅圖像中顏色值或灰度值為k的像素個數nk,其中k=0,1,...,L-1,L是圖像顏色值或灰度值的等級;2)按下述公式,分別計算出每幅待處理圖像的均衡化分布因子FtUD,FtUD=k=0L-1log(nk+1)Llog(k=0L-1nkL+1)----(1)]]>3)根據得到每幅圖像的均衡化分布值FtUD進行圖像分類。
在公式(1)中,分子表示一幅圖像所有顏色或亮度(灰度)分布的乘積,分母表示所有像素最平均分布情形下的乘積,此比值反映了圖像顏色或亮度(灰度)的均勻程度。其原始形式如公式(2)所示。為了使計算簡便,且把比值對數放大,將比值從趨於零的小數映射成分布更趨近1附近的區域,即進行合理放大,使計算得FtUD值更直觀,因此,對公式(2)比值中分子和分母分別取以10為底的對數運算,這樣就將對數中乘積運算轉化成了加法運算。同時為避免對0求對數,所以將原公式(2)中每一項乘積項+1,如公式(3)所示,然後取對數運算,如公式(4)所示。公式(1)即是公式(4)所示的另一種表現形式。因此,此公式(1),(4)是完全等價的,公式(2),(3)是變形公式。
k=0L-1nk(k=0L-1nkL)L----(2)]]>k=0L-1(nk+1)(k=0L-1nkL+1)L----(3)]]>log[k=0L-1(nk+1)]log(k=0L-1nkL+1)L----(4)]]>因為0k=0L-1nk(k=0L-1nkL)L,]]>於是,FtUD是一個間於0與1之間的值。
因為從資訊理論的角度看,圖像的顏色或亮度(灰度)分布越均勻圖像所含的信息熵就越大。所以,FtUD值的大小表徵了圖像顏色或亮度(灰度)均衡化程度,也表示了圖像信息量的狀況,可用於圖像排序,分類,檢索,圖像信息量評價和質量評價。
本發明具有以下突出的技術效果一方面,本發明解決了以往圖像檢索時檢索結果無序且不能分類表示的問題,方便歸類顯示檢索結果。將本發明用於圖像搜尋引擎中,通過對搜索結果自動聚類,提供若干類別,以分類顯示結果,使結果可呈現出有序的狀態,以方便用戶使用。另一方面,本發明也為圖像排序,圖像信息量(質量)評價提供了新手段。


圖1是按照本發明所述方法進行圖像分類的程序流程圖。
圖2a至圖2f顯示了利用本發明所述方法,根據FtUD值分類的情況。
圖3a至圖3c顯示了利用本發明所述方法,根據FtUD值排序後的情況。
具體實施例方式
下面結合附圖實例來進一步說明本發明。
待處理的圖像可以是任意圖像格式的圖像文件,如bmp,jpg,gif,tiff等。圖像資源的來源可以是網際網路上提供的圖像資源,專門的圖片庫,或個人收集的圖片資料。
本發明所述的圖像層次分類法被開發成軟體程序,並存儲在計算機中,這裡所述的計算機也可以用PDA等具有類似數字計算能力的數據處理裝置來替代。
當需要對待處理圖像進行分類時,所述程序依次執行以下步驟,程序流程如圖1所示。
1)分別讀取每幅待處理圖像中每一個像素的顏色值(彩色圖像有R,G,B三個值)或灰度值(黑白圖像只一個灰度值),然後統計每幅圖像中顏色值或灰度值為k的像素個數nk,k=0,1,...,L-1,L是圖像顏色值或灰度值的等級;如果是彩色圖像,可將每一個像素的對應的R,G,B三個值映射成一個亮度值,其映射方式可按國際NTSC制式計算Y=0.299R+0.587G+0.114B,也可以按照PAL制式計算,Y=0.222R+0.707G+0.071B。
2)按下述公式,分別計算出每幅待處理圖像的均衡化分布因子FtUD,FtUD=k=0L-1log(nk+1)Llog(k=0L-1nkL+1)----(1)]]>
其中L是圖像顏色值或灰度值的等級,nk表示圖像中顏色值(可以是轉換後的亮度值)或灰度值為k的像素個數。
3)根據得到每幅圖像的均衡化分布值FtUD進行圖像的分類。
其中,利用每幅圖像的均衡化分布值對圖像進行分類的方法可根據需要具體確定,下文將舉幾個具體分類方式,但本發明並不限於所述的分類方式。
對上述計算得到的均衡化分布FtUD值劃分區間,分成若干段,根據每幅圖像的均衡化分布值所處區間不同,相應地對圖像進行分類。圖2a至圖2f顯示了本發明此種分類情景。取一「airplanes」圖像子庫中的圖片,圖片大小不等,共57張,均為jpg格式。讀取每張圖片的像素值,經公式(1)FtUD值的計算,圖片的FtUD值範圍在0.52~0.98之間。在圖2a至圖2f顯示的幾張樣例圖片中,各圖片的FtUD值分別為0.96,0.90,0.86,0.64,0.62,0.57。然後根據問題領域的經驗值,將區間分成





,每個區間類分別有樣本6,7,6,7,20,11個。其中圖2a顯示的圖片屬於一類,圖2b和圖2c顯示的圖片屬於一類,圖2d和圖2e顯示的圖片屬於一類,圖2f顯示的圖片屬於一類。
如果K-均值聚類事先設定為3類,則聚類結果為


,圖2a、圖2b和圖2c顯示的圖片聚為一類,圖2d、圖2e和圖2f顯示的圖片聚為另一類。
類似地,聚類方法可用基於神經網絡的自組織映射SOM方法或統計學習理論的支持向量機SVM方法替換K-均值聚類,可得到相似的分類結果。
當分類的劃分區間縮小到每個區間只容納一個均衡化分布值時,相當於每幅圖像自為一類。當對這樣的分類結果按照升序或降序排列時,就得到了用均衡化分布值進行圖像排序的結果。圖3顯示了依據FtUD值的大小直接給出降序結果一個例子。該結果具體所得是經過從Internet網上抓取的主題詞為」Cougar」所有圖片,獲取每張圖片上每個像素的彩色R,G,B值或灰度值G,若是彩色R,G,B值,可按照公式Y=0.299R+0.587G+0.114B線性變換成一個亮度值Y,然後統計每幅圖像的Y值或G值為k的像素個數nk;再經過公式(1)FtUD值的計算,圖片的FtUD值範圍均落在0.1~0.99之間,圖3a至圖3c顯示的幾張樣例圖片的FtUD值是降序排列的,分別為圖3a的0.91,圖3b的0.68和圖3c的0.18。從這種降冪排序中可充分表現出圖像層次感和均勻性的衰減變化。
從另一個角度說,圖像分類或排序,其實在一定意義上就是在評價圖像。因此,依據均衡化分布FtUD值的大小,作為圖像所含信息量多少的分值直接對圖像進行信息量評價。如圖3a至圖3c顯示的圖片對應的信息量因子分別為0.91,0.68和0.18。這是用均衡化分布值FtUD從圖像分類到圖像信息量評價的引申應用,對構成圖像質量評價(包括清晰度、信息量、主題意義,信息量是其中之一)也有貢獻。
權利要求
1.圖像層次分類法,其特徵在於所述圖像層次分類法被開發成軟體程序,並存儲在計算機中,當需要對待處理圖像進行分類時,所述程序依次執行以下步驟1)分別讀取每幅待處理圖像中每一個像素的顏色值或灰度值,然後統計每幅圖像中顏色值或灰度值為k的像素個數nk,其中k=0,1,...,L-1,L是圖像顏色值或灰度值的等級;2)按下述公式,分別計算出每幅待處理圖像的均衡化分布因子FtUD,FtUD=k=0L-1log(nk+1)Llog(k=0L-1nkL+1)---(1)]]>3)根據得到每幅圖像的均衡化分布值FtUD進行圖像分類。
2.根據權利要求1所述的圖像層次分類法,其特徵在於對計算得到的均衡化分布值劃分區間,分成若干段,根據每幅圖像的均衡化分布值所處區間不同,相應地對圖像進行分類。
3.根據權利要求1所述的圖像層次分類法,其特徵在於根據計算得到的均衡化分布值,用k-均值聚類、自組織映射或支持向量機算法進行自動聚類,從而實現對圖像的分類。
4.根據權利要求1所述的圖像層次分類法,其特徵在於對計算得到的均衡化分布值採用劃分區間的方式進行分類,且每個區間只容納一個均衡化分布值,然後對這樣的分類結果按照升序或降序排列,從而實現圖像的排序。
5.根據權利要求1所述的圖像層次分類法,其特徵在於將計算得到的均衡化分布值FtUD作為圖像所含信息量多少的分值,對圖像進行信息量評價。
全文摘要
圖像層次分類法,屬於圖像處理與分析的技術領域。本發明主要針對網際網路上湧現的大規模圖像,基於顏色(灰度)分布相似度量的圖像檢索和分類方法無法克服分布相似但類別不同的圖像交疊的現象,提出了一種圖像層次分類法,它通過給出數字圖像顏色或亮度(灰度)均衡化分布屬性Ft
文檔編號G06K9/46GK1664820SQ200510064759
公開日2005年9月7日 申請日期2005年4月21日 優先權日2005年4月21日
發明者姚鴻勳, 郎鹹波, 劉亞洲, 姚桂林 申請人:哈爾濱工業大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀