基於改進概率主題模型的地點圖像識別方法
2023-09-18 15:39:30 1
專利名稱:基於改進概率主題模型的地點圖像識別方法
技術領域:
本發明涉及一種圖像識別方法,尤其是一種基於改進概率主題模型的地點圖像識別方法,用於室內及室外地點圖像的識別。
背景技術:
目前,隨著智能移動機器人走進人們的日常生活,並在軍事、商場、醫院、家庭等各種領域發揮重要作用,人們對智能移動機器人系統的自動定位需求越來越迫切。移動機器人只有準確地知道自身的位置以及所處的工作空間,才能安全有效地進行自主運動,為人類服務。因此,自定位和位置估計成為自主移動機器人最重要的能力之一。視覺系統能夠為移動機器人提供最豐富的感知信息,同時也具有最接近人類的環境感知方式。因此,基於視覺的機器人自定位問題吸引了大量研究人員的參與,同時也取得了大量的研究成果。基於視覺的機器人自定位根據使用的視覺特徵信息的不同,可分為3種基於地標特徵的自定位方法、基於圖像外觀特徵的自定位方法以及最近出現的基於地點識別的自定位方法。其中,基於地點或者場景識別的機器人視覺自定位方法使用人類能夠直接理解的高層語義信息如「門口」、「走廊」、「廚房」等作為視覺特徵,非常適合於機器人在複雜環境中的自定位問題。2005年李桂芝,安成萬,楊國盛等.基於場景識別的移動機器人定位方法研究[J].機器人,2005,27 (2) :123-127使用多通道Gabor濾波器提取場景圖像的全局紋理特徵,並使用支持向量機來分類識別室內、走廊、門廳等場景,進而實現機器人的邏輯定位,2008年Ullah M M,Pronobis A,Caputo B,et al. Towards robust place recognition for robot localization[C]//Proc of 2008IEEE ICRA. 2008 :530-537 使用 Harris 角點特徵檢測子和SIFT特徵描述子提取局部特徵,並使用支持向量機作為分類器實現基於局部特徵的地點識別。然而,機器人實際獲得的圖片常會出現拍攝角度、光照的不同,遮擋甚至背景混亂,以及因為人物及物體的位置變化而導致的高度動態變化等現象,這些固有的可變性導致地點圖像識別的過程充滿了不確定。為了更好地解決地點圖像識別過程中由於拍攝角度、光照的不同,以及人物和物體的高度動態變化所導致的不確定性問題,引入基於概率主題模型的圖像識別方法,並對原始概率主題模型進行改進,降低算法複雜度的同時有效提聞識別性能。概率主題模型是一種流行的一種圖模型結構,它能夠對實際問題進行概率建模, 並對各種複雜相關的因素進行刻畫。作為概率論和圖論相結合的產物,為解決地點圖像識別中的不確定性、複雜性提供了直觀而自然的方法。目前,概率主題模型在人工智慧、自然語言處理、文本分類等領域已經取得了很好的應用效果,並逐漸引入到圖像識別領域中。
發明內容
本發明的目的在於提供一種基於概率主題模型的地點圖像識別方法,更好地解決地點圖像識別過程中由於拍攝角度、光照的不同,以及人物和物體的高度動態變化所導致的不確定性問題,並對原始概率主題模型進行改進,降低算法複雜度的同時有效提高識別性能。為了達到上述目的,本發明所採用的技術方案是提供一種基於改進概率主題模型的地點圖像識別方法,通過改進的概率主題模型建立圖像的潛在主題分布,然後通過分類器來識別未知地點圖像,其特徵包括以下步驟I)圖像獲取步驟,通過安裝在機器人上的標準攝像頭拍攝獲取訓練圖像和測試圖2)圖像預處理步驟,將獲取的圖像進行灰度化,並將其尺寸縮小至128X128像素;3)特徵提取步驟,採用尺度不變特徵提取算法(Scale-Invariant Features(SIFT))對圖像進行局部特徵提取;4)特徵聚類步驟,將所有特徵通過k-means算法進行聚類,得到若干聚類中心;5)特徵分配步驟,將每幅圖像的特徵點在對應的聚類中心上進行投票,得出每幅圖像對應於每個聚類中心的頻數表示向量;6)潛在主題建模步驟,以步驟5)中得出的圖像的頻數向量作為輸入特徵變量,設定潛在主題個數,採用改進的概率主題模型對圖像進行建模,學習模型,得到圖像的潛在主題分布向量;7)採用分類器識別未知地點圖像。所述步驟I)中訓練圖像和測試圖像由安裝在機器人上的標準攝像頭按照固定路徑拍攝得到,圖像可包含光照、視角、尺度的變化以及人物和物體的動態變化。所述步驟3)中採用尺度不變特徵提取算法(Scale-Invariant Features (SIFT)) 對圖像進行局部特徵提取包括圖像關鍵點檢測以及將關鍵點表示為128維的特徵描述子。所述步驟6)中的概率主題模型為潛在Dirichlet分布模型(Latent Dirichlet Allocation, LDA),對原始LDA模型進行改進,加入量化函數得到改進模型Quantified LDA 模型(QLDA),對訓練圖像和測試圖像進行建模。改進模型對於每幅圖像的模型生成過程如下對於每幅圖像X,選擇一個Dirichlet參數π , Ji服從參數為α的Dirichlet分布,g卩Ji Dirichlet ( α ),對於每幅圖像的每個特徵χ」,選擇一個主題ζ」,服從參數π的離散分布,即Zj discrete O ),然後選擇一個特徵Xj,服從參數β的概率分布,即Xj p(Xj| β), β是每幅圖像的不同特徵對應不同主題的概率,如果一幅圖像有m個特徵,k個設定的主題,則β為mXk的矩陣;對於圖像的所有特徵,統計並分析數據集中每幅圖像的特徵分布,根據不同數據集的特徵分布情況,建立對應的量化函數QUP,對輸入特徵進行分級量化處理,使其服從Xj Q(Xj)分布,這樣每幅圖像的密度函數可表示為P(x \(Χ,β)= I ρ(π I )nj=1 Tj2j P(zj I ^)P(Xj I Zj, P)Q(Xj )dn ;分級量化的基本思想是統計平均每幅圖像的特徵在各區間內的密集程度,最密集且特徵值較小的特徵,區分度最低,作為非顯著特徵忽略;比較密集且特徵值較大的特徵,區分度較高,保持不變;最稀疏且特徵值最大的特徵,區分度最高,作為顯著特徵,近似處理為距離其最近的整十數(實驗顯示該處理可降低計算複雜度,且不會影響識別性能);具體的量化標準制定方法如下
統計輸入特徵的最小值Xniin和最大值Xniax ;設定[a,b]區間的特徵密度函數D(a,b),表示特徵在[a,b]區間內的密集程度, 表達式如下
權利要求
1. 一種基於改進概率主題模型的地點圖像識別方法,其特徵在於,通過改進的概率主題模型建立圖像的潛在主題分布,然後通過分類器來識別未知地點圖像,包括以下步驟1.1.圖像獲取步驟,通過安裝在機器人上的標準攝像頭拍攝獲取訓練圖像和測試
圖1.2.圖像預處理步驟,將獲取的圖像進行灰度化,並將其尺寸縮小;1.3.特徵提取步驟,採用尺度不變特徵提取算法對圖像進行局部特徵提取;I. 4.特徵聚類步驟,將所有特徵通過k-means算法進行聚類,得到若干聚類中心;I. 5.特徵分配步驟,將每幅圖像的特徵點在對應的聚類中心上進行投票,得出每幅圖像對應於每個聚類中心的頻數表示向量;I. 6.潛在主題建模步驟,以步驟I. 5中得出的圖像的頻數向量作為輸入特徵變量,設定潛在主題個數,採用改進的概率主題模型對圖像進行建模,學習模型,得到圖像的潛在主題分布向量;I.7.採用分類器識別未知地點圖像;所述步驟I. 6中學習算法採用Variational推斷;估計模型參數U % β*),使整個圖像集的似然函數P ( X α *, β *)最大;與原始LDA相同,該似然函數不可求,須採用Variational推斷;利用Jensen不等式獲得一個可計算的下界來近似真實的似然函數值,然後估計參數來最大化這個下界;用L(y,Φ ;α,β)表示似然函數的近似下界,則有Iogp (X I α , β ) = L( Y , Φ ; α , β )+KL (q( π , ζ | Y , Φ) | | β ( π , ζ | χ, α , β ))其中 Iogp (χ I α,β )為似然函數,q O , ζ | Y , Φ)為 Variational 分布,ρΟ , ζ |χ, α, β )為後驗概率密度函數,KL(q(3 , ζ I Y , Φ) I |ρ( 3 , ζ |χ, α , β ))為 Variational 分布與後驗概率密度函數的Kullback-Leibler距離;由上,最大化下界L( Y,Φ ; α , β )使其接近似然函數logp(x| α,β)就可以轉變為估計參數 U*,Φ*)使 KL(qU,z| Υ,Φ)||ρ(π,ζ χ,α, β))最小,即:(Y *, Φ*) = arg min (γ, $)KL(q( η , ζ Y, Φ)||ρ(π,ζ|χ, α, β))Yi和$〃的計算公式如下
2.根據權利要求I所述的基於改進概率主題模型的地點圖像識別方法,其特徵在於, 所述步驟I. I中訓練圖像和測試圖像由安裝在機器人上的標準攝像頭按照固定路徑拍攝得到,圖像包含光照、視角、尺度的變化以及人物和物體的動態變化。
3.根據權利要求I所述的基於改進概率主題模型的地點圖像識別方法,其特徵在於, 所述的步驟I. 2的縮小尺寸為128 X 128像素。
4.根據權利要求I所述的基於改進概率主題模型的地點圖像識別方法,其特徵在於, 所述步驟I. 3中採用尺度不變特徵提取算法對圖像進行局部特徵提取包括圖像關鍵點檢測以及將關鍵點表示為128維的特徵描述子。
5.根據權利要求I所述的基於改進概率主題模型的地點圖像識別方法,其特徵在於, 所述步驟I. 7中分類器為最近鄰分類方法。
全文摘要
一種基於改進概率主題模型的地點圖像識別方法,屬於圖像識別技術領域。目的在於更好地解決地點圖像識別中由於不同角度、光照,以及人物和物體的高度動態變化導致的不確定性問題。包括以下步驟圖像獲取步驟;圖像預處理步驟;特徵提取步驟,採用SIFT算法對圖像進行特徵提取;特徵聚類步驟,將所有特徵聚類,得到若干聚類中心;特徵分配步驟,將每幅圖像的特徵在聚類中心上投票,得出對應每個聚類中心的頻數向量;潛在主題建模步驟,採用改進的概率主題模型學習圖像的潛在主題分布;採用分類器識別未知地點圖像。本發明在LDA模型中加入量化函數,通過改進LDA模型學習圖像的潛在主題,在保證實時性的前提下,可有效提高識別性能。
文檔編號G06K9/62GK102609719SQ20121001769
公開日2012年7月25日 申請日期2012年1月19日 優先權日2012年1月19日
發明者傅金融, 李明愛, 楊婉露, 楊金福, 王鍇, 王陽麗 申請人:北京工業大學