新四季網

基於改進概率主題模型的地點圖像識別方法

2023-09-18 15:39:30

專利名稱:基於改進概率主題模型的地點圖像識別方法
技術領域:
本發明涉及一種圖像識別方法,尤其是一種基於改進概率主題模型的地點圖像識別方法,用於室內及室外地點圖像的識別。
背景技術:
目前,隨著智能移動機器人走進人們的日常生活,並在軍事、商場、醫院、家庭等各種領域發揮重要作用,人們對智能移動機器人系統的自動定位需求越來越迫切。移動機器人只有準確地知道自身的位置以及所處的工作空間,才能安全有效地進行自主運動,為人類服務。因此,自定位和位置估計成為自主移動機器人最重要的能力之一。視覺系統能夠為移動機器人提供最豐富的感知信息,同時也具有最接近人類的環境感知方式。因此,基於視覺的機器人自定位問題吸引了大量研究人員的參與,同時也取得了大量的研究成果。基於視覺的機器人自定位根據使用的視覺特徵信息的不同,可分為3種基於地標特徵的自定位方法、基於圖像外觀特徵的自定位方法以及最近出現的基於地點識別的自定位方法。其中,基於地點或者場景識別的機器人視覺自定位方法使用人類能夠直接理解的高層語義信息如「門口」、「走廊」、「廚房」等作為視覺特徵,非常適合於機器人在複雜環境中的自定位問題。2005年李桂芝,安成萬,楊國盛等.基於場景識別的移動機器人定位方法研究[J].機器人,2005,27 (2) :123-127使用多通道Gabor濾波器提取場景圖像的全局紋理特徵,並使用支持向量機來分類識別室內、走廊、門廳等場景,進而實現機器人的邏輯定位,2008年Ullah M M,Pronobis A,Caputo B,et al. Towards robust place recognition for robot localization[C]//Proc of 2008IEEE ICRA. 2008 :530-537 使用 Harris 角點特徵檢測子和SIFT特徵描述子提取局部特徵,並使用支持向量機作為分類器實現基於局部特徵的地點識別。然而,機器人實際獲得的圖片常會出現拍攝角度、光照的不同,遮擋甚至背景混亂,以及因為人物及物體的位置變化而導致的高度動態變化等現象,這些固有的可變性導致地點圖像識別的過程充滿了不確定。為了更好地解決地點圖像識別過程中由於拍攝角度、光照的不同,以及人物和物體的高度動態變化所導致的不確定性問題,引入基於概率主題模型的圖像識別方法,並對原始概率主題模型進行改進,降低算法複雜度的同時有效提聞識別性能。概率主題模型是一種流行的一種圖模型結構,它能夠對實際問題進行概率建模, 並對各種複雜相關的因素進行刻畫。作為概率論和圖論相結合的產物,為解決地點圖像識別中的不確定性、複雜性提供了直觀而自然的方法。目前,概率主題模型在人工智慧、自然語言處理、文本分類等領域已經取得了很好的應用效果,並逐漸引入到圖像識別領域中。

發明內容
本發明的目的在於提供一種基於概率主題模型的地點圖像識別方法,更好地解決地點圖像識別過程中由於拍攝角度、光照的不同,以及人物和物體的高度動態變化所導致的不確定性問題,並對原始概率主題模型進行改進,降低算法複雜度的同時有效提高識別性能。為了達到上述目的,本發明所採用的技術方案是提供一種基於改進概率主題模型的地點圖像識別方法,通過改進的概率主題模型建立圖像的潛在主題分布,然後通過分類器來識別未知地點圖像,其特徵包括以下步驟I)圖像獲取步驟,通過安裝在機器人上的標準攝像頭拍攝獲取訓練圖像和測試圖2)圖像預處理步驟,將獲取的圖像進行灰度化,並將其尺寸縮小至128X128像素;3)特徵提取步驟,採用尺度不變特徵提取算法(Scale-Invariant Features(SIFT))對圖像進行局部特徵提取;4)特徵聚類步驟,將所有特徵通過k-means算法進行聚類,得到若干聚類中心;5)特徵分配步驟,將每幅圖像的特徵點在對應的聚類中心上進行投票,得出每幅圖像對應於每個聚類中心的頻數表示向量;6)潛在主題建模步驟,以步驟5)中得出的圖像的頻數向量作為輸入特徵變量,設定潛在主題個數,採用改進的概率主題模型對圖像進行建模,學習模型,得到圖像的潛在主題分布向量;7)採用分類器識別未知地點圖像。所述步驟I)中訓練圖像和測試圖像由安裝在機器人上的標準攝像頭按照固定路徑拍攝得到,圖像可包含光照、視角、尺度的變化以及人物和物體的動態變化。所述步驟3)中採用尺度不變特徵提取算法(Scale-Invariant Features (SIFT)) 對圖像進行局部特徵提取包括圖像關鍵點檢測以及將關鍵點表示為128維的特徵描述子。所述步驟6)中的概率主題模型為潛在Dirichlet分布模型(Latent Dirichlet Allocation, LDA),對原始LDA模型進行改進,加入量化函數得到改進模型Quantified LDA 模型(QLDA),對訓練圖像和測試圖像進行建模。改進模型對於每幅圖像的模型生成過程如下對於每幅圖像X,選擇一個Dirichlet參數π , Ji服從參數為α的Dirichlet分布,g卩Ji Dirichlet ( α ),對於每幅圖像的每個特徵χ」,選擇一個主題ζ」,服從參數π的離散分布,即Zj discrete O ),然後選擇一個特徵Xj,服從參數β的概率分布,即Xj p(Xj| β), β是每幅圖像的不同特徵對應不同主題的概率,如果一幅圖像有m個特徵,k個設定的主題,則β為mXk的矩陣;對於圖像的所有特徵,統計並分析數據集中每幅圖像的特徵分布,根據不同數據集的特徵分布情況,建立對應的量化函數QUP,對輸入特徵進行分級量化處理,使其服從Xj Q(Xj)分布,這樣每幅圖像的密度函數可表示為P(x \(Χ,β)= I ρ(π I )nj=1 Tj2j P(zj I ^)P(Xj I Zj, P)Q(Xj )dn ;分級量化的基本思想是統計平均每幅圖像的特徵在各區間內的密集程度,最密集且特徵值較小的特徵,區分度最低,作為非顯著特徵忽略;比較密集且特徵值較大的特徵,區分度較高,保持不變;最稀疏且特徵值最大的特徵,區分度最高,作為顯著特徵,近似處理為距離其最近的整十數(實驗顯示該處理可降低計算複雜度,且不會影響識別性能);具體的量化標準制定方法如下
統計輸入特徵的最小值Xniin和最大值Xniax ;設定[a,b]區間的特徵密度函數D(a,b),表示特徵在[a,b]區間內的密集程度, 表達式如下
權利要求
1. 一種基於改進概率主題模型的地點圖像識別方法,其特徵在於,通過改進的概率主題模型建立圖像的潛在主題分布,然後通過分類器來識別未知地點圖像,包括以下步驟1.1.圖像獲取步驟,通過安裝在機器人上的標準攝像頭拍攝獲取訓練圖像和測試

圖1.2.圖像預處理步驟,將獲取的圖像進行灰度化,並將其尺寸縮小;1.3.特徵提取步驟,採用尺度不變特徵提取算法對圖像進行局部特徵提取;I. 4.特徵聚類步驟,將所有特徵通過k-means算法進行聚類,得到若干聚類中心;I. 5.特徵分配步驟,將每幅圖像的特徵點在對應的聚類中心上進行投票,得出每幅圖像對應於每個聚類中心的頻數表示向量;I. 6.潛在主題建模步驟,以步驟I. 5中得出的圖像的頻數向量作為輸入特徵變量,設定潛在主題個數,採用改進的概率主題模型對圖像進行建模,學習模型,得到圖像的潛在主題分布向量;I.7.採用分類器識別未知地點圖像;所述步驟I. 6中學習算法採用Variational推斷;估計模型參數U % β*),使整個圖像集的似然函數P ( X α *, β *)最大;與原始LDA相同,該似然函數不可求,須採用Variational推斷;利用Jensen不等式獲得一個可計算的下界來近似真實的似然函數值,然後估計參數來最大化這個下界;用L(y,Φ ;α,β)表示似然函數的近似下界,則有Iogp (X I α , β ) = L( Y , Φ ; α , β )+KL (q( π , ζ | Y , Φ) | | β ( π , ζ | χ, α , β ))其中 Iogp (χ I α,β )為似然函數,q O , ζ | Y , Φ)為 Variational 分布,ρΟ , ζ |χ, α, β )為後驗概率密度函數,KL(q(3 , ζ I Y , Φ) I |ρ( 3 , ζ |χ, α , β ))為 Variational 分布與後驗概率密度函數的Kullback-Leibler距離;由上,最大化下界L( Y,Φ ; α , β )使其接近似然函數logp(x| α,β)就可以轉變為估計參數 U*,Φ*)使 KL(qU,z| Υ,Φ)||ρ(π,ζ χ,α, β))最小,即:(Y *, Φ*) = arg min (γ, $)KL(q( η , ζ Y, Φ)||ρ(π,ζ|χ, α, β))Yi和$〃的計算公式如下
2.根據權利要求I所述的基於改進概率主題模型的地點圖像識別方法,其特徵在於, 所述步驟I. I中訓練圖像和測試圖像由安裝在機器人上的標準攝像頭按照固定路徑拍攝得到,圖像包含光照、視角、尺度的變化以及人物和物體的動態變化。
3.根據權利要求I所述的基於改進概率主題模型的地點圖像識別方法,其特徵在於, 所述的步驟I. 2的縮小尺寸為128 X 128像素。
4.根據權利要求I所述的基於改進概率主題模型的地點圖像識別方法,其特徵在於, 所述步驟I. 3中採用尺度不變特徵提取算法對圖像進行局部特徵提取包括圖像關鍵點檢測以及將關鍵點表示為128維的特徵描述子。
5.根據權利要求I所述的基於改進概率主題模型的地點圖像識別方法,其特徵在於, 所述步驟I. 7中分類器為最近鄰分類方法。
全文摘要
一種基於改進概率主題模型的地點圖像識別方法,屬於圖像識別技術領域。目的在於更好地解決地點圖像識別中由於不同角度、光照,以及人物和物體的高度動態變化導致的不確定性問題。包括以下步驟圖像獲取步驟;圖像預處理步驟;特徵提取步驟,採用SIFT算法對圖像進行特徵提取;特徵聚類步驟,將所有特徵聚類,得到若干聚類中心;特徵分配步驟,將每幅圖像的特徵在聚類中心上投票,得出對應每個聚類中心的頻數向量;潛在主題建模步驟,採用改進的概率主題模型學習圖像的潛在主題分布;採用分類器識別未知地點圖像。本發明在LDA模型中加入量化函數,通過改進LDA模型學習圖像的潛在主題,在保證實時性的前提下,可有效提高識別性能。
文檔編號G06K9/62GK102609719SQ20121001769
公開日2012年7月25日 申請日期2012年1月19日 優先權日2012年1月19日
發明者傅金融, 李明愛, 楊婉露, 楊金福, 王鍇, 王陽麗 申請人:北京工業大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀