新四季網

基於隱馬爾科夫模型判斷手勢運動方向的方法

2023-05-05 20:24:31

專利名稱:基於隱馬爾科夫模型判斷手勢運動方向的方法
技術領域:
本發明涉及視頻圖像處理領域,具體的講是基於隱馬爾科夫模型(HMM)判斷手勢運動方向的方法。
背景技術:
近年來,隨著計算機在現代社會影響的迅速擴大,多模式人機互動在現實生活中的應用越來越廣泛。基於視覺的手勢識別已成為新一代人機互動不可或缺的技術。手勢是一種自然、直觀、易於學習的人機互動手段,以人手直接作為計算機的輸入設備,人機間的通訊將不再需要媒介。基於計算機的手勢識別是具有發展趨勢的一種識別技術,但技術上存在很多困難。如手勢來源於複雜背景(人自身幹擾、光照、場景等)條件下的視頻流、手具有彈性的特點、手具有大量冗餘特徵信息(如掌紋等)、手勢在三維空間如何識別等,這些問題目前還未完善解決,具體實現需要增加限制條件。如何克服手勢識別中的技術問題,使其改變未來人機互動模式,目前有許多研究者致力於此項目。目前,手勢識別視頻流的獲取分為2D攝像頭與3D攝像頭。3D攝像頭獲得的是手勢的三維信息,其成本昂貴不利於普及。因此現階段大多致力於廉價的USB 2D攝像機手勢識別技術,具有積極意義。現有的手勢運動方向判定主要是單一的基於手勢運動跟蹤,通過計算手位移距離從而判定其運動方向的方法。但是由於手是非剛體物體,且手勢跟蹤一般基於膚色進行, 導致這種基於跟蹤的方法不穩定,易受環境光照、及背景色的幹擾,無法形成正確的跟蹤軌跡。

發明內容
針對以上出現的問題,本發明提供了一種基於隱馬爾科夫模型判斷手勢運動方向的方法,通過多種判斷條件對隱馬爾科夫模型的手勢運動方向進行判斷,提高判斷的準確性,降低各種因素對判斷結果的幹擾。本發明基於隱馬爾科夫模型判斷手勢運動方向的方法,包括a.通過攝像頭進行人臉檢測,以確定用戶進入系統識別範圍,可以採用常規的 Adaboost檢測器進行人臉檢測;b.從視頻流中獲取當前運動圖像,建立膚色概率模型,作為手勢運動過程中膚色分割的依據,將膚色概率圖與幀差結果相乘後的數據經中值濾波器進行濾波,得到手勢區域灰度圖;c.根據當前手勢區域灰度圖,更新手勢運動歷史圖,並獲得運動能量圖;d.對有效的手勢運動歷史圖進行圖像梯度向量計算,得到手勢運動向量和向量水平夾角,再將向量水平夾角規劃到360度平面區域劃分的相應區域對應的編碼中;e.通過運動能量圖獲得手勢運動的開始時刻和結束時刻,分割出手勢運動;f.通過步驟a 步驟e對一段視頻的分析,獲得該視頻中一個運動方向的編碼序列,通過所述的編碼序列得到隱馬爾科夫模型的可見狀態序列,對隱馬爾科夫模型參數進行訓練,利用隱馬爾科夫模型的前向、後向算法推定手勢運動方向。本發明的方法不依賴於手勢的跟蹤效果,而是將手的膚色信息與手勢的運動信息 (幀差)相融合,這樣能較準確的分割出手勢。在此基礎上構建出手勢運動歷史圖和運動能量圖,並根據手的運動特徵自適應切分手勢運動間隔,計算並獲得該時間間隔內一系列手勢運動的方向角度特徵,使用該角度特徵序列構建隱馬爾科夫模型,並利用該模型的前、後向算法推斷最有可能的手勢運動方向,從而實現手勢運動的判定。具體的一種方案為,步驟c所述的更新手勢運動歷史圖的方法為
叉=,其中Ητ(χ,y, t)為當前的手勢運動歷史圖,
為當前的手勢區域灰度圖,τ為描述運動的時間範圍的參數,δ為手勢運動歷史圖的衰減參數,I為手勢區域二值分割的閾值。通過大量的仿真試驗和測試,為取得較好的運動判斷,優選的衰減參數δ =0.5, 閾值ξ = 10。另一種具體的方案為,步驟c所述的獲得運動能量圖的方法為
( 、「I H Ax,y,t) > I ET{x,y,t) = \,其中E,(x,y,t)為運動能量圖,τ為描述運動的時間範圍的
參數,X,I分別為運動能量圖的橫縱坐標,t為時刻。進一步的,步驟e所述的通過運動能量圖獲得手勢運動的開始時刻和結束時刻的方法為計算兩個不同時刻的運動能量圖累加的差,如果所述的差值> 400為手勢運動開始,如果所述的差值< 20為手勢運動結束。其中400和20的取值是經過大量實驗的統計數據。具體的,步驟f中所述利用隱馬爾科夫模型的前向、後向算法推定手勢運動方向為根據所述的隱馬爾科夫模型的可見狀態序列,通過隱馬爾科夫模型參數的狀態轉移概率和觀測值概率,計算運動模型概率,根據最大的運動模型概率對應的運動模型對整個系統的手勢運動方向進行判斷。具體的,步驟f中對隱馬爾科夫模型參數進行訓練包括Π.初始化待訓練模型參數,根據動作編碼設定待訓練模型參數的各個狀態轉移矩陣;f2.根據待訓練模型參數和隱馬爾科夫模型可見狀態的觀察值序列,訓練新模型參數如果新模型下獲得所述觀察值序列的概率的對數一待模型下獲得所述觀察值序列的概率的對數< delta,則訓練結束;否則將重複步驟f2。優選的,步驟d中對手勢在上、下、左、右四個方向的運動進行計算。優選的,為克服運動噪聲,步驟f中截取所獲得的編碼序列的中間6 8個編碼為隱馬爾科夫模型的可見狀態序列,進一步優選為截取8個編碼。測試得知,本發明基於隱馬爾科夫模型判斷手勢運動方向的方法,通過多種判斷條件對隱馬爾科夫模型的手勢運動方向進行判斷,能夠提高手勢運動判斷的準確性,能夠明顯降低各種因素對判斷結果的幹擾。以下結合由附圖所示實施例的具體實施方式
,對本發明的上述內容再作進一步的詳細說明。但不應將此理解為本發明上述主題的範圍僅限於以下的實例。在不脫離本發明上述技術思想情況下,根據本領域普通技術知識和慣用手段做出的各種替換或變更,均應包括在本發明的範圍內。


圖I是本發明基於隱馬爾科夫模型判斷手勢運動方向的方法的流程圖。
具體實施例方式如圖I所示本發明基於隱馬爾科夫模型判斷手勢運動方向的方法,包括a.通過攝像頭進行人臉檢測,以確定用戶進入系統識別範圍,採用常規的 Adaboost檢測器檢測當前巾貞f (x, y, t)中人臉個數numf,如果在某個位置附近出現持續人臉個數numf > O且在2秒以上,則認為有用戶進入場景;b.從視頻流中獲取當前運動圖像,建立膚色概率模型,作為手勢運動過程中膚色分割的依據,在HSV(色調、飽和度、亮度)顏色空間,統計大量膚色與非膚色信息, 建立歸一化的H-S(色調、飽和度)膚色直方圖,用於後續視頻幀圖像的膚色分割,膚色
分割的閾值概率設定為O. 85,當前幀的的膚色概率圖
權利要求
1.基於隱馬爾科夫模型判斷手勢運動方向的方法,其特徵為包括a.通過攝像頭進行人臉檢測,以確定用戶進入系統識別範圍;b.從視頻流中獲取當前運動圖像,建立膚色概率模型,作為手勢運動過程中膚色分割的依據,將膚色概率圖與視頻幀差結果相乘後的數據經中值濾波器進行濾波,得到手勢區域灰度圖;c.根據當前手勢區域灰度圖,更新手勢運動歷史圖,並獲得運動能量圖;d.對有效的手勢運動歷史圖進行圖像梯度向量計算,得到手勢運動向量和向量水平夾角,再將向量水平夾角規劃到360度平面區域劃分的相應區域對應的編碼中;e.通過運動能量圖獲得手勢運動的開始時刻和結束時刻,分割出手勢運動;f.通過步驟a 步驟e對一段視頻的分析,獲得該視頻的一個運動方向的編碼序列, 通過所述的編碼序列得到隱馬爾科夫模型的可見狀態序列,對隱馬爾科夫模型參數進行訓練,利用隱馬爾科夫模型的前向、後向算法推定手勢運動方向。
2.如權利要求I所述的基於隱馬爾科夫模型判斷手勢運動方向的方法,其特徵為步驟c所述的更新手勢運動歷史圖的方法為=,其中Ητ (x,y,t)為當前的手勢運動歷史圖,爐0,>^)為當前的手勢區域灰度圖,τ為描述運動的時間範圍的參數,δ為手勢運動歷史圖的衰減參數,ξ為手勢區域二值分割的閾值。
3.如權利要求2所述的基於隱馬爾科夫模型判斷手勢運動方向的方法,其特徵為所述的衰減參數δ =0.5,閾值ξ = 10s。
4.如權利要求I所述的基於隱馬爾科夫模型判斷手勢運動方向的方法,其特徵為步驟( 、「I H Ax,y,t) > I C所述的獲得運動能量圖的法為4(Χ,>^)=。『糹「,其中E,(x,y,t)為運動能量圖,τ為描述運動的時間範圍的參數,x,y分別為運動能量圖的橫縱坐標,t為時刻。
5.如權利要求I所述的基於隱馬爾科夫模型判斷手勢運動方向的方法,其特徵為步驟 e所述的通過運動能量圖獲得手勢運動的開始時刻和結束時刻的方法為計算兩個不同時刻的運動能量圖累加的差,如果所述的差值> 400為手勢運動開始,如果所述的差值< 20 為手勢運動結束。
6.如權利要求I所述的基於隱馬爾科夫模型判斷手勢運動方向的方法,其特徵為步驟 f中所述利用隱馬爾科夫模型的前向、後向算法推定手勢運動方向為根據所述的隱馬爾科夫模型的可見狀態序列,通過隱馬爾科夫模型參數的狀態轉移概率和觀測值概率,計算運動模型概率,根據最大的運動模型概率對應的運動模型對整個系統的手勢運動方向進行判斷。
7.如權利要求I所述的基於隱馬爾科夫模型判斷手勢運動方向的方法,其特徵為步驟 f中對隱馬爾科夫模型參數進行訓練包括fl.初始化待訓練模型參數,根據動作編碼設定待訓練模型參數的各個狀態轉移矩陣;f2.根據待訓練模型參數和隱馬爾科夫模型可見狀態的觀察值序列,訓練新模型參數 如果新模型下獲得所述觀察值序列的概率的對數一待模型下獲得所述觀察值序列的概率的對數< delta,則訓練結束;否則將重複步驟f2。
8.如權利要求I至7之一所述的基於隱馬爾科夫模型判斷手勢運動方向的方法,其特徵為步驟d中對手勢在上、下、左、右四個方向的運動進行計算。
9.如權利要求I至7之一所述的基於隱馬爾科夫模型判斷手勢運動方向的方法,其特徵為步驟f中截取所獲得的編碼序列的中間6 8個編碼為隱馬爾科夫模型的可見狀態序列。
全文摘要
本發明涉及基於隱馬爾科夫模型判斷手勢運動方向的方法,包括a.人臉識別;b.多線索融合得到手勢區域灰度圖;c.根據手勢區域灰度圖,更新手勢運動歷史圖,並獲得運動能量圖;d.劃分向量水平夾角;e.通過運動能量圖獲得手勢運動的開始時刻和結束時刻,分割出手勢運動;f.對隱馬爾科夫模型參數進行訓練,利用隱馬爾科夫模型的前向、後向算法推定手勢運動方向。本發明基於隱馬爾科夫模型判斷手勢運動方向的方法,通過多種判斷條件對隱馬爾科夫模型的手勢運動方向進行判斷,能夠提高手勢運動判斷的準確性,能夠明顯降低各種因素對判斷結果的幹擾。
文檔編號G06K9/00GK102592112SQ201110429580
公開日2012年7月18日 申請日期2011年12月20日 優先權日2011年12月20日
發明者劉恆, 呂金鋼, 張彩虹, 趙仕才 申請人:四川長虹電器股份有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀