新四季網

一種基於多模態序列融合的動作識別方法

2023-05-02 13:55:56 1

一種基於多模態序列融合的動作識別方法
【專利摘要】本發明公開了一種基於多模態序列融合的動作識別方法,包括以下步驟:獲得原始視頻多種模態下的信息,並進行預處理獲取初始RGB圖像序列及初始深度圖像序列,以及獲取骨架特徵序列;對初始RGB圖像序列進行背景建模,通過得到的背景建模結果來提取第一人體區域外接矩形,同時提取初始深度圖像序列上相應位置的第二人體區域外接矩形;在第一、第二人體區域外接矩形上分別提取人體動作特徵,得到RGB模態和深度模態下的特徵向量;根據得到的RGB-LBP、D-LBP特徵向量序列,以及骨架特徵序列,通過多視角判別模型來進行動作識別。本發明能夠將多種模態的序列信息進行互補融合,能夠有效提高動作識別準確率。
【專利說明】一種基於多模態序列融合的動作識別方法

【技術領域】
[0001] 本發明涉及計算機視覺、人體動作識別領域,尤其涉及一種基於多模態序列融合 的動作識別方法。

【背景技術】
[0002] 人體動作識別在智能視頻監控、人機互動、視頻檢索等領域中具有廣闊的應用前 景,已逐漸成為計算機視覺領域的研究熱點。現有技術中的很多研究工作主要是利用普通 RGB攝像機獲得的圖像序列來進行動作識別,並在一些經典的資料庫上驗證了其有效性。然 而,由於光照變化、人體外形的多樣性、遮擋等因素的幹擾,人體動作識別仍然是一項具有 挑戰性的工作。
[0003] 近年來,將深度圖像序列引入人體動作識別領域成為了一個新興的熱點問題。這 主要是由於深度攝像機的成本大大降低,尤其是微軟推出的3D體感攝影機Kinect,其成本 低廉、所攝取的圖像解析度高。與彩色圖像相比,深度圖像能直接反映物體表面的三維特 徵,且不受光照變化、陰影、環境變化等因素的幹擾。此外,深度圖像表示物體在3D空間中 的坐標,可以很好的克服遮擋或重疊問題。人體骨架可以用來有效地表徵人體區域及輪廓 信息,它能反映出人體運動的軌跡,包含很多運動信息,骨架信息能夠直接反映人體的位置 信息,且不會受到光照、陰影、遮擋等因素的幹擾。
[0004] RGB信息、深度信息、骨架信息、熱傳感信息等分別代表著同一個場景的不同形式, 通過將這些不同模態的信息融合進行序列建模,可以提升動作識別的準確率。但是由於不 同模態的信息於不同的流形空間且值域不同,直接將其融合併不能得到最佳效果。所以,如 何進一步多模態序列進行互補融合,是人體動作識別中亟待解決的問題。


【發明內容】

[0005] 本發明提供了一種基於多模態序列融合的動作識別方法,本發明實現了 RGB信息 與深度信息的互補,顯著地提高了動作識別的準確率,詳見下文描述:
[0006] -種基於多模態序列融合的動作識別方法,所述方法包括以下步驟:獲得原始視 頻多種模態下的信息,並進行預處理。包括對原始視頻的RGB圖像序列和深度圖像序列進 行預處理,獲取初始RGB圖像序列及初始深度圖像序列,以及獲取骨架特徵序列;
[0007] 對初始RGB圖像序列進行背景建模,通過得到的背景建模結果來提取第一人體區 域外接矩形,同時提取初始深度圖像序列上相應位置的第二人體區域外接矩形;
[0008] 在第一、第二人體區域外接矩形上分別提取人體動作特徵,得到RGB模態和深度 模態下的特徵向量;
[0009] 根據步驟103中得到的RGB-LBP、D-LBP特徵向量序列,以及步驟101中得到的骨 架特徵序列,通過多視角判別模型來進行動作識別。。
[0010] 所述根據RGB-LBP、D-LBP特徵向量,以及骨架特徵序列,通過多視角判別模型來 進行動作識別的步驟具體為: toon] (1)多視角判別模型的表示:
[0012] 多視角判別模型的條件概率模型可以表示為:
[0013]

【權利要求】
1. 一種基於多模態序列融合的動作識別方法,其特徵在於,所述方法包括以下步驟: 獲得原始視頻多種模態下的信息,並進行預處理,獲取初始RGB圖像序列、初始深度圖 像序列,以及獲取骨架特徵序列; 對所述初始RGB圖像序列進行背景建模,通過得到的背景建模結果來提取第一人體區 域外接矩形,同時提取所述初始深度圖像序列上相應位置的第二人體區域外接矩形; 在第一、第二人體區域外接矩形上分別提取人體動作特徵,得到RGB模態和深度模態 下的RGB-LBP、D-LBP特徵向量序列; 根據所述RGB-LBP、D-LBP特徵向量序列,以及所述骨架特徵序列,通過多視角判別模 型來進行動作識別。
2. 根據權利要求1所述的一種基於多模態序列融合的動作識別方法,其特徵在於,所 述根據所述RGB-LBP、D-LBP特徵向量序列,以及所述骨架特徵序列,通過多視角判別模型 來進行動作識別的步驟具體為: (1) 所述多視角判別模型的表示: 多視角判別模型的條件概率模型可以表示為:
其中,X是觀測序列,Y是序列標記,Η是隱狀態變量,Θ是權重向量,且θ = {θ1; θ2}, 91和θ2表示權重,Τ表示轉置,Φ(Υ,Χ,Η)是特徵函數,表示由圖模型中節點位置以及節 點之間的關聯而決定的序列特徵,Ζ是歸一化的分配函數,用來進行概率歸一化; (2) 所述多視角判別模型的學習: 目標函數為:
其中,Xi表示觀測樣例,Yi表示觀測樣例真實的標註,使得上式取得最小值的Θ值,即 是最優參數Θ ; (3) 所述多視角判別模型的判斷:在所述多視角判別模型參數已經確定之後,判斷觀 測序列X的分類最優標記Y%確定動作類別,

【文檔編號】G06K9/66GK104156693SQ201410337744
【公開日】2014年11月19日 申請日期:2014年7月15日 優先權日:2014年7月15日
【發明者】劉安安, 蘇育挺, 馬莉 申請人:天津大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀