一種數據驅動和稀疏表達的三維人體運動去噪方法
2023-09-18 21:28:45
專利名稱:一種數據驅動和稀疏表達的三維人體運動去噪方法
技術領域:
本發明涉及三維圖形學和虛擬實境領域,尤其涉及一種數據驅動的人體運動數據去噪方法。
背景技術:
人體運 動捕獲技術已被廣泛應用到動畫製作,電影特效,計算機遊戲等娛樂領域,帶來巨大的經濟效益,所有的這些應用都依賴於高精度的人體運動數據。然而,即使是目前非常昂貴的商用人體運動捕獲設備,由於受到標記點之間的相互遮擋、誤標記等原因,常常會出現運動數據包含噪聲和離值點的現象,而導致需要事先對這些運動數據進行去噪處理。最早的去噪方法是基於人工的檢測和手工糾正,需要專業的動畫師,逐幀查看運動數據是否包含噪聲並利用滑鼠拖曳將捕獲異常的點糾正回來,在如今需要海量數據處理的應用前提下,這是非常費時和消耗人工成本的。後來,基於高斯或者卡爾曼濾波器的自動去噪技術被提出來,但是,這些濾波器只適用於運動數據各個獨立維度而忽略了人體運動數據維度之間的相關性,導致去噪後的結果看起來並不自然。然而,這些精心處理後的數據,不具有可重用性,往往只適用於某個特定的應用環境,然後就被廢置。近年來,基於數據驅動的去噪方法逐漸興起,這些方法利用已捕獲的純淨的運動數據作為資料庫支持,以當前輸入的運動作為查詢條件,查找與之類似的近鄰數據,利用這些近鄰數據進行重構,各個方法的差異主要體現在如何重構上面。這種方法使得運動數據可以重複利用,進一步降低了工業成本和提高了運動捕獲的性價比。然而,這種方法由於基於矩陣操作,把運動數據各個維度看做一個整體,而忽略了不同肢體(左右手臂和腿部)之間不同的運動特性。
發明內容
本發明的目的是克服現有技術的不足,提供一種數據驅動和稀疏表達的三維人體運動去噪方法,既考慮到人體運動數據各個維度之間的相關性,又避免把它們作為一個整體,而是依據不同的肢體部分得到更細粒度的表達結構。本發明的目的是通過以下技術方案來實現的一種數據驅動和稀疏表達的三維人體運動去噪方法,包括如下步驟
(O下載純淨人體運動資料庫;
(2)使用運動捕獲設備捕獲人體運動數據使用Vicon運動捕獲系統對貼於人體關節處的marker點的軌跡信息進行捕捉;
(3)對步驟I和2獲得的數據進行預處理將步驟I中資料庫的數據和2中捕獲的輸入數據從BVH格式轉化為TRC格式,同時對每個姿態進行平移、旋轉變換;平移變換主要是將運動數據的位於臀部的root節點移動到全局坐標系的原點去,而旋轉變換是將身體軀幹所在的平面(由身體上貼的marker點所擬合出來的平面)的法向量與全局坐標系中的X坐標對齊,保證所有處理後的姿態具有相同的位置和朝向;記下變換矩陣
Mmiws,其反變換為;
(4)將人體姿態劃分為5個子部分預處理後的運動數據是一個d*T的二維矩陣,d是人體關節點數目乘以3,即一個表示所有關節點在x、y、z軸上的坐標位置的向量,而T表示運動數據的幀數;將該矩陣劃分為包含軀幹(包含頭部)、左手臂、右手臂、左腿和右腿數據 的五個子矩陣,每個子矩陣只包含所屬關節點的信息,對於每個子部分,利用一個寬度為M
幀的滑動窗口,M為自然數,順序地在運動序列上掃描得到每個子部分的運動片段,將運動
片段拉成一列向量,作為一個處理基元Ii, =Γ5 ;
(5)在資料庫中查找與輸入運動片段相近的片段對於一個子部分的有M幀的輸入運動片段拉成的處理基元Ii,遍歷資料庫中每一個運動片段,計算輸入運動片段與資料庫中每一個運動片段之間的相似度,相似度的計算方法為幀與幀之間歐氏距離的平均值;從中提取相似度最大的1200個運動片段作為重構基元,將重構基元的每個片段矩陣拉一個列
向量並拼接成矩陣即為重構字典;
(6)對受到噪聲幹擾的運動片段進行基於近鄰片段的線性回歸對輸入運動片段拉成列向量以後的處理基元Fi和與之對應的重構字典Di,可以利用稀疏表達的框架,計算重構
字典中的重構基元關於1的重構係數Wi ,對於包含高斯噪聲的運動數據,利用!I-k求解
稀疏表達公式
權利要求
1. 一種數據驅動和稀疏表達的三維人體運動去噪方法,其特徵在於,包括如下步驟 (1)下載純淨人體運動資料庫; (2)使用運動捕獲設備捕獲人體運動數據使用Vicon運動捕獲系統對貼於人體關節處的marker點的軌跡信息進行捕捉; (3)對步驟I和2獲得的數據進行預處理將步驟I中資料庫的數據和2中捕獲的輸入數據從BVH格式轉化為TRC格式,同時對每個姿態進行平移、旋轉變換;平移變換主要是將運動數據的位於臀部的root節點移動到全局坐標系的原點去,而旋轉變換是將身體軀幹所在的平面(由身體上貼的marker點所擬合出來的平面)的法向量與全局坐標系中的X坐標對齊,保證所有處理後的姿態具有相同的位置和朝向;記下變換矩陣 ,其反變換為麗; (4)將人體姿態劃分為5個子部分預處理後的運動數據是一個d*T的二維矩陣,d是人體關節點數目乘以3,即一個表示所有關節點在x、y、z軸上的坐標位置的向量,而T表示運動數據的幀數;將該矩陣劃分為包含軀幹(包含頭部)、左手臂、右手臂、左腿和右腿數據的五個子矩陣,每個子矩陣只包含所屬關節點的信息,對於每個子部分,利用一個寬度為M幀的滑動窗口,M為自然數,順序地在運動序列上掃描得到每個子部分的運動片段,將運動片段拉成一列向量,作為一個處理基元
全文摘要
本發明公開了一種數據驅動和稀疏表達的三維人體運動去噪方法,該方法通過對人體運動姿態進行劃分,並利用滑動窗口獲得各個部分的時序片段,進而得到更加細粒度的人體運動時空語意特徵。在包含有純淨的已知三維姿態的運動資料庫中,查找與當前受到噪聲幹擾片段最接近的個檢索結果,利用這個候選運動片段,通過稀疏表達的優化框架對運動進行恢復重建。針對人體運動中最為常見的高斯噪聲和奇異值點噪聲獲得了很好的去噪效果。
文檔編號G06T5/00GK102930516SQ20121046276
公開日2013年2月13日 申請日期2012年11月16日 優先權日2012年11月16日
發明者肖俊, 林海, 馮銀付 申請人:浙江大學