一種基於aam模型的視頻序列人臉識別方法
2023-09-18 12:54:00 2
一種基於aam模型的視頻序列人臉識別方法
【專利摘要】本發明公開了基於AAM模型的視頻序列人臉識別方法,包括訓練步驟和識別步驟;(1)訓練步驟包括:PCA投影;(1-2)LDA投影:通過LDA投影矩陣WLDA對PCA投影降維後的特徵向量進行投影,得到每張訓練圖片最佳分類特徵Γij;(2)識別步驟包括:(2-1)Adaboost檢測;(2-2)AAM跟蹤與姿勢校正;(2-3)PCA投影;(2-4)LDA投影:得到待識別人臉圖像最佳分類特徵;(2-5)最近鄰分類器決策:待識別人臉圖像的最佳分類特徵Γ與各個訓練圖片的最佳分類特徵Γij的最小歐幾裡德距離γ1,將γ1所在分類特徵所在類的人臉圖片判定為識別結果。本發明方法在人臉姿態多變化的情況下能夠精確的識別出人臉,具有魯棒性強的優點。
【專利說明】—種基於AAM模型的視頻序列人臉識別方法
【技術領域】
[0001]本發明涉及一種人臉識別方法,特別涉及一種基於AAM模型的視頻序列人臉識別方法。
【背景技術】
[0002]在這個信息膨脹,計算機技術日新月異的資訊時代,人類開始希望電腦成為一種能夠用自然語言與之間進行交流的機器,並渴望開發全新概念的人機界面和人工智慧技術,從而使人們能夠不再依賴傳統計算機的鍵盤、滑鼠和顯示設備等交互設備。然而,要實現如此自然的人機互動就要求計算機能夠準確快速地獲取用戶的身份、狀態、意圖以及相關的特徵信息。由於人臉所蘊含的大量信息內容是一個重要的信息傳遞窗口,計算機通過利用人臉面部的獨一無二性來獲取對象的身份和相關信息,同時通過人臉豐富的表情變化傳達對象的狀態和意圖,使人與計算機之間建起一座智能化的橋梁,而這些必然要研究有效的與人臉相關的圖像處理技術。
[0003]目前已有的人臉識別方法中,人臉特徵提取方法主要是基於幾何特徵,基於模板匹配,基於子空間和基於神經網絡等方法。在基於子空間的提取方法中,主成分分析PCA和Fisher線性判別等方法是比較常用的方法,它們在靜態圖像中取得較高的識別率。但是在視頻序列中,目前的人臉識別方法必須在用戶配合的情況下才能取得理想識別效果,如果用戶在識別過程中不配合的情況下,識別效果有可能發生大幅降低。另外在視頻序列中,由於人臉姿勢的多變等導致這些方法的識別率有不同程度的下降。
[0004]活動外觀模型(Active Appearance Model,AAM)是廣泛應用於模式識別領域的一種特徵點提取方法。基於AAM的人臉特徵定位方法在建立人臉模型過程中,不但考慮局部特徵信息,而且綜合考慮到全局形狀和紋理信息,通過對人臉形狀特徵以及紋理特徵進行統計分析,建立人臉混合模型,即最終對應的AAM模型。
【發明內容】
[0005]本發明的目的在於克服現有技術的缺點與不足,提供一種基於AAM模型的視頻序列人臉識別方法。該方法在人臉姿勢多變的情況下也能夠精確的識別出人臉,具有很強的
魯棒性。
[0006]本發明的目的通過下述技術方案實現:一種基於AAM模型的視頻序列人臉識別方法,包括訓練階段和識別階段;
[0007](I)所述訓練階段包括:
[0008](1-1) PCA 投影:
[0009]首先對訓練圖片進行歸一化,根據歸一化後的訓練圖片計算平均臉,將所有歸一化後的訓練圖片與平均臉做差值運算,得到第一差值;
[0010]然後根據第一差值構建協方差矩陣,通過協方差矩陣前K個最大特徵值的特徵向量組成PCA投影矩陣WPCA,作為特徵量空間;[0011]最後將第一差值通過PCA投影矩陣WPCA投影到低維空間,得到降維後的特徵向量;
[0012](1-2) LDA 投影:
[0013]首先計算所有訓練圖片樣本經PCA投影得到的降維後的特徵向量的均值向量m以及第i類訓練圖片樣本經PCA投影得到的降維後的特徵向量的均值向量mi ;
[0014]然後根據均值向量m、mi和計算訓練樣本類內離散度矩陣Sw和類間離散度矩陣Sb,計算矩陣Sw-1Sb的特徵向量,通過選取S/SB的前L個最大的特徵向量構成LDA投影矩陣Wlda;
[0015]最後通過LDA投影矩陣Wuia對通過PCA投影降維後的特徵向量進行投影,得到每張訓練圖片的最佳分類特徵ru ;
[0016](2)所述識別階段包括:
[0017](2-1) Adaboost檢測:通過Adaboost算法標識出測試視頻幀包含人臉的子區域;
[0018](2-2) AAM跟蹤與姿勢校正:首先訓練得到AAM模型;然後通過訓練得到的AAM模型對人臉子區域進行跟蹤;最後採用AAM模型訓練時得到的最終形狀參數對人臉的子區域進行姿勢校正,得到姿勢校正後的人臉子區域;
[0019](2-3) PCA 投影:
[0020]首先對上述得到的姿勢校正後的人臉子區域圖片進行歸一化,然後與訓練階段的PCA投影時得到的平均臉做差值運算,得到第二差值;
[0021]然後將上述第二差值矩陣投影到訓練階段得到的PCA投影矩陣WrcA,得到降維後的特徵向量rI ;
[0022](2_4)LDA投影:將步驟(2_3)中得到的降維後的特徵向量投影到訓練階段得到的LDA投影矩陣W.,得到待識別人臉圖像的最佳分類特徵;
[0023]( 2-5)最近鄰分類器決策:
[0024]首先計算出各訓練圖片最佳分類特徵與其他訓練圖片最佳分類特徵之間的歐式距離,從中選取出最大的歐式距離值F ;設定一個閾值b,該閾值b的大小為最大的歐式距離值F的一半;
[0025]然後計算步驟(2-4)得到的待識別人臉圖像的最佳分類特徵與訓練階段得到的各個訓練圖片的最佳分類特徵的最小歐幾裡德距離Y1 ;
[0026]最後將最小歐幾裡德距離Y1與閾值b進行比較,若大於閾值b,則判斷該待識別人臉圖像為非訓練庫圖片;若小於閾值b,則將最小歐幾裡德距離Y1所在分類特徵所在類的人臉圖片判定為識別結果。
[0027]優選的,所述步驟(1-1)中計算得到的平均臉f為:
[0028]
【權利要求】
1.一種基於AAM模型的視頻序列人臉識別方法,包括訓練階段和識別階段; (1)所述訓練階段包括: (1-1) PCA 投影: 首先對訓練圖片進行歸一化,根據歸一化後的訓練圖片計算平均臉,將所有歸一化後的訓練圖片與平均臉做差值運算,得到第一差值; 然後根據第一差值構建協方差矩陣,通過協方差矩陣前K個最大特徵值的特徵向量組成PCA投影矩陣WrcA,作為特徵量空間; 最後將第一差值通過PCA投影矩陣Vpca投影到低維空間,得到降維後的特徵向量; (1-2) LDA 投影: 首先計算所有訓練圖片樣本經PCA投影得到的降維後的特徵向量的均值向量m以及第i類訓練圖片樣本經PCA投影得到的降維後的特徵向量的均值向量mi ; 然後根據均值向量m、mi和計算訓練樣本類內離散度矩陣Sw和類間離散度矩陣Sb,計算矩陣S/SB的特徵向 量,通過選取S/SB的前L個最大的特徵向量構成LDA投影矩陣Wuia ;最後通過LDA投影矩陣Wuia對通過PCA投影降維後的特徵向量進行投影,得到每張訓練圖片的最佳分類特徵rij; (2)所述識別階段包括: (2-1) Adaboost檢測:通過Adaboost算法標識出測試視頻幀包含人臉的子區域;(2-2) AAM跟蹤與姿勢校正:首先訓練得到AAM模型;然後通過訓練得到的AAM模型對人臉子區域進行跟蹤;最後採用AAM模型訓練時得到的最終形狀參數對人臉的子區域進行姿勢校正,得到姿勢校正後的人臉子區域; (2-3) PCA 投影: 首先對上述得到的姿勢校正後的人臉子區域圖片進行歸一化,然後與訓練階段的PCA投影時得到的平均臉做差值運算,得到第二差值; 然後將上述第二差值矩陣投影到訓練階段得到的PCA投影矩陣WrcA,得到降維後的特徵向量rI ; (2-4) LDA投影:將步驟(2-3)中得到的降維後的特徵向量投影到訓練階段得到的LDA投影矩陣Wm,得到待識別人臉圖像的最佳分類特徵; (2-5)最近鄰分類器決策: 首先計算出各訓練圖片最佳分類特徵與其他訓練圖片最佳分類特徵之間的歐式距離,從中選取出最大的歐式距離值F ;設定一個閾值b,該閾值b的大小為最大的歐式距離值F的一半; 然後計算步驟(2-4)得到的待識別人臉圖像的最佳分類特徵與訓練階段得到的各個訓練圖片的最佳分類特徵的最小歐幾裡德距離Y1; 最後將最小歐幾裡德距離Y工與閾值b進行比較,若大於閾值b,則判斷該待識別人臉圖像為非訓練庫圖片;若小於閾值b,則將最小歐幾裡德距離Y1所在分類特徵所在類的人臉圖片判定為識別結果。
2.根據權利要求1所述的基於AAM模型的視頻序列人臉識別方法,其特徵在於,所述步驟(1-1)中計算得到的平均臉f為:
3.根據權利要求2所述的基於AAM模型的視頻序列人臉識別方法,其特徵在於,所述步驟(1-2)中所有訓練圖片樣本經PCA投影得到的降維後的特徵向量的均值向量m為:
j
4.根據權利要求1所述的基於AAM模型的視頻序列人臉識別方法,其特徵在於,所述步驟(2-2)中AAM跟蹤與姿勢校正的AAM模型的訓練步驟如下: (2-2-1)選取訓練對象為包括正臉、左右側臉、上仰臉、低頭臉的S個可靠樣本; (2-2-2)對可靠樣本進行描點,對人臉的68個特徵明顯的位置進行標定; (2-2-3)採用Procrustes對描點後的人臉進行對齊,得到去除平移、尺度和旋轉的對齊人臉; (2-2-4)採用主成分分析方法對步驟(2-2-3)得到的對齊人臉進行形狀建模,得到形狀參數P (即扭曲係數)和形狀模型; (2-2-5)從形狀模型中去除平均形狀人臉,然後對其進行delaunay三角劃分,再用分片仿射法使紋理投射到平均形狀中,最後用主成分分析法處理,得到紋理參數和紋理模型; (2-2-6)根據上述得到的形狀模型和紋理模型,利用反向組合aam匹配算法分別對現有形狀模型和紋理模型進行訓練,得到hessian矩陣。
5.根據權利要求4所述的基於AAM模型的視頻序列人臉識別方法,其特徵在於,所述步驟(2-2-1)中可靠樣本的數量S為100~1000個。
6.根據權利要求4所述的基於AAM模型的視頻序列人臉識別方法,其特徵在於,所述步驟(2-2)中人臉子區域進行跟蹤的過程如下: (2-2-7)根據hessian矩陣和形狀模型的形狀參數P通過以下分片映射函數得到形狀參數增量Δρ:
7.根據權利要求6所述的基於AAM模型的視頻序列人臉識別方法,其特徵在於,所述閾值a為500至2000。
8.根據權利要求6所述的基於AAM模型的視頻序列人臉識別方法,其特徵在於,所述步驟(2-2)中的姿勢校正過程如下:當準確跟蹤到目標人臉圖像後,根據跟蹤迭代過程中得到的最終形狀參數P對人臉的子區域進行姿勢校正,得到扭轉後的形狀I (W(x;p))即為和正臉一致的重建臉。
9.根據權利要求1所述的基於AAM模型的視頻序列人臉識別方法,其特徵在於,所述步驟(2-3)中得到降維後的特徵向量η為:
η =WpcatU ; 待識別人臉圖像的最佳分類特徵gamma為:
T=WldatWpcatU; 其中U為步驟(2-3)中得到的第二差值;其中u=x-f ;x為步驟(2-3)中得到的姿勢校正後的人臉子區域歸一化後的圖片,f為步驟(1-1)中得到的平均臉。
10.根據權利要求1所述的基於AAM模型的視頻序列人臉識別方法,其特徵在於,所述步驟(2-5)中待識別人臉圖像的最佳分類特徵gamma與訓練階段得到的各個訓練圖片的最佳分類特徵gamma ,j的最小歐幾裡德距離Y i為:
【文檔編號】G06K9/00GK103514442SQ201310445776
【公開日】2014年1月15日 申請日期:2013年9月26日 優先權日:2013年9月26日
【發明者】徐向民, 陳曉仕, 黃卓彬, 林旭斌 申請人:華南理工大學