一種基於關鍵點區域圖像的人臉識別方法與流程
2023-05-30 20:37:46 2

本發明涉及人臉識別技術,尤其是涉及一種基於關鍵點區域圖像的gabor-lbp人臉識別技術。
背景技術:
在智能信息化時代,基於計算機的人臉識別應用十分廣泛,如網上交易、自動考勤等。進行人臉自動識別時,不同光照、不同面部表情、不同面部角度、人臉老化等因素仍然是人臉識別技術中的難點問題。這些不利因素往往同時存在,使得識別變得越發困難。
本文提出一種基於特徵點區域的人臉識別技術,該技術能有效克服上述不利因素。基於特徵點的局部區域有兩個優勢:(1)區分度比較好;(2)能有效抵抗人臉的變形、光照等不利因素的影響。另外,由於gabor小波和lbp(局部二進位模式)是人臉識別中的兩種十分有效的特徵提取技術,因而本發明設計出基於關鍵點的gabor-lbp識別方法。sdm是一種有效的人臉特徵點定位方法(xiong,xuehan,andfernandodelatorre."superviseddescentmethodanditsapplicationstofacealignment",cvpr,2013)。在訓練好的模型上,sdm能定位出面部的49個關鍵點。
gabor濾波器能模擬人的感受野函數,十分適合表達紋理圖像。二維gabor濾波器函數為:其中σx和σy是在x和y方向的高斯標準差,f是頻域的中心頻率。藉助於小波變換的多分辨分析,對gabor濾波器進行擴展便可以得到具有多尺度性能的gabor小波。gabor小波為下:pm,n=amaxf-mp(x′,y′),其中k是整數,amax是常量,表示最大分解尺度,f是尺度因子。m(=0,1,…,s-1)和n(=0,1,…,k-1)是gabor小波的尺度參數和方向參數,s和k是整數。利用gabor小波進行分解時能得到s個尺度和k個方向的共s×k個分解子帶。gabor小波在光照變化和圖像噪聲情況下穩定性較好,廣泛應用於機器視覺領域。
lbp(localbinarypatterns,局部二進位模式)是一種計算快速的紋理描述算子,它能有效的提取圖像局部的紋理信息。一個像素點的周圍若干區域稱為該像素點的局部區域,該點稱為中心點。該局部區域的所有像素與其中心像素的差值的二進位編碼稱為「局部二進位編碼」。用lbp(r,p)表示半徑為r、像素點個數為p的局部區域的二進位模式,如lbp(2,8)。本發明採用lbp(2,8)來提取人臉的直方圖特徵。
技術實現要素:
本發明的整體方案是:首先,對圖像進行預處理,在預處理的圖像上定位若干特徵點,並在這些特徵點上提取出「局部小區域」;然後,將這些局部區域重新組合成一個新的圖像(稱為「關鍵區域圖像」),再用gabor小波將其分解為不同方向和不同尺度的特徵圖像(稱為gabor子帶);緊接著,在每一個gabor子帶上,用lbp進行提取特徵,並計算出直方圖(本文稱為gabor-lbp特徵);最後,用白化pca(wpca)對特徵進行壓縮並識別。
本發明的有效之處在於下面三方面:(1)gabor與lbp組合能有效提取人臉特徵。gabor與lbp組合在文獻中已經有報導,被稱為lgbphs方法。本發明在具體實現上採用了與lgbphs方法類似的操作。lgbphs方法對光照,簡單變性等有較好的魯棒性,但是對於極端光照變化,以及較大的面部變形(如誇張的表情、面部角度等導致)會明顯地影響lgbphs的識別效果;(2)「關鍵區域圖像」是基於局部區域的顯著圖像(也是本發明的創新之處)。文獻表明局部化的特徵能有效抵抗光照、變形等不利因數。而且關鍵點區域是人臉中極具區分性的地方,比如不同人臉的「眼角」、「嘴角」等局部小區域有明顯的不同。(3)本發明將這些關鍵點局部區域重新組合為一張圖像(稱為「關鍵區域圖像」)以便更好地提取特徵。為進一步提升性能,我們將對「關鍵區域圖像」進行分塊來提取gabor-lbp特徵。
本發明方法描述如下:
步驟(1)人臉圖像預處理。
由於光照變化和圖像噪聲會影響識別準確率,本發明用預處理去除光照影響和圖像噪聲。設輸入的人臉圖像為i,依次進行下面兩方面的預處理,得到圖像ip1:
(1a)首先,用gamma矯正消除部分光照,gamma矯正是將像素的指數值替換本身的值,表示為:i=iλ,λ是矯正因子,這裡取0.2。
(1b)其次,用直方圖規定化增強圖像。選取一副無光照和噪聲影響的正面圖像的直方圖作為參照,根據該參照人臉圖片將經過gamma矯正後的圖像進行規定化處理,進一步去光照和噪聲影響,增強圖片效果。
步驟(2)建立「關鍵區域圖像」(ikey)
(2a)用sdm方法提取ip1圖像上的25個特徵點。
(2b)對於25個點,以每個關鍵點為中心建立尺寸為m×m像素的局部矩形區域,這裡m=22。
(2c)將25個局部區域組合成一個大小為5m×5m的圖像。當m=22,則新圖像尺寸為110×110,稱這圖像為「關鍵區域圖像」,表示為ikey。
步驟(3)高斯差分算子(dog)濾波「關鍵區域圖像」ikey。
dog濾波的目的是進一步消除圖像噪聲同時增強圖像邊緣,這步處理後的圖像表示為ip2。dog定義為:
步驟(4)用gabor將ip2分解為s尺度k方向分解,共產生s×k個子帶。這裡s=4,k=6,即共產生24個子帶,這些子帶表示為其中j=1,…,24。
步驟(5)計算每一個gabor子帶的lbp直方圖。
(5a)將劃分為非重疊的n×n的小塊,即共產生n2個小塊。這裡取n=10,被劃分為100個小塊。
(5b)對每個小塊區域的像素分別進行lbp算子的轉換,並計算該小塊區域的直方圖,然後將各個區域的直方圖串聯起來,構建成一個全局性的直方圖。在這步得到的全局直方圖表示為hj,其中j=1,…,24。
步驟(6)用wpca特徵變換。從步驟(5)得到的直方圖為人臉特徵hj(j=1,…,24),這些直方圖特徵維數較高,因此本發明用白化主成分分析(whitenedprincipalcomponentanalysis,wpca)降維。在這一步,通過wcpa變換,能得到維數更低、且更具有區分性能的人臉特徵。根據人臉訓練集的hj,得到基於pca正交特徵投影矩陣u(u中每一列是特徵值對應的特徵向量和特徵向量對角矩陣其中n是訓練集中的人臉個數。則經wpca變換後的輸出為:
步驟(7)人臉識別。人臉識別主要是進行兩個人臉特徵向量直接的比較。本發明用餘弦距離來度量兩張人臉圖像的相似程度。餘弦值越小說明兩張人臉越不相似,當接近1時說明兩張人臉來源於同一個人。假定表示帶查詢的人臉圖像特徵人臉數據中已經計算出的特徵為其中i=1,…,n(n為數中人臉個數),則用下面的夾角餘弦距離進行查詢:
附圖說明
圖1是本發明中人臉特徵提取和識別的流程圖。
圖2是建立「關鍵區域圖像」的示意圖。
具體實施方式
步驟(1)人臉圖像預處理。
由於光照變化和圖像噪聲會影響識別準確率,本發明用預處理去除光照影響和圖像噪聲。設輸入的人臉圖像為i,依次進行下面兩方面的預處理,得到圖像ip1:
(1a)首先,用gamma矯正消除部分光照,gamma矯正是將像素的指數值替換本身的值,表示為:i=iλ,λ是矯正因子,這裡取0.2。
(1b)其次,用直方圖規定化增強圖像。選取一副無光照和噪聲影響的正面圖像的直方圖作為參照,根據該參照人臉圖片將經過gamma矯正後的圖像進行規定化處理,進一步去光照和噪聲影響,增強圖片效果。
步驟(2)建立「關鍵區域圖像」(ikey)(參見圖2)
(2a)用sdm方法提取ip1圖像上的25個特徵點。
(2b)對於25個點,以每個關鍵點為中心建立尺寸為m×m像素的局部矩形區域,這裡m=22。
(2c)將25個局部區域組合成一個大小為5m×5m的圖像。當m=22,則新圖像尺寸為110×110,稱這圖像為「關鍵區域圖像」,表示為ikey。
步驟(3)高斯差分算子(dog)濾波「關鍵區域圖像」ikey。
dog濾波的目的是進一步消除圖像噪聲同時增強圖像邊緣,這步處理後的圖像表示為ip2。
步驟(4)用gabor將ip2分解為s尺度k方向分解,共產生s×k個子帶。這裡s=4,k=6,即共產生24個子帶,這些子帶表示為其中j=1,…,24。
步驟(5)計算每一個gabor子帶的lbp直方圖。
(5a)將劃分為非重疊的n×n的小塊,即共產生n2個小塊。這裡取n=10,被劃分為100個小塊。
(5b)對每個小塊區域的像素分別進行lbp算子的轉換,並計算該小塊區域的直方圖,然後將各個區域的直方圖串聯起來,構建成一個全局性的直方圖。在這步得到的全局直方圖表示為hj,其中j=1,…,24。
步驟(6)用wpca特徵變換。從步驟(5)得到的直方圖為人臉特徵hj(j=1,…,24),這些直方圖特徵維數較高,因此本發明用白化主成分分析(whitenedprincipalcomponentanalysis,wpca)降維。在這一步,通過wcpa變換,能得到維數更低、且更具有區分性能的人臉特徵。根據人臉訓練集的hj,得到基於pca正交特徵投影矩陣u(u中每一列是特徵值對應的特徵向量和特徵向量對角矩陣其中n是訓練集中的人臉個數。則經wpca變換後的輸出為:
步驟(7)人臉識別。人臉識別主要是進行兩個人臉特徵向量直接的比較。本發明用餘弦距離來度量兩張人臉圖像的相似程度。餘弦值越小說明兩張人臉越不相似,當接近1時說明兩張人臉來源於同一個人。假定表示帶查詢的人臉圖像特徵人臉數據中已經計算出的特徵為其中i=1,…,n(n為數中人臉個數),則用下面的夾角餘弦距離進行查詢:
。