小樣本條件下的人臉圖像非線性鑑別特徵抽取和識別方法
2023-10-18 00:19:09 6
專利名稱:小樣本條件下的人臉圖像非線性鑑別特徵抽取和識別方法
技術領域:
發明涉及小樣本最佳非線性鑑別特徵抽取和識別領域,具體是一種小樣本條件下 的人臉圖像非線性鑑別特徵抽取和識別方法。本發明可用於機器學習和模式識別領域,除 了人臉圖像的特徵抽取和識別外,還可用於小樣本條件下的其他圖像和數據的特徵抽取和 識別。
背景技術:
人臉圖像的特徵抽取技術可分為基於幾何特徵和基於統計特徵兩大類。早期的方 法主要基於幾何特徵抽取,其基本思想是首先定位人臉上的特徵點的位置,然後計算這些 特徵點的相對位置和距離,用其作為人臉特徵的度量。由於幾何特徵的提取對光照、姿態和 表情的變化較敏感,且難以精確定位,影響了此類方法的穩定性和識別率。近年來較多的是 基於統計特徵的抽取方法。基於統計特徵的抽取方法中,常用的是基於線性和非線性變換的人臉特徵抽取方 法,此類方法通過最優化一個準則函數得到一個變換陣,將原始高維人臉圖像降維至低維 子空間,使在低維子空間中的人臉特徵更緊湊,有更好的可分性。基於核方法的非線性特徵 抽取方法也被應用到了人臉特徵抽取中,其將人臉樣本非線性映射到高維的特徵空間,使 樣本在特徵空間有更好的可分性,更利於處理人臉圖像的各種非線性變化(如光照、表情 和姿態等),因此能得到較線性特徵抽取方法更具鑑別力的非線性鑑別特徵。此類方法將高 維人臉圖像特徵線性或非線性映射到子空中,因此也稱之為子空間方法。人臉識別階段針對所抽取到的特徵設計適合的分類方法,將樣本特徵空間分為各 個區域,然後根據待識別樣本特徵所在的區域將其歸入對應類別中。特徵抽取階段得到人 臉圖像的鑑別特徵後,常用最近鄰分類器分類。在基於子空間的人臉統計特徵抽取方法中,常見的是基於Fisher準則的線性鑑 別分析(簡稱FLDA)方法。FLDA方法通過最優化Fisher準則,使得到的鑑別矢量對樣本降 維後,在低維空間樣本特徵的類間散度最大以及類內散度最小,從而所得鑑別特徵在降維 變換後有最好的類可分性。但是當樣本的維數大於類內散度陣的秩時,則求解最佳鑑別特 徵存在病態奇異問題,此問題也稱為小樣本條件下的病態奇異問題。從統計學習理論發展出來的核方法通過一個非線性變換,將原始樣本從輸入空間 映射到特徵空間,使映射後的樣本在特徵空間有更好的類可分性。在特徵空間進行線性分 析等價於在輸入空間進行非線性分析,從而獲得在輸入空間的非線性學習算法。將FLDA和核方法相結合得到基於核的非線性Fisher鑑別分析(簡稱KFDA)方法 同樣存在小樣本病態奇異問題。早期的KFDA方法僅能處理兩類的分類問題,且求解存在病 態奇異問題,其用加擾動矩陣的方法來解決;基於核的廣義鑑別分析方法進一步將兩類的 KFDA推廣到多類分類的情況,但為解決病態奇異問題,用總散度陣取代了類內散度陣,本質 上不能得到最佳的非線性鑑別特徵;基於核的多類鑑別分析同樣存在病態問題,其同樣用 擾動法來解決,其缺點是難以選擇適合的擾動係數。
發明內容
本發明目的是針對現有人臉圖像特徵抽取和識別技術存在的缺陷提供一種小樣 本條件下的人臉圖像非線性鑑別特徵抽取和識別方法。本發明為實現上述目的,採用如下技術方案本發明利用人臉圖像訓練樣本求解每類人臉的非線性特徵矢量,對待識別人臉圖 像求解非線性特徵矢量,比較兩者的距離用最近鄰準則對待識別人臉圖像進行分類,具體 實現步驟如下⑴訓練階段①計算核矩陣K,構造矩陣A,計算核矩陣Ka 有C個人臉類別,每個人臉類別有N個人臉圖像訓練樣本,總訓練樣本數為M = NC ;將採集到的人臉圖像樣本矩陣拉直為一個矢量,用矢量表示人臉圖像樣本;計算MXM的核矩陣K,其第m行第j列的元素用核函數k(Xm,Xj)計算得到,其中 核函數
是2階多項式核函數,矢量Xm和\分別表示總訓練樣本中的第 m個和第j人臉圖像訓練樣本,< 表示xm的轉置運算,m= 1,2,...,M,j = 1,2,...,M,下
同;構造矩陣A = [~,八2,AJ,其中的矩陣,i = 1,2,...,C,定義如下,
矩陣Ai中從第此行到(i-1)N行均為0,第(i-1)N+1行均為-1,第(N+1行
下面是--個N-1XN-1的單位矩陣,其餘元素均為0 用矩陣K和A計算核矩陣Ka = AtKA,上標T表示矩陣轉置運算 ②構造矩陣B,計算核矩陣Kb: 構造矩陣B為MXC-1的矩陣,構造方法如下
矩陣B中第1行均為-1,第qXN+1行第q列為1,其中q的取值為q = 1,2,..., C-1,其餘元素均為0;計算核矩陣Kb 其中BT表示B的轉置矩陣,矩陣D = A (Ka) ^A1,矩陣(KA) 1表示KA的逆矩陣,AT表 示A的轉置矩陣;③對核矩陣Kb進行Cholesky分解得到上三角矩陣RB,& = RTBRB ;④計算第i類人臉的非線性特徵矢量t 其中
表示第1類人臉的第11個人臉圖像樣 本,i = l,2,...,C,n= 1,2,3,...,N;I表示單位陣,i /表示RB轉置矩陣的逆矩陣;(2)識別階段a)計算待識別人臉圖像樣本xtest的非線性特徵矢量Ytest 其中 b)計算 Ytest 和 1 的最小距離叫
,其中 | |Yi-Ytest| | 表
示Ytest和1的歐氏距離,min表示求最小距離;識別的準則是將待識別人臉圖像樣本xtest 歸入最小距離對應的人臉類別中。本發明的優點是(1)本發明在人臉圖像樣本總散度陣的秩空間和類內散度陣的零空間中求解非線 性鑑別矢量,可以得到最優化Fisher準則的最佳非線性特徵。(2)本發明所計算的非線性 鑑別矢量具有標準正交的性質。通過構造新矩陣,計算新的核矩陣,將特徵空間中的正交化 過程轉化為對新核矩陣的Cholesky分解,提高了數值穩定性和計算效率。(3)本發明在識 別階段只需利用訓練階段計算出的矩陣就可計算出待識別樣本的非線性特徵矢量。識別準 則是計算待識別樣本的特徵矢量和每類人臉圖像特徵矢量的距離,將待識別人臉圖像歸入 最小距離對應的類別中。由於對每類人臉圖像只需計算一個非線性特徵矢量,識別階段的 計算複雜度只和人臉類別數有關,和每類人臉中的人臉圖像樣本個數無關,在識別階段具 有較高的計算效率。(4)對於訓練樣本數較少的人臉識別問題,由於人臉圖像矩陣拉直成矢 量後的維數一般遠大於類內散度陣的秩,因此存在求解小樣本條件下的病態廣義特徵方程的問題。該發明可以較好地解決此問題。
具體實施例方式附
圖1是本發明實現步驟的計算流程圖,下面結合附圖1對本發明的技術方案進 行詳細說明(1)、識別階段①計算核矩陣K,構造矩陣A,計算核矩陣Ka ;②構造矩陣B,計算核矩陣Kb ;③對核矩陣Kb進行Cholesky分解得到上三角矩陣RB ;④計算每類人臉的非線性特徵矢量Yi ;(2)、訓練階段a)計算待識別人臉圖像的非線性特徵矢量Ytest ;b)計算^和Ytest的距離,將待識別樣本歸入最小距離對應的人臉類別中。本發明的實施例是根據本發明的技術方案進行實施的,給出了具體的實施方式和 計算操作過程,但本發明的保護範圍不限於下述的實施例。實施例一採用公共的AT&T標準人臉圖像資料庫。AT&T庫包括40個人臉類別,每個人臉類 別有10張不同人臉姿態、表情和面部細節的人臉圖像,圖像大小為112X92。(1)、訓練階段數據預處理將112X92的圖像矩陣進行下採樣,大小變為28X23。按行拉直為 644維的列矢量,並將圖像的像素值歸一化到0-1之間。將每類人臉樣本隨機分成兩部分, 一部分作為訓練樣本,一部分作為測試樣本。每類人臉的訓練樣本數為N,總訓練樣本數為 M = 40N。N 的取值範圍為 N = 2,3,4,5,6,7,8,9。將每個人臉圖像樣本用列矢量Xm表示,m = 1,2,...,M,按類別次序將訓練樣本排 列成訓練樣本矩陣[Xl,X2,...,XM]。首先構造矩陣A = [A1 A2, ,AJ,Ai的矩陣,i = 1,2, ,40,構造
方法 用人臉圖像樣本和2階多項式核函數計算得到核矩陣K,核矩陣K的第m行第j列的元素為^^,太力二「 +太^^)2,!!! = 1,2,
練樣本中的第m和第j個訓練樣本。
,M,j = 1,2,. . .,M,xm和X」分別表示總訓
計算新的核矩陣KA = AtKA 計算矩陣0 =六禮)_乂 構造MX 39的矩陣B
"-1-1...-11000...;100000100000
第1行 第iV + 1行
第 39xiV + l行計算新的核矩陣Kb = BT[K_2KDK+KDKDK]B,其中BT表示B的轉置矩陣,矩陣D = A (Ka)-V,矩陣(Ka) 1表示Ka的逆矩陣,AT表示A的轉置矩陣。對Kb進行Cholesky分解得到上三角矩陣RB。用第i類的人臉圖像訓練樣本<計算第i類人臉圖像樣本的非線性特徵矢量為Yt = Rf BT[I - KD]G其中I為單位陣,( =阿而,<),對12次),...,對 乂)『,<表示第i類的第m個訓練 樣本,i = l,2,...,40。Xm表示總訓練樣本中的第m個訓練樣本。k表示2階多項式核函數。(2)識別階段計算待識別人臉圖像樣本xtest的非線性特徵矢量YtestYtest=RBTBT[I-KD]H其中H = [k(Xl,xtest),k(x2, xtest), ,k(xM, xtest)]T,k 表示 2 階多項式核函數。識別階段將待識別人臉圖像樣本歸入最小距離對應的人臉類別中min Yt -7test,i = 1,2, ,40。
I表1是用AT&T人臉資料庫測試的結果,共進行8次實驗。對每類人臉,每次實驗 隨機選取2到9個樣本作為訓練樣本,剩下的樣本作為測試樣本,每次實驗重複20次,計算 平均識別率,本發明方法的核函數用2階多項式核函數。將本發明的方法和Fisherface方 法的結果比較,在相同的訓練樣本和測試樣本條件下,本發明的方法均優於Fisherface方 法。表1平均識別率(% ) 實施例二採用公共的UMIST標準人臉圖像資料庫。UMIST庫中包括20個人臉類別,每個人 臉類別選擇20張不同人臉姿態的人臉圖像,圖像大小為220X220。(1)、訓練階段數據預處理將220X220的圖像矩陣進行下採樣,大小變為28X23,拉直為644 維的列矢量,並將圖像的像素值歸一化到0-1之間。將每類人臉樣本隨機分成兩部分,一部 分作為訓練樣本,一部分作為測試樣本。每類人臉的訓練樣本數為N,總訓練樣本數為M = 20N。在本實施例中N的取值為N = 3,5,7,9,11,13,15,170將每個人臉圖像樣本用列矢量Xm表示,m = 1,2,...,M,按類別次序將訓練樣本排 列成訓練樣本矩陣[Xl,X2,...,XM]。首先構造矩陣A =隊,弋,...,A2Q],其中的矩陣,i = 1,2,.,20, 用人臉圖像樣本和2階多項式核函數計算得到核矩陣K,核矩陣K的第m行第j列 的元素為對太-^汐二^ + ^^屍,^和Xj分別表示總訓練樣本中的第m和第j個訓練樣本。
計算新的核矩陣KA = AtKA 計算矩陣0 =六禮)_乂 構造MX 19的矩陣B 計算新的核矩陣Kb = BT[K_2KDK+KDKDK]B,其中BT表示B的轉置矩陣,矩陣D = A (Ka)-V,矩陣(Ka) 1表示Ka的逆矩陣,AT表示A的轉置矩陣。對Kb進行Cholesky分解得到上三角矩陣RB。用第i類的人臉圖像訓練樣本<計算第i類人臉圖像樣本的非線性特徵矢量為Yi =R-/Bt[I-KD]G其中I為單位陣,C^^XXXWh,Of,<表示第i類的第n個訓練
樣本。xm表示總訓練樣本中的第m個訓練樣本。k表示2階多項式核函數。(2)識別階段計算待識別人臉圖像樣本xtest的非線性特徵矢量 其中H = [k(Xl,xtest),k(x2, xtest),…,k(xM, xtest)]T,k 表示 2 階多項式核函數。識別階段將待識別人臉圖像樣本歸入最小距離對應的人臉類別中 表2是用UMIST人臉資料庫測試的結果,共進行8次實驗。對每類人臉,每次實驗 分別隨機選取N = 3,5,7,9,11,13,15,17個樣本作為訓練樣本,剩下的樣本作為測試樣本, 每次實驗重複20次,計算平均識別率,本發明方法的核函數用2階多項式核函數。將本發 明的方法和Fisherface方法的結果比較,在相同的訓練樣本和測試樣本條件下,本發明的 方法均優於Fisherface方法。表2平均識別率(%)
權利要求
一種小樣本條件下的人臉圖像非線性鑑別特徵抽取和識別方法,其特徵在於包括如下步驟(1)訓練階段①計算核矩陣K,構造矩陣A,計算核矩陣KA有C個人臉類別,每個人臉類別有N個人臉圖像訓練樣本,總訓練樣本數為M=NC;將採集到的人臉圖像樣本矩陣拉直為一個矢量,用矢量表示人臉圖像樣本;計算M×M的核矩陣K,其第m行第j列的元素用核函數k(xm,xj)計算得到,其中核函數是2階多項式核函數,矢量xm和xj分別表示總訓練樣本中的第m個和第j人臉圖像訓練樣本,表示xm的轉置運算,m=1,2,...,M,j=1,2,...,M,下同;構造矩陣A=[A1,A2,...,Ai,...,AC],其中Ai是M×N-1的矩陣,i=1,2,...,C,定義如下矩陣Ai中從第1行到(i-1)N行均為0,第(i-1)N+1行均為-1,第(i-1)N+1行下面是一個N-1×N-1的單位矩陣,其餘元素均為0;用矩陣K和A計算核矩陣KA=ATKA,上標T表示矩陣轉置運算;②構造矩陣B,計算核矩陣KB構造矩陣B為M×C-1的矩陣,構造方法如下矩陣B中第1行均為-1,第q×N+1行第q列為1,其中q的取值為q=1,2,...,C-1,其餘元素均為0;計算核矩陣KBKB=BT[K-2KDK+KDKDK]B其中BT表示B的轉置矩陣,矩陣D=A(KA)-1AT,矩陣(KA)-1表示KA的逆矩陣,AT表示A的轉置矩陣;③對核矩陣KB進行Cholesky分解得到上三角矩陣RB,④計算第i類人臉的非線性特徵矢量Yi Y i= R B -T B T[I-KD]G 其中表示第i類人臉的第n個人臉圖像樣本,i=1,2,...,C,n=1,2,3,...,N;I表示單位陣,表示RB轉置矩陣的逆矩陣;(2)識別階段a)計算待識別人臉圖像樣本xtest的非線性特徵矢量Ytest Y test= R B -T B T[I-KD]H 其中H=[k(x1,xtest),k(x2,xtest),...,k(xM,xtest)]T;b)計算Ytest和Yi的最小距離i=1,2,...,C,其中||Yi-Ytest||表示Ytest和Yi的歐氏距離,min表示求最小距離;識別的準則是將待識別人臉圖像樣本xtest歸入最小距離對應的人臉類別中。F2009102346624C0000011.tif,F2009102346624C0000012.tif,F2009102346624C0000013.tif,F2009102346624C0000021.tif,F2009102346624C0000022.tif,F2009102346624C0000024.tif,F2009102346624C0000025.tif,F2009102346624C0000026.tif,F2009102346624C0000028.tif
全文摘要
本發明公開了一種小樣本條件下的人臉圖像非線性鑑別特徵抽取和識別方法。包括(1)訓練階段,首先利用人臉圖像樣本計算一個核矩陣,並構造兩個新矩陣,在此基礎上計算兩個新的核矩陣,並對其中一個核矩陣進行Cholesky分解得到一個上三角矩陣,進而對每類人臉圖像計算出一個非線性特徵矢量。(2)識別階段,首先計算待識別人臉圖像的非線性特徵矢量,然後計算其和每類人臉特徵矢量的距離,將待識別人臉圖像歸入最小距離對應的人臉類別中。本發明所得非線性鑑別矢量和特徵互不相關,消除了非線性鑑別特徵間的冗餘,提高了所得鑑別特徵的鑑別能力。在訓練階段和識別階段均具有較高的計算效率和較好的數值計算穩定性。
文檔編號G06K9/64GK101877065SQ20091023466
公開日2010年11月3日 申請日期2009年11月26日 優先權日2009年11月26日
發明者賀雲輝 申請人:南京信息工程大學