計算機基於層疊式主成分分析法智能識別視頻中人眼狀態的方法
2023-12-11 13:40:27 5
計算機基於層疊式主成分分析法智能識別視頻中人眼狀態的方法
【專利摘要】本發明公開了一種計算機基於層疊式主成分分析法智能識別視頻中人眼狀態的方法,包括以下步驟:(1)採集人眼訓練圖像,對人眼訓練圖像進行主成分分析,獲得特徵眼子空間和係數子空間;(2)將視頻中每幅待測人眼圖像投影到特徵眼子空間和係數子空間中得到另一組新係數向量;取出所有新係數向量的第一個值作為係數值;以視頻中的幀數為x軸,相應幀人眼圖像對應的係數值為Y軸構建一條幀數-係數值的原始數據曲線;(3)獲得一條與原始數據曲線相對應的基準曲線以及差值曲線;(4)將差值曲線上的差值與預設的係數閾值作比較;判斷視頻中人眼狀態。該方法具有很強的自適應性,能夠有效克服不同人眼睛的差別帶來的影響。
【專利說明】計算機基於層疊式主成分分析法智能識別視頻中人眼狀態的方法
【技術領域】
[0001]本發明屬於智能交通【技術領域】,具體涉及一種計算機基於層疊式主成分分析法智能識別視頻中眼睛狀態的方法。
【背景技術】
[0002]眼睛是人體面部最重要的特徵,在數字圖像處理和計算機視覺研究與應用中有著極為重要的作用,眼睛睜閉狀態的檢測是虹膜識別、視線跟蹤和駕駛員疲勞檢測等系統的關鍵環節,檢測的準確率直接影響到系統的性能。然而,在實際應用過程中,不均勻光照、光斑、睫毛和眼鏡框等諸多因素的影響,使眼睛睜閉狀態識別成為了一個極具挑戰性的任務。
[0003]目前的眼睛睜閉狀態檢測方法主要有以下兩大類:基於眼球/瞳孔檢測的方法和基於眼部結構特徵的方法。前者主要通過檢測眼部圖像是否含有眼球/瞳孔來判斷眼睛的狀態;後者主要根據眼部整體結構特徵的變化,如上下眼瞼的變化來判斷眼睛的狀態。基於眼球/瞳孔檢測的方法主要有灰度積分投影法和Hough變換檢測瞳孔等算法:灰度積分投影法由於只用到圖像的灰度信息,計算量少,速度快,但當出現睫毛、鏡框和光斑等因素幹擾時,該算法將變得不再適用;Hough變換算法需要進行邊緣提取,而邊緣的提取往往難度較大,易受到睫毛和不均勻光斑等的幹擾,且擬合速度較慢,很難達到實時要求。基於眼部結構特徵的算法主要有可變性模板法和神經網絡法:可變性模板或將主動形狀模型(ASM,Active Shape Model)用於檢測上下眼瞼的方法較為耗時,且檢測效果受模板參數的影響;神經網絡法的泛化能力較差,而樣本的選取往往很難覆蓋實際應用中的各種情況。而基於多種策略組合的研究狀態檢測方法,需要過多的人為參與,檢測效果因人而異,且此方法流程流於繁瑣,檢測速度很難達到實時要求。本發明因此而來。
【發明內容】
[0004]本發明提供的一種計算機基於層疊式主成分分析法智能識別視頻中眼睛狀態的方法,解決了現有技術中計算機進行眼睛睜閉狀態的識別時普遍存在方法實時性差、易受多種因素的影響、魯棒性差的問題。
[0005]為了解決現有技術中的這些問題,本發明提供的技術方案是:
[0006]一種計算機基於層疊式主成分分析法智能識別視頻中人眼狀態的方法,其特徵在於所述方法包括以下步驟:
[0007](I)採集人眼訓練圖像,對人眼訓練圖像進行第一層主成分分析,獲得特徵眼子空間;將每幅人眼訓練圖像投影到特徵眼子空間中,分別得到一組係數向量,組合得到一個係數矩陣;對係數矩陣進行第二層主成分分析,得到係數子空間;
[0008](2)將視頻中每幅待測人眼圖像投影到步驟(I)得到的特徵眼子空間上,分別得到一組係數向量;將係數向量分別投影到步驟(I)獲得的係數子空間中得到另一組新係數向量;取出所有新係數向量的第一個值作為係數值;以視頻中的幀數為X軸,相應幀人眼圖像對應的係數值為Y軸構建一條幀數-係數值的原始數據曲線;
[0009](3)進行均值濾波處理獲得一條與原始數據曲線相對應的基準曲線;將原始數據曲線和基準曲線上的對應值相減並取絕對值,就得到一條差值曲線;
[0010](4)將差值曲線上的差值與預設的係數閾值作比較;若差值小於係數閾值,則判定為視頻中人眼狀態為睜眼狀態;若差值大於係數閾值,則判定視頻中人眼狀態為閉眼狀態。
[0011]優選的,所述方法步驟(3)中均值濾波處理是以某一幀人眼圖像為中心獲取前後若干幀人眼圖像對應的係數值,然後求取它們的平均值作為該幀原始係數值的基準值;以視頻中的幀數為X軸,相應幀原始係數值的基準值為Y軸構建一條幀數-基準值的基準曲線。
[0012]優選的,所述方法中每一幀的待測人眼圖像和人眼訓練圖像均經歸一化處理成大小相同,且人眼區域均為右眼區域或左眼區域的圖像。
[0013]優選的,所述方法步驟(1)中假設人眼訓練圖像共有K幅,歸一化處理後大小均為nXm的圖像,將每幅圖像按列優先構成一個nXm的列向量,即:
[0014]X= (bnV..bnlb12V..V..blnb2n...bJ ;
[0015]以每幅圖像的列向量為一列,構成一個維數為(nXm) XK的矩陣X,即:X- (Xi,X2,...,x^),i — 1,2,...,K。
[0016]優選的,所述方法步驟(1)中對人眼訓練圖像進行第一層主成分分析,獲得特徵眼子空間的步驟包括:
[0017]I)定義平均人眼為
【權利要求】
1.一種計算機基於層疊式主成分分析法智能識別視頻中人眼狀態的方法,其特徵在於所述方法包括以下步驟: (1)採集人眼訓練圖像,對人眼訓練圖像進行第一層主成分分析,獲得特徵眼子空間;將每幅人眼訓練圖像投影到特徵眼子空間中,分別得到一組係數向量,組合得到一個係數矩陣;對係數矩陣進行第二層主成分分析,得到係數子空間; (2)將視頻中每幅待測人眼圖像投影到步驟(1)得到的特徵眼子空間上,分別得到一組係數向量;將係數向量分別投影到步驟(1)獲得的係數子空間中得到另一組新係數向量;取出所有新係數向量的第一個值作為係數值;以視頻中的幀數為X軸,相應幀人眼圖像對應的係數值為Y軸構建一條幀數-係數值的原始數據曲線; (3)對原始數據曲線進行均值濾波處理獲得一條與原始數據曲線相對應的基準曲線;將原始數據曲線和基準曲線上的對應值相減並取絕對值,就得到一條差值曲線; (4)將差值曲線上的差值與預設的係數閾值作比較;若差值小於係數閾值,則判定為視頻中人眼狀態為睜眼狀態;若差值大於係數閾值,則判定視頻中人眼狀態為閉眼狀態。
2.根據權利要求1所述的方法,其特徵在於所述方法步驟(3)中均值濾波處理是以某一幀人眼圖像為中心獲取前後若干幀人眼圖像對應的係數值,然後求取它們的平均值作為該幀原始係數值的基準值;以視頻中的幀數為X軸,相應幀原始係數值的基準值為Y軸構建一條幀數-基準值的基準曲線。
3.根據權利要求1所述的方法,其特徵在於所述方法中每一幀的待測人眼圖像和人眼訓練圖像均經歸一化處理成大小相同,且人眼區域均為右眼區域或左眼區域的圖像。
4.根據權利要求1所述的方法,其特徵在於所述方法步驟(1)中假設人眼訓練圖像共有K幅,歸一化處理後大小均為nXm的圖像,將每幅圖像按列優先構成一個nXm的列向量,即: X= (bnbybmbubyb^…blnb2n...bj ; 以每幅圖像的列向量為一列,構成一個維數為(nXm) XK的矩陣X,即:X =(x」 X2, ? ? ?,x^),i 1,2,...,K。
5.根據權利要求4所述的方法,其特徵在於所述方法步驟(1)中對人眼訓練圖像進行第一層主成分分析,獲得特徵眼子空間的步驟包括:. 1)定義平均人眼為:
6.根據權利要求5所述的方法,其特徵在於所述方法步驟(1)或(2)中將每幅人眼圖像投影到特徵眼子空間中,分別得到一組係數向量的步驟為將人眼圖像X投影到特徵眼子空間中,得到其對應的投影係數向量y為:y = Ut(x-ux),不同的圖像得到不同的係數向量
7. 根據權利要求6所述的方法,其特徵在於所述方法中當每一幅人眼訓練圖像X投影到特徵眼子空間中,分別得到一組係數向量y,將其組合在一起就得到一個係數矩陣Y ;對係數矩陣Y再次進行主成分分析,得到一個新的特徵子空間,即係數子空間P。
【文檔編號】G06K9/62GK103745192SQ201310624554
【公開日】2014年4月23日 申請日期:2013年11月27日 優先權日:2013年11月27日
【發明者】張偉, 成波 申請人:蘇州清研微視電子科技有限公司, 清華大學蘇州汽車研究院(吳江)