一種基於回歸模型的圖像集合建模與匹配方法
2023-04-24 03:54:36 1
專利名稱:一種基於回歸模型的圖像集合建模與匹配方法
技術領域:
本發明涉及計算機視覺技術領域,特別涉及ー種基於回歸模型的圖像集合的建模與匹配方法。
背景技術:
長期以來,物體分類是計算機視覺研究中的ー項重要課題,分類器的訓練和測試通常都是基於物體的單個或者很少量的樣本進行的。隨著攝像機和大容量存儲設備等硬體技術的普及發展,在很多新的應用場景,例如視頻監控、視頻檢索等任務中,可以獲取到物體的大量圖像數據,從而為後端分類問題的訓練和測試階段提供大量的樣本,這些樣本通常以圖像集合的模式進行建模表示。在這類識別問題中,每個集合通常包含屬於同一個物體類別的多個圖像樣本,這些圖像樣本涵蓋了物體廣泛的表觀變化模式,比如姿態視角的變化、非剛性變形、光照變化等等。 基於圖像集合的分類問題的難點在幹,如何有效地刻畫與建模集合中多幅圖像的分布,並根據所建的模型綜合利用多祥本提供的信息。近年來,典型的做法主要有兩類,即分別從參數式與非參數式兩個角度對圖像集合建模,前者通常利用概率分布函數來表示圖像集合的樣本分布,進而採用諸如K-L散度之類的度量來計算兩個概率分布函數之間的相似度。後者則根據圖像集合中樣本的本質變化模式將其建模為線性子空間或者更為一般的非線性流形,基於這種建模方式,集合匹配分類的問題就可以轉化為子空間或者流形匹配的問題,從而採用子空間或者流形上的各種可能的相似性度量函數與匹配策略進行分類。總體而言,當前採用的這兩類集合建模方法都對圖像集合中樣本分布的形式有一定程度的假設,而在實際問題中集合樣本的來源通常是多種多祥的,當與模型所假設的樣本分布形式差別較大時,分類效果就會有很大的偏差。
發明內容
本發明g在至少解決現有技術中存在的技術問題,特別創新地提出了一種基於回歸模型的圖像集合的建模與匹配方法。為了實現本發明的上述目的,本發明提供了ー種基於回歸模型的圖像集合建模與匹配方法,其包括如下步驟SI :組織訓練圖像集合;S2 :建立特徵-類別回歸模型;S3 :對測試圖像集合進行投影;S4 :對測試圖像集合進行分類。本發明針對具有任意樣本分布形式的圖像集合,採用樣本特徵與相應的類別標記學習雙線性回歸模型,建立起集合樣本與其類別之間的本質語義關聯;針對未知類別標記的集合,只需將其每個樣本進行線性回歸然後綜合各樣本的類別響應即可得到整體集合的類別輸出。該方法直觀高效,計算簡便,其對集合樣本的分布形式和集合樣本的規模均無任何先驗假設,對集合中可能存在的噪聲數據具有很好的容忍性。本發明的附加方面和優點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發明的實踐了解到。
本發明的上述和/或附加的方面和優點從結合下面附圖對實施例的描述中將變得明顯和容易理解,其中圖I是本發明基於回歸模型的圖像集合建模與匹配方法的流程圖;圖2為本發明所採用的偏最小ニ乘回歸方法的示意圖。
具體實施例方式下面詳細描述本發明的實施例,所述實施例的示例在附圖中示出,其中自始至終 相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,僅用於解釋本發明,而不能理解為對本發明的限制。本發明提供了ー種基於回歸模型的圖像集合建模與匹配方法,如圖I所示,其包括如下步驟SI:組織訓練圖像集合;S2 :建立特徵-類別回歸模型;S3 :對測試圖像集合進行投影;S4 :對測試圖像集合進行分類。本發明組織訓練圖像集合的方法為給定m個帶有類別標籤的訓練圖像集合,分別構造用於存放觀察樣本特徵表示向量的預測矩陣X和用於存放觀察樣本類別指示向量的響應矩陣Y,其中,m為大於I的正整數。預測矩陣X的每一行對應ー個觀察樣本的特徵表示向量,該特徵表示向量可以是但不限於圖像灰度特徵、小波特徵。響應矩陣Y的每一行對應ー個觀察樣本的類別屬性指示向量。具體地,假設給定的類別數為c,那麼響應矩陣Y的姆一行為c維的類別指示向量,如果ー個類別指示向量的第j個元素為1,其餘元素全為0,即為
,則表明當前觀察樣本屬於第j類,其中,c為大於I的正整數,j為小於或等於c的正整數。本發明建立特徵-類別回歸模型的方法為採用偏最小ニ乘回歸方法學習觀察圖像集合的預測矩陣X與響應矩陣Y之間的線性回歸模型Y = XBpw如圖2所示,該模型的具體求解步驟如下首先,根據構造的預測矩陣X和響應矩陣Y,定義偏最小ニ乘回歸的目標函數X = ΤΡτ+ΕY = UQT+F其中,T為預測數據X對應的語義表示矩陣,U為響應數據Y對應的語義表示矩陣,P為X對應的荷載矩陣,Q為Y對應的荷載矩陣,E為X對應的殘差矩陣,F為Y對應的殘差矩陣。然後,採用迭代優化方法最大化目標語義空間變量T和U之間的協方差,在本實施方式中,可以採用但不限於NIPALS的方法求解目標語義空間變量T和U之間的協方差,其中,變量T和U之間為線性關係,具有U = TD+H,其中,D為對角矩陣,H為殘差矩陣。最後,利用優化所得的變量T和U,推導出預測矩陣X與響應矩陣Y之間的關係Y= X(Pt)+DQt,得到線性回歸模型Bm= (Pt)+DQt。通過這ー線性回歸模型,可以建立不同類別觀察數據的樣本特徵表示與其對應類別屬性標籤之間的本質語義關聯,從而用於測試階段的樣本投影分類。本發明對測試集合進行投影的方法為給定未知類別的一個圖像集合,按照訓練圖像集合的構造方式,將每個圖像樣本對應的特徵表示向量作為觀察圖像預測矩陣Xt的一個行向量,利用訓練階段學習所得的線性回歸模型Bpw得到測試圖像樣本集合對應的類別指示向量的響應矩陣Yt = XtBm。本發明對測試集合進行分類的方法為通過綜合測試圖像集合內各單樣本的類別指示向量的投票得到。具體有兩種投票方式第一種投票方式為首先根據各單樣本對應的類別指示向量確定其所屬類別,之 後依據各類別所對應的樣本數進行最大數投票。具體操作為記錄響應矩陣Yt每個行向量中最大元素所對應的位置標號,之後根據各標號出現的頻次進行由大到小的排序,頻次最高的標號即對應該測試圖像集合的類別標號。第二種投票方式為首先將所有單樣本的類別指示向量累加得到整體圖像集合的類別指示向量,之後依據該類別指示向量針對不同類別的響應來進行投票。具體操作為累加矩陣Yt的所有行向量得到一個整體和向量,記錄該和向量中最大元素值所對應的位置標號,即為給定測試圖像集合的類別標號。在本說明書的描述中,參考術語「ー個實施例」、「一些實施例」、「示例」、「具體示例」、或「ー些示例」等的描述意指結合該實施例或示例描述的具體特徵、結構、材料或者特點包含於本發明的至少ー個實施例或示例中。在本說明書中,對上述術語的示意性表述不一定指的是相同的實施例或示例。而且,描述的具體特徵、結構、材料或者特點可以在任何的一個或多個實施例或示例中以合適的方式結合。儘管已經示出和描述了本發明的實施例,本領域的普通技術人員可以理解在不脫離本發明的原理和宗g的情況下可以對這些實施例進行多種變化、修改、替換和變型,本發明的範圍由權利要求及其等同物限定。
權利要求
1.ー種基於回歸模型的圖像集合建模與匹配方法,其特徵在於,包括如下步驟 Si:組織訓練圖像集合; S2:建立特徵-類別回歸模型; 53:對測試圖像集合進行投影; 54:對測試圖像集合進行分類。
2.如權利要求I所述的基於回歸模型的圖像集合建模與匹配方法,其特徵在於,所述組織訓練圖像集合的方法為給定m個帶有類別標籤的訓練圖像集合,分別構造用於存放觀察樣本特徵表示向量的預測矩陣X和用於存放觀察樣本類別指示向量的響應矩陣Y,其中,預測矩陣X的每一行對應ー個觀察樣本的特徵表示向量,響應矩陣Y的每一行對應ー個觀察樣本的類別指示向量,所述m為大於I的正整數。
3.如權利要求I所述的基於回歸模型的圖像集合建模與匹配方法,其特徵在於,建立特徵-類別回歸模型的方法為採用偏最小ニ乘回歸方法學習預測矩陣X與響應矩陣Y之間的線性回歸模型Y = XBm。
4.如權利要求3所述的基於回歸模型的圖像集合建模與匹配方法,其特徵在於,所述線性回歸模型Y = XBpls包括如下求解步驟 511:根據構造的預測矩陣X和響應矩陣Y,定義偏最小ニ乘回歸的目標函數X = TPt+EY = UQt+F 其中,T為預測數據X對應的語義表示矩陣,U為響應數據Y對應的語義表示矩陣,P為X對應的荷載矩陣,Q為Y對應的荷載矩陣,E為X對應的殘差矩陣,F為Y對應的殘差矩陣; 512:採用迭代優化方法最大化目標語義空間中變量T和U之間的協方差,其中,T和U之間為線性關係,具有U = TD+H,其中,D為對角矩陣,H為殘差矩陣; 513:利用優化所得的內蘊空間語義變量T和U,推導出預測矩陣X與響應矩陣Y之間的線性回歸模型Y = X(Pt)+DQt,得到Bpls = (Pt)+DQt0
5.如權利要求I所述的基於回歸模型的圖像集合建模與匹配方法,其特徵在於,對測試集合進行投影的方法為給定未知類別的一個圖像集合,按照訓練圖像集合的構造方式,將每個圖像樣本對應的特徵表示向量作為觀察圖像預測矩陣Xt的ー個行向量,利用訓練階段學習所得的線性回歸模型得到,得到測試圖像樣本集合對應的類別指示向量的響應矩陣Yt = XtBm。
6.如權利要求I所述的基於回歸模型的圖像集合建模與匹配方法,其特徵在於,對測試集合進行分類的方法為綜合測試圖像集合內各單樣本的類別指示向量的投票得到。
7.如權利要求6所述的基於回歸模型的圖像集合建模與匹配方法,其特徵在於,所述投票方式為根據各單樣本對應的類別指示向量確定其所屬類別,之後依據各類別所對應的樣本數進行最大數投票。
8.如權利要求6所述的基於回歸模型的圖像集合建模與匹配方法,其特徵在於,所述投票方式為將所有單樣本的類別指示向量累加得到整體圖像集合的類別指示向量,依據所述類別指示向量針對不同類別的響應來進行投票。
全文摘要
本發明提出了一種基於回歸模型的圖像集合建模與匹配方法,其包括如下步驟組織訓練圖像集合;建立特徵-類別回歸模型;對測試圖像集合進行投影;對測試圖像集合進行分類。本發明針對具有任意樣本分布形式的圖像集合,採用樣本特徵與相應的類別標記學習雙線性回歸模型,建立起集合樣本與其類別之間的本質語義關聯;針對未知類別標記的集合,只需將其每個樣本進行線性回歸然後綜合各樣本的類別響應即可得到整體集合的類別輸出。該方法直觀高效,計算簡便,其對集合樣本的分布形式和集合樣本的規模均無任何先驗假設,對集合中可能存在的噪聲數據具有很好的容忍性。
文檔編號G06K9/62GK102663418SQ20121007688
公開日2012年9月12日 申請日期2012年3月21日 優先權日2012年3月21日
發明者戴瓊海, 王瑞平 申請人:清華大學