一種應用於行人再識別的多核支持向量機多示例學習算法
2023-05-09 00:41:21
一種應用於行人再識別的多核支持向量機多示例學習算法
【專利摘要】本發明公開了一種應用於行人再識別的多核支持向量機多示例學習算法,包括多特徵描述和多核SVM模型多示例學習算法兩個主要步驟。本發明通過提取了同一行人在A、B攝像機機下二張圖片的HSV顏色特徵和SIFT局部特徵並構建詞袋,用二種特徵的差異矢量代表兩攝像機下特徵的轉移關係作為二個示例樣本,並封裝為一個包;其次對多核支持向量機模型進行了優化,採用高斯核和多項式核線性融合對包進行訓練,並用多示例學習獲得最優的參數,具有較高的識別率。
【專利說明】—種應用於行人再識別的多核支持向量機多示例學習算法
【【技術領域】】
[0001]本發明涉及行人再識別算法的【技術領域】,特別是應用於行人再識別的多核支持向量機多示例學習算法的【技術領域】。
【【背景技術】】[0002]隨著平安城市戰略的啟動,越來越多的監控攝像機被安裝在了交通要塞,這些交通要塞距離較遠,採用傳統的單攝像機來進行跟蹤難以滿足需要。行人再識別是指在非重疊視域多攝像機監控下進行的行人匹配,即如何確認不同位置的攝像機在不同時刻發現的目標是否為同一人。由於攝像機的成像受參數、光照條件、角度、背景等因素的影響,導致不同攝像機拍攝的同一目標差異較大。
[0003]再識別方法可以分為兩種:描述法和測度學習法。描述法先對目標進行特徵提取,再求特徵向量之間的距離(主要有歐式、馬氏、巴氏等)來表示兩者之間的相似度。Gheissari等人為了克服行人姿態的變化,把行人劃分為三角狀以提高相似度,但該方法只對視角相似的行人識別率較高。為克服直接採用顏色直方圖進行匹配的不足,Wang等人將行人分割成區域塊,提取不同區域的顏色特徵來進行識別^arenzena等人提取行人的多種特徵來進行識別;Cheng等將行人分割成頭、胸、腰、腿四個部位,並提取每個部位的顏色特徵來進行識別。Gray等人提取行人的顏色和紋理特徵,採用adaboost方法選擇相關性,該方法速度較快,但識別率不高。測度學習法採用對提取的行人特徵進行訓練學習,在另外一個測度空間對特徵進行比較。為提高SVM方法的識別率,Prosser等人提出了合成SVM排名算法,先對訓練樣本進行分類學習,得到N個弱分類器,再用boosting算法進行加權融合獲得一個強分類器,該算法效果不錯,但複雜度較高。Tamar等人對訓練樣本分類進行了改進,將同類樣本和異類樣本分別串接,再用SVM實現,雖提高了運算速度,但識別率和穩定性都不高。
[0004]描述法依賴於穩定的特徵,且單一特徵直接匹配識別率較低,只有多個特徵進行融合才能保證識別效果。而目前測度學習法主要針對單一特徵來進行學習和匹配,而不同攝像機拍到的同一人物外觀可能存在巨大的變化,如VIPeR數據集中同一行人在A攝像機中是正面圖像,B攝像機中可能是後背或側面,差異較大,顯然,單一特徵來描述一個行人的正面、側面、後面圖像存在較大的局限。本文在測度學習法的基礎上,結合描述性方法的多特徵,將一個行人的單個特徵作為一個示例,多個特徵構成一個包,並採用多個核函數來對該包進行訓練學習的算法,即多核多示例的行人再識別算法。該算法與多核SVM方法的最大區別在於前者中包有標籤而示例沒有標籤,後者中所有樣本都有標籤。包標籤為正的含義是A、B攝像機下的行人為同一個人,負表示不是同一個人。示例標籤為正的含義是用該特徵能很好表達A、B攝像機下行人的差異;負表示該特徵不能表達差異。
【
【發明內容】
】
[0005]本發明的目的就是解決現有技術中的問題,提出一種應用於行人再識別的多核支持向量機多示例學習算法,將同一個人的多個特徵描述構建差異矢量,作為示例樣本封裝成包,採用多核支持向量機對包進行訓練,多示例算法學習獲得最優解,本算法與單特徵算法及經典的再識別算法相比,準確度有了較大的提高。
[0006]為實現上述目的,本發明提出了一種應用於行人再識別的多核支持向量機多示例學習算法,包括以下步驟:
[0007]a)多特徵描述:
[0008]al)顏色特徵:顏色特徵按照如下方法進行提取,先把行人圖像劃分為五個大小相等的區域,每個區域提取H、S、V三個分量的直方圖,間隔取10,將提取的區域特徵串聯,最終構成特徵為150維的列向量的全局特徵,區域劃分的目的是保留圖像的局部信息,防止不同區域中的相同顏色產生的誤匹配;
[0009]a2) SIFT特徵提取及其詞袋的構建:按照4X4模板進行提取SIFT特徵,由於圖像的SIFT特徵只是局部特徵描述,在採用SVM進行訓練和學習前需要採用詞袋模型對SIFT特徵進行規則化,規則化的過程就是將數量不定的無序特徵轉變成有序的固定維數的向量;
[0010]a3)示例及包的構建:用<,,描述攝像機A所拍攝的目標m的第i幅圖片特徵,
描述攝像機B所拍攝的目標η的第j幅圖片特徵,.<L,4/s = r+1.—為差異矢
量,用以描述A、B攝像機之間的特徵轉移關係,將同一行人的每個差異矢量作為一個示例,多種特徵差異矢量構成的示例封裝成一個樣本包Oi = {(si,s2),y},y e {1,-1},用以描述多種特徵在不同攝像機間的轉移關係,本算法中局部特徵和全局特徵屬於不同的高維空間平面,沒有交集,可以把包看成兩個示例向量的切面,由同一個行人構成的包其標籤號為正包,否則為負包;
[0011]b)多核SVM模型多示例學習算法:
[0012]bl)多示例問題描述:給定樣本集C = {(O1, Y1),(02,Y2),...,(0n,Yn)},含義是當Yj = I時,(0j, Yj)表示正包Oi中至少存在一個示例是正示例;當Yj
=-1時,(O」, Y」)的含義是負包q = h}中所有不例sji是均是負不例;對樣本
包O I =|51,,….,sKl,…,}只有包中所有的樣本都是負時,才能被認定為負
包,否則為正,其決策函數為
【權利要求】
1.一種應用於行人再識別的多核支持向量機多示例學習算法,包括以下步驟: a)多特徵描述: al)顏色特徵:顏色特徵按照如下方法進行提取,先把行人圖像劃分為五個大小相等的區域,每個區域提取H、S、V三個分量的直方圖,間隔取10,將提取的區域特徵串聯,最終構成特徵為150維的列向量的全局特徵,區域劃分的目的是保留圖像的局部信息,防止不同區域中的相同顏色產生的誤匹配; a2) SIFT特徵提取及其詞袋的構建:按照4X4模板進行提取SIFT特徵,由於圖像的SIFT特徵只是局部特徵描述,在採用SVM進行訓練和學習前需要採用詞袋模型對SIFT特徵進行規則化,規則化的過程就是將數量不定的無序特徵轉變成有序的固定維數的向量; a3)示例及包的構建:用描述攝像機A所拍攝的目標m的第i幅圖片特徵,x:j描述攝像機B所拍攝的目標η的第j幅圖片特徵
2.如權利要求1所述的一種應用於行人再識別的多核支持向量機多示例學習算法,其特徵在於:所述步驟a2)中的詞袋是指將一組經過打包和封裝數據,對圖像建立詞袋模型進行描述,主要是將圖像中特徵點進行聚類,形成多個詞袋,並建立索引,以便更好地來描述圖像,在本算法中,採用K-means算法對SIFT特徵進行聚類,生成若干個類,並用編碼的方法對每個特徵點在所屬類別中建立索,這樣每個聚類被稱為視覺關鍵字,用以描述圖像中局部相似特徵點的集合,所有的聚類稱為視覺關鍵字詞表,形成關鍵字詞表後,圖像就可以用視覺關鍵字詞表的直方圖表示出來,從而固定了維數。
【文檔編號】G06K9/46GK103839084SQ201410091319
【公開日】2014年6月4日 申請日期:2014年3月12日 優先權日:2014年3月12日
【發明者】蔣雲良, 劉紅海, 侯向華, 黃旭 申請人:湖州師範學院