新四季網

基於多解析度特徵關聯的行人檢測方法

2023-05-27 13:50:31 1

基於多解析度特徵關聯的行人檢測方法
【專利摘要】本發明涉及一種基於多解析度特徵關聯的行人目標檢測方法。本發明通過採樣車載道路交通視頻中的圖像序列,對行人進行標註來獲得行人樣本數據集,並根據行人解析度大小將其分類,建立多解析度行人樣本庫;通過將模型參數求解問題轉變為兩個凸優化子問題,使用統計學習的方法得到分辨對應的特徵轉換矩陣以及分類函數係數;以滑窗掃圖的方式對不同解析度行人的HOG特徵使用對應解析度變換矩陣,將特徵映射至相同的特徵子空間;然後,使用分類函數對子空間中的特徵進行分類;最後對檢測結果進行聚類,得到最終檢測結果。本發明具有較好的泛化能力和自適應性,由於引入了解析度對應特徵變換,使得本發明在對中遠距離的行人檢測性能方面優於以往方法。
【專利說明】基於多解析度特徵關聯的行人檢測方法
【技術領域】
[0001]本發明涉及一種基於多解析度特徵關聯的行人目標檢測方法,特別涉及一種基於方向梯度直方圖HOG (Histogram of Oriented Gradient)算法在多解析度條件下改進方法,提高遠距離行人檢測效果。
【背景技術】
[0002]隨著計算機技術的發展和計算機視覺原理的廣泛應用,利用計算機圖像處理技術對目標進行實時檢測研究越來越熱門。基於機器視覺的行人檢測作為領域內的典型問題一直受到高度關注。如何提高算法實際檢測性能是行人檢測從學術走向實際應用的關鍵問題。
[0003]近幾年,HOG(Histogram of Oriented Gradient, )、DPM (Deformable PartsModel)等行人特徵描述模型研究取得了較大進展,使得近距離高解析度行人取得了良好的檢測性能;但是,上述模型直接應用於中遠距離低解析度行人的檢測,其檢測性能急劇下降。對於道路交通而言,中遠距離行人的檢測卻是至關重要的,更遠的距離意味著留給駕駛員的反應時間更多,潛在地能挽救更多的生命。
[0004]已有對低分辨行人檢測採用的解決方法是針對低解析度行人樣本訓練一個新的分類器。該方法基於尺度不變的假設:在一個特定解析度下,針對抽取特徵訓練出的分類器能夠通過改變探測器尺寸,或是對圖像進行縮放來推廣至所有解析度。但是,由於遠距離行人的圖像採樣頻率受圖像傳感器硬體限制,導致圖像中遠距離行人目標解析度低、信息丟失嚴重;因此,在同一圖像傳感器中,近距離和遠距離的行人目標的尺度不變假設無法成立,導致了行人檢測性能隨著解析度下降而急劇下降。

【發明內容】

[0005]針對上述問題,本發明公開了一種在多解析度情況下,提高遠距離低解析度行人檢測效果的改進方法。該方法基於HOG特徵,對特徵向量進行主成分分析(PrincipalComponent Analysis, PCA)轉化,應用解析度對應的轉換方程將各個解析度的特徵描述向量映射至相同的特徵子空間,以此建立聞解析度行人特徵與低解析度行人特徵的聯繫,提高了特徵描述子在低解析度下的描述能力,為分類函數能更好地分類提供了理論基礎。為了建立上述檢測模型,給出了優化特徵轉換方程參數和子空間分類模型參數的方法,通過拆分整個檢測模型參數的非凸二次優化問題為兩個凸優化子問題,進行多倫迭代優化,得到各個特徵轉換方程參數和分類函數係數。
[0006]該方法適合於在遠距離低分率上行人檢測上提高各類行人檢測算法的性能,可以應用於DPM等其他行人檢測模型。
[0007]本發明的技術方案步驟如下:
[0008]步驟1:對取材自道路交通場景的錄像進行去冗餘採樣,對生成的圖片集進行行人的人工標註。人工標註包括:行人的邊界框位置與大小,並根據邊界框大小將行人樣本進行分類。
[0009]步驟2:對樣本進行方向梯度直方圖(HOG)特徵計算。將每一解析度類別的樣本重構為統一尺寸大小的樣本,然後進行特徵向量的計算。
[0010]步驟3:建立行人識別模型。將識別模型的優化分解為兩個子問題:解析度對應特徵轉換模型優化與特徵子空間分類模型優化。該過程首先採用PCA方法對個解析度的特徵轉換模型進行參數初始化,然後進行解析度對應特徵轉換模型與特徵子空間分類模型的迭代優化。
[0011]步驟4:對各解析度行人進行識別。對圖片中的低解析度行人的HOG特徵向量進行一輪低閾值粗糙檢測,然後對檢測結果的HOG特徵向量進行解析度對應的特徵轉換;在轉換後的特徵子空間中,使用子空間分類模型進行分類;而對於高解析度行人的檢測則不使用解析度轉換,直接進行HOG特徵的分類。分別給出不同解析度的檢測結果分數,根據對應閾值輸出檢測結果。步驟5:對步驟4中的檢測結果,採用非最大值抑制方法進行聚類。將高解析度行人檢測結果進行統一的聚類,而經過特徵轉換的低解析度行人進行單獨的聚類。然後合併聚類結果集,輸出結果集,完成單幀行人檢測。
[0012]在步驟3中,提出了行人識別模型:包括解析度對應特徵轉換模型和特徵子空間分類模型。解析度對應轉換模型用於在高解析度特徵清晰的樣本與低解析度特徵噪音大的樣本之間建立聯繫,一定程度上增強了低解析度行人樣本的特徵描述能力,使轉換後的特徵更容易被特徵子空間分類模型區分,提高了遠距離的低分別率行人檢測的性能。
[0013]在步驟4中對於低解析度行人的檢測,採用了由粗到精的級聯檢測的思想。對於高解析度行人的檢測不用特徵轉換就能夠達到較好的檢測效果,而對於低解析度行人,兩段檢測能夠極大地減少計算量。所設計的檢測模型在不影響檢測精度的情況下進一步提高了檢測實時性。
[0014]在步驟5中對各解析度分類結果的進行差別聚類。由於基於HOG的分類模型給出的分數與基於特徵變換的分類模型給出的分數評價基準不同,而低解析度行人的檢測結果也不應該與高解析度行人檢測結果重合。因此,我們分別實施非最大值抑制的方法進行聚類,然後合併結果集。
[0015]本發明的有益效果:
[0016]1、本發明針對中遠距離低解析度行人檢測問題,提出了多解析度的特徵變換方法,建立低解析度行人與高解析度行人的特徵向量之間的關係,彌補前者特徵噪音過多,描述能力不強的問題,增強了中遠距離低解析度行人的特徵描述能力。然後,在變換後的共同特徵子空間中訓練的分類模型,提高對中遠距離低解析度行人的識別性能。
[0017]2、本發明在對單幀圖片的檢測識別中採用了解析度對應的級聯分類方法。對高解析度行人的識別,不進行特徵變換,採用原有算法保持高識別性能和實時性;而對於低解析度行人的識別,採用由粗到精的級聯識別過程,通過改進非最大值抑制聚類,保證高檢測效果和實時性。
[0018]3、本發明從真實道路交通場景錄像中採集樣本數據,建立訓練道路交通場景的多解析度樣本庫和訓練模型,保證了本發明提出的模型在真實道路場景中的泛化能力,使本方法得到的檢測器具有更強的自適應能力和中遠距離檢測效果。【專利附圖】

【附圖說明】
[0019]圖1為建立分類模型流程圖。
[0020]圖2為本發明進行解析度對應行人檢測時的流程圖。
[0021]圖3為適合本發明的非最大值抑制算法流程圖。
[0022]圖4為本發明在紅外場景中的行人檢測效果圖。
【具體實施方式】
[0023]下面結合附圖,對本發明的具體實施方案作進一步詳細描述。關於分類模型的建立其具體步驟描述如圖1所示:
[0024]步驟1:將每秒30幀的錄像以I秒一幀的頻率進行去冗餘採樣,將大於80像素高度的樣本歸類為高解析度樣本,小於的歸類為低解析度樣本。在人工標註中給出標註框的左上角和右下角的坐標:(xTL, yTL),(xBE, yBE),行人的像素高度h = xBE-xTL,根據h進行歸類。
[0025]步驟2:計算各類樣本的特徵。根據標註框限定高寬比例為2:1的ROI (感興趣區域),將ROI按一定縮放尺度縮放至固定大小後,使用HOG算法提取統一維度的特徵向量。對單個標註框限定2:1的ROI算法如下:
[0026]Input: Annotated BoundiIig Box Anchor (xTL, yTL), (xBE, yBE)
[0027]Output: Size Fixed ROI Anchor (x' TL, y' TL), (x' BE, y' BE)
[0028]Define:h = yBR-yTL, w = xBR-xTL..h
【權利要求】
1.基於多解析度特徵關聯的行人檢測方法,其特徵在於該方法的具體步驟如下: 步驟1:對取材自道路交通場景的錄像進行去冗餘採樣,對生成的圖片集進行行人的人工標註;人工標註包括行人的邊界框位置與大小,然後根據邊界框大小將行人樣本進行分類; 步驟2:對樣本進行HOG特徵計算;將每一解析度類別的樣本重構為統一尺寸大小的樣本,然後對樣本進行特徵向量的計算; 步驟3:建立行人識別模型scored,L);
【文檔編號】G06K9/66GK103984965SQ201410143556
【公開日】2014年8月13日 申請日期:2014年4月10日 優先權日:2014年4月10日
【發明者】徐向華, 虞抒沁 申請人:杭州電子科技大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀