新四季網

目標檢測設備和方法及分類器訓練設備和方法

2023-05-23 03:38:56 1

專利名稱:目標檢測設備和方法及分類器訓練設備和方法
技術領域:
本公開涉及目標檢測領域,具體地,涉及圖像中的目標檢測設備和方法、目標分類器訓練設備和方法。
背景技術:
目標檢測是圖像/視頻自動分析中的重要技術之一。在目標檢測中,目標特徵提取是進行目標檢測的基礎。由於圖像中目標的姿態、背景以及光照條件等的多樣性,因此,很難提取統一的顏色或者結構紋理信息作為進行目標檢測的有效特徵。如何提取用於目標檢測的有效特徵用於目標分類器訓練和目標檢測是本領域的重要課題。

發明內容
在下文中給出關於本公開的一些方面的簡要概述,以便提供對於本公開的基本理解。應當理解,這個概述並不是對本公開的窮舉性概述。該概述也並非意圖確定本公開的關鍵或重要部分,也不是意圖限定本公開的範圍。其目的僅僅是以簡化的形式給出某些概念,以此作為稍後論述的更詳細描述的前序。根據本公開的一個方面,提供了一種目標檢測設備,該目標檢測設備可以包括特徵提取裝置,用於從輸入圖像中提取一個或更多個特徵向量,至少一個所述特徵向量包括所述輸入圖像中的至少三個像素中的每一像素的一個或更多個通道值構成的向量的加權和,所述至少三個像素位於彼此基本上平行的一組平行線上,該組平行線至少包括兩條平行線,並且其中的任意兩條相鄰平行線之間的距離大於一個像素的尺寸,並且所述至少三個像素中的至少兩個像素位於所述一組平行線中的同一平行線上;以及目標判斷裝置,用於利用分類器、根據所述一個或更多個特徵向量來判斷所述輸入圖像中是否存在目標。根據本公開的另一方面,提供了一種目標檢測方法,該目標檢測方法可以包括從輸入圖像中提取一個或更多個特徵向量,至少一個所述特徵向量包括所述輸入圖像中的至少三個像素中的每一像素的一個或更多個通道值構成的向量的加權和,所述至少三個像素位於彼此基本上平行的一組平行線上,該組平行線包括至少兩條平行線,並且其中的任意兩條相鄰平行線之間的距離大於一個像素的尺寸,並且所述至少三個像素中的至少兩個像素位於所述一組平行線中的同一平行線上;以及利用分類器、根據所述一個或更多個特徵向量來判斷所述輸入圖像中是否存在目標。根據本公開的另一方面,提供了包括上述目標檢測設備的電子設備。根據本公開的另一方面,提供了一種用於訓練目標分類器的設備,該設備可以包括特徵提取裝置,用於從多個圖像樣本中的每個中提取一個或更多個特徵向量,從每個圖像樣本中提取的至少一個所述特徵向量包括該圖像樣本中的至少三個像素中的每一像素的一個或更多個通道值構成的向量的加權和,所述至少三個像素位於彼此基本上平行的一組平行線上,該組平行線包括至少兩條平行線,並且其中的任意兩條相鄰平行線之間的距離大於一個像素的尺寸,並且所述至少三個像素中的至少兩個像素位於所述一組平行線中的同一平行線上;以及訓練裝置,用於利用多個圖像樣本及所提取的特徵向量來訓練用於區分待檢測目標和背景的分類器。根據本公開的另一方面,提供了一種用於訓練目標分類器的方法,該方法可以包括從多個圖像樣本的每個中提取一個或更多個特徵向量,從每個圖像樣本中提取的至少一個所述特徵向量包括該圖像樣本中的至少三個像素中的每一像素的一個或更多個通道值構成的向量的加權和,所述至少三個像素位於彼此基本上平行的一組平行線上,該組平行線包括至少兩條平行線,並且其中的任意兩條相鄰平行線之間的距離大於一個像素的尺寸,並且所述至少三個像素中的至少兩個像素位於所述一組平行線中的同一平行線上;以及利用所述多個圖像樣本及所提取的特徵向量來訓練用於區分待檢測目標和背景的分類器。根據本公開的另一方面,提供了包括上述用於訓練目標分類器的設備的電子設備。
另外,本公開的實施例還提供了用於實現上述方法的電腦程式。此外,本公開的實施例還提供了至少計算機可讀介質形式的電腦程式產品,其上記錄有用於實現上述方法的電腦程式代碼。


參照下面結合附圖對本公開實施例的說明,會更加容易地理解本公開的以上和其它目的、特點和優點。附圖中的部件只是為了示出本公開的原理。在附圖中,相同的或類似的技術特徵或部件將採用相同或類似的附圖標記來表示。圖I是示出根據本公開的一個實施例的用於訓練目標分類器的訓練方法的示意性流程圖;圖2是示出根據本公開的一個實施例的用於訓練目標分類器的訓練設備的結構的示意性框圖;圖3是示出根據本公開的一個實施例的目標檢測方法的示意性流程圖;圖4是示出根據本公開的一個實施例的目標檢測設備的結構的示意性框圖;圖5是示出根據本公開的一些示例在圖像中提取平行線段採樣差分特徵的示意圖;圖6是示出根據本公開的一些示例在圖像中提取平行線段採樣差分特徵的示意圖;以及圖7是示出用於實現本公開的實施例或示例的計算機的結構的示例性框圖。
具體實施例方式下面參照附圖來說明本公開的實施例。在本公開的一個附圖或一種實施方式中描述的元素和特徵可以與一個或更多個其它附圖或實施方式中示出的元素和特徵相結合。應當注意,為了清楚的目的,附圖和說明中省略了與本公開無關的、本領域普通技術人員已知的部件和處理的表示和描述。本公開的一些實施例提供了目標檢測設備和方法、目標分類器訓練設備和方法以及利用這樣的方法或包括這樣的設備的電子設備。
在本公開中,所謂「圖像」可以表示一幅或一組靜止圖像,也可以表示一個圖像序列,如視頻圖像等。圖I是示出了根據本公開的一個實施例的目標分類器訓練方法的示意性流程圖。如圖I所示,目標分類器訓練方法可以包括步驟102和104。在步驟102中,從多個圖像樣本中的每個圖像樣本中提取一個或更多個特徵向量,這裡所提取的至少一個特徵向量可以包括從該圖像樣本中選擇的至少三個像素中的每一像素的一個或更多個通道值構成的向量的加權和。所選擇的像素要滿足以下條件這些像素位於彼此基本上平行的一組平行線(即該組平行線包括彼此基本上平行的至少兩條平行線)上,該組平行線中的任意兩條相鄰平行線之間的距離大於一個像素的尺寸,並且所述至少三個像素中的至少兩個像素位於該組平行線中的同一平行線上(即,該組平行線中至少一條平行線上包括兩個或更多個像素)。在本公開中,上述特徵向量也稱為平行線段採樣差分特徵。作為一個示例,在圖像樣本或待檢測圖像為單通道圖像(灰度圖像)的情況下,像素的通道值是指該像素的亮度值(灰度值)。在這種情況下,與所提取的每一像素對應的一個或更多個通道值所構成的向量為一維向量,所得到的平行線段採樣差分特徵也 是一維向量。在圖像為多通道圖像(彩色圖像或者多光譜圖像)的情況下,像素的通道值是指表示該像素的各通道的值。在這種情況下,與所提取的每一像素對應的一個或更多個通道值構成的向量為一維或多維向量,相應地,所得到的平行線段採樣差分特徵是一維或多維向量。圖5 (A)、⑶、(C)、⑶、(E)和(F)分別示意性示出了上述平行線段採樣差分特徵的一些具體示例。在這些示例中,以二維圖像為例,各圖中符號「X」所指代的有向線段表示圖像中的X軸方向,圖中的方塊分別表示在圖像中選擇的像素。在圖5㈧所示的示例中,選擇圖像中的4個像素P5A1、P5A2、P5A3和P5a4來計算平行線段採樣差分特徵,其中的三個像素P5A2、P5A3和P5M基本上位於一條線L5ai上,而另一像素P5A1位於與線L5ai基本上平行的另一條線(圖中未繪出)上。在圖5(B)所示的示例中,選擇圖像中的8個像素P5B1、P5B2> P5B3、P5B4、P5B5、P5B6、P5B7和P5B8來計算平行線段採樣差分特徵,這8個像素分成4組,分別位於基本上彼此平行的4條平行線上,這4條平行線包括像素P5bi和P5b2形成的線L5bi、像素P5b3和P5b4形成的線L5B2、像素P5b5和P5b6形成的線L5b3、像素P5b7和P5b8形成的線L5B4。在圖5(C)所示的示例中,選取圖像中的8個像素P5C1、P5c2> P5c3> P5c4> P5c5> P5c6> P5c7和Pre8來計算平行線段採樣差分特徵,這8個像素分成4組,分別位於基本上彼此平行的4條平行線上,這4條平行線包括像素P5a和P5e2形成的線L5a、像素P5e3和P5e4形成的線L5C2、像素P5e5和P5e6形成的線L5e3、像素P5e7和P5e8形成的線L5C4。在圖5(D)所示的示例中,選取圖像中的8個像素P5D1、P5D2> P5D3、P5D4、P5D5、P5D6、P5D7和P5D8來計算平行線段採樣差分特徵,這8個像素分成三組,分別位於基本上彼此平行的3條平行線,這三條平行線包括像素P5D1、P5d2和P5d3形成的線L5111、像素P5d4和P5d5形成的線L 2、像素 P5D6、P5D7 和 P5D8 形成的線 L5d3。在圖5 (E)所示的示例中,選擇圖像中的4個像素P5E1、P5E2、P5e3和P5e4來計算平行線段採樣差分特徵,其中的像素P5E1、P5e2基本上位於一條線L5ei上,而像素P5E3、P5e4位於與線L5ei基本上平行的另一條線L5e2上。
在圖5(F)所示的示例中,選擇圖像中的8個像素P5F1、P5F2> P5F3、P5F4、P5F5、P5F6、P5F7和P5F8來計算平行線段採樣差分特徵,其中的像素P5F1、P5F2> P5f3和P5f4基本上位於一條線L5Fl上,而像素Pa 5、F*5P6、P5F7和位於與線L5f1基本上平行的另一條線L5f2上。應注意,在本公開的實施例或示例中,使用「平行線」的概念是用於表示為了計算上述特徵向量(平行線段採樣差分特徵)而選擇的各個像素之間的位置關係,而不一定是在圖像樣本或待檢測圖像中實際存在的線段。例如,圖5中畫出的各組平行線均用於表示相應像素之間的位置關係。還應注意,在本公開的實施例或示例中,「一組平行線」中的各平行線大體上彼此平行即可。例如,在實際圖像中,當所選像素的位置所形成的平行線與圖像的像素掃描方向(例如X軸)的角度不是0°或45°或90°時,這些平行線就可能不是嚴格平行的,而是大體上保持平行。作為一個具體示例,在圖像中選擇用於計算平行線段採樣差分特徵的至少三個像素時,可以先選擇一組平行線,在該組平行線上取至少三個點(下文稱為「代表點」),然後,在圖像中選擇與每個代表點距離最近的像素,作為用於計算平行線段採樣差分特徵的像素。在圖像中選擇了至少三個像素之後,可以針對每一所選像素,將其對應的一個或更多個通道值所構成的向量進行加權,並計算加權和,作為平行線段採樣差分特徵。所計算的平行線段採樣差分特徵可以用下式來表示
權利要求
1.一種目標檢測設備,包括 特徵提取裝置,用於從輸入圖像中提取一個或更多個特徵向量,至少一個所述特徵向量包括所述輸入圖像中的至少三個像素中的每一像素的一個或更多個通道值構成的向量的加權和,其中,所述至少三個像素位於彼此基本上平行的一組平行線上,該組平行線包含至少兩條平行線,並且該組平行線中的任意兩條相鄰平行線之間的距離大於一個像素的尺寸,所述至少三個像素中的至少兩個像素位於該組平行線中的同一平行線上;以及 目標判斷裝置,用於利用分類器、根據所述一個或更多個特徵向量來判斷所述輸入圖像中是否存在目標。
2.根據權利要求I所述的目標檢測設備,其中,所述至少三個像素中位於同一平行線上的任意兩個像素之間的距離大於或等於兩個像素的尺寸。
3.根據權利要求I所述的目標檢測設備,其中,所述至少三個像素中位於同一平行線上的相鄰像素之間的間隔是基本上相等的。
4.根據權利要求I所述的目標檢測設備,其中,所述至少三個像素中位於同一平行線上的像素的權重均為正值或負值,且所述至少三個像素中所有像素的權重的和基本為O。
5.根據權利要求I所述的目標檢測設備,其中,該組平行線的角度、位置和間距是根據目標的邊緣特徵選擇的。
6.一種用於訓練目標分類器的設備,包括 特徵提取裝置,用於從多個圖像樣本中的每個中提取一個或更多個特徵向量,從每個圖像樣本中提取的至少一個所述特徵向量包括該圖像樣本中的至少三個像素中的每一像素的一個或更多個通道值構成的向量的加權和,其中,所述至少三個像素位於彼此基本上平行的一組平行線上,該組平行線包含至少兩條平行線,並且該組平行線中的任意兩條相鄰平行線之間的距離大於一個像素的尺寸,所述至少三個像素中的至少兩個像素位於該組平行線中的同一平行線上;以及 訓練裝置,用於利用所述多個圖像樣本及所提取的特徵向量來訓練用於區分待檢測目標和背景的分類器。
7.根據權利要求6所述用於訓練目標分類器的設備,其中,所述至少三個像素中的、位於同一平行線上的任意兩個像素之間的距離大於或等於兩個像素的尺寸。
8.根據權利要求6所述用於訓練目標分類器的設備,其中,所述至少三個像素中位於同一平行線上的相鄰像素之間的間隔是基本上相等的。
9.根據權利要求6所述用於訓練目標分類器的設備,其中,所述至少三個像素中位於同一平行線上的像素的權重均為正值或負值,且所述至少三個像素中的所有像素的權重的和基本為O。
10.根據權利要求6所述用於訓練目標分類器的設備,其中,該組平行線的角度、位置和間距是根據待檢測目標的邊緣特徵選擇的。
11.一種目標檢測方法,包括 從輸入圖像中提取一個或更多個特徵向量,至少一個所述特徵向量包括所述輸入圖像中的至少三個像素中的每一像素的一個或更多個通道值構成的向量的加權和,其中,所述至少三個像素位於彼此基本上平行的一組平行線上,該組平行線包含至少兩條平行線,並且該組平行線中的任意兩條相鄰平行線之間的距離大於一個像素的尺寸,所述至少三個像素中的至少兩個像素位於該組平行線中的同一平行線上;以及 利用分類器、根據所述一個或更多個特徵向量來判斷所述輸入圖像中是否存在目標。
12.一種用於訓練目標分類器的方法,包括 從多個圖像樣本的每個中提取一個或更多個特徵向量,從每個圖像樣本中提取的至少一個所述特徵向量包括該圖像樣本中的至少三個像素中的每一像素一個或更多個通道值構成的向量的加權和,其中,所述至少三個像素位於彼此基本上平行的一組平行線上,該組平行線包含至少兩條平行線,並且該組平行線中的任意兩條相鄰平行線之間的距離大於一個像素的尺寸,所述至少三個像素中的至少兩個像素位於該組平行線中的同一平行線上;以及 利用所述多個圖像樣本及所提取的特徵向量來訓練用於區分待檢測目標和背景的分類器。
全文摘要
本公開提供了目標檢測設備和方法及分類器訓練設備和方法。目標檢測設備可包括特徵提取裝置,用於從輸入圖像中提取一個或更多個特徵向量,至少一個所述特徵向量包括所述輸入圖像中的至少三個像素中的每一像素的一個或更多個通道值構成的向量的加權和,所述至少三個像素位於彼此基本上平行的一組平行線上,該組平行線包括至少兩條平行線,並且其中的任意兩條相鄰平行線之間的距離大於一個像素的尺寸,並且所述至少三個像素中的至少兩個像素位於所述一組平行線中的同一平行線上;以及目標判斷裝置,用於利用分類器、根據所述一個或更多個特徵向量來判斷所述輸入圖像中是否存在目標。還提供了包括上述目標檢測設備和/或分類器訓練設備的電子設備。
文檔編號G06K9/32GK102789573SQ20111012961
公開日2012年11月21日 申請日期2011年5月16日 優先權日2011年5月16日
發明者張倫, 韓博 申請人:索尼公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀