目標檢測設備和方法及分類器訓練設備和方法

2023-05-23 03:38:56 1

專利名稱：目標檢測設備和方法及分類器訓練設備和方法
技術領域：
本公開涉及目標檢測領域，具體地，涉及圖像中的目標檢測設備和方法、目標分類器訓練設備和方法。
背景技術：
目標檢測是圖像/視頻自動分析中的重要技術之一。在目標檢測中，目標特徵提取是進行目標檢測的基礎。由於圖像中目標的姿態、背景以及光照條件等的多樣性，因此，很難提取統一的顏色或者結構紋理信息作為進行目標檢測的有效特徵。如何提取用於目標檢測的有效特徵用於目標分類器訓練和目標檢測是本領域的重要課題。

發明內容
在下文中給出關於本公開的一些方面的簡要概述，以便提供對於本公開的基本理解。應當理解，這個概述並不是對本公開的窮舉性概述。該概述也並非意圖確定本公開的關鍵或重要部分，也不是意圖限定本公開的範圍。其目的僅僅是以簡化的形式給出某些概念，以此作為稍後論述的更詳細描述的前序。根據本公開的一個方面，提供了一種目標檢測設備，該目標檢測設備可以包括特徵提取裝置，用於從輸入圖像中提取一個或更多個特徵向量，至少一個所述特徵向量包括所述輸入圖像中的至少三個像素中的每一像素的一個或更多個通道值構成的向量的加權和，所述至少三個像素位於彼此基本上平行的一組平行線上，該組平行線至少包括兩條平行線，並且其中的任意兩條相鄰平行線之間的距離大於一個像素的尺寸，並且所述至少三個像素中的至少兩個像素位於所述一組平行線中的同一平行線上；以及目標判斷裝置，用於利用分類器、根據所述一個或更多個特徵向量來判斷所述輸入圖像中是否存在目標。根據本公開的另一方面，提供了一種目標檢測方法，該目標檢測方法可以包括從輸入圖像中提取一個或更多個特徵向量，至少一個所述特徵向量包括所述輸入圖像中的至少三個像素中的每一像素的一個或更多個通道值構成的向量的加權和，所述至少三個像素位於彼此基本上平行的一組平行線上，該組平行線包括至少兩條平行線，並且其中的任意兩條相鄰平行線之間的距離大於一個像素的尺寸，並且所述至少三個像素中的至少兩個像素位於所述一組平行線中的同一平行線上；以及利用分類器、根據所述一個或更多個特徵向量來判斷所述輸入圖像中是否存在目標。根據本公開的另一方面，提供了包括上述目標檢測設備的電子設備。根據本公開的另一方面，提供了一種用於訓練目標分類器的設備，該設備可以包括特徵提取裝置，用於從多個圖像樣本中的每個中提取一個或更多個特徵向量，從每個圖像樣本中提取的至少一個所述特徵向量包括該圖像樣本中的至少三個像素中的每一像素的一個或更多個通道值構成的向量的加權和，所述至少三個像素位於彼此基本上平行的一組平行線上，該組平行線包括至少兩條平行線，並且其中的任意兩條相鄰平行線之間的距離大於一個像素的尺寸，並且所述至少三個像素中的至少兩個像素位於所述一組平行線中的同一平行線上；以及訓練裝置，用於利用多個圖像樣本及所提取的特徵向量來訓練用於區分待檢測目標和背景的分類器。根據本公開的另一方面，提供了一種用於訓練目標分類器的方法，該方法可以包括從多個圖像樣本的每個中提取一個或更多個特徵向量，從每個圖像樣本中提取的至少一個所述特徵向量包括該圖像樣本中的至少三個像素中的每一像素的一個或更多個通道值構成的向量的加權和，所述至少三個像素位於彼此基本上平行的一組平行線上，該組平行線包括至少兩條平行線，並且其中的任意兩條相鄰平行線之間的距離大於一個像素的尺寸，並且所述至少三個像素中的至少兩個像素位於所述一組平行線中的同一平行線上；以及利用所述多個圖像樣本及所提取的特徵向量來訓練用於區分待檢測目標和背景的分類器。根據本公開的另一方面，提供了包括上述用於訓練目標分類器的設備的電子設備。
另外，本公開的實施例還提供了用於實現上述方法的電腦程式。此外，本公開的實施例還提供了至少計算機可讀介質形式的電腦程式產品，其上記錄有用於實現上述方法的電腦程式代碼。

參照下面結合附圖對本公開實施例的說明，會更加容易地理解本公開的以上和其它目的、特點和優點。附圖中的部件只是為了示出本公開的原理。在附圖中，相同的或類似的技術特徵或部件將採用相同或類似的附圖標記來表示。圖I是示出根據本公開的一個實施例的用於訓練目標分類器的訓練方法的示意性流程圖；圖2是示出根據本公開的一個實施例的用於訓練目標分類器的訓練設備的結構的示意性框圖；圖3是示出根據本公開的一個實施例的目標檢測方法的示意性流程圖；圖4是示出根據本公開的一個實施例的目標檢測設備的結構的示意性框圖；圖5是示出根據本公開的一些示例在圖像中提取平行線段採樣差分特徵的示意圖；圖6是示出根據本公開的一些示例在圖像中提取平行線段採樣差分特徵的示意圖；以及圖7是示出用於實現本公開的實施例或示例的計算機的結構的示例性框圖。
具體實施例方式下面參照附圖來說明本公開的實施例。在本公開的一個附圖或一種實施方式中描述的元素和特徵可以與一個或更多個其它附圖或實施方式中示出的元素和特徵相結合。應當注意，為了清楚的目的，附圖和說明中省略了與本公開無關的、本領域普通技術人員已知的部件和處理的表示和描述。本公開的一些實施例提供了目標檢測設備和方法、目標分類器訓練設備和方法以及利用這樣的方法或包括這樣的設備的電子設備。
在本公開中，所謂「圖像」可以表示一幅或一組靜止圖像，也可以表示一個圖像序列，如視頻圖像等。圖I是示出了根據本公開的一個實施例的目標分類器訓練方法的示意性流程圖。如圖I所示，目標分類器訓練方法可以包括步驟102和104。在步驟102中，從多個圖像樣本中的每個圖像樣本中提取一個或更多個特徵向量，這裡所提取的至少一個特徵向量可以包括從該圖像樣本中選擇的至少三個像素中的每一像素的一個或更多個通道值構成的向量的加權和。所選擇的像素要滿足以下條件這些像素位於彼此基本上平行的一組平行線(即該組平行線包括彼此基本上平行的至少兩條平行線)上，該組平行線中的任意兩條相鄰平行線之間的距離大於一個像素的尺寸，並且所述至少三個像素中的至少兩個像素位於該組平行線中的同一平行線上(即，該組平行線中至少一條平行線上包括兩個或更多個像素)。在本公開中，上述特徵向量也稱為平行線段採樣差分特徵。作為一個示例，在圖像樣本或待檢測圖像為單通道圖像(灰度圖像)的情況下，像素的通道值是指該像素的亮度值(灰度值)。在這種情況下，與所提取的每一像素對應的一個或更多個通道值所構成的向量為一維向量，所得到的平行線段採樣差分特徵也是一維向量。在圖像為多通道圖像(彩色圖像或者多光譜圖像)的情況下，像素的通道值是指表示該像素的各通道的值。在這種情況下，與所提取的每一像素對應的一個或更多個通道值構成的向量為一維或多維向量，相應地，所得到的平行線段採樣差分特徵是一維或多維向量。圖5 (A)、⑶、(C)、⑶、(E)和(F)分別示意性示出了上述平行線段採樣差分特徵的一些具體示例。在這些示例中，以二維圖像為例，各圖中符號「X」所指代的有向線段表示圖像中的X軸方向，圖中的方塊分別表示在圖像中選擇的像素。在圖5㈧所示的示例中，選擇圖像中的4個像素P5A1、P5A2、P5A3和P5a4來計算平行線段採樣差分特徵，其中的三個像素P5A2、P5A3和P5M基本上位於一條線L5ai上，而另一像素P5A1位於與線L5ai基本上平行的另一條線(圖中未繪出)上。在圖5(B)所示的示例中，選擇圖像中的8個像素P5B1、P5B2> P5B3、P5B4、P5B5、P5B6、P5B7和P5B8來計算平行線段採樣差分特徵，這8個像素分成4組，分別位於基本上彼此平行的4條平行線上，這4條平行線包括像素P5bi和P5b2形成的線L5bi、像素P5b3和P5b4形成的線L5B2、像素P5b5和P5b6形成的線L5b3、像素P5b7和P5b8形成的線L5B4。在圖5(C)所示的示例中，選取圖像中的8個像素P5C1、P5c2> P5c3> P5c4> P5c5> P5c6> P5c7和Pre8來計算平行線段採樣差分特徵，這8個像素分成4組，分別位於基本上彼此平行的4條平行線上，這4條平行線包括像素P5a和P5e2形成的線L5a、像素P5e3和P5e4形成的線L5C2、像素P5e5和P5e6形成的線L5e3、像素P5e7和P5e8形成的線L5C4。在圖5(D)所示的示例中，選取圖像中的8個像素P5D1、P5D2> P5D3、P5D4、P5D5、P5D6、P5D7和P5D8來計算平行線段採樣差分特徵，這8個像素分成三組，分別位於基本上彼此平行的3條平行線，這三條平行線包括像素P5D1、P5d2和P5d3形成的線L5111、像素P5d4和P5d5形成的線L 2、像素 P5D6、P5D7 和 P5D8 形成的線 L5d3。在圖5 (E)所示的示例中，選擇圖像中的4個像素P5E1、P5E2、P5e3和P5e4來計算平行線段採樣差分特徵，其中的像素P5E1、P5e2基本上位於一條線L5ei上，而像素P5E3、P5e4位於與線L5ei基本上平行的另一條線L5e2上。
在圖5(F)所示的示例中，選擇圖像中的8個像素P5F1、P5F2> P5F3、P5F4、P5F5、P5F6、P5F7和P5F8來計算平行線段採樣差分特徵，其中的像素P5F1、P5F2> P5f3和P5f4基本上位於一條線L5Fl上，而像素Pa 5、F*5P6、P5F7和位於與線L5f1基本上平行的另一條線L5f2上。應注意，在本公開的實施例或示例中，使用「平行線」的概念是用於表示為了計算上述特徵向量(平行線段採樣差分特徵)而選擇的各個像素之間的位置關係，而不一定是在圖像樣本或待檢測圖像中實際存在的線段。例如，圖5中畫出的各組平行線均用於表示相應像素之間的位置關係。還應注意，在本公開的實施例或示例中，「一組平行線」中的各平行線大體上彼此平行即可。例如，在實際圖像中，當所選像素的位置所形成的平行線與圖像的像素掃描方向(例如X軸)的角度不是0°或45°或90°時，這些平行線就可能不是嚴格平行的，而是大體上保持平行。作為一個具體示例，在圖像中選擇用於計算平行線段採樣差分特徵的至少三個像素時，可以先選擇一組平行線，在該組平行線上取至少三個點(下文稱為「代表點」)，然後，在圖像中選擇與每個代表點距離最近的像素，作為用於計算平行線段採樣差分特徵的像素。在圖像中選擇了至少三個像素之後，可以針對每一所選像素，將其對應的一個或更多個通道值所構成的向量進行加權，並計算加權和，作為平行線段採樣差分特徵。所計算的平行線段採樣差分特徵可以用下式來表示
權利要求
1.一種目標檢測設備，包括特徵提取裝置，用於從輸入圖像中提取一個或更多個特徵向量，至少一個所述特徵向量包括所述輸入圖像中的至少三個像素中的每一像素的一個或更多個通道值構成的向量的加權和，其中，所述至少三個像素位於彼此基本上平行的一組平行線上，該組平行線包含至少兩條平行線，並且該組平行線中的任意兩條相鄰平行線之間的距離大於一個像素的尺寸，所述至少三個像素中的至少兩個像素位於該組平行線中的同一平行線上；以及目標判斷裝置，用於利用分類器、根據所述一個或更多個特徵向量來判斷所述輸入圖像中是否存在目標。
2.根據權利要求I所述的目標檢測設備，其中，所述至少三個像素中位於同一平行線上的任意兩個像素之間的距離大於或等於兩個像素的尺寸。
3.根據權利要求I所述的目標檢測設備，其中，所述至少三個像素中位於同一平行線上的相鄰像素之間的間隔是基本上相等的。
4.根據權利要求I所述的目標檢測設備，其中，所述至少三個像素中位於同一平行線上的像素的權重均為正值或負值，且所述至少三個像素中所有像素的權重的和基本為O。
5.根據權利要求I所述的目標檢測設備，其中，該組平行線的角度、位置和間距是根據目標的邊緣特徵選擇的。
6.一種用於訓練目標分類器的設備，包括特徵提取裝置，用於從多個圖像樣本中的每個中提取一個或更多個特徵向量，從每個圖像樣本中提取的至少一個所述特徵向量包括該圖像樣本中的至少三個像素中的每一像素的一個或更多個通道值構成的向量的加權和，其中，所述至少三個像素位於彼此基本上平行的一組平行線上，該組平行線包含至少兩條平行線，並且該組平行線中的任意兩條相鄰平行線之間的距離大於一個像素的尺寸，所述至少三個像素中的至少兩個像素位於該組平行線中的同一平行線上；以及訓練裝置，用於利用所述多個圖像樣本及所提取的特徵向量來訓練用於區分待檢測目標和背景的分類器。
7.根據權利要求6所述用於訓練目標分類器的設備，其中，所述至少三個像素中的、位於同一平行線上的任意兩個像素之間的距離大於或等於兩個像素的尺寸。
8.根據權利要求6所述用於訓練目標分類器的設備，其中，所述至少三個像素中位於同一平行線上的相鄰像素之間的間隔是基本上相等的。
9.根據權利要求6所述用於訓練目標分類器的設備，其中，所述至少三個像素中位於同一平行線上的像素的權重均為正值或負值，且所述至少三個像素中的所有像素的權重的和基本為O。
10.根據權利要求6所述用於訓練目標分類器的設備，其中，該組平行線的角度、位置和間距是根據待檢測目標的邊緣特徵選擇的。
11.一種目標檢測方法，包括從輸入圖像中提取一個或更多個特徵向量，至少一個所述特徵向量包括所述輸入圖像中的至少三個像素中的每一像素的一個或更多個通道值構成的向量的加權和，其中，所述至少三個像素位於彼此基本上平行的一組平行線上，該組平行線包含至少兩條平行線，並且該組平行線中的任意兩條相鄰平行線之間的距離大於一個像素的尺寸，所述至少三個像素中的至少兩個像素位於該組平行線中的同一平行線上；以及利用分類器、根據所述一個或更多個特徵向量來判斷所述輸入圖像中是否存在目標。
12.一種用於訓練目標分類器的方法，包括從多個圖像樣本的每個中提取一個或更多個特徵向量，從每個圖像樣本中提取的至少一個所述特徵向量包括該圖像樣本中的至少三個像素中的每一像素一個或更多個通道值構成的向量的加權和，其中，所述至少三個像素位於彼此基本上平行的一組平行線上，該組平行線包含至少兩條平行線，並且該組平行線中的任意兩條相鄰平行線之間的距離大於一個像素的尺寸，所述至少三個像素中的至少兩個像素位於該組平行線中的同一平行線上；以及利用所述多個圖像樣本及所提取的特徵向量來訓練用於區分待檢測目標和背景的分類器。
全文摘要
本公開提供了目標檢測設備和方法及分類器訓練設備和方法。目標檢測設備可包括特徵提取裝置，用於從輸入圖像中提取一個或更多個特徵向量，至少一個所述特徵向量包括所述輸入圖像中的至少三個像素中的每一像素的一個或更多個通道值構成的向量的加權和，所述至少三個像素位於彼此基本上平行的一組平行線上，該組平行線包括至少兩條平行線，並且其中的任意兩條相鄰平行線之間的距離大於一個像素的尺寸，並且所述至少三個像素中的至少兩個像素位於所述一組平行線中的同一平行線上；以及目標判斷裝置，用於利用分類器、根據所述一個或更多個特徵向量來判斷所述輸入圖像中是否存在目標。還提供了包括上述目標檢測設備和/或分類器訓練設備的電子設備。
文檔編號G06K9/32GK102789573SQ20111012961
公開日2012年11月21日申請日期2011年5月16日優先權日2011年5月16日
發明者張倫, 韓博申請人:索尼公司

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

目標檢測設備和方法及分類器訓練設備和方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法