一種候選框搜索步長的獲取方法及裝置與流程

2023-07-26 21:16:31 1

本發明涉及計算機視覺及模式識別中的目標檢測領域，尤其涉及一種候選框搜索步長的獲取方法及裝置。

背景技術：

隨著計算機圖像處理技術的迅速發展和廣泛應用，對於目標檢測技術的需求也逐漸上升。目標檢測已經成為計算機視覺和模式識別領域的基本問題，而檢測目標的候選框搜索步長的確定是目標識別分類的一項重要的前期工作。目前現有的生成目標候選框的方法一般是滑動窗搜索方式，滑動窗搜索方式在進行目標搜索時，候選框在整個掃描窗口以固定的長度步進。

在實現本發明過程中，發明人發現現有技術中至少存在如下問題：

按照現有的目標搜索方法，在對目標進行搜索的過程中，候選框在整個掃描窗口以固定的長度步進，在搜索目標個數不同的區域內都以固定的長度步進搜索可能會出現漏檢，搜索結果不是全局最優的。

技術實現要素：

有鑑於此，本發明實施例提供了一種候選框搜索步長的獲取方法及裝置，可以根據搜索目標在區域內出現的頻率和密度信息確定候選框搜索步長。

一方面，本發明實施例提供了一種候選框搜索步長的獲取方法，所述方法包括：

獲取待搜索圖像；

獲取所述待搜索圖像中各個原始分區的圖像信息以及各個原始分區各自對應的泊松分布函數；

根據每個原始分區的圖像信息和泊松分布函數，確定每個原始分區的分區類型；

根據所述分區類型，確定在每個原始分區中的候選框搜索步長。

另一方面，本發明實施例提供了一種候選框搜索步長的獲取裝置，所述裝置包括：

第一獲取單元，用於獲取待搜索圖像；

第二獲取單元，用於獲取所述待搜索圖像中各個原始分區的圖像信息以及各個原始分區各自對應的泊松分布函數；

第一確定單元，用於根據每個原始分區的圖像信息和泊松分布函數，確定每個原始分區的分區類型；

第二確定單元，用於根據所述分區類型，確定在每個原始分區中的候選框搜索步長。

本發明實施例提供的一種候選框搜索步長的獲取方法及裝置，通過分區建立泊松模型並不斷學習更新得到的特定搜索目標的位置信息，可以調整每幀圖像中每塊區域的候選框搜索步長，約束目標候選框的數量，從而針對不同的區域對搜索目標進行檢測。這種方法及裝置提升了檢測效果，可以獲得較高的檢出率。

【附圖說明】

為了更清楚地說明本發明實施例的技術方案，下面將對實施例中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本發明的一些實施例，對於本領域普通技術人員來講，在不付出創造性勞動性的前提下，還可以根據這些附圖獲得其它的附圖。

圖1是本發明實施例提供的一種候選框搜索步長的獲取方法流程圖；

圖2是本發明實施例提供的另一種候選框搜索步長的獲取方法流程圖；

圖3是本發明實施例提供的另一種候選框搜索步長的獲取方法流程圖；

圖4是本發明實施例提供的另一種候選框搜索步長的獲取方法流程圖；

圖5是本發明實施例提供的一種候選框搜索步長的獲取裝置的組成框圖；

圖6是本發明實施例提供的另一種候選框搜索步長的獲取裝置的組成框圖；

圖7是本發明實施例提供的另一種候選框搜索步長的獲取裝置的組成框圖；

圖8是本發明實施例提供的另一種候選框搜索步長的獲取裝置的組成框圖。

【具體實施方式】

為了更好的理解本發明的技術方案，下面結合附圖對本發明實施例進行詳細描述。

應當明確，所描述的實施例僅僅是本發明一部分實施例，而不是全部的實施例。基於本發明中的實施例，本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其它實施例，都屬於本發明保護的範圍。

在本發明實施例中使用的術語是僅僅出於描述特定實施例的目的，而非旨在限制本發明。在本發明實施例和所附權利要求書中所使用的單數形式的「一種」、「所述」和「該」也旨在包括多數形式，除非上下文清楚地表示其他含義。

應當理解，本文中使用的術語「和/或」僅僅是一種描述關聯對象的關聯關係，表示可以存在三種關係，例如，A和/或B，可以表示：單獨存在A，同時存在A和B，單獨存在B這三種情況。另外，本文中字符「/」，一般表示前後關聯對象是一種「或」的關係。

取決於語境，如在此所使用的詞語「如果」可以被解釋成為「在……時」或「當……時」或「響應於確定」或「響應於檢測」。類似地，取決於語境，短語「如果確定」或「如果檢測(陳述的條件或事件)」可以被解釋成為「當確定時」或「響應於確定」或「當檢測(陳述的條件或事件)時」或「響應於檢測(陳述的條件或事件)」。

本發明實施例提供了一種候選框搜索步長的獲取方法，能夠適用於包括靜態監控視頻、車載監控視頻等場景中行人檢測、車輛檢測等目標檢測過程中，如圖1所示，所述方法包括：

101、獲取待搜索圖像。

其中，所述待搜索圖像指的是目標檢測過程中的所有待檢測圖像。

102、獲取所述待搜索圖像中各個原始分區的圖像信息以及各個原始分區各自對應的泊松分布函數。

其中，需要說明的是，本發明實施例針對靜態監控視頻以及車載監控視頻等場景監控，圖像中搜索目標出現在某塊區域的頻率和分布密度服從泊松分布。

其中，所述各個原始分區指的是對檢測區域進行分塊後的各個區域。

其中，所述各個原始分區的圖像信息包括搜索目標在每塊區域出現的頻率信息以及搜索目標分布的密度信息。

其中，所述搜索目標指的是目標檢測過程中的待檢測對象，比如人、車輛和物體等。

其中，所述泊松分布函數基於數學泊松模型建立的函數，適用於描述單位時間內隨機事件發生的次數。

103、根據每個原始分區的圖像信息和泊松分布函數，確定每個原始分區的分區類型。

其中，所述分區類型由原始分區中搜索目標個數的多少確定。

其中，所述搜索目標個數指的是單位時間內搜索目標分布的數量，與搜索目標出現的頻率信息和分布的密度信息相關。

104、根據所述分區類型，確定在每個原始分區中的候選框搜索步長。

本發明實施例提供的一種候選框搜索步長的獲取方法，通過分區建立泊松模型並不斷學習更新得到的特定目標的位置信息，可以調整每幀圖像中每塊區域的候選框搜索步長，約束目標候選框的數量，從而針對不同的區域對目標進行檢測。這種方法提升了檢測效果，可以獲得較高的檢出率。

進一步來說，結合前述方法流程，在本發明實施例的另一種可能的實現方式中，針對步驟103根據每個原始分區的圖像信息和泊松分布函數，確定每個原始分區的分區類型的實現提供了以下具體流程，如圖2所示，包括：

201、根據每個原始分區的圖像信息和泊松分布函數，確定每個原始分區中搜索目標的個數。

其中，所述泊松分布函數在連續分布時有兩個參數，一個是時域上隨機事件發生的頻率，另一個是空間域上隨機事件的分布密度，在本發明實施例中，所述時域上隨機事件發生的頻率指的是搜索目標在每個原始分區中出現的頻率，所述空間域上隨機事件的分布密度指的是搜索目標分布的密度。

其中，所述泊松分布函數在對搜索目標進行檢測的過程中進行訓練，在學習過程中動態獲取搜索目標在每塊區域出現的頻率信息和搜索目標的分布密度信息。

其中，當對搜索目標進行檢測時，對每一幀待搜索圖像進行檢測，泊松分布函數變為離散型分布，確定了時間，搜索目標的個數即是單位時間內搜索目標分布的密度。

202、當所述搜索目標的個數在第一閾值範圍內時，則將搜索目標的個數在第一閾值範圍內的原始分區的分區類型確定為目標稀疏分布區域。

其中，所述第一閾值範圍指的搜索目標個數比較少的一個數目範圍，記為[L,Lmin)。

其中，所述L為大於0的整數。

其中，所述Lmin為大於L的整數。

203、當所述搜索目標的個數在第二閾值範圍內時，則將搜索目標的個數在第一閾值範圍內的原始分區的分區類型確定為目標中等分布區域。

其中，所述第二閾值範圍指的是搜索目標個數大於第一閾值範圍的一個數目範圍，記為[Lmin,Lmax]。

其中，所述Lmax為大於Lmin的整數。

204、當所述搜索目標的個數在第三閾值範圍內時，則將搜索目標的個數在第一閾值範圍內的原始分區的分區類型確定為目標密集分布區域。

其中，所述第三閾值範圍指的是搜索目標個數大於第二閾值範圍的一個數目範圍，記為[Lmax,+∝)。

其中，當所述原始分區的搜索目標個數大於Lmin時，原始分區視為目標出現較多的區域。

其中，當所述原始分區的搜索目標個數小於L時，原始分區視為目標出現較少的區域。

其中，對於搜索目標出現較多的區域確定分區類型，對於搜索目標出現較少的區域直接根據搜索目標的個數確定候選框的搜索步長。

進一步來說，結合前述方法流程，在本發明實施例的另一種可能的實現方式提供了如何根據所述分區類型，確定在每個原始分區中的候選框搜索步長的具體步驟，針對步驟104的實現提供了以下具體流程，如圖3所示，包括：

301、將所述分區類型為目標稀疏分布區域的原始分區中的候選框搜索步長設置為第一步長。

其中，所述第一步長可根據所述目標稀疏分布區域的搜索目標分布情況自行定義長短。

302、將所述分區類型為目標中等分布區域的原始分區中的候選框搜索步長設置為第二步長。

其中，所述第二步長可根據所述目標中等分布區域的搜索目標分布情況自行定義長短。

其中，所述第二步長小於所述第一步長。

303、將所述分區類型為目標密集分布區域的原始分區中的候選框搜索步長設置為第三步長。

其中，所述第三步長可根據所述目標密集分布區域的搜索目標分布情況自行定義長短。

其中，所述第三步長小於所述第二步長。

需要說明的是，當原始分區屬於搜索目標出現較少的區域時，根據搜索目標出現的個數直接確定步長，所述步長不小於所述第一步長。

進一步來說，結合前述方法流程，本發明實施例提供了另一種可能的實現方式，如圖4所示，在所述獲取待搜索圖像之前，還包括：

401、獲取原始圖像內的原始分區。

其中，所述原始圖像指的是檢測區域內的n幀圖像。

其中，所述n是大於0的整數。

其中，所述原始分區根據檢測區域大小和特徵進行分塊。

其中，所述原始分區數目越多時，函數越能準確的反應分區內目標出現的頻率和分布密度信息，每個原始分區內部的統計分布可認為基本一致。

其中，所述原始分區的數目越多時，需要計算的數據越多，從計算方法的複雜程度和準確程度兩方面考慮，所述原始分區的數目根據搜索區域的大小和特徵來確定。

402、採集所述原始分區內搜索目標的出現頻率和分布密度。

其中，所述採集所述原始分區內搜索目標的出現頻率和分布密度指的是採集所述n幀圖像各個原始分區搜索目標的出現頻率和分布密度。

403、根據所述搜索目標的出現頻率和密度，確定所述原始分區的泊松分布函數。

其中，所述泊松分布函數通過採集所述n幀圖像內搜索目標的出現頻率和密度信息進行參數估計得到初始值。

本發明實施例提供的一種候選框搜索步長的獲取方法，通過分區建立泊松模型並不斷學習更新得到的特定搜索目標的位置信息，可以調整每幀圖像中每塊區域的候選框搜索步長，約束目標候選框的數量，從而針對不同的區域對搜索目標進行檢測。這種方法提升了檢測效果，可以獲得較高的檢出率。

為了更好的理解本技術方案，本發明實施例提供了更加具體的實施方式，需要說明的本發明實施例適用但不限於以下實施方式。

步驟1、將檢測區域分成12(3x4)塊小區域，對前2400幀圖像的每塊區域建立行人的泊松位置並進行參數估計得到模型初始值，從而可以得到每塊區域處泊松模型單位時間內行人出現的平均發生率初始值。

步驟2、訓練泊松模型，在學習過程中動態獲取行人在每塊區域出現的頻率信息以及行人分布的密度信息。

步驟21、根據建立的泊松模型的初始值利用梯度下降法學習更新得到行人在每幀圖像中各個原始分區分布的密度信息。

步驟22、對於步驟21得到的各個位置區域行人分布的情況，針對實施例中場景，對於行人出現較多的分塊區域：

當出現的行人個數為10個以內時，將該區域視作行人稀疏分布區域；

當出現的行人個數為10至30時，將該區域視作行人中等分布區域；

當出現行人的次數大於30時，將該區域視作行人密集分布區域。

步驟23、對於行人出現較少的分塊區域，設置出現行人的次數閾值為8。

步驟3、根據泊松位置模型學習得到的行人在每幀圖像分布的密度信息，在搜索目標不同分布密度集的區域設置候選框不同的搜索步長，控制整幀圖像的候選框數目。

步驟31、對於搜索目標分布較多的區域設置步長如下：行人稀疏分布區域step＝16，行人中等分布區域step＝8，行人密集分布區域step＝4。

步驟32、對於搜索目標分布較少的區域設置步長如下：對於出現行人的次數大於8的情況，步長step＝16，反之，設置步長step＝32。

本發明的實施例中，各區域設置的候選框的寬高比鎖定為0.5，另外，對於各區域處不出現行人的情況，則不生成候選框。

本發明實施例提供了一種候選框搜索步長的獲取裝置，可用於實現前述各方法流程，其組成如圖5所示，所述裝置包括：

第一獲取單元51，用於獲取待搜索圖像。

第二獲取單元52，用於獲取所述待搜索圖像中各個原始分區的圖像信息以及各個原始分區各自對應的泊松分布函數。

第一確定單元53，用於根據每個原始分區的圖像信息和泊松分布函數，確定每個原始分區的分區類型。

第二確定單元54，用於根據所述分區類型，確定在每個原始分區中的候選框搜索步長。

可選的是，如圖6所示，所述第一確定單元53包括：

第一確定模塊531，用於根據每個原始分區的圖像信息和泊松分布函數，確定每個原始分區中搜索目標的個數。

第二確定模塊532，用於當所述搜索目標的個數在第一閾值範圍內時，將搜索目標的個數在第一閾值範圍內的原始分區的分區類型確定為目標稀疏分布區域。

第三確定模塊533，用於當所述搜索目標的個數在第二閾值範圍內時，將搜索目標的個數在第一閾值範圍內的原始分區的分區類型確定為目標中等分布區域。

第四確定模塊534，用於當所述搜索目標的個數在第三閾值範圍內時，將搜索目標的個數在第一閾值範圍內的原始分區的分區類型確定為目標密集分布區域。

可選的是，如圖7所示，所述第二確定單元54包括：

第一設置模塊541，用於將所述分區類型為目標稀疏分布區域的原始分區中的候選框搜索步長設置為第一步長。

第二設置模塊542，用於將所述分區類型為目標中等分布區域的原始分區中的候選框搜索步長設置為第二步長。

第三設置模塊543，用於將所述分區類型為目標密集分布區域的原始分區中的候選框搜索步長設置為第三步長。

可選的是，如圖8所示，所述裝置還包括：

第三獲取單元55，用於獲取原始圖像內的原始分區。

採集單元56，用於採集所述原始分區內搜索目標的出現頻率和分布密度。

第三確定單元57，用於根據所述搜索目標的出現頻率和密度，確定所述原始分區的泊松分布函數。

本發明實施例提供的一種候選框搜索步長的獲取裝置，通過分區建立泊松模型並不斷學習更新得到的特定搜索目標的位置信息，可以調整每幀圖像中每塊區域的候選框搜索步長，約束目標候選框的數量，從而針對不同的區域對搜索目標進行檢測。這種裝置提升了檢測效果，可以獲得較高的檢出率。

所屬領域的技術人員可以清楚地了解到，為描述的方便和簡潔，上述描述的系統，裝置和單元的具體工作過程，可以參考前述方法實施例中的對應過程，在此不再贅述。

在本發明所提供的幾個實施例中，應該理解到，所揭露的系統，裝置和方法，可以通過其它的方式實現。例如，以上所描述的裝置實施例僅僅是示意性的，例如，所述單元的劃分，僅僅為一種邏輯功能劃分，實際實現時可以有另外的劃分方式，例如，多個單元或組件可以結合或者可以集成到另一個系統，或一些特徵可以忽略，或不執行。另一點，所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口，裝置或單元的間接耦合或通信連接，可以是電性，機械或其它的形式。

所述作為分離部件說明的單元可以是或者也可以不是物理上分開的，作為單元顯示的部件可以是或者也可以不是物理單元，即可以位於一個地方，或者也可以分布到多個網絡單元上。可以根據實際的需要選擇其中的部分或者全部單元來實現本實施例方案的目的。

另外，在本發明各個實施例中的各功能單元可以集成在一個處理單元中，也可以是各個單元單獨物理存在，也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以採用硬體的形式實現，也可以採用硬體加軟體功能單元的形式實現。

上述以軟體功能單元的形式實現的集成的單元，可以存儲在一個計算機可讀取存儲介質中。上述軟體功能單元存儲在一個存儲介質中，包括若干指令用以使得一臺計算機裝置(可以是個人計算機，伺服器，或者網絡裝置等)或處理器(Processor)執行本發明各個實施例所述方法的部分步驟。而前述的存儲介質包括：U盤、移動硬碟、只讀存儲器(Read-Only Memory，ROM)、隨機存取存儲器(Random Access Memory，RAM)、磁碟或者光碟等各種可以存儲程序代碼的介質。

以上所述僅為本發明的較佳實施例而已，並不用以限制本發明，凡在本發明的精神和原則之內，所做的任何修改、等同替換、改進等，均應包含在本發明保護的範圍之內。

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

一種候選框搜索步長的獲取方法及裝置與流程

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法