新四季網

三維卷積神經網絡訓練方法、視頻異常事件檢測方法及裝置製造方法

2023-09-14 11:07:25

三維卷積神經網絡訓練方法、視頻異常事件檢測方法及裝置製造方法
【專利摘要】本發明實施例涉及視頻圖像【技術領域】,尤其涉及一種三維卷積神經網絡訓練方法、一種基於三維卷積神經網絡的視頻異常事件檢測方法及裝置,用以對擁擠人群場景下發生的異常事件進行檢測。本發明實施例的方法中三維卷積神經網絡正向傳遞過程中第N組卷積-採樣層中的卷積層上的每個卷積核對第N-1組卷積-採樣層中的採樣層的所有通道的所有特徵圖的數據進行卷積,由於最後一層卷積層對所有通道的所有特徵圖的數據進行卷積,從而可提取更具有表達能力的特徵,從而可通過這些特徵更好地描述擁擠人群場景下發生的異常事件,進而提高異常事件的檢測的準確率。
【專利說明】三維卷積神經網絡訓練方法、視頻異常事件檢測方法及裝

【技術領域】
[0001] 本發明涉及視頻圖像【技術領域】,尤其涉及一種三維卷積神經網絡訓練方法、一種 基於三維卷積神經網絡的視頻異常事件檢測方法及裝置。

【背景技術】
[0002] 隨著經濟的快速發展,在商場、體育場等公共場所中常常存在著人流高峰,而這些 擁擠的人群對公共安全帶來了極大的隱患。如果能夠及時檢測到監控視頻中的異常行為, 便可及時採取相應的解決方案,避免重大意外事件發生。
[0003] 現有技術中用於對監控視頻中的異常事件進行自動檢測的方法需基於運動對象 的跟蹤,即通過不斷檢測運動對象運動軌跡,進行異常行為檢測。該類方法異常行為檢測效 果在很大程度上依賴於運動對象跟蹤的結果,因此該類方法僅適用於非擁擠場景中,但對 於如商場、體育場等公共場所的擁擠場景,由於目標的互遮擋與自遮擋相當嚴重,導致有效 的運動對象跟蹤困難,因此在人群擁擠的場景下,基於運動對象跟蹤的方法並不適用。
[0004] 綜上,亟需一種視頻異常事件檢測方法,用以對擁擠人群場景下發生的異常事件 進行檢測。


【發明內容】

[0005] 本發明實施例提供一種三維卷積神經網絡的訓練方法、一種基於三維卷積神經網 絡的視頻異常事件檢測方法及裝置,用以對擁擠人群場景下發生的異常事件進行檢測。
[0006] 本發明實施例提供一種三維卷積神經網絡的訓練方法,包括:
[0007] 三維卷積神經網絡中按照正向傳遞過程依次包含第一組至第N組卷積-採樣層, 每組卷積-採樣層中按照正向傳遞過程包含一個卷積層和一個採樣層,第N-1組卷積-採 樣層中的採樣層與第N組卷積-採樣層中的卷積層全連接,N>1 ;
[0008] 三維卷積神經網絡的訓練方法包括:
[0009] 執行正向傳遞過程,根據正向傳遞過程的輸出結果,在三維卷積神經網絡中執行 反向傳遞過程,以修正三維卷積神經網絡的模型參數;
[0010] 正向傳遞過程包括:三維卷積神經網絡接收待檢測視頻序列的特徵塊,針對特徵 塊執行異常檢測過程,根據待檢測視頻序列的每個特徵塊的異常事件檢測結果確定待檢測 視頻序列是否發生異常事件;
[0011] 其中,第N組卷積-採樣層中的卷積層上的每個卷積核對第N-1組卷積-採樣層 中的採樣層的所有通道的所有特徵圖的數據進行卷積,並將通過卷積所得到的特徵圖信息 輸出給第N組卷積-採樣層中的採樣層進行採樣處理。
[0012] 三維卷積神經網絡正向傳遞過程中第N組卷積-採樣層中的卷積層上的每個卷積 核對第N-1組卷積-採樣層中的採樣層的所有通道的所有特徵圖的數據進行卷積,由於最 後一層卷積層對所有通道的所有特徵圖的數據進行卷積,從而可提取更具有表達能力的特 徵,從而可通過這些特徵更好地描述擁擠人群場景下發生的異常事件,進而提高異常事件 的檢測的準確率。
[0013] 較佳的,三維卷積神經網絡接收待檢測視頻序列的特徵塊之前,還應做一些前期 處理,如:對待檢測的第i幀至第i+Ι幀的視頻幀序列進行特徵提取,並將第i幀至第i+1 幀的視頻幀序列切割為RXCX1的多個特徵塊;其中,i、1、R、C均為大於1的整數,R和C 分別表示特徵塊的長度和寬度。
[0014] 較佳的,三維卷積神經網絡接收待檢測視頻序列的特徵塊,對特徵塊進行檢測,輸 出的異常事件檢測結果中包括異常值概率和正常值概率;由於前期可能對視頻幀序列進行 切割,因此同一個幀序列可能具有多個特徵塊,三維卷積神經網絡會對每個特徵塊輸出一 個異常事件檢測結果。根據多個待檢測視頻序列的每個特徵塊的異常事件檢測結果確定待 檢測視頻序列是否發生異常事件時,若待檢測視頻序列的特徵塊中至少有一個特徵塊滿足 以下條件,則確定待檢測視頻序列發生異常事件:異常值概率減去正常值概率得到的差值 大於設定閾值。
[0015] 如前,三維卷積神經網絡輸出的異常事件檢測結果中包括異常值概率和正常值概 率。當想要確定具體哪一幀發生了異常事件時,則需結果多個特徵塊進行計算。例如,需要 確定第k幀是否發生了異常事件,則需將所有包含第k幀的視頻幀序列中的所有特徵塊的 異常檢測結果中的異常值概率進行加權相加,將包含第k幀的所有視頻幀序列中的所有特 徵塊的異常檢測結果中的正常值概率進行加權相加;其中,所有包含第k幀的視頻幀序列 是通過具有1幀時間長度的滑動窗口每次移動單幀得到的;針對所有包含第k幀的視頻幀 序列中的所有特徵塊,若加權相加之後的異常值概率減去加權相加之後的正常值概率得到 的差值大於設定閾值,則確定第k幀發生異常事件;其中,k為正整數。
[0016] 較佳的,由於第k幀具有多個異常檢查結果,因此對第k幀的異常檢測結果進行加 權相加之前必須設定權值。針對所有包含第k幀的視頻幀序列中的所有特徵塊,將第一特 徵塊的的異常檢測結果中的異常值概率和正常值概率的權值設置為最大值;其中,第一特 徵塊滿足以下條件:

【權利要求】
1. 一種三維卷積神經網絡的訓練方法,其特徵在於,包括: 三維卷積神經網絡中按照正向傳遞過程依次包含第一組至第N組卷積-採樣層,每組 卷積-採樣層中按照正向傳遞過程包含一個卷積層和一個採樣層,第N-1組卷積-採樣層 中的採樣層與第N組卷積-採樣層中的卷積層全連接,N>1 ; 所述三維卷積神經網絡的訓練方法包括: 執行正向傳遞過程,根據所述正向傳遞過程的輸出結果,在所述三維卷積神經網絡中 執行反向傳遞過程,以修正所述三維卷積神經網絡的模型參數; 所述正向傳遞過程包括:三維卷積神經網絡接收待檢測視頻序列的特徵塊,針對所述 特徵塊執行異常檢測過程,根據待檢測視頻序列的每個特徵塊的異常事件檢測結果確定所 述待檢測視頻序列是否發生異常事件; 其中,第N組卷積-採樣層中的卷積層上的每個卷積核對第N-1組卷積-採樣層中的 採樣層的所有通道的所有特徵圖的數據進行卷積,並將通過卷積所得到的特徵圖信息輸出 給第N組卷積-採樣層中的採樣層進行採樣處理。
2. 如權利要求1所述的三維卷積神經網絡的訓練方法,其特徵在於,所述三維卷積神 經網絡接收待檢測視頻序列的特徵塊之前,還包括: 對待檢測的第i幀至第i+1幀的視頻幀序列進行特徵提取,並將所述第i幀至第i+1 幀的視頻幀序列切割為RXCX1的多個特徵塊;其中,i、1、R、C均為大於1的整數,R和C 分別表示特徵塊的長度和寬度。
3. 如權利要求1所述的三維卷積神經網絡的訓練方法,其特徵在於,所述異常事件檢 測結果中包括異常值概率和正常值概率; 所述根據待檢測視頻序列的每個特徵塊的異常事件檢測結果確定所述待檢測視頻序 列是否發生異常事件,包括: 若所述待檢測視頻序列的特徵塊中至少有一個特徵塊滿足以下條件,則確定所述待檢 測視頻序列發生異常事件:異常值概率減去正常值概率得到的差值大於設定閾值。
4. 如權利要求2所述的三維卷積神經網絡的訓練方法,其特徵在於,所述異常事件檢 測結果中包括異常值概率和正常值概率; 所述根據待檢測視頻序列的每個特徵塊的異常事件檢測結果確定所述待檢測視頻序 列是否發生異常事件,包括: 將所有包含第k幀的視頻幀序列中的所有特徵塊的異常檢測結果中的異常值概率進 行加權相加,將包含第k幀的所有視頻幀序列中的所有特徵塊的異常檢測結果中的正常值 概率進行加權相加; 其中,所述所有包含第k幀的視頻幀序列是通過具有1幀時間長度的滑動窗口每次移 動單幀得到的; 針對所有包含第k幀的視頻幀序列中的所有特徵塊,若加權相加之後的異常值概率減 去加權相加之後的正常值概率得到的差值大於設定閾值,則確定第k幀發生異常事件; 其中,k為正整數。
5. 如權利要求4所述的三維卷積神經網絡的訓練方法,其特徵在於,所述將所有包含 第k幀的視頻幀序列中的所有特徵塊的異常檢測結果中的異常值概率進行加權相加,將包 含第k幀的所有視頻幀序列中的所有特徵塊的異常檢測結果中的正常值概率進行加權相 加之前,還包括: 針對所有包含第k幀的視頻幀序列中的所有特徵塊,將第一特徵塊的的異常檢測結 果中的異常值概率和正常值概率的權值設置為最大值;其中,所述第一特徵塊滿足以下條 件:
其中, L-J 表示向下取整,表示向上取整。
6. -種基於三維卷積神經網絡的視頻異常事件檢測方法,其特徵在於,所述三維卷積 神經網絡中按照正向傳遞過程依次包含第一組至第N組卷積-採樣層,每組卷積-採樣層 中按照正向傳遞過程包含一個卷積層和一個採樣層,第N-1組卷積-採樣層中的採樣層與 第N組卷積-採樣層中的卷積層全連接,N>1 ; 所述基於三維卷積神經網絡的視頻異常事件檢測方法包括: 三維卷積神經網絡接收待檢測視頻序列的特徵塊,針對所述特徵塊執行異常檢測過 程,根據待檢測視頻序列的每個特徵塊的異常事件檢測結果確定所述待檢測視頻序列是否 發生異常事件; 其中,第N組卷積-採樣層中的卷積層上的每個卷積核對第N-1組卷積-採樣層中的 採樣層的所有通道的所有特徵圖的數據進行卷積,並將通過卷積所得到的特徵圖信息輸出 給第N組卷積-採樣層中的採樣層進行採樣處理。
7. 如權利要求6所述的基於三維卷積神經網絡的視頻異常事件檢測方法,其特徵在 於,所述三維卷積神經網絡接收待檢測視頻序列的特徵塊之前,還包括: 對待檢測的第i幀至第i+1幀的視頻幀序列進行特徵提取,並將所述第i幀至第i+1 幀的視頻幀序列切割為RXCX 1的多個特徵塊;其中,i、1、R、C均為大於1的整數,R和C 分別表示特徵塊的長度和寬度。
8. 如權利要求6所述的基於三維卷積神經網絡的視頻異常事件檢測方法,其特徵在 於,所述異常事件檢測結果中包括異常值概率和正常值概率; 所述根據待檢測視頻序列的每個特徵塊的異常事件檢測結果確定所述待檢測視頻序 列是否發生異常事件,包括: 若所述待檢測視頻序列的特徵塊中至少有一個特徵塊滿足以下條件,則確定所述待檢 測視頻序列發生異常事件:異常值概率減去正常值概率得到的差值大於設定閾值。
9. 如權利要求7所述的基於三維卷積神經網絡的視頻異常事件檢測方法,其特徵在 於,所述異常事件檢測結果中包括異常值概率和正常值概率; 所述根據待檢測視頻序列的每個特徵塊的異常事件檢測結果確定所述待檢測視頻序 列是否發生異常事件,包括: 將所有包含第k幀的視頻幀序列中的所有特徵塊的異常檢測結果中的異常值概率進 行加權相加,將包含第k幀的所有視頻幀序列中的所有特徵塊的異常檢測結果中的正常值 概率進行加權相加; 其中,所述所有包含第k幀的視頻幀序列是通過具有1幀時間長度的滑動窗口每次移 動單幀得到的; 針對所有包含第k幀的視頻幀序列中的所有特徵塊,若加權相加之後的異常值概率減 去加權相加之後的正常值概率得到的差值大於設定閾值,則確定第k幀發生異常事件; 其中,k為正整數。
10. 如權利要求9所述的基於三維卷積神經網絡的視頻異常事件檢測方法,其特徵在 於,所述將所有包含第k幀的視頻幀序列中的所有特徵塊的異常檢測結果中的異常值概率 進行加權相加,將包含第k幀的所有視頻幀序列中的所有特徵塊的異常檢測結果中的正常 值概率進行加權相加之前,還包括: 針對所有包含第k幀的視頻幀序列中的所有特徵塊,將第一特徵塊的的異常檢測結 果中的異常值概率和正常值概率的權值設置為最大值;其中,所述第一特徵塊滿足以下條 件:
11. 一種基於三維卷積神經網絡的視頻異常事件檢測裝置,其特徵在於,包括: 存儲單元,用於被配置以存儲三維卷積神經網絡的模型的描述信息,所述三維卷積神 經網絡中按照正向傳遞過程依次包含第一組至第N組卷積-採樣層,每組卷積-採樣層中 按照正向傳遞過程包含一個卷積層和一個採樣層,第N-1組卷積-採樣層中的採樣層與第 N組卷積-採樣層中的卷積層全連接,N>1 ; 接收單元,用於在正向傳遞過程中和視頻異常事件檢測過程中接收待檢測視頻序列的 特徵塊; 檢測單元,用於在正向傳遞過程中和視頻異常事件檢測過程中針對所述特徵塊執行異 常檢測過程, 異常事件確定單元,用於在正向傳遞過程中和視頻異常事件檢測過程中根據待檢測視 頻序列的每個特徵塊的異常事件檢測結果確定所述待檢測視頻序列是否發生異常事件; 其中,第N組卷積-採樣層中的卷積層上的每個卷積核對第N-1組卷積-採樣層中的 採樣層的所有通道的所有特徵圖的數據進行卷積,並將通過卷積所得到的特徵圖信息輸出 給第N組卷積-採樣層中的採樣層進行採樣處理; 輸出處理單元:在所述反向傳遞過程中:根據所述正向傳遞過程的輸出結果,在所述 三維卷積神經網絡中執行反向傳遞過程,以修正所述三維卷積神經網絡的模型參數。
12. 如權利要求11所述的裝置,其特徵在於,還包括特徵塊生成單元, 用於對待檢測的第i幀至第i+1幀的視頻幀序列進行特徵提取,並將所述第i幀至第 i+1幀的視頻幀序列切割為RXCX1的多個特徵塊;其中,i、1、R、C均為大於1的整數,R 和C分別表示特徵塊的長度和寬度。
13. 如權利要求11所述的裝置,其特徵在於,所述異常事件檢測結果中包括異常值概 率和正常值概率; 所述異常事件確定單元,具體用於: 若所述待檢測視頻序列的特徵塊中至少有一個特徵塊滿足以下條件,則確定所述待檢 測視頻序列發生異常事件:異常值概率減去正常值概率得到的差值大於設定閾值。
14. 如權利要求12所述的裝置,其特徵在於,所述異常事件檢測結果中包括異常值概 率和正常值概率; 所述異常事件確定單元,具體用於: 將所有包含第k幀的視頻幀序列中的所有特徵塊的異常檢測結果中的異常值概率進 行加權相加,將包含第k幀的所有視頻幀序列中的所有特徵塊的異常檢測結果中的正常值 概率進行加權相加; 其中,所述所有包含第k幀的視頻幀序列是通過具有1幀時間長度的滑動窗口每次移 動單幀得到的; 針對所有包含第k幀的視頻幀序列中的所有特徵塊,若加權相加之後的異常值概率減 去加權相加之後的正常值概率得到的差值大於設定閾值,則確定第k幀發生異常事件; 其中,k為正整數。
15.如權利要求14所述的裝置,其特徵在於,所述異常事件確定單元,還用於: 針對所有包含第k幀的視頻幀序列中的所有特徵塊,將第一特徵塊的的異常檢測結 果中的異常值概率和正常值概率的權值設置為最大值;其中,所述第一特徵塊滿足以下條 件:
【文檔編號】G06K9/46GK104281858SQ201410469780
【公開日】2015年1月14日 申請日期:2014年9月15日 優先權日:2014年9月15日
【發明者】田永鴻, 史業民, 王耀威, 黃鐵軍 申請人:中安消技術有限公司, 北京大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀