一種基於頻域的視頻流模糊檢測方法
2023-07-19 16:03:16
一種基於頻域的視頻流模糊檢測方法
【專利摘要】一種基於頻域的視頻流模糊檢測方法,包括如下步驟:對輸入視頻流按照場景不同進行分割,計算運動矢量;計算視頻塊的DCT係數,並統計出整幀各個頻率分量的非零DCT係數個數矩陣A1;計算視頻塊的主導方向角度;計算視頻塊主導方向的後驗概率密度;計算出權重值,構造初始權重矩陣,對初始權重矩陣中的各個參數作對應調整,得到權重矩陣;計算幀清晰指數和塊清晰指數,並對和作歸一化;由和歸一化後的清晰指數求出模糊指數,確定整個場景的全局模糊閥值,判斷出全局模糊幀和局部模糊幀。本發明大大減少了算法運算複雜度與所需內存空間,能準確檢測出全局模糊幀和局部模糊幀並定量判斷模糊程度;適用於各種視頻流尤其是體育運動視頻流的模糊檢測。
【專利說明】一種基於頻域的視頻流模糊檢測方法
【技術領域】
[0001] 本發明屬於計算機軟體算法領域,涉及視頻圖像處理技術,特別是一種基於頻域 的視頻流模糊檢測方法。
【背景技術】
[0002] 隨著三網融合的最主要應用--"泛視頻"產業的蓬勃發展,大量非專業攝影視頻 數據如泉水般突湧出來,並被廣泛地應用於手機視頻、CMMB (中國移動多媒體廣播)手機電 視、IPTV (Internet Protocol Television)和網際網路視頻業務。然而由於普通攝影器材 的局限性以及廣大攝影愛好者拍攝技術的參差不齊,使得非專業攝影採集到的視頻流質量 差異巨大,難於只經過簡單的常規後期處理就直接應用於節目製作、壓縮存儲、視頻傳輸和 視頻搜索等業務。
[0003] 模糊,尤其運動模糊是泛視頻中最常見最頭痛的問題;競技體育視頻中,運動模糊 更是最普遍的現象。因此作為視頻預處理技術之一的自動模糊檢測技術倍受關注。該技術 能為視頻編輯、視頻搜索和視頻壓縮等技術的實施帶來方便,並為上述技術改進提供素材、 開闢創新觀點。視頻模糊檢測是一項判斷視頻幀是否模糊、模糊程度是多少的技術。在視 頻非線性編輯領域模糊檢測技術能協助視頻預處理人員丟棄模糊程度大的視頻幀,提高編 輯效率;在視頻搜索領域模糊檢測技術能提高關鍵幀和重要區域檢測與提取效能,從而大 大改進搜索技術的準確性和實時性;在視頻壓縮領域模糊檢測技術能檢測出模糊幀與模糊 區域,針對模糊幀和模糊區域的特殊編碼模式(如:模糊幀不能作為參考幀編碼、模糊區域 採用大量化步長)能進一步推動基於視頻內容的智能壓縮技術的深化改革與日趨成熟;在 視頻傳輸領域模糊檢測能協助預測編碼後的碼率,從而為實現泛視頻在通信網絡和數字終 端的智能高效傳輸添磚加瓦。
[0004] 現有的視頻模糊檢測技術大多是基於視頻幀像素的統計參數判斷,比如像素的自 相關函數、熵、灰度值變化情況、梯度值、能量、密度函數。其中Stefan Roth和Zhu提出的 用整幀圖像的灰度梯度呈現出的重尾分布(如圖1所示,大量灰度梯度值集中於小值區域 形成比後重的拖尾,少量灰度梯度值具有顯著的大值形成尖峰。當圖像清晰時灰度梯度分 布會呈現出後重寬大的拖尾,圖像越模糊拖尾越窄越薄)進行模糊檢測能有效地判斷出兩 個視頻幀誰更具有全局模糊,用視頻幀中各物體部分的灰度梯度的重尾分布進行模糊檢測 能有效地判斷出兩個視頻幀中相同物體部分誰更具局部模糊。該方案首先對同一場景的視 頻流進行背景建模,然後提取運動目標,當運動目標區域比例s (s=前景物體區域大小/視 頻幀大小)小於閥值?;時認為該視頻幀沒有運動目標而結束模糊檢測;當s大於?\時認為 整個視頻幀都是運動目標,從而用整幀圖像灰度梯度的重尾分布確定該視頻幀是否具有全 局模糊;當s小於?\大於?;時認為該視頻幀有部分運動目標,從而用部分運動目標的重尾 分布確定該視頻幀是否具有局部模糊。
[0005] 在頻域進行模糊檢測的方法中Karl S. Ni和Hanghang Tong提出的方法具有代 表性,該方案通過哈爾小波變換來分析整幅視頻圖像的邊緣類型和尖銳程度,並與清晰的 參考圖像進行比較從而判斷被檢測視頻圖像是否模糊,及模糊程度如何。
[0006] Stefan Roth和Zhu提出的灰度梯度重尾分布方案有如下缺點:1.運算複雜耗時 對同一場景的視頻流進行背景建模需要幾十到上百幅視頻幀進行大量的迭代運算,有時算 法會不收斂從而得不到該場景的背景圖像,最終導致檢測方案失敗。2.所需內存大、成本 高背景重構和運動目標提取工作需要將幾十至上百幅未壓縮的視頻幀放入內存進行處 理,以CIF大小(352X288)的視頻為例所需存儲空間100MB,而普通高清視頻(1920X1080) 則需要1.6GB的存儲空間。3.檢測準確度不夠高不同內容不同清晰度的視頻幀可能會有 近似的灰度梯度分布4.僅適用於固定攝像頭的監測視頻的模糊檢測,不適用於普通視頻尤 其是體育競技視頻的模糊檢測。
[0007] Karl S. Ni和Hanghang Tong提出的哈爾小波變換分析方案有如下缺點:1.只 能檢測視頻幀的全局模糊,不能檢測出視頻幀的局部模糊。2.需要清晰的內容相同或相近 的視頻巾貞作為參考判斷。
【發明內容】
[0008] 為克服現有視頻圖像模糊檢測方法運算量大,所需佔用硬體存儲設備容量巨大, 需要清晰參考幀的技術缺陷,本發明公開了一種基於頻域的視頻流模糊檢測方法。
[0009] 本發明所述基於頻域的視頻流模糊檢測方法一種基於頻域的視頻流模糊檢測方 法,包括如下步驟: 51. 對輸入視頻流按照場景不同進行分割,對同一場景的視頻幀按照從左到右、從上 到下的順序分為若干BxXB y大小的視頻塊,Bx、By分別表示水平和垂直方向視頻塊中像素點 個數,計算視頻塊的DCT係數,並統計出整幀各個頻率分量的非零DCT係數個數矩陣A1 ;按 照(1)式,計算視頻塊的主導方向特徵,並取與(1)式計算值最接近的劃分角度作為主導方 向角度;
【權利要求】
1. 一種基於頻域的視頻流模糊檢測方法,其特徵在於,包括如下步驟:
51. 對輸入視頻流按照場景不同進行分割,對同一場景的視頻幀按照從左到右、從上 到下的順序分為若干BxXB y大小的視頻塊,Bx、By分別表示水平和垂直方向視頻塊中像素點 個數,計算視頻塊的DCT係數,並統計出整幀各個頻率分量的非零DCT係數個數矩陣A1 ;按 照(1)式,計算視頻塊的主導方向特徵,並取與(1)式計算值最接近的劃分角度作為主導方 向角度;
其中F(0, j)與F(i,0)為DCT係數,所述劃分角度為: 0,1*360° /B,2* 360° /B,…(B-l)*360° /B;B 為角度劃分參數;
52. 按照(2)式計算視頻塊主導方向的後驗概率密度;
其中
為針對內容content的概率,
為該主導方向角度〃的概率;根據 Α-- ?.?ι按內容和主導角度對視頻幀的每個塊進行分類,統計得到各種分類各個頻率 分量下的非零DCT係數個數矩陣Α2 ; 按照(3)式對同一場景不同視頻幀的分塊進行運動矢量計算找出同一場景視頻幀中各 類塊的匹配塊;
(3) 其中s表示當前視頻幀的像素值,c表示參考視頻幀的像素值,MVX、MVy分別表示水平 或垂直運動矢量,Bx、By分別表示水平和垂直方向視頻塊中像素點個數,SAD 表示對括 號內的內容計算絕對誤差和;min 表示取最小值;
53. 按照(4)式計算出權重值,
(4) 其中奮+*|·為權重調整函數; 構造B階矩陣作為初始權重矩陣,將根據(4)式得到的權重值對初始權重矩陣中的各 個參數作對應調整,得到最終權重矩陣;
54. 用步驟S1統計出的整幀各個頻率分量的非零DCT係數個數矩陣A1乘以該幀的權 重矩陣得到幀清晰指數用步驟S2統計出的各類視頻塊各個頻率分量下的非零DCT系 數個數矩陣A2乘以其相應的權重矩陣得到各視頻塊的塊清晰指數,並對元^.和作 歸一化;
55. 由匕和+?...歸一化後的清晰指數求出模糊指數,根據模糊指數分布將場景中的 各個幀分為清晰幀與非清晰幀兩類,以非清晰幀中的最大模糊指數作為該整個場景的全局 模糊閥值DTA ; 再根據各類匹配塊的模糊指數分布分為清晰塊和非清晰塊,以非清晰塊中的最大模糊 指數作為該類視頻塊的局部模糊閥值DTP ; 對每一個視頻幀的模糊指數與全局模糊閥值DTA進行比較,超過DTA閥值則視為全局 模糊幀,模糊指數與模糊閥值的比值計為全局模糊程度;對每一類視頻塊的模糊指數與該 類的局部模糊閥值DTP進行比較,超過DTP閥值視為模糊塊,當模糊塊的個數超過佔整個視 頻幀總塊數的C%時,視該幀為局部模糊幀,所述C為預設的局部模糊幀比例判斷閥值,各塊 模糊指數與對應的局部模糊閥值比值的平均值計為局部模糊程度。
2. 如權利要求1所述的基於頻域的視頻流模糊檢測方法,其特徵在於,所述步驟S1、S3 中角度劃分參數B=8,所述劃分角度為0°、45°、90°、135°、180°、225°、270°、315° ; 所述(4)式為:
3. 如權利要求1所述的基於頻域的視頻流模糊檢測方法,其特徵在於,所述步驟S2中 根據按內容和主導角度對視頻幀的每個塊進行分類。
4. 如權利要求1所述的基於頻域的視頻流模糊檢測方法,其特徵在於,所述步驟S5中 將清晰幀與非清晰幀、清晰塊與非清晰塊的模糊指數分成兩類的方法為K-中心點聚類法。
5. 如權利要求1所述的基於頻域的視頻流模糊檢測方法,其特徵在於,所述C=15至 40。
【文檔編號】H04N17/00GK104301722SQ201410607582
【公開日】2015年1月21日 申請日期:2014年11月3日 優先權日:2014年11月3日
【發明者】鄔震宇, 沈曉峰, 萬群, 馮健, 周代英 申請人:電子科技大學