一種鏡頭邊界檢測方法
2023-11-02 12:13:42 1
專利名稱:一種鏡頭邊界檢測方法
技術領域:
本發明屬於視頻檢索領域,具體涉及一種鏡頭邊界檢測方法。
背景技術:
在視頻檢索的過程中,鏡頭邊界檢測是整個系統的第一步,鏡頭邊界檢測的準確度和效率的高低,關係到整個視頻檢索系統的成敗,是視頻檢索系統中至關重要的一步。鏡頭邊界檢測的任務就是通過比較視頻序列幀的差異來尋找鏡頭邊界,確定鏡頭變化類型和位置。目前,該領域內解決鏡頭邊界檢測的方法主要是基於閾值和基於機器學習的。基於閾值的方法由於閾值選取的好壞對檢測效果有較大的影響;而且不同的視頻閾值差異很大。這些都限制了閾值方法更進一步提高效果。近年來,基於機器學習的鏡頭邊界檢測方法得到了深入研究。文獻《Temporal videosegmentation using unsupervisedclustering and semantic object tracking》(作者Bilge Gunsel, A. Mufit Ferman,A. Murat Tekalp, J. Electron.1maging 7 (3), 1998, 592-604)中,提取顏色直方圖特徵並計算相鄰幀的幀間差異,接著採用K均值聚類算法對視頻的序列幀進行分類。文獻《Supervisedclassification for video shot segmentation [A]》(作者Y Qi, HauptmannAT Liu, IEEE ICME03[C]。Baltimore, MD, USA, 2003, vol. 2,689-692)中,採用 k 最近鄰域分類、Naive Bayes可能性分類法和支持向量機將視頻序列幀分成切變幀和非切變幀;對非切變幀,又採用小波光滑去噪的方法來檢測漸變幀,從而完成鏡頭邊界的分割。文獻((Algorithm for Shot Boundary Detection basedon Support Vector Machine inCompressed Domain》(作者Jian-Rong Caoand An-Ni Cai,在 Tien Tzu Hsueh Pao/ActaElectronica Sinica,36(l) =203-208,2008)中提出,利用滑動窗口的方法將提取到的壓縮域特徵組成一個多維的特徵向量,對SVM進行訓練,使用訓練好的SVM模型對視頻幀進行分類,從而得到鏡頭的邊界。但是,支持向量機參數的選取至今仍然沒有一個統一的標準,參數選取大多依靠經驗採取試湊的方法,這樣不僅費時而且很難得到滿意的結果;此外,對於鏡頭邊界檢測中對於長漸變鏡頭的檢測一直明顯存在的漏檢問題也沒有很好的方法。。
發明內容
本發明的目的在於解決上述現有技術中存在的難題,提供一種鏡頭邊界檢測方法,使用禁忌搜索算法對支持向量機的參數進行優化,綜合使用上下文特徵向量和基于禁忌搜索優化的支持向量機分類模型,降低參數選擇的盲目性和不準確,而且對於檢測各類鏡頭突變和漸變十分穩定和準確。本發明是通過以下技術方案實現的—種鏡頭邊界檢測方法,基於上下文特徵向量和禁忌搜索算法優化支持向量機實現鏡頭邊界檢測。
所述方法包括以下步驟(I),提取視頻數據的底層特徵提取全局顏色直方圖和小波紋理特徵;(2),計算幾種特定間隔下視頻序列幀的幀間差,將其組成幾種滑動窗口下的上下文特徵向量;(3),使用禁忌搜索算法優化支持向量機分類模型;(4),利用得到的近似最優參數訓練得到最優分類模型,並以此為基礎對視頻序列幀進行分類,最終完成鏡頭分割;所述近似最優參數包括懲罰因子C和核函數參數Y。所述步驟(I)中的提取全局顏色直方圖是這樣實現的通過計算每個顏色區間的像素值個數來統計得到;對於原始的視頻序列幀,需要提取並計算每一個通道下的顏色直方圖區間值,採用X 2距離來計算幀間差異值,根據下式進行
權利要求
1.一種鏡頭邊界檢測方法,其特徵在於所述方法基於上下文特徵向量和禁忌搜索算法優化支持向量機實現鏡頭邊界檢測。
2.根據權利要求I所述的鏡頭邊界檢測方法,其特徵在於 所述方法包括以下步驟 (1),提取視頻數據的底層特徵提取全局顏色直方圖和小波紋理特徵; (2),計算幾種特定間隔下視頻序列幀的幀間差,將其組成幾種滑動窗口下的上下文特徵向量; (3),使用禁忌搜索算法優化支持向量機分類模型; (4),利用得到的近似最優參數訓練得到最優分類模型,並以此為基礎對視頻序列幀進行分類,最終完成鏡頭分割;所述近似最優參數包括懲罰因子C和核函數參數Y。
3.根據權利要求2所述的鏡頭邊界檢測方法,其特徵在於所述步驟(I)中的提取全局顏色直方圖是這樣實現的通過計算每個顏色區間的像素值個數來統計得到;對於原始的視頻序列幀,需要提取並計算每一個通道下的顏色直方圖區間值,採用X2距離來計算幀間差異值,根據下式進行
4.根據權利要求2所述的鏡頭邊界檢測方法,其特徵在於所述步驟(I)中的提取小波紋理特徵是這樣實現的 首先,使用三層小波變換對原始幀進行分解,分解得到的結果如下
5.根據權利要求2所述的鏡頭邊界檢測方法,其特徵在於所述步驟(3)具體如下 (3.A),初始解和適應度函數(C(I,Ytl)代表隨機產生的一個初始解,採用f(c,y)=accuracy作為適應度函數來計算適應度值,式中的c和、分別是支持向量機中的懲罰因子和核函數參數; (3. B),鄰域解和禁忌對象在初始解(C(l,Y0)周圍能夠得到很多組鄰域解(C,Y),通過初始預測每組解都會得到一個相應的適應度值;鄰域解的生成策略是以初始解為中心,根據劃定的一個預定範圍在其中隨機生成一定變化步長的解;適應度值的計算應用了支持向量機的交叉驗證策略; (3. C),候選集生成每一代根據適應度值的情況從鄰域解中選取; (3. D),禁忌表的生成每代中最好的解都放入到禁忌表中,在接下來若干代的迭代中所述最好的解被禁忌使用; (3. E),對禁忌表中的解的特赦如果禁忌解對應的適應度值比到現在為止最好的適應度值更大,那麼允許其從禁忌表中逃逸;另外,每隔若干代的迭代,之前放入到禁忌表中的最優解也會被釋放出來; (3. F),如果達到最大迭代次數或者得到了足夠好的適應度解,則停止迭代)。
6.根據權利要求2所述的鏡頭邊界檢測方法,其特徵在於所述步驟(4)是這樣實現的 使用支持向量機的分類函數svmpredict,將測試集的所有數據劃分為三類,分別對應突變幀、漸變幀和普通幀,這樣也就完成了鏡頭分割。
全文摘要
本發明提供了一種鏡頭邊界檢測方法,屬於視頻檢索領域。所述方法基於上下文特徵向量和禁忌搜索算法優化支持向量機實現鏡頭邊界檢測,包括以下步驟(1)提取視頻數據的底層特徵;(2)計算幾種特定間隔下視頻序列幀的幀間差,將其組成幾種滑動窗口下的上下文特徵向量;(3)使用禁忌搜索算法優化支持向量機分類模型;(4)利用得到的近似最優參數訓練得到最優分類模型,並以此為基礎對視頻序列幀進行分類,最終完成鏡頭分割。本發明方法避免了傳統支持向量機選取參數時的盲目性和低效率,能夠一次性準確地得到近似最優參數,而且能夠保證不陷入局部最優的麻煩。
文檔編號G06K9/62GK102982553SQ201210574509
公開日2013年3月20日 申請日期2012年12月21日 優先權日2012年12月21日
發明者孫學梅, 趙龍 申請人:天津工業大學