新四季網

一種視頻內容去重的處理方法

2023-06-16 15:18:46 3

一種視頻內容去重的處理方法
【專利摘要】本發明涉及一種視頻內容去重的處理方法,所述的視頻內容去重的處理方法包括如下步驟:(1)根據視頻的時長進行排序形成鍊表;(2)在設置的窗口內,計算所述鍊表中的視頻與待驗視頻的時長相似度;如所述時長相似度達到設定的閾值範圍,執行步驟(3);否則,將所述待驗視頻插入到所述鍊表中;(3)在所述的窗口內進一步計算其他元數據相似度,並結合所述時長相似度和所述其他元數據相似度,所述其他元數據包括:視頻標題、標籤、關鍵詞、上傳時間、文件大小,判定所述鍊表中是否已存在所述的待驗視頻;如所述鍊表中不存在所述的待驗視頻,將所述待驗視頻插入到所述鍊表中;否則,放棄該待驗視頻。該處理方法在降低計算複雜度的同時,能保障視頻內容去重處理的有效性。
【專利說明】一種視頻內容去重的處理方法

【技術領域】
[0001] 本發明涉及多媒體通信領域,特別涉及一種視頻內容去重的處理方法。

【背景技術】
[0002] 網際網路視頻業務中,在視頻獲取、搜索、推薦時,如何識別出高相似度視頻成為限 制硬體資源節省、用戶體驗的提高。
[0003] 現有的視頻去重處理方法有下面幾種:
[0004] (1)根據視頻文件MD5值去重。為了完整性校驗和版權保護,每個視頻文件中都 保存有一個MD5值,具有相同的MD5值的視頻可以認為是同一視頻。這種方法的局限性在 於,只能識別出具有完全相同來源的視頻,視頻經過轉碼後MD5值就會變化,而且無法識別 出內容高度相似的視頻。
[0005] (2)根據視頻文本元數據信息去重,最常用的是基於向量空間模型(VSM)的方 法,根據視頻的描述信息提取出視頻的文本特徵,為視頻建立一個文本向量空間模型:
[term, weight;.......],term是提取出的視頻文本特徵tag, weight是這個tag的權重。 在為每個視頻建立文本向量空間模型後,計算兩個向量的距離就得到了對於視頻相似度的 度量,計算向量距離的方法有很多,例如餘弦定理、歐式距離、曼哈頓距離、漢明距離等;這 種方法的計算時間複雜度為θ (η2),面對大量的網際網路視頻,計算代價太大;
[0006] (3)根據視頻內容去重,視頻內容並不能完全由元數據信息來衡量,視頻是由一幀 一幀的圖像組成的,可以通過關鍵幀的圖像匹配來計算視頻的相似度,但是這種方法也存 在不足,首先,這種方法的計算時間複雜度為θ (η2),而且單個相似度的計算量過於複雜, 不具有實際工程應用性;其次,有些視頻內容具有很高的相似性,但是由於拍攝期間或者後 期處理等的差異性,使得關鍵幀不相同造成漏識別。
[0007] 在已公開的專利中,申請號:201210239076. 0的中國專利公開了"一種網際網路資 源去重的處理方法及系統",該方法利用資源包名和資源的名字進行去重,但不適合網際網路 視頻剔重。


【發明內容】

[0008] 本發明的目的在於,為了克服現有的視頻去重處理方法存在著上述使用的局限 性,本發明提供一種視頻內容去重的處理方法,該處理方法在降低計算複雜度的同時,能保 障視頻內容去重處理的有效性。
[0009] 為實現上述目的,本發明提供一種視頻內容去重的處理方法,所述的視頻內容去 重的處理方法包括如下步驟:
[0010] (1)根據視頻的時長進行排序形成鍊表;
[0011] (2)在設置的窗口內,計算所述鍊表中的視頻與待驗視頻的時長相似度;如所述時 長相似度達到設定的閾值範圍,執行步驟(3);否則,將所述待驗視頻插入到所述鍊表中;
[0012] (3)在所述的窗口內進一步計算其他元數據相似度,所述其他元數據包括:視頻標 題、標籤、關鍵詞、上傳時間、文件大小,並結合所述時長相似度和所述其他元數據相似度, 判定所述鍊表中是否已存在所述的待驗視頻;如所述鍊表中不存在所述的待驗視頻,將所 述待驗視頻插入到所述鍊表中;否則,放棄該待驗視頻。
[0013] 作為上述技術方案的進一步改進,所述判定的方法為:
[0014] (1)對所述時長相似度和其他元數據相似度進行加權,得出總相似度;
[0015] (2)如所述總相似度達到設定的閾值範圍,則所述鍊表中已存在所述的待驗視頻, 否則,所述鍊表中不存在所述的待驗視頻。
[0016] 作為上述技術方案的進一步改進,所述窗口的設置方法包括:靜態設置和動態設 置;所述靜態設置按時長或數量設置窗口;所述動態設置按鍊表不同區間視頻數目和鍊表 視頻總數目,或鍊表密度,或待比較的視頻時長設置窗口。
[0017] 作為上述技術方案的進一步改進,所述鍊表按所述視頻的時長的粗細粒度進行排 序形成多層桶結構,所述多層桶包括粗粒度桶和細粒度桶,該粗粒度桶由多個細粒度桶組 成;每個粗粒度桶均按時長通過計數排序算法排序組成一個鍊表,所有細粒度桶按視頻時 長排序組成一個總鍊表。
[0018] 本發明的一種視頻內容去重的處理方法的優點在於:
[0019] 1.由於視頻的時長是一個區分性很高元數據,本發明只計算窗口內的待驗視頻的 時長相似度,結合鍊表按所述視頻的時長的粗細粒度進行計數排序形成多層桶結構,計算 複雜度從θ (η2)降低到〇 (η);進一步結合其他元數據相似性,提高了識別率。
[0020] 2.根據去重處理的需要,窗口可以動態調整,保障了視頻內容去重處理的有效性。

【專利附圖】

【附圖說明】
[0021] 圖1是本發明的一種視頻內容去重的處理方法的流程圖。
[0022] 圖2是本發明的一種視頻內容去重的處理方法的多層桶結構示意圖。

【具體實施方式】
[0023] 下文將結合附圖和【具體實施方式】對本發明作進一步的說明。
[0024] 如圖1所示,本發明提供一種視頻內容去重的處理方法,所述的視頻內容去重的 處理方法包括如下步驟:
[0025] 101)根據視頻的時長進行排序形成鍊表,當一個待驗視頻要插入所述鍊表中時, 進入102);
[0026] 102)在設置的窗口內,計算所述鍊表中的視頻與待驗視頻的時長相似度,進入 103);
[0027] 103)判斷所述時長相似度是否達到設定的閾值範圍,如果達到,進入104),否則, 進入108);
[0028] 104)在所述的窗口內進一步計算其他元數據相似度,所述其他元數據包括:視頻 標題、標籤、關鍵詞、上傳時間、文件大小,進入105);
[0029] 105)結合所述時長相似度和所述其他元數據相似度,判定所述鍊表中是否已存在 所述的待驗視頻;所述的判定可採用對所述時長相似度和其他元數據相似度進行加權,得 出總相似度的方法;在本實施中僅以上述方法為例進行判定,進入106);
[0030] 106)比較步驟105)中得到的總相似度,如果總相似度達到設定閥值,則表明所述 鍊表中存在與待驗視頻相同的視頻,進入107);否則,表明所述鍊表中不存在與待驗視頻相 同的視頻,進入108);
[0031] 107)放棄所述待驗視頻,進入109);
[0032] 108)將所述待驗視頻插入到所述鍊表中,進入109);
[0033] 109)本待驗視頻去重執行完畢,下一個待驗視頻去重開始。
[0034] 基於上述實施例,所述窗口的設置方法可通過靜態設置和動態設置;所述靜態設 置按時長或數量設置窗口;所述動態設置按鍊表不同區間視頻數目和鍊表視頻總數目,或 鍊表密度,或待比較的視頻時長設置窗口。
[0035] 如圖2所示,所述鍊表可按所述視頻的時長的粗細粒度進行排序形成多層桶結 構,所述多層桶包括粗粒度桶和細粒度桶,該粗粒度桶由多個細粒度桶組成;每個粗粒度桶 均按時長通過計數排序算法排序組成一個鍊表,所有細粒度桶按視頻時長排序組成一個總 鍊表。在本實施例中,所述鍊表的排序結構採用二層桶模型,所述視頻的時長的粗細粒度分 別以小時和分鐘劃分。
[0036] 最後所應說明的是,以上實施例僅用以說明本發明的技術方案而非限制。儘管參 照實施例對本發明進行了詳細說明,本領域的普通技術人員應當理解,對本發明的技術方 案進行修改或者等同替換,都不脫離本發明技術方案的精神和範圍,其均應涵蓋在本發明 的權利要求範圍當中。
【權利要求】
1. 一種視頻內容去重的處理方法,其特徵在於,所述的視頻內容去重的處理方法包括 如下步驟: (1) 根據視頻的時長進行排序形成鍊表; (2) 在設置的窗口內,計算所述鍊表中的視頻與待驗視頻的時長相似度;如所述時長相 似度達到設定的閾值範圍,執行步驟(3);否則,將所述待驗視頻插入到所述鍊表中; (3) 在所述的窗口內進一步計算其他元數據相似度,所述其他元數據包括:視頻標題、 標籤、關鍵詞、上傳時間、文件大小,並結合所述時長相似度和所述其他元數據相似度,判定 所述鍊表中是否已存在所述的待驗視頻;如所述鍊表中不存在所述的待驗視頻,將所述待 驗視頻插入到所述鍊表中;否則,放棄該待驗視頻。
2. 根據權利要求1所述的視頻內容去重的處理方法,其特徵在於,所述判定的方法為: (1) 對所述時長相似度和其他元數據相似度進行加權,得出總相似度; (2) 如所述總相似度達到設定的閾值範圍,則所述鍊表中已存在所述的待驗視頻,否 貝1J,所述鍊表中不存在所述的待驗視頻。
3. 根據權利要求1所述的視頻內容去重的處理方法,其特徵在於,所述窗口的設置方 法包括:靜態設置和動態設置;所述靜態設置按時長或數量設置窗口;所述動態設置按鏈 表不同區間視頻數目和鍊表視頻總數目,或鍊表密度,或待比較的視頻時長設置窗口。
4. 根據權利要求1所述的視頻內容去重的處理方法,其特徵在於,所述鍊表按所述視 頻的時長的粗細粒度進行排序形成多層桶結構,所述多層桶包括粗粒度桶和細粒度桶,該 粗粒度桶由多個細粒度桶組成;每個粗粒度桶均按時長通過計數排序算法排序組成一個鏈 表,所有細粒度桶按視頻時長排序組成一個總鍊表。
【文檔編號】G06F17/30GK104216925SQ201310221597
【公開日】2014年12月17日 申請日期:2013年6月5日 優先權日:2013年6月5日
【發明者】劉學, 江佳偉, 徐開誠 申請人:中國科學院聲學研究所, 上海尚恩華科網絡科技股份有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀