新四季網

視頻索引表的創建方法和裝置,視頻的推薦方法和裝置製造方法

2023-06-15 00:56:16 2

視頻索引表的創建方法和裝置,視頻的推薦方法和裝置製造方法
【專利摘要】本發明提供了一種視頻索引表的創建方法和裝置,視頻的推薦方法和裝置,以解決由於推薦的視頻無序、缺失、不準確的問題。視頻索引表的創建方法包括:獲取多個UGC視頻及各UGC視頻的視頻ID;對UGC視頻進行聚類,針對各個聚類分配視頻聚類ID;針對各個聚類中的UGC視頻生成描述信息,對描述信息進行排序;採用排序後的描述信息生成UGC視頻推薦列表;採用視頻ID和對應的視頻聚類ID創建第一級索引表,採用視頻聚類ID和對應的UGC視頻推薦列表創建第二級索引表。由於視頻推薦列表中包括進行聚類後的UGC視頻的描述信息,因此描述信息更加全面,解決了缺少某些集數的問題,對描述信息進行了排序,解決了順序混亂的問題。
【專利說明】視頻索引表的創建方法和裝置,視頻的推薦方法和裝置
【技術領域】
[0001]本發明涉及多媒體【技術領域】,特別是涉及一種視頻索引表的創建方法和裝置,以及一種視頻的推薦方法和裝置。
【背景技術】
[0002]UGC全稱為User Generated Content,也就是用戶生成內容的意思。UGC的概念最早起源於網際網路領域,即用戶將自己原創的內容通過網際網路平臺進行展示或者提供給其他用戶共享。UGC是伴隨著以提倡個性化為主要特點的Web2.0概念興起的。UGC並不是某一種具體的業務,而是一種用戶使用網際網路的新方式,即由原來的以下載為主變成下載和上傳並重。好友社交網絡、視頻分享網絡、知識分享網絡、社區、論壇、微博等都是UGC的主要應用形式。
[0003]UGC視頻是指用戶自己生成的,並且通過網際網路技術上傳到各大視頻分享網站的視頻內容。UGC視頻具有海量的特徵,用戶可以通過在視頻分享網站中搜索觀看其他用戶上傳的UGC視頻。在用戶觀看某一個UGC視頻時,該視頻分享網站可以向用戶推薦一些與當ill觀看的UGC視頻相關的視頻。
[0004]但是,目前各大視頻分享網站中大量用戶上傳的UGC視頻非常扁平化,缺少嚴謹的信息結構。因此,在向用戶推薦相關UGC視頻時,所推薦的視頻順序混亂,並且可能會缺少某些視頻,甚至所推薦的視頻與當前觀看的視頻不屬於同一個類別。例如,針對某一個電視劇類的UGC視頻,在推薦時展現的劇集順序混亂、缺少某些集數等,從而使得用戶需要繁雜的藉助搜尋引擎進行劇集定位。
[0005]因此,目前的UGC視頻推薦技術中存在推薦的視頻無序、缺失、視頻不準確等缺陷,導致繁瑣地進行搜索定位過程,無形中增加用戶的流失率。

【發明內容】

[0006]本發明提供了一種視頻索引表的創建方法和裝置,以及一種視頻的推薦方法和裝置,以解決目前的UGC視頻推薦技術中存在推薦的視頻無序、缺失、視頻不準確等缺陷,導致繁瑣地進行搜索定位過程,無形中增加用戶的流失率的問題。
[0007]為了解決上述問題,本發明公開了一種視頻索引表的創建方法,其特徵在於,包括:
[0008]獲取客戶端上傳的多個用戶生成內容UGC視頻及各個UGC視頻的視頻ID ;
[0009]對所述多個UGC視頻進行聚類,並針對各個聚類分配視頻聚類ID ;
[0010]針對所述各個聚類中的UGC視頻分別生成描述信息,並對所述描述信息進行排序;
[0011]採用所述排序後的描述信息生成UGC視頻推薦列表;
[0012]採用所述視頻ID和對應的視頻聚類ID創建第一級索引表,以及,採用所述視頻聚類ID和對應的UGC視頻推薦列表創建第二級索引表。[0013]優選地,在所述獲取客戶端上傳的多個UGC視頻及各個UGC視頻的視頻ID的步驟之後,還包括:
[0014]分別抽取各個UGC視頻的視頻元數據。
[0015]優選地,所述對所述多個UGC視頻進行聚類的步驟包括:
[0016]分別對每兩個UGC視頻的視頻元數據進行相似度計算;
[0017]將相似度位於預設的相似度區間之內的視頻元數據對應的UGC視頻確定為屬於同一個聚類。
[0018]優選地,所述視頻元數據包括視頻標題;所述針對所述各個聚類中的UGC視頻分別生成描述信息,並對所述描述信息進行排序的步驟包括:
[0019]針對所述各個聚類中的UGC視頻分別按照預設規則從視頻標題中提取視頻集數;
[0020]將UGC視頻的視頻集數確定為該UGC視頻的描述信息;
[0021]針對所述各個聚類中的UGC視頻的視頻集數分別進行升序排序或降序排序。
[0022]優選地,所述視頻元數據包括視頻時長;在所述對所述多個UGC視頻進行聚類的步驟之後,還包括:
[0023]針對所述各個聚類中的UGC視頻分別獲取視頻時長;
[0024]當某個UGC視頻的視頻時長位於預設的時長區間之外時,將該UGC視頻從其所屬的聚類中刪除。
[0025]優選地,所述方法還包括:
[0026]採用所述視頻ID和對應的視頻元數據創建第三級索引表。
[0027]根據本發明的另一方面,還公開了一種視頻的推薦方法,其特徵在於,包括:
[0028]接收客戶端發送的用戶生成內容UGC視頻播放請求,所述播放請求包括目標UGC視頻ID ;
[0029]在預先創建的第一級索引表中查找所述目標UGC視頻ID對應的視頻聚類ID ;所述第一級索引表包括視頻ID和對應的視頻聚類ID ;
[0030]在預先創建的第二級索引表中查找所述視頻聚類ID對應的UGC視頻推薦列表,作為目標UGC視頻推薦列表;所述第二級索引表包括視頻聚類ID和對應的UGC視頻推薦列表;其中,所述視頻聚類ID用於表徵UGC視頻的聚類,所述UGC視頻推薦列表由各個聚類中的UGC視頻排序後的描述信息生成;
[0031]將所述目標UGC視頻推薦列表下發至所述客戶端。
[0032]優選地,所述UGC視頻的描述信息為視頻集數;
[0033]在所述將所述目標UGC視頻推薦列表下發至所述客戶端的步驟之前,還包括:
[0034]在預先創建的第三級索引表中查找所述目標UGC視頻ID對應的視頻元數據;所述第三級索引表包括視頻ID和對應的視頻元數據,所述視頻元數據包括視頻標題;
[0035]按照預設規則從所述視頻標題中提取視頻集數;
[0036]從所述目標UGC視頻推薦列表中截取所述視頻集數之前或之後的部分UGC視頻推薦列表;
[0037]所述將所述目標UGC視頻推薦列表下發至所述客戶端的步驟包括:將所述部分UGC視頻推薦列表下發至所述客戶端。
[0038]優選地,所述排序為升序排序或降序排序;所述從所述目標UGC視頻推薦列表中截取所述視頻集數之前或之後的部分UGC視頻推薦列表的步驟包括:
[0039]如果所述排序為升序排序,則從所述目標UGC視頻推薦列表中截取所述視頻集數之後的部分UGC視頻推薦列表;
[0040]如果所述排序為降序排序,則從所述目標UGC視頻推薦列表中截取所述視頻集數之前的部分UGC視頻推薦列表。
[0041]根據本發明的另一方面,還公開了一種視頻索引表的創建裝置,其特徵在於,包括:
[0042]視頻獲取模塊,用於獲取客戶端上傳的多個用戶生成內容UGC視頻及各個UGC視頻的視頻ID ;
[0043]聚類模塊,用於對所述多個UGC視頻進行聚類,並針對各個聚類分配視頻聚類ID ;
[0044]排序模塊,用於針對所述各個聚類中的UGC視頻分別生成描述信息,並對所述描述信息進行排序;
[0045]生成模塊,用於採用所述排序後的描述信息生成UGC視頻推薦列表;
[0046]第一創建模塊,用於採用所述視頻ID和對應的視頻聚類ID創建第一級索引表;
[0047]第二創建模塊,用於採用所述視頻聚類ID和對應的UGC視頻推薦列表創建第二級索引表。
[0048]優選地,所述裝置還包括:
[0049]抽取模塊,用於在所述視頻獲取模塊獲取客戶端上傳的多個UGC視頻及各個UGC視頻的視頻ID之後,分別抽取各個UGC視頻的視頻元數據。
[0050]優選地,所述聚類模塊包括:
[0051]計算子模塊,用於分別對每兩個UGC視頻的視頻元數據進行相似度計算;
[0052]聚類確定子模塊,用於將相似度位於預設的相似度區間之內的視頻元數據對應的UGC視頻確定為屬於同一個聚類。
[0053]優選地,所述排序模塊包括:
[0054]提取子模塊,用於針對所述各個聚類中的UGC視頻分別按照預設規則從視頻標題中提取視頻集數;
[0055]信息確定子模塊,用於將UGC視頻的視頻集數確定為該UGC視頻的描述信息;
[0056]排序子模塊,用於針對所述各個聚類中的UGC視頻的視頻集數分別進行升序排序或降序排序。
[0057]優選地,所述視頻元數據包括視頻時長;所述裝置還包括:
[0058]時長獲取模塊,用於在所述聚類模塊對所述多個UGC視頻進行聚類之後,針對所述各個聚類中的UGC視頻分別獲取視頻時長;
[0059]視頻刪除模塊,用於當某個UGC視頻的視頻時長位於預設的時長區間之外時,將該UGC視頻從其所屬的聚類中刪除。
[0060]優選地,所述裝置還包括:
[0061]第三創建模塊,用於採用所述視頻ID和對應的視頻元數據創建第三級索引表。
[0062]根據本發明的另一方面,還公開了一種視頻的推薦裝置,其特徵在於,包括:
[0063]接收模塊,用於接收客戶端發送的用戶生成內容UGC視頻播放請求,所述播放請求包括目標UGC視頻ID ;[0064]第一查找模塊,用於在預先創建的第一級索引表中查找所述目標UGC視頻ID對應的視頻聚類ID ;所述第一級索引表包括視頻ID和對應的視頻聚類ID ;
[0065]第二查找模塊,用於在預先創建的第二級索引表中查找所述視頻聚類ID對應的UGC視頻推薦列表,作為目標UGC視頻推薦列表;所述第二級索引表包括視頻聚類ID和對應的UGC視頻推薦列表;其中,所述視頻聚類ID用於表徵UGC視頻的聚類,所述UGC視頻推薦列表由各個聚類中的UGC視頻排序後的描述信息生成;
[0066]下發模塊,用於將所述目標UGC視頻推薦列表下發至所述客戶端。
[0067]優選地,所述UGC視頻的描述信息為視頻集數;所述裝置還包括:
[0068]第三查找模塊,用於在所述下發模塊將所述目標UGC視頻推薦列表下發至所述客戶端之前,在預先創建的第三級索引表中查找所述目標UGC視頻ID對應的視頻元數據;所述第三級索引表包括視頻ID和對應的視頻元數據,所述視頻元數據包括視頻標題;
[0069]提取模塊,用於按照預設規則從所述視頻標題中提取視頻集數;
[0070]截取模塊,用於從所述目標UGC視頻推薦列表中截取所述視頻集數之前或之後的部分UGC視頻推薦列表;
[0071]所述下發模塊,具體用於將所述部分UGC視頻推薦列表下發至所述客戶端。
[0072]優選地,所述排序為升序排序或降序排序;所述截取模塊包括:
[0073]第一截取子模塊,用於在所述排序為升序排序時,從所述目標UGC視頻推薦列表中截取所述視頻集數之後的部分UGC視頻推薦列表;
[0074]第二截取子模塊,用於在所述排序為降序排序時,從所述目標UGC視頻推薦列表中截取所述視頻集數之前的部分UGC視頻推薦列表。
[0075]與現有技術相比,本發明包括以下優點:
[0076]本發明中首先可以對客戶端上傳的多個UGC視頻進行聚類,並針對各個聚類分配視頻聚類ID ;然後針對各個聚類中的UGC視頻分別生成描述信息,並對描述信息進行排序,採用排序後的描述信息生成UGC視頻推薦列表;最後採用UGC視頻的視頻ID和對應的視頻聚類ID創建第一級索引表,以及,採用視頻聚類ID和對應的UGC視頻推薦列表創建第二級索引表。在接收到UGC視頻播放請求後,即可在第一級索引表和第二級索引表中查找到目標UGC視頻ID對應的目標UGC視頻推薦列表,並將其下發至客戶端。由於視頻推薦列表中包括了進行聚類之後的UGC視頻的描述信息,因此這些描述信息更加全面,解決了缺少某些集數的問題;並且對這些描述信息進行了排序,因此解決了順序混亂的問題。
【專利附圖】

【附圖說明】
[0077]圖1是本發明實施例一的一種視頻索引表的創建方法的流程圖;
[0078]圖2是本發明實施例一的一種視頻的推薦方法的流程圖;
[0079]圖3是本發明實施例二的一種視頻索引表的創建方法的流程圖;
[0080]圖4是本發明實施例二的一種視頻的推薦方法的流程圖;
[0081]圖5是本發明實施例三的一種視頻索引表的創建裝置的結構框圖;
[0082]圖6是本發明實施例三的一種視頻的推薦裝置的結構框圖。
【具體實施方式】[0083]為使本發明的上述目的、特徵和優點能夠更加明顯易懂,下面結合附圖和【具體實施方式】對本發明作進一步詳細的說明。
[0084]用戶在視頻分享網站觀看某個UGC視頻時,該網站可以向用戶推薦一些與當前觀看的UGC視頻相關的視頻。但是,目前的視頻推薦技術所推薦的視頻順序混亂,並且可能會缺少某些視頻,甚至所推薦的視頻與當前觀看的視頻不屬於同一個類別,導致需要繁瑣地進行搜索定位過程,無形中增加用戶的流失率。針對上述問題,本發明提出了一種視頻索引表的創建方法和裝置,以及一種視頻的推薦方法和裝置,從而保證推薦給用戶的視頻更加全面、有序,提聞用戶體驗。
[0085]下面,通過以下各個實施例對視頻索引表的創建方法和裝置,以及視頻的推薦方法和裝置分別進行詳細介紹。
[0086]實施例一:
[0087]參照圖1,示出了本發明實施例一的一種視頻索引表的創建方法的流程圖,該方法具體可以包括以下步驟:
[0088]步驟101,獲取客戶端上傳的多個UGC視頻及各個UGC視頻的視頻ID。
[0089]UGC視頻是指用戶自己生成的,並且通過網際網路技術上傳到各大視頻分享網站的視頻內容。UGC視頻具有海量的特徵,用戶可以通過在視頻分享網站中搜索觀看自己或其他用戶上傳的UGC視頻。在用戶通過客戶端上傳UGC視頻後,伺服器即可保存這些UGC視頻,並且,每個UGC視頻還具有一個唯一的視頻標識(ID)。本發明實施例中,可以對伺服器中保存的UGC視頻進行整合,從而為視頻推薦過程提供條件,首先可以獲取客戶端上傳的多個UGC視頻及各個UGC視頻的視頻ID。
[0090]步驟102,對所述多個UGC視頻進行聚類,並針對各個聚類分配視頻聚類ID。
[0091]在獲取到客戶端上傳的多個UGC視頻之後,即可對所述多個UGC視頻進行聚類,因此即可生成至少一個聚類,每個聚類裡都包括有屬於同一類別的至少一個UGC視頻,然後還可以針對各個聚類分配視頻聚類ID,以標識各個聚類。
[0092]步驟103,針對所述各個聚類中的UGC視頻分別生成描述信息,並對所述描述信息進行排序。
[0093]在生成上述至少一個聚類之後,還可以進一步針對各個聚類中的UGC視頻分別生成描述信息,所述描述信息用於描述對應的UGC視頻的特徵,根據該描述信息可以將某個UGC視頻與其他的UGC視頻進行區分。
[0094]步驟104,採用所述排序後的描述信息生成UGC視頻推薦列表。
[0095]針對所述各個聚類中的UGC視頻分別生成描述信息之後,可以對所述描述信息進行排序,排序後的描述信息即可表徵對應的UGC視頻的順序,然後即可採用所述排序後的描述信息生成UGC視頻推薦列表。即針對一個聚類,可以將其中的UGC視頻的描述信息進行排序,並生成一個對應的UGC視頻推薦列表。
[0096]所述UGC推薦視頻列表由進行聚類之後的UGC視頻的描述信息生成,因此所包括的UGC視頻更加全面,並且對描述信息進行了排序,因此生成的即為有序UGC推薦視頻列表。
[0097]步驟105,採用所述視頻ID和對應的視頻聚類ID創建第一級索引表,以及,採用所述視頻聚類ID和對應的UGC視頻推薦列表創建第二級索引表。[0098]根據上述各個步驟,將UGC視頻進行聚類,每個聚類中可以包括至少一個UGC視頻,每個UGC視頻都具有一個視頻ID,每個聚類被分配一個視頻聚類ID。因此,可以採用所述視頻ID和對應的視頻聚類ID創建第一級索引表,一個視頻ID可以對應一個視頻聚類ID,該視頻聚類ID即為該視頻ID對應的UGC視頻所屬聚類的視頻聚類ID ;—個視頻聚類ID可以對應一個或多個視頻ID,該視頻ID即為該視頻聚類ID對應的聚類中的UGC視頻的視頻ID。
[0099]針對每個聚類,還將其中的UGC視頻的描述信息進行排序,並採用排序後的描述信息生成UGC視頻推薦列表。因此,可以採用所述視頻聚類ID和對應的UGC視頻推薦列表創建第二級索引表,一個視頻聚類ID可以對應一個UGC視頻推薦列表,該UGC視頻推薦列表即為該視頻聚類ID對應的聚類中的UGC視頻的描述信息生成的UGC視頻推薦列表。
[0100]在生成上述UGC視頻推薦列表,並創建第一級索引表和第二級索引表之後,即可在進行UGC視頻推薦時,根據第一級索引表和第二級索引表查找對應的UGC視頻推薦列表,並顯示給用戶。
[0101]下面,介紹根據上述圖1所示的視頻索引表的創建方法所創建的視頻索引表進行視頻推薦的方法。
[0102]參照圖2,示出了本發明實施例一的一種視頻的推薦方法的流程圖,該方法具體可以包括以下步驟:
[0103]步驟201,接收客戶端發送的UGC視頻播放請求,所述播放請求包括目標UGC視頻ID0
[0104]用戶在訪問視頻分享網站時,可以請求播放該視頻分享網站的伺服器中所保存的UGC視頻,此時可以通過該視頻分享網站的客戶端向伺服器發送UGC視頻播放請求,該播放請求中可以包括用戶想要播放的目標UGC視頻的視頻ID,即目標UGC視頻ID。
[0105]步驟202,在預先創建的第一級索引表中查找所述目標UGC視頻ID對應的視頻聚類ID。
[0106]在接收到上述UGC視頻播放請求後,即可在預先創建的第一級索引表中查找播放請求中所包括的目標UGC視頻ID對應的視頻聚類ID。所述第一級索引表即可以為上述圖1所示的視頻索引表的創建方法中所創建的第一級索引表,該第一級索引表可以包括視頻ID和對應的視頻聚類ID,因此,根據所述目標UGC視頻ID即可查找到其對應的視頻聚類ID。
[0107]步驟203,在預先創建的第二級索引表中查找所述視頻聚類ID對應的UGC視頻推薦列表,作為目標UGC視頻推薦列表。
[0108]在查找到所述目標UGC視頻ID對應的視頻聚類ID後,還可以在預先創建的第二級索引表中查找所述視頻聚類ID對應的UGC視頻推薦列表。所述第一級索引表即可以為上述圖1所示的視頻索引表的創建方法中所創建的第二級索引表,該第二級索引表可以包括視頻聚類ID和對應的UGC視頻推薦列表;其中,所述視頻聚類ID用於表徵UGC視頻的聚類,所述UGC視頻推薦列表由各個聚類中的UGC視頻排序後的描述信息生成。因此,根據所述視頻聚類ID即可查找到其對應的UGC視頻推薦列表,所查找到的UGC視頻推薦列表即為所述目標UGC視頻ID對應的UGC視頻推薦列表,因此作為目標UGC視頻推薦列表。
[0109]步驟204,將所述目標UGC視頻推薦列表下發至所述客戶端。
[0110]查找到目標UGC視頻推薦列表後,即可將該目標UGC視頻推薦列表下發至所述客戶端,因此在客戶端的顯示界面上即可顯示該目標UGC視頻推薦列表,用戶可以根據該目標UGC視頻推薦列表播放相應的推薦視頻。
[0111]本發明實施例中的視頻推薦列表中包括了進行聚類之後的UGC視頻的描述信息,因此這些描述信息更加全面,解決了缺少某些集數的問題;並且對這些描述信息進行了排序,因此解決了順序混亂的問題。
[0112]下面,通過實施例二具體描述一種視頻索引表的創建方法和一種視頻的推薦方法。
[0113]實施例二:
[0114]參照圖3,示出了本發明實施例二的一種視頻索引表的創建方法的流程圖,該方法具體可以包括以下步驟:
[0115]步驟301,獲取客戶端上傳的多個UGC視頻及各個UGC視頻的視頻ID。
[0116]用戶通過客戶端將UGC視頻上傳至伺服器中,伺服器可以對這些UGC視頻進行保存,其中,每個UGC視頻都對應有一個視頻ID。首先,伺服器可以獲取其所保存的UGC視頻及各個UGC視頻的視頻ID,然後對其進行相關處理,以生成對應的視頻索引表。
[0117]步驟302,分別抽取各個UGC視頻的視頻元數據。
[0118]在獲取到上述多個UGC視頻後,分別抽取各個UGC視頻的視頻元數據,然後根據這些視頻元數據可以對所述多個UGC視頻進行聚類。
[0119]步驟303,對所述多個UGC視頻進行聚類,並針對各個聚類分配視頻聚類ID。
[0120]本發明實施例中,所述視頻元數據可以包括視頻標題、視頻時長、視頻上傳者、視頻類型等信息,可以根據這些視頻元數據對所述多個UGC視頻進行聚類,從而將屬於同一類別的UGC視頻聚集在一起。例如,如果UGC視頻為電視劇類的UGC視頻,則可以將同一部電視劇的各集聚集在一起;如果UGC視頻為綜藝節目類的UGC視頻,則可以將同一個綜藝節目的各期節目聚集在一起,等等。
[0121]由於對於某些UGC視頻,僅通過其視頻標題、視頻時長、視頻上傳者、視頻類型這些信息無法準確地進行聚類。例如,對於電視劇類的UGC視頻,同一個標題的電視劇可能包括多個版本,如對於標題為「射鵰英雄傳」的這一電視劇而言,其可能包括83版、94版、03版、08版等多個版本,如果僅通過上述視頻標題等信息無法將同一版本的「射鵰英雄傳」電視劇的各集準確地聚集在一起。因此,本發明實施例中,所述視頻元數據還可以包括視頻導演、視頻演員等信息,不同版本的電視劇的視頻導演、視頻演員是不同的,因此根據這些視頻信息即可唯一標識某一版本的電視劇,從而提高視頻聚類的準確性。
[0122]在本發明的一種優選實施例中,該步驟303具體可以包括以下子步驟:
[0123]子步驟al,分別對每兩個UGC視頻的視頻元數據進行相似度計算;
[0124]子步驟a2,將相似度位於預設的相似度區間之內的視頻元數據對應的UGC視頻確定為屬於同一個聚類。
[0125]分別對每兩個UGC視頻的視頻元數據進行相似度計算,如果相似度位於預設的相似度區間之內,則可以說明對應的兩個UGC視頻屬於同一個聚類。對於所述相似度區間的設置,要保證屬於同一個聚類的UGC視頻的視頻元數據的相似度既不能太小,也不能太大,如果太大,則說明兩個UGC視頻的相關信息差別很大,不屬於同一個類別,如果太小,則說明兩個UGC視頻的相關信息差別很小,其可能屬於相同的UGC視頻。本領域技術人員可以根據實際經驗設置相似度區間的對應數值,本發明實施例對具體的數值並不加以限制。
[0126]在本發明的一種優選實施例中,在判斷出兩個UGC視頻的視頻元數據的相似度位於預設的相似度區間之外,並且小於該區間的較小邊界值時,例如相似度區間為[a,b],當判斷出相似度小於邊界值a時,由於該種情況下這兩個UGC視頻可以認為是相同的UGC視頻,因此還可以進一步刪除屬於相同的UGC視頻中的一個,從而避免視頻重複,佔用視頻資源的問題。
[0127]本發明實施例中,上述子步驟al可以包括以下子步驟:
[0128]子步驟all,將每個所述UGC視頻的元數據轉換成一個對應的向量;
[0129]子步驟al2,分別根據對應的向量對每兩個UGC視頻的視頻元數據進行相似度計算。[0130]本發明實施例中,子步驟al2可以通過計算兩個向量的歐氏距離、曼哈頓距離、夾角餘弦值等方法對每兩個UGC視頻的視頻元數據進行相似度計算。例如,可以計算每兩個向量之間的歐氏距離,當所述歐氏距離位於預設的第一距離區間之內時,確定該兩個向量對應的視頻元數據的相似度位於預設的相似度區間之內;還可以計算每兩個向量之間的曼哈頓距離,當所述曼哈頓距離位於預設的第二距離區間之內時,確定該兩個向量對應的視頻元數據的相似度位於預設的相似度區間之內;還可以計算每兩個向量的夾角的餘弦值,當所述夾角的餘弦值位於預設的餘弦值區間之內時,確定該兩個向量對應的視頻元數據的相似度位於預設的相似度區間之內。對於其中第一距離區間、第二距離區間和餘弦值區間的具體數值,被利用技術人員根據實際經驗進行相關設定即可,本發明實施例對具體的數值並不加以限制。
[0131]歐氏距離是最易於理解的一種距離計算方法,源自歐氏空間中兩點間的距離公式。兩個η維向量a(xn, X12,..., xln)與b(x21, x22,..., x2n)間的歐氏距離為:
【權利要求】
1.一種視頻索引表的創建方法,其特徵在於,包括: 獲取客戶端上傳的多個用戶生成內容UGC視頻及各個UGC視頻的視頻ID ; 對所述多個UGC視頻進行聚類,並針對各個聚類分配視頻聚類ID ; 針對所述各個聚類中的UGC視頻分別生成描述信息,並對所述描述信息進行排序; 採用所述排序後的描述信息生成UGC視頻推薦列表; 採用所述視頻ID和對應的視頻聚類ID創建第一級索引表,以及,採用所述視頻聚類ID和對應的UGC視頻推薦列表創建第二級索引表。
2.根據權利要求1所述的方法,其特徵在於,在所述獲取客戶端上傳的多個UGC視頻及各個UGC視頻的視頻ID的步驟之後,還包括: 分別抽取各個UGC視頻的視頻元數據。
3.根據權利要求2所述的方法,其特徵在於,所述對所述多個UGC視頻進行聚類的步驟包括: 分別對每兩個UGC視頻的視頻元數據進行相似度計算; 將相似度位於預設的相似度區間之內的視頻元數據對應的UGC視頻確定為屬於同一個聚類。
4.根據權利要求2所述的方法,其特徵在於,所述視頻元數據包括視頻標題;所述針對所述各個聚類中的UGC視頻分別生成描述信息,並對所述描述信息進行排序的步驟包括: 針對所述各個聚類中的UGC視頻分別按照預設規則從視頻標題中提取視頻集數; 將UGC視頻的視頻集數確定為該UGC視頻的描述信息; 針對所述各個聚類中的UGC視頻的視頻集數分別進行升序排序或降序排序。
5.根據權利要求2所述的方法,其特徵在於,所述視頻元數據包括視頻時長;在所述對所述多個UGC視頻進行聚類的步驟之後,還包括: 針對所述各個聚類中的UGC視頻分別獲取視頻時長; 當某個UGC視頻的視頻時長位於預設的時長區間之外時,將該UGC視頻從其所屬的聚類中刪除。
6.根據權利要求2所述的方法,其特徵在於,還包括: 採用所述視頻ID和對應的視頻元數據創建第三級索引表。
7.一種視頻的推薦方法,其特徵在於,包括: 接收客戶端發送的用戶生成內容UGC視頻播放請求,所述播放請求包括目標UGC視頻ID ; 在預先創建的第一級索引表中查找所述目標UGC視頻ID對應的視頻聚類ID ;所述第一級索引表包括視頻ID和對應的視頻聚類ID ; 在預先創建的第二級索引表中查找所述視頻聚類ID對應的UGC視頻推薦列表,作為目標UGC視頻推薦列表;所述第二級索引表包括視頻聚類ID和對應的UGC視頻推薦列表;其中,所述視頻聚類ID用於表徵UGC視頻的聚類,所述UGC視頻推薦列表由各個聚類中的UGC視頻排序後的描述信息生成; 將所述目標UGC視頻推薦列表下發至所述客戶端。
8.根據權利要求7所述的方法,其特徵在於,所述UGC視頻的描述信息為視頻集數; 在所述將所述目標UGC視頻推薦列表下發至所述客戶端的步驟之前,還包括:在預先創建的第三級索引表中查找所述目標UGC視頻ID對應的視頻元數據;所述第三級索引表包括視頻ID和對應的視頻元數據,所述視頻元數據包括視頻標題; 按照預設規則從所述視頻標題中提取視頻集數; 從所述目標UGC視頻推薦列表中截取所述視頻集數之前或之後的部分UGC視頻推薦列表; 所述將所述目標UGC視頻推薦列表下發至所述客戶端的步驟包括:將所述部分UGC視頻推薦列表下發至所述客戶端。
9.根據權利要求8所述的方法,其特徵在於,所述排序為升序排序或降序排序;所述從所述目標UGC視頻推薦列表中截取所述視頻集數之前或之後的部分UGC視頻推薦列表的步驟包括: 如果所述排序為升序排序,則從所述目標UGC視頻推薦列表中截取所述視頻集數之後的部分UGC視頻推薦列表; 如果所述排序為降序排序,則從所述目標UGC視頻推薦列表中截取所述視頻集數之前的部分UGC視頻推薦列表。
10.一種視頻索引表的創建裝置,其特徵在於,包括: 視頻獲取模塊,用於 獲取客戶端上傳的多個用戶生成內容UGC視頻及各個UGC視頻的視頻ID ; 聚類模塊,用於對所述多個UGC視頻進行聚類,並針對各個聚類分配視頻聚類ID ;排序模塊,用於針對所述各個聚類中的UGC視頻分別生成描述信息,並對所述描述信息進行排序; 生成模塊,用於採用所述排序後的描述信息生成UGC視頻推薦列表; 第一創建模塊,用於採用所述視頻ID和對應的視頻聚類ID創建第一級索引表; 第二創建模塊,用於採用所述視頻聚類ID和對應的UGC視頻推薦列表創建第二級索引表。
11.根據權利要求10所述的裝置,其特徵在於,所述裝置還包括: 抽取模塊,用於在所述視頻獲取模塊獲取客戶端上傳的多個UGC視頻及各個UGC視頻的視頻ID之後,分別抽取各個UGC視頻的視頻元數據。
12.根據權利要求11所述的裝置,其特徵在於,所述聚類模塊包括: 計算子模塊,用於分別對每兩個UGC視頻的視頻元數據進行相似度計算; 聚類確定子模塊,用於將相似度位於預設的相似度區間之內的視頻元數據對應的UGC視頻確定為屬於同一個聚類。
13.根據權利要求11所述的裝置,其特徵在於,所述排序模塊包括: 提取子模塊,用於針對所述各個聚類中的UGC視頻分別按照預設規則從視頻標題中提取視頻集數; 信息確定子模塊,用於將UGC視頻的視頻集數確定為該UGC視頻的描述信息; 排序子模塊,用於針對所述各個聚類中的UGC視頻的視頻集數分別進行升序排序或降序排序。
14.根據權利要求11所述的裝置,其特徵在於,所述視頻元數據包括視頻時長;所述裝置還包括:時長獲取模塊,用於在所述聚類模塊對所述多個UGC視頻進行聚類之後,針對所述各個聚類中的UGC視頻分別獲取視頻時長; 視頻刪除模塊,用於當某個UGC視頻的視頻時長位於預設的時長區間之外時,將該UGC視頻從其所屬的聚類中刪除。
15.根據權利要求11所述的裝置,其特徵在於,所述裝置還包括: 第三創建模塊,用於採用所述視頻ID和對應的視頻元數據創建第三級索引表。
16.一種視頻的推薦裝置,其特徵在於,包括: 接收模塊,用於接收客戶端發送的用戶生成內容UGC視頻播放請求,所述播放請求包括目標UGC視頻ID ; 第一查找模塊,用於在預先創建的第一級索引表中查找所述目標UGC視頻ID對應的視頻聚類ID ;所述第一級索引表包括視頻ID和對應的視頻聚類ID ; 第二查找模塊,用於在預先創建的第二級索引表中查找所述視頻聚類ID對應的UGC視頻推薦列表,作為目標UGC視頻推薦列表;所述第二級索引表包括視頻聚類ID和對應的UGC視頻推薦列表;其中,所述視頻聚類ID用於表徵UGC視頻的聚類,所述UGC視頻推薦列表由各個聚類中的UGC視頻排序後的描述信息生成; 下發模塊,用於將所述目標UGC視頻推薦列表下發至所述客戶端。
17.根據權利 要求16所述的裝置,其特徵在於,所述UGC視頻的描述信息為視頻集數;所述裝置還包括: 第三查找模塊,用於在所述下發模塊將所述目標UGC視頻推薦列表下發至所述客戶端之前,在預先創建的第三級索引表中查找所述目標UGC視頻ID對應的視頻元數據;所述第三級索引表包括視頻ID和對應的視頻元數據,所述視頻元數據包括視頻標題; 提取模塊,用於按照預設規則從所述視頻標題中提取視頻集數; 截取模塊,用於從所述目標UGC視頻推薦列表中截取所述視頻集數之前或之後的部分UGC視頻推薦列表; 所述下發模塊,具體用於將所述部分UGC視頻推薦列表下發至所述客戶端。
18.根據權利要求17所述的裝置,其特徵在於,所述排序為升序排序或降序排序;所述截取模塊包括: 第一截取子模塊,用於在所述排序為升序排序時,從所述目標UGC視頻推薦列表中截取所述視頻集數之後的部分UGC視頻推薦列表; 第二截取子模塊,用於在所述排序為降序排序時,從所述目標UGC視頻推薦列表中截取所述視頻集數之前的部分UGC視頻推薦列表。
【文檔編號】G06F17/30GK104008139SQ201410193565
【公開日】2014年8月27日 申請日期:2014年5月8日 優先權日:2014年5月8日
【發明者】王敏, 傅一峰, 周燕紅 申請人:北京奇藝世紀科技有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀