一種用於視頻網站的搜尋引擎的製作方法
2023-08-04 07:24:16 1
專利名稱:一種用於視頻網站的搜尋引擎的製作方法
技術領域:
本發明涉及在線視頻搜索技術領域,具體說是一種用於視頻網站的搜尋引擎。
背景技術:
目前有些視頻網站的搜尋引擎在提供搜索提示(搜索提示是指在您向搜索框 (搜索詞輸入框)鍵入搜索詞(可理解為用於指示需要查詢的對象的關鍵字)以便查詢時, 搜尋引擎會推測您鍵入的內容,並實時提供建議。例如,如果您向搜索框中鍵入「音樂」二字作為搜索詞,搜尋引擎可能會提供一個優化查詢建議列表,包括「音樂下載」或「音樂試聽」 等。與之類似,如果您只鍵入字詞的一部分,如「貝克」,搜尋引擎可能會向您提供一些優化建議,如「貝克漢姆」或「貝克漢姆圖片」等。)時,會根據用戶輸入的搜索詞,提供與這個搜索詞相關的其他的搜索詞供用戶選擇,用戶可以利用這些由搜尋引擎提供的搜索詞再次搜索,找到相應的東西。但是,這種搜索提示只是幫助用戶節省了輸入搜索詞的時間,用戶仍然需要再次搜索。
發明內容
針對現有技術中存在的缺陷,本發明的目的在於提供一種用於視頻網站的搜尋引擎,在用戶輸入搜索詞的同時,根據這一搜索詞,以及對用戶搜索行為的分析,在提示用戶常用搜索詞的同時將用戶可能想找的視頻(例如影視劇)提示出來,用戶可以在提示框內直接看到視頻的相關信息,並能直接播放。用戶不需要再次搜索,節省了用戶的時間。由於用戶在搜索行為、興趣愛好存在差異,提示信息可能滿足不了搜索行為比較特殊的用戶。為達到以上目的,本發明採取的技術方案是本發明所述的用於視頻網站的搜尋引擎,在用戶輸入搜索詞的同時,根據這一搜索詞,以及對用戶搜索行為的分析,在提示用戶常用搜索詞的同時將用戶可能想找的視頻 (例如影視劇)提示出來,用戶可以在提示框內直接看到視頻的相關信息,並能直接播放。 用戶不需要再次搜索,節省了用戶的時間。由於用戶在搜索行為、興趣愛好存在差異,提示信息可能滿足不了搜索行為比較特殊的用戶。
本發明有如下附圖圖1搜索流程示意圖。
具體實施例方式以下結合附圖對本發明作進一步詳細說明。用戶使用視頻網站的搜尋引擎,其目的性很明確,就是為了通過搜索詞找到自己所需或感興趣的視頻(例如影視劇),或通過搜尋引擎的搜索提示,找到自己所需或感興趣的視頻(例如影視劇)。也有一些目的性不強的用戶,使用視頻網站的搜尋引擎,就是為了通過搜尋引擎的搜索提示,找到自己所需或感興趣的視頻(例如影視劇)。本發明所說的影視劇,是指電視劇,電影,綜藝節目,動漫這類的長視頻,這類的視頻是一個視頻網站的核心競爭力,能夠滿足絕大多數用戶的需求。相反那些UGC內容(也就是用戶上傳的內容),數量很大,但無論從播放量還是總播放時長上都無法與長視頻相提並論。而且,現在的長視頻都是版權劇,需要為此支付龐大的版權費用。所以無論從滿足用戶需求還是從公司角度都需要著力推廣這些有版權的長視頻。本發明所述的用於視頻網站的搜尋引擎,尤指用於在視頻網站搜索影視劇的搜尋引擎。如圖1所示,本發明所述的用於視頻網站的搜尋引擎,其搜索流程如下步驟1,用戶通過在搜尋引擎的搜索詞輸入框內填入搜索詞並點擊搜索按鈕查詢所需的視頻,在點擊搜索按鈕之前,搜尋引擎自動將該搜索詞發送到伺服器;所述視頻可以是影視劇等長視頻;步驟2,伺服器根據收到的搜索詞,在預先分析並儲存好的用戶搜索行為資料庫裡匹配與搜索詞對應的提示結果,確定相應的提示結果後將提示結果返回到搜尋引擎,搜尋引擎在搜索詞輸入框下方彈出提示結果顯示框,並在提示結果顯示框內將從伺服器收到的提示結果顯示出來供用戶選擇;所述提示結果是指與搜索詞有對應關係的視頻的名稱和視頻播放連結;步驟3,伺服器收集用戶對提示結果的點擊,對用戶搜索行為資料庫進行優化,或伺服器收集用戶點擊搜索按鈕之後,所選擇的視頻播放連結,對用戶搜索行為資料庫進行優化。本發明通過將與搜索詞有對應關係的視頻的名稱和視頻播放連結作為提示結果直觀的提供給用戶,用戶不一定非要等搜索之後才能找到所需的視頻的名稱和視頻播放連結,使搜索服務更便捷,而且減輕了伺服器的搜索負擔,提高了搜索效率。在上述技術方案的基礎上,所述伺服器中記錄有視頻的名稱,例如影視劇的名稱,與視頻的名稱對應的視頻別名,例如影視劇別名,可以是國產劇的英文名作為視頻別名,可以是國外劇的中文名視頻別名,至少一條與視頻的名稱對應的視頻播放連結,例如影視劇播放地址,通常為網址,所述用戶搜索行為資料庫裡的每一條記錄包括用戶在搜尋引擎的搜索詞輸入框內填入的搜索詞,各搜索詞和視頻的名稱的對應關係,二者藉助視頻播放連結產生對應關係。即用戶通過某一搜索詞最終會選擇某一視頻播放連結播放該視頻(或者是通過提示結果選擇的視頻播放連結,或者是點擊搜索按鈕後選擇的視頻播放連結),則搜索詞和視頻播放連結會產生一個對應關係,這個對應關係可以通過搜索點擊日誌確立,某一個搜索詞對應某一用戶選擇的某一個視頻播放連結,這個對應關係是多對多的,即1、同一個搜索詞可能不同的用戶最終選擇的視頻播放連結不同,此時應視為確定了多條搜索詞與視頻播放連結間的對應關係的記錄,與此同理,2、不同的搜索詞可能不同的用戶最終選擇的視頻播放連結相同,此時也應視為確定了多條搜索詞與視頻播放連結間的對應關係的記錄,
這種對應關係是根據用戶輸入的搜索詞以及最終選擇的視頻播放連結確定的,而不是預先指定的特定的對應關係;而視頻的名稱和視頻播放連結也有一個對應關係(這是預先指定的特定的對應關係,通常視頻網站中視頻的名稱和視頻播放連結是一對一的),這個對應關係可以通過視頻網站的視頻資料庫確立,這樣一來,就通過視頻播放連結使各搜索詞和視頻的名稱有了對應關係。例如伺服器的視頻資料庫中記錄有視頻的名稱——《宮鎖心玉》,這是一個電視劇,視頻別名——「宮」,與視頻的名稱對應的視頻播放連結——IinkU link2,視頻播放連結linkl、link2都屬於電視劇《宮鎖心玉》這個電視劇,當用戶A搜索「宮01」後,點擊了視頻播放連結linkl,當用戶B搜索「宮鎖心玉 09」後,點擊了視頻播放連結link2,則在搜索點擊日誌裡就會有上面兩條記錄,兩個搜索詞分別和視頻播放連結linkl、link2產生一個對應關係,而被記錄在用戶搜索行為資料庫中。則通過linkUlink2將搜索詞「宮01」、「宮鎖心玉09」與視頻的名稱《宮鎖心玉》形成
對應關係。在上述技術方案的基礎上,在用戶搜索行為資料庫裡還設有一個與視頻別名對應的播放累計次數,每播放一次視頻的名稱所對應的視頻時,則將與視頻別名對應的播放累計次數加壹。即每當有用戶通過搜索觀看了《宮鎖心玉》這部電視劇,就將視頻別名「宮」對應電視劇《宮鎖心玉》的播放累計次數累加,每播放一次則播放累計次數加壹。在上述技術方案的基礎上,播放累計次數按以下方式計算首先是以天為單位收集用戶的搜索詞,將與同一個視頻的名稱有對應關係搜索詞的搜索次數累加,並將累加後的搜索次數計算到與視頻別名對應的播放累計次數中,則通過搜索詞播放視頻和通過視頻別名播放視頻的次數均計入播放累計次數中。還以前述內容為例,假設以天為單位收集用戶的搜索詞後,發現通過視頻別名 「宮」播放對應電視劇《宮鎖心玉》3次,通過搜索詞「宮01」、「宮鎖心玉09」分別播放對應電視劇《宮鎖心玉》6次、1次,則播放累計次數=3+6+1 = 10。在上述技術方案的基礎上,步驟2中當伺服器在預先分析並儲存好的用戶搜索行為資料庫裡匹配到收到的搜索詞時,代表該搜索詞和視頻的名稱的對應關係已經建立過了,則直接將視頻的名稱作為該搜索詞的提示結果,並將提示結果返回到搜尋引擎,並轉步驟3,步驟2中當伺服器在預先分析並儲存好的用戶搜索行為資料庫裡匹配不到收到的搜索詞時,代表該搜索詞和視頻的名稱的對應關係不存在,則將「沒有適合的提示結果」 返回到搜尋引擎,並轉步驟3。在上述技術方案的基礎上,當執行步驟2在預先分析並儲存好的用戶搜索行為資料庫裡匹配與搜索詞對應的提示結果時,進一步判斷該搜索詞是否對應影視明星,所述影視明星的判斷根據伺服器中影視明星資料庫的內容判斷,當該搜索詞和影視明星資料庫中的人名一樣,就確定該搜索詞是一個影視明星, 則去伺服器中視頻資料庫內查詢該影視明星對應的影視作品,將該影視明星對應的若干個影視作品作為提示結果,返回到搜尋引擎,並轉步驟3。
例如視頻資料庫中影視明星與影視作品之間的對應關係大多是一對多的,但作為提示結果的個數會有限制,按照我們目前的涉及,只取前三個該影視明星的影視作品作為提示結果,排序規則如下我們會結合視頻(例如影視劇)的時效性(也就是上映時間) 和受歡迎程度(也就是播放量,可通過播放累計次數分析播放量),做一個綜合的排序。排序的標準是平均每天的播放量,也就是總播放量除以已經上映的天數)。在上述技術方案的基礎上,步驟3包括以下具體步驟記錄用戶在搜尋引擎的搜索詞輸入框內填入的搜索詞,記錄用戶最終選擇的視頻播放連結,查詢伺服器的視頻資料庫確定視頻播放連結所對應的視頻的名稱,以及視頻別名,在用戶搜索行為資料庫內檢索是否存在該搜索詞,當搜索詞存在,則進一步判斷用戶搜索行為資料庫內記錄的搜索詞和視頻的名稱的對應關係與本次優化所記錄的信息是否一致,如果一致,則更新播放累計次數,如果不一致,則形成一條新的搜索詞和視頻的名稱的對應關係記錄,然後再更新播放累計次數,一條新的搜索詞和視頻的名稱的對應關係記錄其播放累計次數通常為1,當搜索詞不存在,則形成一條新的搜索詞和視頻的名稱的對應關係記錄,然後再更新播放累計次數,一條新的搜索詞和視頻的名稱的對應關係記錄其播放累計次數通常為 1。通常一個視頻(例如影視劇)會有多個視頻播放連結,比如電視劇,它的每一集都是一個視頻播放連結。這時可以利用視頻資料庫,去確定這些視頻播放連結屬於哪一個視頻(例如影視劇)。然後就可建立一個視頻的名稱和視頻播放連結的對應關係,但是這個對應關係我們還不能直接使用,還必須排除一些搜索詞中的幹擾詞。因此在上述技術方案的基礎上,步驟3還包括以下對搜索詞的分析、優化步驟將與某一個視頻的名稱對應的全部搜索詞統計出來,並分別統計每個搜索詞對應到該某一個視頻的名稱的次數,以及對應到其他視頻的名稱的次數,按這個次數對些搜索詞進行如下分級確定級搜索詞,這個搜索詞只會唯一的對應到這個視頻的名稱,用戶搜索行為資料庫內記錄的搜索詞絕大部分屬於確定級搜索詞,以確保通過用戶搜索行為資料庫得到的結果的準確性;例如搜索詞「EVA」都對應到「新世紀福音戰士」這個視頻的名稱,則將搜索詞 「EVA」視為確定級搜索詞,此類搜索詞在用戶搜索行為資料庫中記錄的越多,越有利於得到準確的搜索結果,提高搜索效率,待定級搜索詞,這個搜索詞與若干個視頻的名稱對應,但絕大部分都對應到這個視頻的名稱,對用戶搜索行為資料庫內記錄的待定級搜索詞的數量進行控制,避免待定級搜索詞過多影響確保通過用戶搜索行為資料庫得到的結果的準確性;具體數量可以根據實際需要控制,亦可人工處理;幹擾級搜索詞,這個搜索詞與多個視頻的名稱對應,且對應關係分散、不確定,則視為這個搜索詞是一個無意義的詞,在用戶搜索行為資料庫內直接刪除與這個搜索詞對應的記錄。
還可以按以下方式確定三個等級的搜索詞設對應一個視頻的名稱有η個搜索詞與之對應,每個搜索詞與之對應的個數為Ni, 前述有η個搜索詞,則搜索詞與之對應的個數分別記為Ni,Ν2,……,Nn,按以下公式求出m到Nn的平均數,作為閥值S,
權利要求
1.一種用於視頻網站的搜尋引擎,其特徵在於,包括以下步驟步驟1,用戶通過在搜尋引擎的搜索詞輸入框內填入搜索詞並點擊搜索按鈕查詢所需的視頻,在點擊搜索按鈕之前,搜尋引擎自動將該搜索詞發送到伺服器;步驟2,伺服器根據收到的搜索詞,在預先分析並儲存好的用戶搜索行為資料庫裡匹配與搜索詞對應的提示結果,確定相應的提示結果後將提示結果返回到搜尋引擎,搜尋引擎在搜索詞輸入框下方彈出提示結果顯示框,並在提示結果顯示框內將從伺服器收到的提示結果顯示出來供用戶選擇;所述提示結果是指與搜索詞有對應關係的視頻的名稱和視頻播放連結; 步驟3,伺服器收集用戶對提示結果的點擊,對用戶搜索行為資料庫進行優化,或伺服器收集用戶點擊搜索按鈕之後,所選擇的視頻播放連結,對用戶搜索行為資料庫進行優化。
2.如權利要求1所述的用於視頻網站的搜尋引擎,其特徵在於,所述伺服器中記錄有 視頻的名稱,與視頻的名稱對應的視頻別名,至少一條與視頻的名稱對應的視頻播放連結,所述用戶搜索行為資料庫裡的每一條記錄包括用戶在搜尋引擎的搜索詞輸入框內填入的搜索詞,各搜索詞和視頻的名稱的對應關係,二者藉助視頻播放連結產生對應關係。
3.如權利要求2所述的用於視頻網站的搜尋引擎,其特徵在於在用戶搜索行為資料庫裡還設有一個與視頻別名對應的播放累計次數,每播放一次視頻的名稱所對應的視頻時,則將與視頻別名對應的播放累計次數加壹。
4.如權利要求3所述的用於視頻網站的搜尋引擎,其特徵在於,播放累計次數按以下方式計算首先是以天為單位收集用戶的搜索詞,將與同一個視頻的名稱有對應關係搜索詞的搜索次數累加,並將累加後的搜索次數計算到與視頻別名對應的播放累計次數中,則通過搜索詞播放視頻和通過視頻別名播放視頻的次數均計入播放累計次數中。
5.如權利要求3所述的用於視頻網站的搜尋引擎,其特徵在於步驟2中當伺服器在預先分析並儲存好的用戶搜索行為資料庫裡匹配到收到的搜索詞時,代表該搜索詞和視頻的名稱的對應關係已經建立過了,則直接將視頻的名稱作為該搜索詞的提示結果,並將提示結果返回到搜尋引擎,並轉步驟3,步驟2中當伺服器在預先分析並儲存好的用戶搜索行為資料庫裡匹配不到收到的搜索詞時,代表該搜索詞和視頻的名稱的對應關係不存在,則將「沒有適合的提示結果」返回到搜尋引擎,並轉步驟3。
6.如權利要求5所述的用於視頻網站的搜尋引擎,其特徵在於當執行步驟2在預先分析並儲存好的用戶搜索行為資料庫裡匹配與搜索詞對應的提示結果時,進一步判斷該搜索詞是否對應影視明星,所述影視明星的判斷根據伺服器中影視明星資料庫的內容判斷,當該搜索詞和影視明星資料庫中的人名一樣,就確定該搜索詞是一個影視明星,則去伺服器中視頻資料庫內查詢該影視明星對應的影視作品,將該影視明星對應的若干個影視作品作為提示結果,返回到搜尋引擎,並轉步驟3。
7.如權利要求5所述的用於視頻網站的搜尋引擎,其特徵在於,步驟3包括以下具體步驟記錄用戶在搜尋引擎的搜索詞輸入框內填入的搜索詞,記錄用戶最終選擇的視頻播放連結,查詢伺服器的視頻資料庫確定視頻播放連結所對應的視頻的名稱,以及視頻別名,在用戶搜索行為資料庫內檢索是否存在該搜索詞,當搜索詞存在,則進一步判斷用戶搜索行為資料庫內記錄的搜索詞和視頻的名稱的對應關係與本次優化所記錄的信息是否一致,如果一致,則更新播放累計次數,如果不一致, 則形成一條新的搜索詞和視頻的名稱的對應關係記錄,然後再更新播放累計次數,一條新的搜索詞和視頻的名稱的對應關係記錄其播放累計次數通常為1,當搜索詞不存在,則形成一條新的搜索詞和視頻的名稱的對應關係記錄,然後再更新播放累計次數,一條新的搜索詞和視頻的名稱的對應關係記錄其播放累計次數通常為1。
8.如權利要求5所述的用於視頻網站的搜尋引擎,其特徵在於,步驟3還包括以下對搜索詞的分析、優化步驟將與某一個視頻的名稱對應的全部搜索詞統計出來,並分別統計每個搜索詞對應到該某一個視頻的名稱的次數,以及對應到其他視頻的名稱的次數,按這個次數對些搜索詞進行如下分級確定級搜索詞,這個搜索詞只會唯一的對應到這個視頻的名稱,用戶搜索行為資料庫內記錄的搜索詞絕大部分屬於確定級搜索詞,以確保通過用戶搜索行為資料庫得到的結果的準確性;待定級搜索詞,這個搜索詞與若干個視頻的名稱對應,但絕大部分都對應到這個視頻的名稱,對用戶搜索行為資料庫內記錄的待定級搜索詞的數量進行控制,避免待定級搜索詞過多影響確保通過用戶搜索行為資料庫得到的結果的準確性;具體數量可以根據實際需要控制,亦可人工處理;幹擾級搜索詞,這個搜索詞與多個視頻的名稱對應,且對應關係分散、不確定,則視為這個搜索詞是一個無意義的詞,在用戶搜索行為資料庫內直接刪除與這個搜索詞對應的記錄。
9.如權利要求8所述的用於視頻網站的搜尋引擎,其特徵在於,還可以按以下方式確定三個等級的搜索詞設對應一個視頻的名稱有η個搜索詞與之對應,每個搜索詞與之對應的個數為Ni,前述有η個搜索詞,則搜索詞與之對應的個數分別記為Ni,Ν2,……,Nn,按以下公式求出m到Nn的平均數,作為閥值S,s 9- Xnin (91計算出閥值S的值後,通過將閥值S與每個搜索詞與之對應的個數為Ni逐個比較,凡是Ni大於閥值S的視為其屬於確定級搜索詞,小於閥值S但差值在允許範圍內的視為其屬於待定級搜索詞,將剩餘的詞都劃分為幹擾級搜索詞。
10.如權利要求8所述的用於視頻網站的搜尋引擎,其特徵在於最接近閥值S的前10 個視為允許範圍。
全文摘要
本發明涉及一種用於視頻網站的搜尋引擎,包括以下步驟用戶在搜尋引擎的搜索詞輸入框內填入搜索詞,在點擊搜索按鈕之前,搜尋引擎自動將該搜索詞發送到伺服器;伺服器根據收到的搜索詞確定相應的提示結果後將提示結果返回到搜尋引擎,搜尋引擎將提示結果顯示出來供用戶選擇;伺服器收集用戶對提示結果的點擊,對用戶搜索行為資料庫進行優化。本發明在用戶輸入搜索詞的同時,根據這一搜索詞,以及對用戶搜索行為的分析,在提示用戶常用搜索詞的同時將用戶可能想找的視頻(例如影視劇)提示出來,用戶可以在提示框內直接看到視頻的相關信息,並能直接播放。用戶不需要再次搜索,節省了用戶的時間。
文檔編號G06F17/30GK102495840SQ201110356409
公開日2012年6月13日 申請日期2011年11月11日 優先權日2011年11月11日
發明者盧述奇, 姚鍵, 尹玉宗, 潘柏宇, 石磊, 蘆葦, 譚修光, 邊俊傑, 陳虎 申請人:合一網絡技術(北京)有限公司