新四季網

額外豐富內容元數據生成器的製造方法

2023-05-18 08:20:31 2

額外豐富內容元數據生成器的製造方法
【專利摘要】本公開涉及額外豐富內容元數據生成器。在一個實施方式中,方法包括接收與由內容提供者提供的內容項相關的內容元數據;從一個或多個外部源檢索額外元數據,額外元數據包括內容元數據的語言變化版本;將內容元數據連同額外元數據存儲在存儲設備中,其中內容元數據被存儲為與額外元數據關聯;接收來自用戶的搜索請求,搜索請求包括以第一語言變化版本表示的一個或多個搜索項;在內容元數據或者額外元數據中識別匹配一個或多個搜索項的相關元數據;識別存儲為與相關元數據關聯的額外的相關元數據,額外的相關元數據包括相關元數據的語言變化版本;以及增加一個或多個額外搜索項至搜索請求,一個或多個額外搜索項對應於額外相關元數據。
【專利說明】額外豐富內容元數據生成器

【技術領域】
[0001] 本公開內容總體上涉及用於內容元數據生成的方法和裝置。

【背景技術】
[0002] 隨著新的混合網絡(除了具有廣播能力(例如,地面電視(TV)、衛星TV、電纜TV), 還具有寬帶網際網路能力(例如,數字用戶線路(DSL)或者電纜))的迅速發展,流媒體內容 變得越來越流行。現在用戶可利用和可進入包括多媒體和視聽覺(AV)內容的越來越多的 內容。這樣大量的增加可能隨著傳統的廣播產業通過開發新一代的機頂盒(STB)和能夠流 傳送和回放此類內容的配套設備(例如,計算機、行動電話、平板電腦、手持設備等)進入互 聯網電視機頂盒業務(OTT)匯聚世界而進一步增加。TV用戶現在期望TV內容搜索與它們 在網際網路世界中一樣簡單、豐富和高效。


【發明內容】

[0003] 因此,根據本發明的一個方面,提出一種方法,包括:接收與由內容提供者提供的 內容項有關的內容元數據;從一個或多個外部源檢索額外元數據,額外元數據包括內容元 數據的語言變化版本;將內容元數據連同額外元數據存儲在存儲設備中,其中,內容元數據 被存儲為與額外元數據關聯;接收來自用戶的搜索請求,搜索請求包括以第一語言變化版 本表示的一個或多個搜索項;在內容元數據或者額外元數據中識別匹配一個或多個搜索項 的相關元數據;識別存儲為與相關元數據關聯的額外的相關的元數據,額外的相關的元數 據包括相關元數據的語言變化版本;以及增加一個或多個額外的搜索項至搜索請求,一個 或多個額外的搜索項對應於額外的相關的元數據。
[0004] 根據本發明的另一個方面,提出一種裝置,包括:管理單元,可操作地接收與由內 容提供者提供的內容項相關的內容元數據;創建單元,可操作地從一個或多個外部源檢索 額外元數據,額外元數據包括內容元數據的語言變化版本;存儲單元,可操作地存儲內容元 數據連同額外元數據,其中,內容元數據被存儲為與額外元數據關聯;其中,管理單元被另 外可操作為:接收來自用戶的搜索請求,搜索請求包括以第一語言變化版本表示的一個或 多個搜索項;在內容元數據或者額外元數據中識別匹配一個或多個搜索項的相關元數據; 識別存儲為與相關元數據關聯的額外的相關的元數據,額外的相關的元數據包括相關元數 據的語言變化版本;以及增加一個或多個額外的搜索項至搜索請求,一個或多個額外的搜 索項對應於額外的相關的元數據。
[0005] 根據本發明的又一方面,提出一種或多種計算機可讀有形存儲介質,利用包括計 算機可執行指令的軟體編碼並且當軟體被執行時,可操作為:接收與由內容提供者提供的 內容項相關的內容元數據;從一個或多個外部源檢索額外元數據,額外元數據包括所接收 的內容元數據的語言變化版本;將所接收的內容元數據連同額外元數據存儲在存儲設備 中,其中,所接收的內容元數據被存儲為與額外元數據關聯;接收來自用戶的搜索請求,搜 索請求包括以第一語言變化版本表示的一個或多個搜索項;在所接收的內容元數據或者額 外元數據中識別匹配一個或多個搜索項的相關元數據;識別存儲為與所識別的相關元數據 關聯的額外的相關的元數據,額外的相關的元數據包括所識別的相關元數據的語言變化版 本;以及增加一個或多個額外的搜索項至搜索請求,一個或多個額外的搜索項對應於額外 的相關的元數據。

【專利附圖】

【附圖說明】
[0006] 結合附圖,從以下詳細描述中將更充分地理解並領會本發明,在附圖中:
[0007] 圖1是根據本發明的實施方式構造和操作的系統的簡化框圖示圖;
[0008] 圖2是根據本發明的實施方式構造和操作的包括額外豐富(extra-rich,超豐富) 內容元數據生成器的系統的簡化框圖示圖;
[0009] 圖3是描述根據本發明的實施方式的操作額外豐富內容元數據生成器的方法的 流程圖;和
[0010] 圖4是根據本發明的實施方式的與具體演員相關的不同的元數據之間的關係的 方框圖示圖。

【具體實施方式】
[0011] 概述
[0012] 在一個實施方式中,方法包括接收與由內容提供者提供的內容項相關的內容元數 據;從一個或多個外部源檢索額外元數據,額外元數據包括內容元數據的語言變化版本; 將內容元數據與額外元數據存儲在存儲設備中,其中,內容元數據被存儲為與額外元數據 關聯;接收來自用戶的搜索請求,搜索請求包括以第一語言變化版本表示的一個或多個搜 索項;在內容元數據或者額外元數據中識別匹配一個或多個搜索項的相關的元數據;識別 存儲為與相關的元數據關聯的額外的相關的元數據,額外的相關的元數據包括相關的元數 據的語言變化版本;並且增加一個或多個額外的搜索項至搜索請求,一個或多個額外的搜 索項對應於額外的相關的元數據。
[0013] 示例性實施方式
[0014] 在以下描述中,闡述大量的具體細節以提供對本發明的各種原理的全面理解。然 而,本領域技術人員將理解不是所有這些細節始終必要地需要用於實踐本發明。在此情況 下,為了避免不必要地使一般概念模糊,並未詳細地示出眾所周知的電路、控制邏輯、和用 於慣用算法和處理的電腦程式指令的細節。
[0015] 雖然本發明的原理在此被大量地描述為與電視廣播和OTT環境以及相關的電視 應用有關,這個是為方便展現起見選擇的示例,沒有限制性。
[0016] 類似地,雖然本發明的原理在此被大量地描述為與漢語語言變化版本和格式有 關,這個是為方便展現起見選擇的示例,沒有限制性。
[0017] 在一些國家中和/或對於某些語言,使用傳統的遠程控制搜索內容(諸如TV節 目、與演員/導演等相關的額外的信息)不容易、不方便、和甚至有時不可能。例如,使用通 常僅支持拉丁字的傳統的遠程控制來輸入漢字是困難的。因此,在傳統的電視廣播世界的 這些區域中,內容搜索不被看做是重要的業務範圍。然而,電視廣播產業正在進入具有用作 用於內容消耗的新媒體的配套設備(例如,個人計算機、智慧型電話、平板電腦等)的提升的 多屏融合世界。這些配套設備提供包括新的和更加便利的搜索的新的功能和語言輸入能 力。實際上,用戶現在可以使用不同的輸入類型例如,諸如繪製或者鍵入字(例如,中文簡 體字和繁體字)的人工錄入、聲音錄入等搜索。因此,可靠的跨平臺內容搜索支持變為此類 國家和/或語言的重要的發行物。
[0018] 並且,TV用戶現在期望內容搜索與他們在網際網路世界中一樣簡單和高效。通常, 提供搜索網際網路以發現包含一個或多個指定關鍵字的內容的搜尋引擎(軟體程序),並 且返回與含有關鍵字的內容連結的搜索結果條目。諸如Google(www. google, com)或者 Yahoo(www. yahoo, com)的廣泛搜尋引擎使用網絡爬蟲(Web crawler)訪問非常大量的內 容項(例如,網頁)。然後,稱為索引器的另一個程序解析這些內容項並且基於每個內容項 的元數據創建搜索索引。每個搜尋引擎使用專有算法創建索引以理想地僅返回用於每個查 詢的有意義的搜索結果。然而,由於某些語言的複雜性和多樣性,原始的內容元數據可能無 法提供足夠的信息以允許搜尋引擎返回一致的和/或精確的搜索結果。再次參考中文語言 示例,不同類型的書面中文格式在不同的區域中存在。簡體中文通常在中國大陸使用,而繁 體中文在香港和臺灣使用。此外,這些不同的區域也可以使用不同的方言。事實上,普通話 是中國大陸的官方語言(也被稱作漢語拼音-在下文中稱為拼音),然而,廣東話廣泛地用 於香港或者甚至在中國大陸的南部(威妥瑪式拼音法(Wade-Giles Romanization)-在下 文中稱作香港拼音)。並且,臺灣有其自己的稍微不同於漢語和香港拼音的語言發音(臺灣 通用拼音-在下文中稱作臺灣拼音)。這些拼音變化版本被中國用戶廣泛地用作關鍵字輸 入,因為它們被轉錄為拉丁字,並且因此更加便利的進行搜索(尤其利用僅支持拉丁字輸 入的遠程控制)。例如,如果用戶搜索與"Jackie Chan"(眾所周知的演員)相關的內容並 且使用它的簡體中文格式("成龍")作為關鍵字,然後將僅回復包含這個具體書面格式的 搜索結果。利用以另一個格式書面的元數據的索引的內容項,諸如:
[0019] 繁體中文:"成龍";
[0020] 拼音:"Cheng Long,';
[0021] 香港拼音:"Sing Lung" ;
[0022] 臺灣拼音:"Cheng Lung" ;或者
[0023] 甚至英語:"Jackie Chan"。
[0024] 可能沒有發現,並且因此沒有作為搜索的結果返回至用戶。為了返回更加精確的 和一致的搜索結果,用戶行為也是可以被考慮的標準。利用上文給出的示例進一步進行,觀 察到繁體中文用戶大量使用拼音簡寫作為關鍵字搜索。拼音簡寫通常對應於全部拼音的首 個字母/字。以下給出"Jackie Chan"的拼音簡寫:
[0025] "CL" 用於大陸(Cheng Long)和臺灣(Cheng Lung)拼音;和
[0026] "SL" 用於香港拼音(Sing Lung)。
[0027] 因此,需要能夠考慮語言變化版本、用戶的行為和簡檔,從而提供更加準確的、個 性化的和相關搜索結果的系統。例如,使用"CL"作為關鍵字搜索的臺灣用戶應當能夠接收 包括"Jackie Chan"作為演員的電影的繁體中文格式的搜索結果。
[0028] 另一個挑戰涉及地理的和版權限制。對於OTT平臺,地理限制不再是問題。在開 放網際網路世界中,用戶(例如,註冊消費者)可以自身位於世界各地通過OTT消費內容。然 而,在某些區域/範圍中,對一些內容項的訪問可能被限制和/或不同版本的相同的內容項 可以由於文化差異、版權或者其他管制法律被廣播。例如,"泰坦尼克3D"電影的定製版本 在中國大陸被特殊準備和播放-即,一些場景被去除-但是"斷背山"電影沒有被允許播 放。而且,電影片名在電影被播放時可以被翻譯為國家語言。在中文示例中情形甚至更加 複雜,因為電影片名可以被翻譯為多種中文片名。為了闡明這個,考慮詹姆斯邦德的最後的 片名為"Skyfall"的電影的示例。在中國,"Skyfall"可以被翻譯為 :
[0029] 中國大陸的"大破天幕殺機";
[0030] 香港(繁體中文)的"新鐵金剛:智破天兇城";和
[0031] 臺灣(繁體中文)的"空降危機"。
[0032] 增加拼音變化版本和簡寫,"Skyfall"還可以被翻譯為:
[0033] 大陸拼音的"Da Po Tian Mu Sha Ji "和"TMSJ"作為相應的簡寫,"Da Po"通常 被忽略因為其為形容詞;
[0034] 香港拼音的"Zhi Po Tian Xiong Cheng"和相應的簡寫"ZPTXC";以及
[0035] 臺灣拼音的"Kong Jiang Wei Ji "和相應的簡寫"KJWJ"。
[0036] 本領域技術人員將理解存在其他非標準的形式諸如:"詹姆斯邦德2012"、或者 "邦德23"等。因此,需要能夠考慮這些限制的系統。
[0037] 本發明,在其實施方式中,提供當考慮區域和/或版權限制時使用戶能夠輕易地 進行內容搜索並且獲得準確、個性化和一致的搜索結果的改善方法和相關的裝置。
[0038] 現在參考圖1,它是根據本發明的實施方式構造和作業系統的簡化的方框圖示圖。
[0039] 頭端110通常通過通信網絡130與多個客戶端設備120通信。附帶地或可選地,多 個頭端110與單個的客戶端設備120或者通過通信網絡130與多個客戶端設備120通信。 為了描繪和描述的簡單性,並且不限制本發明的一般性,在圖1中示出與僅一個頭端110通 信的僅一個客戶端設備120。
[0040] 通信網絡130包括以下中至少一個:基於衛星的通訊網絡;基於電纜的通訊網絡; 常規地面廣播電視網絡;基於電話的通訊網絡;基於電話的電視廣播網絡;基於行動電話 的電視廣播網絡;網際網路協議(IP)電視廣播網絡;以及基於計算機的通訊網絡。應理解,在 替換的實施方式中,通信網絡130可以,例如,通過雙向混合通信網絡,諸如組合電纜-電話 網絡,組合衛星-電話網絡,基於組合衛星-計算機通信網絡,或者通過任何其他適當的網 絡實現。對於本領域的一些技術人員,實現通信網絡130的其他方式將是明顯的。
[0041] 客戶端設備120可以是能夠通過通信網絡130與頭端110通信的任何類型的設 備。客戶端設備120可以是例如(但是不限制本發明的一般性),機頂盒(STB)、PVR(個人 的視頻信號記錄器)、DVR (數字視頻記錄器)、諸如可攜式計算機、臺式機或者個人計算機 (PC)的配套設備、諸如iPadTM的平板電腦、諸如個人數字助理(PDA)的可移動計算裝置、移 動電話、或者任何合適的手持設備。圖1示出設置在頭端110和顯示設備140之間的客戶端 設備120。在此類情形中,客戶端設備120通常通過數字AV接口(例如,HDMI、DVI等)或 者通過模擬AV接口(例如,單元(RGB、YPbPr)、混合式(NTSC、PAL、SECAM)、S-視頻、SCART、 RF同軸、D-端子(D-端子)等)操作連接至顯示設備140。儘管在圖1中作為分離的實體 示出,在本發明的其他實施例中,客戶端設備120可以是具有顯示設備140的整體。
[0042] 顯示設備140通常由用戶,例如通過遠程控制單元(RCU) 150操作。本領域技術人 員將理解可以使用諸如PC、行動電話、平板電腦或者其他合適的手持設備的其他設備操作 顯示設備140。根據使用的設備,用戶可以使用包括例如,用於計算機的計算機滑鼠、用於移 動電話的鍵盤按鈕、或者甚至用於支持直接操縱的設備的用戶的手指的各種方法錄入搜索 關鍵字。通過使用一個或多個在上文作為示例給出的各種手段,用戶可以搜索、瀏覽、請求、 和選擇AV內容以觀看(諸如實時事件廣播、視頻點播(VOD)資產、記錄事件等)或者任何 合適的信息和/或元數據。客戶端設備120內的作業系統軟體監測與顯示設備140和/或 客戶端設備120的用戶交互。
[0043] 此外,通常位於頭端側110的額外豐富內容元數據生成器160(ERCMG)可操作地通 過通信網絡130與搜尋引擎170和客戶端設備120通信。圖1僅示出一個通信網絡130。 儘管在圖1中示出為被嵌入頭端110,本領域技術人員將理解在本發明的進一步實施方式 中,ERCMG 160可以是可操作與頭端110通信的分離的實體。
[0044] 最後,提供搜尋引擎170(作為頭端110的單元示出)。當用戶操作RCU 150和選 擇菜單時,輸入一個或多個搜索項諸如字和/或數量或者通過在顯示設備140 (嵌入和/或 相關於客戶端設備120)上顯示的應用進行動作,可以通過通信網絡130將請求發送至頭端 110並且由搜尋引擎170接收。請求可以是對元數據、TV節目或者內容、或者任何其他額外 的信息的請求。然後,搜尋引擎170可以將請求傳遞/轉發至ERCMG 160。作為響應,ERCMG 160返回包括原始的搜索請求的不同的語言變化版本的相關的額外豐富元數據至搜索引 擎170,並且通過增加這個相關的額外豐富元數據至原始的搜索請求來更新請求。然後,搜 索引擎使用更新的搜索請求進行搜索並且一組相關的搜索結果在顯示在顯示設備140上 之前被發送回至客戶端設備120。ERCMG 160還能夠通過考慮與用戶相關的有用的情境信 息諸如,例如(但是不限制本發明的一般性),地理位置、初始語言輸入、簡檔、優選、搜索歷 史等適應搜索結果的相關性/排列。這樣做,定義如何排列和顯示搜索結果的權重規則由 ERCMG 160使用所述情境信息創建並然後應用在通過搜尋引擎170獲得的搜索結果上。
[0045] 現在參考圖2,圖2是根據本發明的實施方式的包括額外豐富內容元數據生成器 (ERCMG)的系統的簡化框圖示圖。以下將詳細地描述與圖3的方法有關的圖2的系統的操 作。
[0046] 過程在步驟300開始,並且在步驟301,內容提供者202 (例如,TV操作員)發送 與內容項(例如,構成TV時間表或者VOD目錄的部分的程序)相關的內容元數據至ERCMG 260。通常,內容元數據可以被通過資產分配接口(ADI)、使用元數據描述(例如,電纜實驗 室ADI規格描述資源(諸如TV節目和商業廣告)如何可以從內容源極分配至TV廣播員)定 義資源如何標記和分類的產業方針、或者線性業務量信息接口(例如,XML流量接口(XTI), 其為用於輸入XML格式化流量數據至流動資料庫伺服器和從流動資料庫伺服器輸出XML格 式化流量數據的基於Java的應用)被接收和攝入。本領域技術人員將理解可以使用任何 其他合適的用於元數據攝入的格式。一旦攝入,內容元數據被存儲和索引在ERCM資料庫 266中從而對用戶可用。在攝入期間或者攝入之後,一些或者所有攝入內容元數據被轉發 至ERCMG 260和由ERCM管理單元261接收。通常,在內容製備平臺期間,這個內容元數據 攝入操作預先在內容提供者/TV操作者的控制下進行。
[0047] 在步驟302, ERCM創建子單元262檢查ERCM管理單元261接收的內容元數據並且 然後使用一個或多個網絡爬蟲來檢索額外元數據從而使內容提供者提供的原始的內容元 數據豐富。通常,網絡爬蟲被用於訪問、解析和從外源諸如(但是不限制本發明的一般性), 由內容提供者指定的網站入口提取元數據。本領域技術人員將理解,任何其他合適的網絡 來源可以被訪問,只要網絡爬蟲能夠解析和提取來自該網絡源的元數據。在本發明的一個 實施方式中,網絡爬蟲被用於搜索與原始的內容元數據的子集相關的額外元數據。例如,由 內容提供者提供的原始的內容元數據可以包括用於每個TV或者VOD節目的一個或多個圖 像、類型和/或次類型、片名、開始和結束時間、持續時間、一個或多個視頻、摘錄、不同演員 的名字、導演的名字等。因此,網絡爬蟲可以檢索在TV或者VOD節目中呈現的與片名或者 演員相關的額外元數據。這些額外元數據通常包括對應於原始的內容元數據的區域或者語 言變化版本的演員/導演/標題的額外的名字,版權資訊和區域限制等。
[0048] 在中文語言和區域變化版本的背景下,網絡爬蟲可以訪問不同的門戶網絡諸如例 如(但是不限制本發明的一般性),時光網(中國大陸的內容元數據門戶網絡)、香港雅虎 電影、或者True電影(臺灣)並且提取以書面的漢字表示的額外元數據。在包括原始的內 容元數據的情形中,例如:
[0049] "Jackie Chan"作為演員,網絡爬蟲可以能夠檢索以下對應於其區域和/或語言變 化版本以及社交共用名字的額外元數據中至少一個:
[0050] 簡體中文的"成龍";
[0051] 繁體中文的"成龍";和/或
[0052] Jackie Chan的中文原名"陳港生"。
[0053] "Skyfall"作為電影片名,網絡爬蟲可以能夠檢索以下對應於其區域和/或語言 變化版本以及社交共用名稱的額外元數據中至少一個:
[0054] 中國大陸的"大破天幕殺機";
[0055] 香港(繁體中文)的"新鐵金剛:智破天兇城";
[0056] 臺灣(繁體中文)的"空降危機";和/或
[0057] 作為社交共用名字的"詹姆斯邦德2012"或者"邦德23"。
[0058] 對本領域中的技術人員顯而易見的是原始的內容元數據可以被以任何合適的格 式設置並且網絡爬蟲被配置為檢索缺失的額外元數據。
[0059] 在步驟303,確定是否網絡爬蟲沒有發現一個或多個額外元數據。如果成功地檢索 所有的額外元數據,然後過程直接進行至步驟305。相反地,在缺失一個或多個額外元數據 的情形中,創建子單元262的ERCM可以在移動至步驟305之前在步驟304通過詞典檢查來 檢索缺失的額外元數據。
[0060] 一旦被網絡爬蟲檢索到,額外元數據被集中並且可以被存儲為與原始的內容元數 據在多個索引中關聯或者在ERCM資料庫266的表267和268中。通常,原始的內容元數據 利用它們相應的額外元數據,即,對應於原始內容元數據的語言變化版本的額外元數據相 關聯和存儲。並且,創建子單元262的ERCM還可以進行以漢字書面的原始內容元數據和以 漢字書面相應的額外元數據的拼音映射。因此,在包括原始內容元數據和額外元數據的情 形中,例如:簡體中文的"成龍";繁體中文的"成龍";和作為JackieChan的中文原名的"陳 港生",進行以下拼音映射:
[0061] 大陸拼音的 "Cheng Long" ;
[0062] 香港拼音的"Sing Lung" ;和/或
[0063] 臺灣拼音的 "Cheng Lung"。
[0064] 並且,可以為Skyfall樣本進行以下拼音映射:
[0065] 大陸拼音的 "Da Po Tian Mu Sha Ji " ;
[0066] 香港拼音的 "Zhi Po Tian Xiong Cheng" ;和 / 或
[0067] 臺灣拼音的 "Kong Jiang Wei Ji "。
[0068] 在步驟306, ERCM創建子單元262進一步創建拼音簡寫。通常,採用拼音格式的每 個單詞的首個字母以創建拼音簡寫。因此,拼音簡寫被表示為以下:
[0069] 對於 "Jackie Chan,':
[0070] "CL"用於大陸和臺灣拼音;和/或
[0071] "SL"用於香港拼音。
[0072] 對於"Skyfall" :
[0073] "TMSJ"用於大陸拼音;
[0074] "ZPTXC"用於香港拼音;和/或
[0075] "KJWJ"用於臺灣拼音。
[0076] -旦被處理,原始內容元數據和關聯的額外元數據,拼音和拼音簡寫被在ERCM管 理單元261的控制下進一步相關聯地存儲在存儲單元266 -在下文中稱作ERCM資料庫 266 -(步驟307)。雖然僅在圖2中示出一個ERCM存儲單元266,本領域技術人員將理解可 以採用單個或者多個存儲器單元、資料庫等作為存儲手段。原始內容元數據和關聯的額外 元數據以及它們的拼音和拼音簡寫可以被存儲在多個索引或者表中。圖2示出兩個表267 和268。表267是通常包括大陸中文(S卩,簡體中文)、大陸漢語拼音和TV操作員直接保持 或者更新的相同的元數據的英語語言變化版本的元數據表。為了說明,以下表1示出包括 用於在上文給出的兩個示例的元數據變化版本的元數據表267 :
[0077] 表1 -兀數據表267
[0078]

【權利要求】
1. 一種方法,包括: 接收與由內容提供者提供的內容項有關的內容元數據; 從一個或多個外部源檢索額外元數據,所述額外元數據包括所述內容元數據的語言變 化版本; 將所述內容元數據連同所述額外元數據存儲在存儲設備中,其中,所述內容元數據被 存儲為與所述額外元數據關聯; 接收來自用戶的搜索請求,所述搜索請求包括以第一語言變化版本表示的一個或多個 搜索項; 在所述內容元數據或者所述額外元數據中識別匹配所述一個或多個搜索項的相關元 數據; 識別存儲為與所述相關元數據關聯的額外的相關的元數據,所述額外的相關的元數據 包括所述相關元數據的語言變化版本;以及 增加一個或多個額外的搜索項至所述搜索請求,所述一個或多個額外的搜索項對應於 所述額外的相關的元數據。
2. 根據權利要求1所述的方法,其中,所述從一個或多個外部源檢索額外元數據包括:採集和解析一個或多個網絡源,其中,所述一個或多個網絡源包括以不同的語言變化 版本提供額外元數據的一個或多個網絡入口;和 從所採集和所解析的一個或多個網絡源中的每一個提取所述額外元數據。
3. 根據權利要求1所述的方法,其中,所述從一個或多個外部源檢索額外元數據包括 檢索與所述內容元數據的子集相關的額外元數據。
4. 根據權利要求3所述的方法,其中,所述內容元數據的所述子集包括以下的至少一 個: 演員名字; 導演名字; 片名;和 版權和/或區域信息。
5. 根據權利要求1所述的方法,其中,所述額外元數據包括以下語言變化版本的至少 一個: 書面格式; 發音格式;和 社交共用名字。
6. 根據權利要求5所述的方法,其中,所述書面格式包括簡體中文和/或繁體中文。
7. 根據權利要求5所述的方法,其中,所述發音格式包括香港、臺灣通用和/或漢語拼 音。
8. 根據權利要求5所述的方法,其中,對應於所述發音格式的簡寫創建另外的語言變 化版本。
9. 根據權利要求8所述的方法,其中,所述簡寫通過採用發音格式的每個所述額外元 數據的每個單詞的首個字母創建。
10. 根據權利要求8所述的方法,其中,包括以第一語言變化版本表示的一個或多個搜 索項的所述搜索請求為發音格式的簡寫。
11. 根據權利要求1所述的方法,所述方法進一步包括: 創建限定如何排列和顯示搜索結果的權重規則;和 應用所述權重規則至使用包括所述一個或多個搜索項和所述一個或多個額外的搜索 項的所述搜索請求獲得的搜索結果。
12. 根據權利要求11所述的方法,其中,限定如何排列和顯示搜索結果的所述權重規 則包括將以對應於所述第一語言變化版本的語言變化版本的搜索結果排列為高於其他搜 索結果。
13. 根據權利要求11所述的方法,其中,限定如何排列和顯示搜索結果的所述權重規 則包括將以之前搜索的所述用戶最頻繁使用的語言變化版本的搜索結果排列為高於其他 搜索結果。
14. 根據權利要求11所述的方法,其中,限定如何排列和顯示搜索結果的所述權重規 則包括將以定義在所述用戶的簡檔中的語言變化版本的搜索結果排列為高於其他搜索結 果。
15. 根據權利要求11所述的方法,其中,限定如何排列和顯示搜索結果的所述權重規 則包括將以對應於所述用戶的當前位置的語言變化版本的搜索結果排列為高於其他搜索 結果。
16. 根據權利要求11所述的方法,其中,限定如何排列和顯示搜索結果的所述權重規 則包括根據所述用戶的當前地理位置和當地版權限制去除語言變化版本的一些搜索結果。
17. 根據權利要求11所述的方法,其中,限定如何排列和顯示搜索結果的所述權重規 則包括根據所述用戶的當前地理位置和當地版權限制替換語言變化版本的一些搜索結果。
18. -種裝置,包括: 管理單元,可操作地接收與由內容提供者提供的內容項相關的內容元數據; 創建單元,可操作地從一個或多個外部源檢索額外元數據,所述額外元數據包括所述 內容元數據的語言變化版本; 存儲單元,可操作地存儲所述內容元數據連同所述額外元數據,其中,所述內容元數據 被存儲為與所述額外元數據關聯; 其中,所述管理單元被另外可操作為:接收來自用戶的搜索請求,所述搜索請求包括以 第一語言變化版本表示的一個或多個搜索項;在所述內容元數據或者所述額外元數據中識 別匹配所述一個或多個搜索項的相關元數據;識別存儲為與所述相關元數據關聯的額外的 相關的元數據,所述額外的相關的元數據包括所述相關元數據的語言變化版本;以及增加 一個或多個額外的搜索項至所述搜索請求,所述一個或多個額外的搜索項對應於所述額外 的相關的元數據。
19. 一種或多種計算機可讀有形存儲介質,利用包括計算機可執行指令的軟體編碼並 且當所述軟體被執行時,可操作為: 接收與由內容提供者提供的內容項相關的內容元數據; 從一個或多個外部源檢索額外元數據,所述額外元數據包括所接收的內容元數據的語 言變化版本; 將所接收的內容元數據連同所述額外元數據存儲在存儲設備中,其中,所接收的內容 元數據被存儲為與所述額外元數據關聯; 接收來自用戶的搜索請求,所述搜索請求包括以第一語言變化版本表示的一個或多個 搜索項; 在所接收的內容元數據或者所述額外元數據中識別匹配所述一個或多個搜索項的相 關元數據; 識別存儲為與所識別的相關元數據關聯的額外的相關的元數據,所述額外的相關的元 數據包括所識別的相關元數據的語言變化版本;以及 增加一個或多個額外的搜索項至所述搜索請求,所述一個或多個額外的搜索項對應於 所述額外的相關的元數據。
【文檔編號】G06F17/30GK104424362SQ201410444283
【公開日】2015年3月18日 申請日期:2014年9月2日 優先權日:2013年9月3日
【發明者】李宇亮, 克裡斯·米爾斯, 伊恩·R·謝爾頓, 斯圖爾特·P·阿什比, 安德魯·瓦倫廷 申請人:思科技術公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀