用於推薦代表用戶興趣的項目的自適應原型簡檔的方法和設備的製作方法
2023-05-14 06:52:16
專利名稱:用於推薦代表用戶興趣的項目的自適應原型簡檔的方法和設備的製作方法
技術領域:
本發明涉及用於推薦例如電視節目等感興趣的項目的方法和設備,尤其涉及用於推薦感興趣的節目以及其它項目的技術。
背景技術:
隨著電視觀眾可觀看的頻道數以及在這些頻道上可看的節目內容的多樣性的增長,對於電視觀眾來講,辨別感興趣的節目已經逐漸成為一種難題。電子節目指南(EPG)通過例如標題、時間、日期和頻道標識出可看的電視節目,並且通過允許根據個性化偏好搜索或分類可用的電視節目,方便了對感興趣的節目進行識別。
已經對推薦感興趣的電視節目和其它項目建議或提議了多種推薦工具。例如,電視節目推薦工具將觀眾的偏好應用到EPG以獲得特定觀眾感興趣的一組推薦節目。總體上,電視節目推薦工具使用隱式或顯式技術,或者使用上述技術的一些組合來獲得觀眾的偏好。隱式電視節目推薦工具以不引人注目的方式,根據從觀眾的收看歷史得到的信息生成電視節目推薦。另一方面,顯式電視節目推薦工具明確地詢問觀眾對節目屬性的偏好,諸如標題、流派、演員、頻道和日期/時間之類,以得到觀眾簡檔並生成推薦。
雖然當前可用的推薦工具幫助用戶識別感興趣的項目,但是他們受到多種限制,如果克服了這些限制,可以大大提高上述推薦工具的便利性和性能。例如,為了更加全面,顯式推薦工具的初始化非常冗長,要求每個新用戶響應一個非常詳細的調查,將他們的偏好指定在一個粗略的粒度級別上。雖然隱式電視節目推薦工具通過觀察收看行為不引入注目地得到簡檔,但是需要長的時間使之準確。另外,這種隱式電視節目推薦工具至少需要最小量的收看歷史才開始做出推薦。因此,當第一次得到這種隱式電視節目推薦工具時不能做出推薦。
因此存在這樣的需要,即在得到充分的個性化收看歷史之前,能夠不引人注目地推薦諸如電視節目等項目的方法和設備。另外,存在對準確地捕捉用戶收看行為的方法和設備的需要。
總得來說,公開了一種向用戶推薦感興趣的項目的方法和設備,例如電視節目推薦。根據本發明的原理,修改或轉換在得到用戶的收看歷史或購買歷史之前生成的最初推薦以使用反饋處理來更好地捕捉用戶的收看行為。
最初,例如根據特定收看區域的收看歷史生成原型(stereotype),其被用於建立原型簡檔。生成的原型簡檔反映由代表性的觀眾所選擇的項目的典型模式。使用原型簡檔相對於實地真實(ground truth)數據來計算推薦。用原型簡檔中的每個原型的矩心計算在實地真實數據中每個演出之間的間距。如果計算的推薦與原始的實地真實數據之間不一致,則從用戶請求附加的反饋,該反饋被用於創建在後簡檔(meta-profile)。在後簡檔包括用戶已經向他/她希望被推薦或放棄的演出所提供的所有加權(例如正/負的補充)的集合。最後,使用相對於原型簡檔的在後簡檔重新計算推薦。
通過參考下列詳細的描述和附圖,將獲得對本發明的更全面的理解,以及本發明進一步的特徵和優勢。
圖1是根據本發明的電視節目推薦器的示意框圖;圖2是描述實現本發明原理的圖1中自適應原型簡檔處理的流程圖。
具體實施例方式
圖1圖解根據本發明的電視節目推薦器100。如圖1所示,示範性的電視節目推薦器100評估節目資料庫200中的節目,以標識特定觀眾感興趣的節目。例如,使用公知的在屏幕上顯示技術的置頂終端/電視(未示出)可以向觀眾呈現一組推薦的節目。雖然在此是以電視節目推薦來舉例說明本發明,但是本發明可應用到基於對諸如收看歷史或者購買歷史等用戶行為的評估而自動生成的推薦。特別地,像機頂盒,TiVo之類的設備(硬碟記錄器、PVR,等等)。本發明還可用於使用用戶簡檔群集的任何應用。在全球網-簡檔的情況下,本發明被嵌入網絡瀏覽器中。
在可得到用戶的收看歷史140之前,例如當用戶第一次獲得電視節目推薦器100時,電視節目推薦器100生成電視節目推薦。如圖1所示,電視節目推薦器100利用來自一個或多個第三方的收看歷史130向特定用戶推薦感興趣的節目。通常,第三方收看歷史130基於一個或多個抽樣人口的收看習慣,人口統計例如代表大多數人口的年齡、收入、性別和教育。
如圖1所示,第三方收看歷史130包含一組被特定人群收看或者沒有收看的節目。通過觀察被特定人群實際收看的節目獲得被收看的那組節目。例如,通過隨機抽樣節目資料庫200中的節目獲得未被收看的那組節目。在進一步的變型中,根據2001年3月28日提交的,題為「An Adaptive Sampling Technique for Selecting NegativeExamples for Artificial Intelligence Applications」的美國專利申請序列號No.09/819,286的教導獲得未被收看的那組節目。該申請已被轉讓給本發明的受讓人並在此引入作為參考。
電視節目推薦器100處理第三方收看歷史130以生成原型簡檔,其反映由代表性的觀眾收看的電視節目的典型模式。一個原型簡檔是在某些方面互相類似的電視節目(數據點)的群集。可以使用多種方式的任何一種生成原型簡檔。例如,如在2001年11月14日提交的題為「Method and Apparatus for Generating a StereotypicalProfile for Recommending Items of Interest Using Item-BasedClustering」的美國專利申請序列號NO.xx/xxx,xxx,以及2001年11月13日提交的題為「Method and Apparatus for Generating aStereotypical Profile for Recommending Items of InterestUsing Feature-Based Clustering」的美國專利申請序列號NO.xx/xxx,xxx中所描述的。每個申請在此引入作為參考。
電視節目推薦器100可以實現為任何一種計算設備,例如個人計算機或工作站等設備,它包括例如中央處理單元(CPU)的處理器115,和例如RAM和/或ROM的存儲器120。例如,電視節目推薦器100還可以實現為在置頂終端或顯示器(未示出)中的專用集成電路(ASIC)。另外,電視節目推薦器100可以實現為任意可用的電視節目推薦器,諸如可從加利福尼亞Sunyvale的Tivo公司得到的商用TivoTM系統,或者在1999年12月17日提交的題為「Method and Apparatus forRecommending Television Programming Using Decision Trees」的美國專利申請No.09/466,406中所描述的電視節目推薦器,以及在2000年2月4日提交,題目為「Bayesian TV Show Recommender」的美國專利申請No.09/498,271中所描述的電視節目推薦器,以及在於2000年7月27日提交的題為「Three-Way Media RecommendationMethod and System」的美國專利申請No.09/627,139中所描述的電視節目推薦器,或者他們的任意組合,每個申請都在此引入作為參考。
電視節目推薦器100包括節目資料庫200和存儲器120中的伺服器例行程序,例如原型簡檔處理300,以及(未示出)群集例行程序,均值計算例行程序,間距計算例行程序和群集性能估算例行程序。通常,節目資料庫200可以實現為已知的電子節目指南並記錄在給定時間間隔中可獲得的每個節目的信息。自適應原型簡檔處理300(i)處理第三方收看歷史130以生成原型簡檔,原型簡檔反映了由代表性的觀眾收看的電視節目的典型模式;(ii)使用所選的原型生成相對於所謂實地真實情況的推薦,用原型簡檔中的每個原型的矩心來計算實地真實數據中的每個演出之間的間距(實地真實數據是用戶已經給出特定信息的一組演出,特定信息例如是他/她喜歡那個演出的程度。例如,用戶可指示他/她熱愛演出「Seinfeld」,熱愛可以被轉換成0.85和1.0之間或者被轉換為其它適合的評分換算方式);(iii)如果在計算的推薦與原始的實地真實數據之間存在不一致(例如,如果用戶指示他/她熱愛「Seinfeld」,則分數應當在0.85和1.0之間,因此我們知道當計算推薦時評分小於0.85,則存在不一致)。然後從用戶請求的附加反饋使用用戶反饋160來轉換推薦;(iv)接著使用用戶反饋創建一個在後簡檔(meta-profile),在後簡檔包括用戶已經向他/她希望被推薦或放棄的演出所提供的所有加權(比如正/負的補充)的集合。(v)使用相對於原型簡檔的在後簡檔來重新計算推薦。
特別地,在一個示範性實施例中,群集例行程序可以被自適應原型簡檔處理300調用,以將第三方收看歷史130(數據集合)劃分為群集,以便在一個群集中的那些點(電視節目)比任何其它的群集更接近那個群集的均值(矩心)。群集例行程序調用均值計算例行程序來計算群集的符號均值。間距計算例行程序被群集例行程序調用,以基於特定電視節目與特定群集的均值之間的間距來估算電視節目與每個群集的接近度。接著群集例行程序調用群集性能估算例行程序,確定何時滿足用於生成群集的停止標準,如在2001年11月13日提交的題為「Method and Apparatus for Generating a stereotypicalprofile for recommending items of interest using feature-based clustering」的美國專利申請No.10/014,189的中所進一步描述的,該申請在此引入作為參考。
圖2是一個流程圖,它描述了具有本發明特徵的自適應原型簡檔處理300的示範性執行。如前面指示的,自適應原型簡檔處理300在步驟310處理第三方收看歷史130,以根據反映由代表性觀眾收看的電視節目的典型模式的原型來生成原型簡檔。在步驟320使用選擇的原型生成相對於實地真實數據的推薦。通過使用下列等式,用原型簡檔中的每個原型的矩心計算在實地真實數據中的每個演出之間的間距來計算推薦。
D(S1-S2)=1N(S1i-S2i)]]>這裡S1和S2對應兩個演出,N對應構成演出記錄的特徵數目。請注意間距D被規一化為處於0和1之間。
此後在步驟330-350,計算出的推薦與原始實地真實數據相比,如果它們之間存在不一致,則用戶被提示關於推薦的附加反饋。能夠通過任何常規的方法從用戶獲得反饋。接著該反饋被用於形成加權因子。作為一個實例,如果用戶指示他喜歡所有Clint Eastwood的電影,那麼有Clint Eastwood演出的全部評分都被增加,反之亦然。另外,該加權因子被用在節目級別以及特徵級別。例如,在整個演出級別或構成演出的諸如演員、種類等特徵。在步驟360,反饋被用於創建在後簡檔,該簡檔包括用戶已經為他/她希望被推薦或放棄的演出提供的所有加權(比如正/負的補充)的集合。最後,在步驟370,通過使用相對於原型簡檔的在後簡檔來重新計算推薦D(S1-S2)=(1-W)1N(S1i-S2i)]]>應當注意,因為簡檔中的演出本身是矩心,所以對原型簡檔的加權常常被設置成1。直觀地,當用戶給出反饋時,他/她希望演出的評分離矩心更近或遠離矩心。應注意上面給出的措施給出了一個間距。理想地,演出具有零間距時,這意味著演出更接近矩心。為了得到一個評分;從1中減去。作為例證,如果用戶已經對特定演出給出下列反饋——不關心、喜歡和熱愛,這分別對應於0、0.7和1。另外,讓我們假設在演出與原型簡檔之間實際計算的間距為0.2。下表顯示用上面所示的等式計算的數值。
加權 間距概率...........................................
0 0.2 0.80.7 0.060.941 0 1.0要注意的是,在用戶完全不喜歡的情況下,需要建立特殊的邊界條件,例如,如果用戶說(-1),則根本不推薦這個演出。在間距超過1的情況下,間距應當被重新規一化以便可以計算分數。
應當理解,在此顯示和描述的實施例和變形只是舉例說明本發明的原理,並且由本領域的熟練技術人員可以做出各種修改而不脫離本發明的精神和範圍。
權利要求
1.一種用於在推薦器中向用戶推薦感興趣的項目的方法,所述方法包括步驟使用原型簡檔和實地真實數據生成最初的推薦;如果最初的推薦與實地真實數據不一致,獲得關於推薦的用戶反饋;使用用戶反饋生成修訂的推薦。
2.權利要求1的方法,其中所述生成最初推薦的步驟包括生成原型,其用於建立原型簡檔。
3.權利要求2的方法,其中所述生成最初推薦的步驟包括用原型簡檔中的每個原型的矩心計算在實地真實數據的每個演出之間的間距。
4.權利要求3的方法,其中所述生成修訂的推薦的步驟包括創建在後簡檔,所述在後簡檔包括一組基於用戶反饋的加權因子,所述在後簡檔被用於生成修訂的推薦。
5.權利要求3的方法,其中所述用於特定符號特徵的兩個值S1和S2之間的間距D由D(S1-S2)=1N(S1i-S2i)]]>給出,其中S1和S2對應兩個項目,N對應構成該項目的原型的數目。
6.權利要求4的方法,其中所述生成修訂推薦包括通過應用相對於原型簡檔的在後簡檔W來計算修訂間距D,間距D由D(S1-S2)=(1-W)1N(Sli-S2i)]]>給出,其中S1和S2對應兩個項目,N對應構成該項目的原型的數目。
7.權利要求1的方法,其中所述項目是節目。
8.權利要求1的方法,其中所述項目是內容。
9.權利要求1的方法,其中所述項目是產品。
10.一種用於在推薦器中向用戶推薦感興趣的項目的系統(100),包括存儲器(120),用於存儲計算機可讀代碼;以及處理器(115),可操作地耦合到所述存儲器,所述處理器被配置成使用原型簡檔和實地真實數據生成最初的推薦;如果最初的推薦與實地真實數據不一致,請求關於推薦的用戶反饋;使用用戶反饋生成修訂推薦。
11.一種用於在推薦器中向用戶推薦感興趣的項目的系統(100),包括使用原型簡檔與實地真實數據生成最初推薦的裝置;如果最初的推薦與實地真實數據不一致,請求關於推薦的用戶反饋的裝置;使用用戶反饋生成修訂推薦的裝置。
12.一種使用推薦器向用戶推薦感興趣的項目的製品,包括其中嵌入了計算機可讀代碼裝置的計算機可讀介質,所述計算機可讀程序代碼裝置包括使用原型簡檔和實地真實數據生成最初推薦的步驟;如果最初的推薦與實地真實數據不一致,獲得關於推薦的用戶反饋的步驟;使用用戶反饋生成修訂推薦的步驟。
全文摘要
公開一種用於向用戶推薦感興趣的項目的方法和設備,例如電視節目推薦。根據本發明的原理,修改或轉換在得到用戶的收看歷史或購買歷史之前生成的最初推薦,以使用反饋處理更好地捕捉用戶的收看行為。特別地,生成的原型被用於建立原型簡檔。然後生成的原型簡檔反映由代表性觀眾選擇的項目的典型模式。使用原型簡檔計算相對於實地真實數據的推薦,其中用原型簡檔中的每個原型的矩心來計算在所謂實地真實數據的每個演出之間的間距。如果計算的推薦與原始的實地真實數據之間不一致,則從用戶請求附加反饋,該反饋用來創建在後簡檔。在後簡檔包括用戶已經向他/她希望推薦或放棄的演出提供的所有加權(比如正/負的補充)的集合。最後,通過使用相對於原型簡檔的在後簡檔來重新計算推薦。
文檔編號H04N7/173GK1663263SQ03814205
公開日2005年8月31日 申請日期2003年6月11日 優先權日2002年6月18日
發明者S·古特塔, K·庫拉帕蒂 申請人:皇家飛利浦電子股份有限公司