新四季網

一種信息推薦方法及系統的製作方法

2023-08-10 08:15:06

專利名稱:一種信息推薦方法及系統的製作方法
技術領域:
本申請涉及網際網路應用技術領域,特別是涉及一種信息推薦方法及系統。
背景技術:
隨著網際網路的不斷發展,通過網站或即時通信等方式結識網友已經成為一種流行趨勢。目前,很多網站或即時通信工具都具有好友信息推薦的功能,通過好友信息推薦,可以拓展用戶群體,增進網友之間的交流和互動,也可以加強網站或即時通信工具對用戶的粘性。現有技術中一種常用的好友信息推薦方式是根據當前已經存在的好友關係進行推薦,例如,當前,用戶A和用戶B具有好友關係,並且用戶B和用戶C具有好友關係,則系統會根據上述已存在的好友關係,將用戶C的標識信息推薦給用戶A,其中,用戶標識信息可以在系統中唯一標識用戶的身份,例如用戶名、用戶郵件帳號、用戶ID號碼等。上述信息推薦方式的問題在於,系統向用戶所推薦的只是「好友的好友」,卻並不一定是用戶真正感興趣的好友。現有技術中另一種信息推薦方式是根據用戶的屬性信息進行推薦,例如,向用戶推薦具有相同或相似愛好的用戶作為好友。這種方式的實現依賴於用戶屬性信息的完整性和準確性,然而在實際應用中,很多用戶在註冊時往往並不注重這部分信息的填寫,使得這種方案難以實施。綜上所述,現有的推薦方案無法實現準確有效的好友信息推薦,而一旦向用戶推薦了不合適的網友的信息,則很可能會降低用戶的使用感受。從系統的角度而言,不合適的好友信息推薦必然會增加用戶之間不必要的信息交互,從而導致為網站伺服器或即時通信伺服器增加額外的無效負擔,以及網絡帶寬資源的額外浪費。

發明內容
為解決上述技術問題,本申請實施例提供一種信息推薦方法及系統,以提高用戶的使用感受、減少用戶之間不必要的信息交互,減輕系統伺服器的負擔,節省網絡帶寬資源佔用。本申請實施例所提供的技術方案如下本申請實施例提供一種信息推薦方法,包括查詢預置時間段內的用戶行為數據;根據所查詢的用戶行為數據,獲得用戶的子類目興趣度和/或用戶的關鍵詞興趣度,並利用所獲得的子類目興趣度和/或關鍵詞興趣度,構成用戶的興趣度向量;利用向量夾角公式,計算當前用戶興趣度向量與其他用戶興趣度向量的相似性;根據相似性計算結果,選取與當前用戶興趣度向量相似性最高的至少一名用戶, 將所選取的用戶的標識信息,向當前用戶進行推薦;其中,所述子類目興趣度,用於表示用戶對網站子類目訪問興趣度的相對關係;所述關鍵詞興趣度,用於表示用戶對關鍵詞使用興趣的相對關係。
本申請實施例還提供一種信息推薦系統,包括查詢單元,用於查詢預置時間段內的用戶行為數據;用戶興趣度獲得單元,用於根據所述查詢單元的查詢結果,獲得用戶的子類目興趣度和/或用戶的關鍵詞興趣度,並利用所獲得的子類目興趣度和/或關鍵詞興趣度,構成用戶的興趣度向量;用戶相似性計算單元,用於利用向量夾角公式,計算當前用戶興趣度向量與其他用戶興趣度向量的相似性;第一推薦單元,用於根據相似性計算結果,選取與當前用戶興趣度向量相似性最高的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦;其中,所述子類目興趣度,用於表示用戶對網站子類目訪問興趣度的相對關係;所述關鍵詞興趣度,用於表示用戶對關鍵詞使用興趣的相對關係。本申請實施例提供的技術方案,利用用戶在網站上的行為數據進行好友標識信息的推薦。行為數據是在用戶訪問網站時系統所要記錄的必要信息,因此本申請方案不會為系統增加額外的負擔。與現有的推薦方式相比,行為數據信息能夠在客觀上反映用戶的興趣及需求,也不需要依賴於用戶個人的填寫,因此本申請方案可以實現更為準確和有效的好友信息推薦,從而提高用戶的使用感受、減少用戶之間不必要的信息交互,減輕系統伺服器的負擔,節省網絡帶寬資源佔用。


為了更清楚地說明本申請實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請中記載的一些實施例,對於本領域普通技術人員來講,還可以根據這些附圖獲得其他的附圖。圖1為本申請實施例信息推薦方法的一種流程圖;圖2為本申請實施例信息推薦方法的第二種流程圖;圖3為本申請實施例信息推薦方法的第三種流程圖;圖4為本申請實施例信息推薦方法的第四種流程圖;圖5為本申請實施例信息推薦系統的結構示意圖;圖6為本申請實施例信息推薦系統的另一種結構示意圖;圖7為本申請實施例信息推薦系統的第三種結構示意圖。
具體實施例方式為了使本技術領域的人員更好地理解本申請中的技術方案,下面將結合本申請實施例中的附圖,對本申請實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本申請一部分實施例,而不是全部的實施例。基於本申請中的實施例,本領域普通技術人員所獲得的所有其他實施例,都應當屬於本申請保護的範圍。首先對本申請實施例的一種信息推薦方法進行說明,參見圖1所示,包括以下步驟查詢預置時間段內的用戶行為數據,
根據所查詢的用戶行為數據,獲得用戶的子類目興趣度和/或用戶的關鍵詞興趣度,並利用所獲得的子類目興趣度和/或關鍵詞興趣度,構成用戶的興趣度向量;利用向量夾角公式,計算當前用戶興趣度向量與其他用戶興趣度向量的相似性;根據相似性計算結果,選取與當前用戶興趣度向量相似性最高的至少一名用戶, 將所選取的用戶的標識信息,向當前用戶進行推薦;在上述方案中,「子類目興趣度」的作用是表示用戶對網站各個子類目訪問興趣度的相對關係,其中,在用戶行為數據中,一般都記錄著用戶對每個網站子類目頁面的點擊/ 瀏覽次數、在每個子類目的停留時間、在每個子類目發布信息的次數等信息,這些信息都可以用來表示用戶對子類目的興趣。在實際應用中,可以利用上述任意一種信息數據值,或者多種信息數據值的加權,分別表示出用戶對每個網站子類目的興趣值,某個用戶對每個網站子類目的興趣值的數據集合,即構成了該用戶的子類目興趣度。類似地,「關鍵詞興趣度」的作用是表示用戶對各種關鍵詞使用興趣度的相對關係,其中,在用戶行為數據中,一般都記錄著用戶對各種關鍵詞的使用場景、使用次數等信息,這些信息都可以用來表示用戶對關鍵詞的使用興趣。在實際應用中,可以利用上述任意一種信息數據值,或者多種信息數據值的加權,分別表示出用戶對每個關鍵詞的興趣值,某個用戶對每個關鍵詞的興趣值的數據集合,即構成了該用戶的關鍵詞興趣度。在本申請實施例的方案中,為系統中的每個用戶構建一個興趣度向量,然後根據用戶間的興趣度向量的相似性關係,判斷用戶之間是否有相似的興趣,並以此作為推薦好友的依據。其中,用戶的興趣度向量可以單獨根據子類目興趣度構建、也可以單獨根據關鍵詞興趣度構建,還可以同時使用以上兩者進行構建。上述方案利用了用戶在網站上的行為數據進行好友信息推薦。由於行為數據是在用戶訪問網站時系統所要記錄的必要信息,因此本申請方案不會為系統增加額外的負擔。與現有的推薦方式相比,行為數據信息能夠在客觀上反映用戶的興趣及需求,也不需要依賴於用戶個人的填寫,因此本申請方案可以實現更為準確和有效的好友信息推薦,從而提高用戶的使用感受、減少用戶之間不必要的信息交互,減輕系統伺服器的負擔,節省網絡帶寬資源佔用。下面結合具體的實施方式,對本申請的信息推薦方案進行說明圖1所示為本申請實施例一種信息推薦方法的流程圖,包括以下步驟S101,查詢預置時間段內的用戶行為數據;本申請實施例方案,是基於用戶的行為的歷史數據,對用戶之間的興趣相似性進行分析,作為好友信息推薦的依據。對於網站或即時通信工具的每一個註冊用戶,系統都會記錄用戶的各種行為,並將這些行為記錄在用戶日誌中,常見的用戶行為數據包括用戶的瀏覽行為數據(例如曾經瀏覽過哪些頁面、瀏覽頁面的次數、瀏覽頁面的時間)、搜索行為數據(例如曾經使用過哪些搜索關鍵詞、使用搜索關鍵詞的次數)等等,當然,對於不同應用的網站或即時通信工具,所記錄的具體行為數據的種類也各不相同。例如,對於電子商務網站而言,用戶的行為數據還可以包括用戶的賣、買行為數據等等,這些都可以體現出用戶的個人興趣,本領域技術人員也可以根據實際的應用需求,獲取不同類型的用戶行為數據, 本實施例對此並不進行限定。 本申請實施例方案中,通過用戶日誌獲取用戶的各種行為數據,在實際應用中,可以獲取用戶從註冊時間開始至今的行為數據作為計算用戶興趣度的依據。而考慮到用戶的興趣很可能是隨著時間階段性變化的,因此也可以選擇用戶在最近一段時間(例如30天、 60天等等)的行為數據作為計算用戶短期興趣度的依據。本領域技術人員可以根據實際需求對所查詢時間段進行設定。S102,根據所查詢的用戶行為數據,獲得用戶的子類目興趣度和/或用戶的關鍵詞興趣度,並利用子類目興趣度和/或關鍵詞興趣度,構成用戶的興趣度向量;1)子類目興趣度「子類目興趣度」的作用是表示用戶對網站各個子類目訪問興趣度的相對關係,例如,某網站共有兩個子類目A、B,那麼對於該網站而言,用戶的子類目興趣度中,應該同時體現用戶對A、B兩個子類目興趣的相對關係。具體而言,用戶的對單個子類目的興趣,可以根據用戶行為數據中的相關信息來表示,例如,根據用戶行為數據可知用戶1曾經瀏覽過子類目A下的網頁2次、瀏覽過子類目B下的網頁5次;用戶2曾經瀏覽過子類目A下的網頁3次、瀏覽過子類目B下的網頁0次。那麼可以將用戶1的子類目興趣度表示為O、5),將用戶2的子類目興趣度表示為 (3,0)。上述例子中,是以「用戶瀏覽子類目下網頁次數」這一行為數據來構建用戶的子類目興趣度,可以理解的是,在實際應用中,還可以用其他的行為數據來構建用戶的子類目興趣度,或者綜合考慮多種行為數據來構建用戶的子類目興趣度,以電子商務網站應用為例, 可以採用以下的方式,計算用戶對單個子類目的興趣值用戶對某子類目興趣值=在該子類目下發布的商品數量拉+對該子類目下頁面的瀏覽次數*0. 1+在該子類目下的回覆次數*0. 4+在該子類目下的訂單發放次數拉+在該子類目下的求購信息發布次數拉在上述方法中,利用到了電子商務網站中的5種行為數據,並且對每種行為數據賦予一定的權重,然後通過計算加權值,得到對單個子類目的興趣值。通過上面的公式可以看出,結合電子商務網站的實際情況,對於發布商品、發布訂單等買賣行為賦予了較高的權值,而對於瀏覽等行為賦予了較低的權值。當然,以上公式僅用於示意性說明,根據不同的應用需求,也可以設置其他的權重值,或者選擇其他類型的行為數據,本申請實施例對此並不進行限定。分別計算出用戶對每個子類目的興趣值之後,這些興趣值的集合也就構成了用戶的子類目興趣度。2)關鍵詞興趣度「關鍵詞興趣度」的作用是表示用戶對各種關鍵詞使用興趣度的相對關係。在實際應用中,不同用戶所使用過的關鍵詞可能千差萬別,為了便於統計,系統可以根據所有用戶的歷史搜索行為,選取出一定數量的使用頻率較高、或者比較具有代表性的關鍵詞作為統計的依據。例如,某網站選用個搜索關鍵詞χ、γ、ζ作為關鍵詞興趣度的統計依據,那麼對於該網站而言,用戶的關鍵詞興趣度中,應該同時體現用戶對X、Y、Z三個關鍵詞使用興趣的相對關係。
具體而言,用戶的對單個關鍵詞的使用興趣,可以根據用戶行為數據中的相關信息來表示,例如,根據用戶行為數據可知用戶1曾經使用關鍵詞X進行搜索共2次、使用關鍵詞Y進行搜索共3次、使用關鍵詞Z進行搜索共4次;用戶2曾經使用關鍵詞X進行搜索共3次、使用關鍵詞Y進行搜索共1次、使用關鍵詞Z進行搜索共0次;那麼可以將用戶1的關鍵詞興趣度表示為0、3、4),將用戶2的關鍵詞興趣度表示為(3、1、0)。當然,在實際應用中,所選用的關鍵詞數量可能遠大於3,上述例子僅用於示意性說明。上述例子中,是以「用戶使用關鍵詞進行搜索的次數」這一行為數據來構建用戶的關鍵詞興趣度,可以理解的是,在實際應用中,還可以用其他的行為數據來構建用戶的關鍵詞興趣度,或者綜合考慮多種行為數據來構建用戶的關鍵詞興趣度,以電子商務網站應用為例,可以採用以下的方式,計算用戶對單個關鍵詞的興趣值用戶對某關鍵詞興趣值=所發布的商品信息中包含該關鍵詞的次數拉+所發布的求購信息中包含該關鍵詞的次數拉+使用該關鍵詞進行搜索的次數*0. 4在上述方法中,利用到了電子商務網站中的3種行為數據,並且對每種行為數據賦予一定的權重,然後通過計算加權值,得到對單個關鍵詞的興趣值。通過上面的公式可以看出,結合電子商務網站的實際情況,對於在買賣行為中使用關鍵詞的行為賦予了較高的權值,而對於使用關鍵詞進行搜索的行為賦予了較低的權值。當然,以上公式僅用於示意性說明,根據不同的應用需求,也可以設置其他的權重值,或者選擇其他類型的行為數據,本申請實施例對此並不進行限定。分別計算出用戶對每個關鍵詞的興趣值之後,這些興趣值的集合也就構成了用戶的關鍵詞興趣度。3)用戶興趣度向量本申請實施例中,利用子類目興趣度和關鍵詞興趣度,構成用戶的興趣度向量,例如,根據前面的例子,可得到將用戶1的興趣度向量為K2、5),(2、3、4)]、用戶2的興趣度向量為[(3、0),(3、1、0)]。當然,可以理解的是,也可以僅採用子類目興趣度或關鍵詞興趣度中的一種,直接構成用戶的興趣度向量,本實施例對此不再詳細說明。S103,利用向量夾角公式,計算當前用戶興趣度向量與其他用戶興趣度向量的相似性;通過步驟S102,可以獲得在網站中註冊的所有用戶的興趣度向量。可以看出, 上述例子中,用戶的興趣度都是以一個5維向量的形式表示,根據多維歐氏空間中對向量夾角的定義,可以使用向量夾角公式來表示任意兩個用戶興趣度向量之間的相似性,例如用戶1的興趣度向量為a,用戶2的興趣度向量為b,那麼,向量a和向量b的相似性 similarity (a, b)可表示為Similarity (a, b) = cos (a, b)=(向量a與向量b的內積)/(向量a與向量b模的乘積)
根據上述公式可知,用戶興趣度向量相似性的取值範圍為[_1,1],當取值為1時, 兩個向量相同(向量夾角為0度),說明兩個用戶的興趣也完全相同;而取值為-1時,兩個向量相反(夾角為180度),說明兩個用戶間的興趣也完全沒有相似之處。假設用戶1為當前用戶,準備對用戶1進行信息推薦,則系統分別計算出用戶1與系統中其他用戶興趣度向量的相似性。S104,根據相似性計算結果,選取與當前用戶興趣度向量相似性最高的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦;得到當前用戶與系統中其他用戶興趣度向量的相似性之後,可以按照相似性排列的大小順序,選取相似性最高的一名或多名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦;當然,也可以預先設置一個相似性閾值,這個閾值的理論取值範圍是(_1,1),考慮到相似性的實際意義,該閾值一般應該設置為大於0。如果某個用戶與當前用戶的相似性不小於該閾值,則可以對將這個用戶的標識信息加入推薦列表中,推薦給當前用戶。在實際應用中,可能推薦結果中的有些用戶已經和當前用戶具有好友關係了,這種情況下,系統可以將這些已經成為好友的用戶的標識信息濾除,按照相似性排列的大小順序,繼續選擇其他用戶進行推薦。此外,考慮到向用戶推薦的網友,應該是在網絡中活動比較多的網友,因此,可以利用一種或多種用戶歷史行為數據的加權,構成「用戶活躍度」,例如,定義用戶活躍度=用戶登錄網站的次數*0. 2+用戶登錄網站的時長*0. 2+用戶登錄即時通信工具的次數*0. 1+用戶登錄即時通信工具的時長*0. 2+新增好友的數目*0.3其中,上述的即時通信工具,應該是與網站有所關聯的即時通信工具,例如阿里巴巴網站所對應的貿易通(阿里旺旺),因此,用戶在即時通信工具的相關行為信息,也可以反映出用戶在網站的活躍程度。在上述方法中,利用到了電子商務網站中的5種行為數據,並且對每種行為數據賦予一定的權重,然後通過計算加權值,得到用戶在一定時期內的活躍度,當然,以上公式僅用於示意性說明,根據不同的應用需求,也可以設置其他的權重值,或者選擇其他類型的行為數據,本申請實施例對此並不進行限定。得到每個用戶的活躍度之後,可以結合S103中的計算結果,在與當前用戶興趣度向量相似性較高的用戶中,進一步選出活躍度較高的用戶,將所選取的用戶的標識信息,向當前用戶進行推薦。當然,也可以預先設置一個活躍度閾值,如果某個用戶活躍度不小於該閾值,則可以將這個用戶的標識信息加入推薦列表中,推薦給當前用戶。上述方法中,根據用戶的行為數據,為系統中的每個用戶構建一個興趣度向量,然後根據用戶間的興趣度向量的相似性關係,判斷用戶之間是否有相似的興趣,並以此作為推薦好友的依據。結合電子商務網站的實際情況,在本申請的另一個實施例中,還可以根據用戶的買賣行為對用戶類型進行劃分,然後根據不同的用戶類型分別進行信息推薦,參見圖2所示,本申請實施例所提供的另一種信息推薦方法,可以包括以下步驟S101,查詢預置時間段內的用戶行為數據;
這部分內容與前一實施例中的SlOl基本類似,具體到本實施例而言,只是所獲取的具體行為數據類型有所區別,這裡不再重複說明。S105,根據所查詢的用戶歷史行為數據,確定用戶的類別;買賣行為是電子商務的網站中的一種特有的行為,本實施根據用戶的買賣行為數據,將用戶分為以下三類第一類用戶(純賣家用戶)僅發布過商品供應信息、沒有購買行為的用戶;第二類用戶(純買家用戶)沒有發布過商品供應信息、僅有購買行為的用戶;第三類用戶(買賣用戶)既發布過商品供應信息、又有購買行為的用戶。S106,根據當前用戶的類別,選取與其對應的推薦類別的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦;根據S105所確定的用戶類別,採用以下原則進行信息推薦如果當前用戶為純賣家用戶,則向其推薦純買家用戶作為網友;如果當前用戶為純買家用戶,則向其推薦純賣家用戶作為網友;如果當前用戶為買賣用戶,那麼,一種推薦方案是也向其推薦買賣用戶作為網友; 另一種方案是,既向其推薦純賣家用戶,也向其推薦純買家用戶;在推薦過程中,還可以結合用戶的興趣商品類目進行推薦,即所推薦的網友應該是與當前網友具有相同或相似興趣商品類目的,這裡,可以利用步驟S102中對單一子類目興趣值的計算方法,得到每名用戶最感興趣(興趣值最高)的一個或多個類目。相應地,在推薦過程中,根據當前用戶的類別,首先選取與其對應的推薦類別,然後進一步在推薦類別中,選取當前用戶的具有相同偏好子類目的一名或多名用戶,將所選取的用戶的標識信息, 向當前用戶進行推薦。特別地,對於買賣用戶而言,其「購買興趣類目」和「售賣興趣類目」 可能並不一致,因此,當應用上述的同時推薦純賣家用戶和純買家用戶的方案時,可以根據當前用戶的買賣行為,分別計算得到其「購買興趣類目」和「售賣興趣類目」,然後針對其「購買興趣類目,,推薦相應的純賣家用戶、針對其「售賣興趣類目,,推薦相應的純買家用戶。可以理解的是,這裡同樣可以結合考慮「用戶活躍度」的因素,即在與當前用戶的具有相同偏好子類目的用戶中,進一步選出活躍度較高的用戶,將所選取的用戶的標識信息,向當前用戶進行推薦。其中,用戶活躍度的計算方式可以與S104中所述相同,這裡不再重複描述。以上,提供了兩種根據用戶的行為數據進行信息推薦的具體方案,在實際應用中, 這兩種方案可以分別單獨使用,也可以共同使用,參見圖3所示,該方法中,根據用戶的興趣度相似性和用戶的類別,分別得到兩組推薦結果,在步驟S107中,對這兩組推薦結果進行綜合處理,綜合處理的方式可以是分將兩組推薦結果分別展示給用戶,並且告知每組結果的推薦依據,讓用戶根據個人需求進行選擇;當然,也可以分別從兩組推薦結果中各隨機選取一部分,混合處理之後展示給用戶。本實施例對具體的綜合處理方式並不進行限定。參見圖4所示,在本申請的另一個實施例中,將根據用戶類別所選擇的用戶的集合,作為根據相似性計算結果所選擇的用戶的集合的補充數據集,向當前用戶進行信息推薦。本實施例中S201-S204與前述的S101-S104相同,而在S205中,推薦系統判斷根據相似性計算結果所推薦的好友數是否達到預定的推薦數量,如果沒有達到,則繼續執行後續步驟,根據用戶類別進行好友信息推薦。例如,系統要求每次向當前用戶推薦20個用戶的標識信息作為選擇,但是由於相似性閾值、活躍度閾值等條件限制,導致S204結果推薦的用戶標識信息數並沒有達到20, 此時將進一步執行S206-S207(與前述的S106-S107相同),然後,在S208中,將S207的推薦結果作為S204推薦結果的補充,作為最終的推薦結果反饋給當前用戶。在補充數據集的實際實現中,可以為每個類目預先計算出每個100名活躍度高的純買家用戶、100名活躍度高的純賣家用戶、以及100名活躍度高的買賣用戶作為候選。選擇100這個數字遠大於實際需要的推薦數量20,這樣可以避免為不同用戶提供的補足數據太過重複。在推薦過程中,根據當前用戶的類型和偏好子類目,找到對應的推薦類型下的候選數據,隨機選取需要的數目進行補足。在隨機選取補足數據時,可以根據被推薦用戶的ID 生成一個Hash函數,映射到1-100之間,然後根據這個映射的序號,選取在此序號後面需要的補足個數的數據。這樣既保證了取數的隨機性,又能夠保證對相同的用戶ID,取到的補足的推薦數據是相同的。最後,如果當前用戶是新的註冊用戶,沒有足夠的行為數據可用於識別用戶的興趣或類型,這種情況下,作為對本申請方案的補充,可以根據用戶的屬性信息(例如來源地區等),隨機從具有相同屬性信息的100個活躍度高的用戶中選取20名用戶進行信息推薦。上述實施例所提供的方案,可應用於電子商務網站頁面的好友信息推薦,如阿里巴巴人脈通應用;也可應用於即時通信工具的好友信息推薦,如阿里巴巴的貿易通;還可應用於移動通訊終端設備的應用程式。當然,結合不同的應用需求,也可以將本申請的方案應用與其他類型的網站或即時通信工具的好友信息推薦。以實現更為準確和有效的好友信息推薦,提高用戶的使用感受、減少用戶之間不必要的信息交互,減輕系統伺服器的負擔, 節省網絡帶寬資源佔用。相應於上面的方法實施例,本申請還提供一種信息推薦系統,參見圖5所示,該系統可以包括查詢單元510,用於查詢預置時間段內的用戶行為數據,用戶興趣度獲得單元520,用於根據所述查詢單元510的查詢結果,獲得用戶的子類目興趣度和/或用戶的關鍵詞興趣度,並利用所獲得的子類目興趣度和/或關鍵詞興趣度,構成用戶的興趣度向量;用戶相似性計算單元530,用於利用向量夾角公式,計算當前用戶興趣度向量與其他用戶興趣度向量的相似性;第一推薦單元M0,用於根據相似性計算結果,選取與當前用戶興趣度向量相似性最高的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦;其中,所述子類目興趣度,用於表示用戶對網站各個子類目訪問興趣度的相對關係;所述關鍵詞興趣度,用於表示用戶對各種關鍵詞使用興趣的相對關係。其中,所述用戶興趣度獲得單元520,可以利用用戶對多個網站子類目的興趣值, 構成用戶的子類目興趣度向量。而用戶對單個子類目的興趣值,可以利用以下一種或多種用戶歷史行為數據的加權來獲得在該子類目下發布的商品數量、對該子類目下頁面的瀏覽次數、在該子類目下的回覆次數、在該子類目下的訂單發放次數、在該子類目下的求購信息發布次數。
此外,所述用戶興趣度獲得單元520,可以利用用戶對多個關鍵詞的興趣值,構成用戶的關鍵詞興趣度向量。而用戶對單個關鍵詞的興趣值,可以利用以下一種或多種用戶歷史行為數據的加權來獲得所發布的商品信息中包含該關鍵詞的次數、所發布的求購信息中包含該關鍵詞的次數、使用該關鍵詞進行搜索的次數。參見圖6所示,本申請實施例所提供的信息推薦系統,還可以包括用戶類別確定單元550,用於根據所述查詢單元510的查詢結果,確定用戶的類別;第二推薦單元560,用於根據當前用戶的類別,選取與其對應的推薦類別的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦;其中,用戶類別包括第一類用戶僅發布過商品供應信息、沒有購買行為的用戶;第二類用戶沒有發布過商品供應信息、僅有購買行為的用戶;第三類用戶既發布過商品供應信息、又有購買行為的用戶;所述第一類用戶對應的推薦類別為第二類用戶;所述第二類用戶對應的推薦類別為第一類用戶;所述第三類用戶對應的推薦類別為第三類用戶、或第一類用戶與第二類用戶的組合。具體而言,所述第二推薦單元560,可以根據當前用戶的類別,選取與其對應的推薦類別中的、且與當前用戶的具有相同偏好子類目的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦;其中,所述偏好子類目為用戶對該子類目的興趣值大於預置門限值的子類目。更為具體地,所述第二推薦單元560,可以根據當前用戶的類別,選取與其對應的推薦類別中的、且與當前用戶的具有相同偏好子類目的、且用戶活躍度最高至少一名用戶, 將所選取的用戶的標識信息,向當前用戶進行推薦;其中,用戶的活躍度,可以利用以下一種或多種用戶歷史行為數據的加權來獲得登錄網站的次數、時長、登錄與所述網站關聯的即時通信工具的次數、時長、新增的好友數目。參見圖7所示,本申請實施例所提供的信息推薦系統,還可以進一步包括第三推薦單元570,用於對第一推薦單元540和第二推薦單元560的處理結果進行綜合處理,然後向當前用戶進行推薦,例如將所述第二推薦單元560所選擇的用戶的集合,作為所述第一推薦單元540所選擇的用戶的集合的補充數據集,向所述當前用戶進行信息推薦。為了描述的方便,描述以上裝置時以功能分為各種單元分別描述。當然,在實施本申請時可以把各單元的功能在同一個或多個軟體和/或硬體中實現。通過以上的實施方式的描述可知,本領域的技術人員可以清楚地了解到本申請可藉助軟體加必需的通用硬體平臺的方式來實現。基於這樣的理解,本申請的技術方案本質上或者說對現有技術做出貢獻的部分可以以軟體產品的形式體現出來,該計算機軟體產品可以存儲在存儲介質中,如ROM/RAM、磁碟、光碟等,包括若干指令用以使得一臺計算機設備 (可以是個人計算機,伺服器,或者網絡設備等)執行本申請各個實施例或者實施例的某些部分所述的方法。本說明書中的各個實施例均採用遞進的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對於系統實施例而言,由於其基本相似於方法實施例,所以描述得比較簡單,相關之處參見方法實施例的部分說明即可。以上所描述的系統實施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位於一個地方,或者也可以分布到多個網絡單元上。可以根據實際的需要選擇其中的部分或者全部模塊來實現本實施例方案的目的。本領域普通技術人員在不付出創造性勞動的情況下,即可以理解並實施。本申請可用於眾多通用或專用的計算系統環境或配置中。例如個人計算機、伺服器計算機、手持設備或可攜式設備、平板型設備、多處理器系統、基於微處理器的系統、置頂盒、可編程的消費電子設備、網絡PC、小型計算機、大型計算機、包括以上任何系統或設備的分布式計算環境等等。本申請可以在由計算機執行的計算機可執行指令的一般上下文中描述,例如程序模塊。一般地,程序模塊包括執行特定任務或實現特定抽象數據類型的例程、程序、對象、組件、數據結構等等。也可以在分布式計算環境中實踐本申請,在這些分布式計算環境中,由通過通信網絡而被連接的遠程處理設備來執行任務。在分布式計算環境中,程序模塊可以位於包括存儲設備在內的本地和遠程計算機存儲介質中。以上所述僅是本申請的具體實施方式
,應當指出,對於本技術領域的普通技術人員來說,在不脫離本申請原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應視為本申請的保護範圍。
權利要求
1.一種信息推薦方法,其特徵在於,包括 查詢預置時間段內的用戶行為數據;根據所查詢的用戶行為數據,獲得用戶的子類目興趣度和/或用戶的關鍵詞興趣度, 並利用所獲得的子類目興趣度和/或關鍵詞興趣度,構成用戶的興趣度向量;利用向量夾角公式,計算當前用戶興趣度向量與其他用戶興趣度向量的相似性; 根據相似性計算結果,選取與當前用戶興趣度向量相似性最高的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦;其中,所述子類目興趣度,用於表示用戶對網站子類目訪問興趣度的相對關係;所述關鍵詞興趣度,用於表示用戶對關鍵詞使用興趣的相對關係。
2.根據權利要求1所述的方法,其特徵在於,所述獲得用戶的子類目興趣度,包括利用用戶對多個網站子類目的興趣值,構成用戶的子類目興趣度向量;所述獲得用戶的關鍵詞興趣度,包括利用用戶對多個關鍵詞的興趣值,構成用戶的關鍵詞興趣度向量。
3.根據權利要求2所述的方法,其特徵在於,利用以下一種或多種用戶歷史行為數據的加權,獲得用戶對單個子類目的興趣值 在該子類目下發布的商品數量、對該子類目下頁面的瀏覽次數、在該子類目下的回覆次數、在該子類目下的訂單發放次數、在該子類目下的求購信息發布次數。
4.根據權利要求2所述的方法,其特徵在於,利用以下一種或多種用戶歷史行為數據的加權,獲得用戶對單個關鍵詞的興趣值 所發布的商品信息中包含該關鍵詞的次數、所發布的求購信息中包含該關鍵詞的次數、使用該關鍵詞進行搜索的次數。
5.根據權利要求1所述的方法,其特徵在於,所述選取與當前用戶興趣度向量相似性最高的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦,包括在與當前用戶興趣度向量相似性最高的至少一名用戶中,進一步選取用戶活躍度最高的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦;其中,利用以下一種或多種用戶歷史行為數據的加權,獲得用戶的活躍度 登錄網站的次數、時長、登錄與所述網站關聯的即時通信工具的次數、時長、新增的好友數目。
6.根據權利要求1-5任一項所述的方法,其特徵在於,所述方法還包括 根據所查詢的用戶歷史行為數據,確定用戶的類別;根據當前用戶的類別,選取與其對應的推薦類別的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦; 其中,用戶類別包括第一類用戶僅發布過商品供應信息、沒有購買行為的用戶; 第二類用戶沒有發布過商品供應信息、僅有購買行為的用戶; 第三類用戶既發布過商品供應信息、又有購買行為的用戶;所述第一類用戶對應的推薦類別為第二類用戶;所述第二類用戶對應的推薦類別為第一類用戶;所述第三類用戶對應的推薦類別為第三類用戶、或第一類用戶與第二類用戶的組合。
7.根據權利要求6所述的方法,其特徵在於,所述根據當前用戶的類別,選取與其對應的推薦類別的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦,包括根據當前用戶的類別,選取與其對應的推薦類別中的、且與當前用戶的具有相同偏好子類目的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦;其中,所述偏好子類目為用戶對該子類目的興趣值大於預置門限值的子類目。
8.根據權利要求7所述的方法,其特徵在於,所述選取與當前用戶的具有相同偏好子類目的至少一名用戶,包括選取與當前用戶的具有相同偏好子類目的、且用戶活躍度最高的至少一名用戶; 其中,利用以下一種或多種用戶歷史行為數據的加權,獲得用戶的活躍度 登錄網站的次數、時長、登錄與所述網站關聯的即時通信工具的次數、時長、新增的好友數目。
9.根據權利要求6所述的方法,其特徵在於,將根據用戶類別所選擇的用戶的集合,作為根據相似性計算結果所選擇的用戶的集合的補充數據集,向所述當前用戶進行信息推薦。
10.一種信息推薦系統,其特徵在於,包括查詢單元,用於查詢預置時間段內的用戶行為數據;用戶興趣度獲得單元,用於根據所述查詢單元的查詢結果,獲得用戶的子類目興趣度和/或用戶的關鍵詞興趣度,並利用所獲得的子類目興趣度和/或關鍵詞興趣度,構成用戶的興趣度向量;用戶相似性計算單元,用於利用向量夾角公式,計算當前用戶興趣度向量與其他用戶興趣度向量的相似性;第一推薦單元,用於根據相似性計算結果,選取與當前用戶興趣度向量相似性最高的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦;其中,所述子類目興趣度,用於表示用戶對網站子類目訪問興趣度的相對關係;所述關鍵詞興趣度,用於表示用戶對關鍵詞使用興趣的相對關係。
11.根據權利要求10所述的系統,其特徵在於,所述系統還包括用戶類別確定單元,用於根據所述查詢單元的查詢結果,確定用戶的類別; 第二推薦單元,用於根據當前用戶的類別,選取與其對應的推薦類別的至少一名用戶, 將所選取的用戶的標識信息,向當前用戶進行推薦; 其中,用戶類別包括第一類用戶僅發布過商品供應信息、沒有購買行為的用戶; 第二類用戶沒有發布過商品供應信息、僅有購買行為的用戶; 第三類用戶既發布過商品供應信息、又有購買行為的用戶;所述第一類用戶對應的推薦類別為第二類用戶;所述第二類用戶對應的推薦類別為第一類用戶;所述第三類用戶對應的推薦類別為第三類用戶、或第一類用戶與第二類用戶的組合。
12.根據權利要求11所述的系統,其特徵在於,該系統還包括第三推薦單元,用於將所述第二推薦單元所選擇的用戶的集合,作為所述第一推薦單元所選擇的用戶的集合的補充數據集,向所述當前用戶進行信息推薦。
全文摘要
本申請公開了一種信息推薦方法及系統。一種信息推薦方法包括查詢預置時間段內的用戶行為數據;根據所查詢的用戶行為數據,獲得用戶的子類目興趣度和/或用戶的關鍵詞興趣度,並利用所獲得的子類目興趣度和/或關鍵詞興趣度,構成用戶的興趣度向量;利用向量夾角公式,計算當前用戶興趣度向量與其他用戶興趣度向量的相似性;根據相似性計算結果,選取與當前用戶興趣度向量相似性最高的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦信息。本申請方案可以實現更為準確和有效的信息推薦,從而提高用戶的使用感受、減少用戶之間不必要的信息交互,減輕系統伺服器的負擔,節省網絡帶寬資源佔用。
文檔編號G06F17/30GK102411596SQ20101029845
公開日2012年4月11日 申請日期2010年9月21日 優先權日2010年9月21日
發明者楊志雄, 蘇寧軍, 顧海傑 申請人:阿里巴巴集團控股有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀