一種移動社會網絡中的人群劃分方法
2023-05-04 09:33:16 3
一種移動社會網絡中的人群劃分方法
【專利摘要】本發明公開了一種移動社會網絡中的人群劃分方法,包括以下步驟:a、導入用戶地理軌跡日誌文件,計算任意兩個用戶之間的離散地理軌跡相似度si,j;b、基於任意兩用戶的離散地理軌跡相似度,建立User-User相似性矩陣G、Locate-User矩陣L和User-Locate矩陣U;c、導入用戶社交活動日誌,根據用戶彼此之間的手機呼叫歷史記錄建立社交網絡模型,計算社交網絡鄰接矩陣F;d、計算分塊矩陣並劃分人群。本發明通過對手機網絡或基於位置在線社交網絡中的用戶精準劃分,可應用於個性化內容推薦系統,向目標用戶推送個性化內容。
【專利說明】一種移動社會網絡中的人群劃分方法
【技術領域】
[0001]本發明涉及數據挖掘與用戶行為分析技術,具體涉及一種移動社會網絡中的人群劃分方法。通過對手機網絡或基於位置在線社交網絡中的用戶精準劃分,可應用於個性化內容推薦系統。
【背景技術】
[0002]準確劃分人群中的社團或聚類對於優化基於位置的網際網路服務等個性化內容推薦系統具有重大意義,根據人群劃分結果,可準確地向目標用戶推送個性化內容。
[0003]現有劃分人群的方法一般可以分為基於社會網絡社團探測方法和基於數據特徵的聚類方法。
[0004]一方面,基於社會網絡的社團探測的方法根據個體之間的社交關係的緊密程度來劃分傳統意義上的社團,由於這種方法獲得的社團可以很直觀的反映社團內外的社交關係,因此很容易用來分析並解釋一些普遍現象,可以很方便的應用到純社交網絡服務推薦或其他與社交關係緊密相關的問題研究中,但是人群並不一定僅僅具有社交屬性,其他屬性例如地理屬性,社會屬性等同樣影響到個體的行為乃至社團的劃分,進而影響其應用面。
[0005]另一方面,基於共同特徵的數據聚類方法在數據挖掘領域已經有很多應用。這種方法基於不同個體維度的屬性的相似性來獲得個體之間的共同特徵的聚類,從而劃分不同類型的人群。這種方法已廣泛應用到例如電子商務、多媒體內容推送等個性化推薦領域中,但這種方法針對性相對較強,僅能分析並探測用戶在特定屬性維度上的行為。
【發明內容】
[0006]針對現有技術的不足,本發明的目的在於提出一種移動社會網絡中的人群劃分方法,該方法基於離散地理軌跡相似性,同時結合個體的地理屬性與社交屬性,劃分更為精準。
[0007]為實現以上發明目的,本發明採用以下技術方案:
[0008]一種移動社會網絡中的人群劃分方法,包括以下步驟:
[0009]a、導入用戶地理軌跡日誌文件,計算任意兩個用戶之間的離散地理軌跡相似度Si,j,其中,給定總用戶數N,用戶活動區域由M個基站完全覆蓋,所述用戶地理軌跡日誌由用戶ID與用戶活動的基站序號列表組成;
[0010]b、基於任意兩用戶的離散地理軌跡相似度,建立User-User相似性矩陣G、Locate-User矩陣L和User-Locate矩陣U,其中,N*M維User-Locate矩陣U的矩陣兀素PVij表示用戶i在位置j的出現概率;M*N維Locate-User矩陣L的矩陣元素LVij表示位置i上用戶j出現的概率;N*N維User-User相似性矩陣G為:
[0011]
【權利要求】
1.一種移動社會網絡中的人群劃分方法,包括以下步驟: a、導入用戶地理軌跡日誌文件,計算任意兩個用戶之間的離散地理軌跡相似度Si,j,其中,給定總用戶數N,用戶活動區域由M個基站完全覆蓋,所述用戶地理軌跡日誌由用戶ID與用戶活動的基站序號列表組成; b、基於任意兩用戶的離散地理軌跡相似度,建立User-User相似性矩陣G、Locate-User矩陣L和User-Locate矩陣U,其中,N*M維User-Locate矩陣U的矩陣兀素PVij表示用戶i在位置j的出現概率;M*N維Locate-User矩陣L的矩陣元素LVij表示位置i上用戶j出現的概率;N*N維User-User相似性矩陣G為:
2.根據權利要求1所述的劃分方法,其中,任意用戶i,j之間的離散地理軌跡相似度表示為兩者所有共同位置的餘弦相似性指標之和:
3.根據權利要求2所述的劃分方法,其中,步驟a具體為: 首先導入任意兩個用戶的歷史基站序號列表,對比兩者共同的基站數量以及佔各自的比例,計算各自在所有共有基站位置I的出現概率Pu,然後計算對應的餘弦相似性指標,最後求和得到任意兩用戶的離散地理軌跡相似度。
4.根據權利要求1所述的劃分方法,其中,步驟b還包括: 利用對稱非負矩陣分解算法(SNMF)對User-User相似性矩陣G進行矩陣分解,得到個體地理軌跡的初步劃分,即所屬各分塊矩陣的分屬度。
5.根據權利要求1所述的劃分方法,其中,所述用戶i,j的社交關係的權重具體為用戶i,j的社交互動頻次,即用戶i,j之間的通信次數與通話時長。
6.根據權利要求1所述的劃分方法,其中,步驟c具體為:導入N個用戶的社交活動日誌,初始化N*N社交網絡鄰接矩陣F = O,循環讀取每個用戶的社交活動日誌中對應的目標用戶,根據個體間社交關係的權重,更新社交網絡鄰接矩陣中相應的矩陣元素,從而建立群體的社交網絡鄰接矩陣。
7.根據權利要求1所述的劃分方法,其中,步驟d具體為:導入步驟b中的User-User相似性矩陣G、User_Locate矩陣U、Locate_User矩陣L以及步驟c中的社交網絡鄰接矩陣F,設定目標分塊矩陣的初值X為步驟b中對User-User相似性矩陣G進行矩陣分解而得到的分屬度矩陣,採用聯合非負矩陣分解算法(JNMF)做矩陣分解,反覆迭代直到目標分塊矩陣I滿足前後兩次迭代的差值的模小於預定值,輸出各節點所屬各分塊矩陣及其分屬度,即得到群體的劃分情況。`
【文檔編號】G06Q50/00GK103700018SQ201310686372
【公開日】2014年4月2日 申請日期:2013年12月16日 優先權日:2013年12月16日
【發明者】陳述, 塗來, 黃本雄, 馬雪琴 申請人:華中科技大學