一種社交監測子網構建的方法及裝置製造方法
2023-05-21 18:02:01 1
一種社交監測子網構建的方法及裝置製造方法
【專利摘要】本發明提供一種社交監測子網構建的方法及裝置,該方法包括:從社交網絡事件中獲取樣本事件;對參與所述樣本事件的用戶進行篩選得到一用戶組,根據構建所述社交監測子網的事件覆蓋度大於等於預設事件覆蓋度Ne,且所述社交監測子網的事件監測概率大於等於預設事件監測概率Pe,構建子網選取模型,根據所述子網選取模型確定的所述用戶數量,從所述用戶組中選取構建所述社交監測子網所需的用戶,通過該方法構建了由少量活躍且有影響力的用戶組成的社交監測子網,通過對社交監測子網的檢測獲取社交網絡事件,不僅極大地降低了數據量處理,減少系統代價,還實現了單機檢測,而且可以去除大量噪聲信息,提高事件檢測的準確率。
【專利說明】一種社交監測子網構建的方法及裝置
【技術領域】
[0001]本發明涉及一種社交網路領域,尤其涉及一種社交監測子網構建的方法及裝置。【背景技術】
[0002]在Web2.0時代,社交網絡已成為人們網絡生活的重要組成部分,月度瀏覽時長已超新聞資訊大類服務,成為主流信息資訊平臺之一,由中國人民大學輿論研究所與百度合作完成的《中國社會輿情年度報告(2012)》藍皮書集中呈現了 2011年中國社會發展現狀及熱點問題,藍皮書顯示,在網民數量攀升與權利意識提高、熱點話題層出不窮、「全民發聲」、「圍觀結構」的網際網路背景下,中國社會輿情呈現出複雜的變化趨勢,同時社交網絡上傳播著各種正面、負面甚至是謠言信息,而負面和謠言信息帶來的社會影響非常壞,所以對社交網絡上傳播的事件進行監測顯得非常必要。
[0003]目前,社交網絡事件監測技術主要是基於傳統話題監測技術對社交網絡的所有傳播信息進行處理來獲取事件,具體的實現方式為:採用分時間段採集所有事件信息,提取事件的關鍵詞構建特徵向量,通過相似度比較,將所有話題相關的信息組成一個事件,然後根據參與話題的人數多少進行事件是否是熱點事件的判斷。
[0004]然而,現有的社交網絡事件監測方法需要對所有的社交網絡信息進行處理才能獲得事件,而社交網絡數據信息量巨大,對處理速度要求極高,無法實現單機實時監測,而且以微博網絡為例,通過少量微博關鍵詞搜索話題和合併,會導致大量跟話題無關的噪聲微博被合併,即內容較少話題合併準確率低,比如話題一般都由多個關鍵詞組成,很多無關的微博卻只是因為包含某個關鍵詞也被加入到話題中,最終會干擾了熱點事件的判斷。
【發明內容】
[0005]本發明提供一種社交監測子網構建的方法及裝置,實現了單機實時檢測社交網絡事件,降低了數據量處理,減少系統代價,而且去除大量噪聲信息,提高事件檢測的準確率。
[0006]第一方面,提供社交監測子網構建的方法,包括:
[0007]從社交網絡事件中獲取樣本事件;
[0008]對參與所述樣本事件的用戶進行篩選得到一用戶組,所述用戶組包括N個用戶,所述N為正整數;
[0009]根據構建社交監測子網的事件覆蓋度大於等於預設事件覆蓋度Ne,且所述社交監測子網的事件監測概率大於等於預設事件監測概率匕,構建子網選取模型,所述子網選取模型用於確定構建所述社交監測子網應從所述用戶組中選取的用戶數量,其中,所述事件覆蓋度為參與同一事件的用戶數,所述事件監測概率是根據事件監測概率公式計算得到的;
[0010]根據所述子網選取模型確定的所述用戶數量,從所述用戶組中選取用戶來構建所述社交監測子網。
[0011]在第一方面的第一種可能的實現方式中,所述根據構建所述社交監測子網的事件覆蓋度大於等於所述N6,且所述社交監測子網的事件監測概率大於等於所述P6,構建子網選取模型,包括:
[0012]計算所述用戶組中每個用戶的事件參與概率Pi,根據所述Pi和下述所述事件監測概率公式(I)計算所述事件監測概率Pr (X1, X2,…Xi,…,Xn):
【權利要求】
1.一種社交監測子網構建的方法,其特徵在於,該方法包括: 從社交網絡事件中獲取樣本事件; 對參與所述樣本事件的用戶進行篩選得到一用戶組,所述用戶組包括N個用戶,所述N為正整數; 根據構建社交監測子網的事件覆蓋度大於等於預設事件覆蓋度隊,且所述社交監測子網的事件監測概率大於等於預設事件監測概率匕,構建子網選取模型,所述子網選取模型用於確定構建所述社交監測子網應從所述用戶組中選取的用戶數量,其中,所述事件覆蓋度為參與同一事件的用戶數,所述事件監測概率是根據事件監測概率公式計算得到; 根據所述子網選取模型確定的所述用戶數量,從所述用戶組中選取用戶來構建所述社交監測子網。
2.根據權利要求1所述的方法,其特徵在於,所述根據構建所述社交監測子網的事件覆蓋度大於等於所述N6,且所述社交監測子網的事件監測概率大於等於所述P6,構建子網選取模型,包括: 計算所述用戶組中每個用戶的事件參與概率Pi,根據所述Pi和下述所述事件監測概率公式(1)計算所述事件監測概率Pr (X1, X2,…Xi,…,Xn):
3.根據權利要求2所述的方法,其特徵在於,所述從所述用戶組中選取用戶來構建所述社交監測子網,包括: 採用動態編程的方法從所述用戶組中選取構建所述社交監測子網所需的用戶,具體為: 將所述用戶組中每個用戶的事件參與概率Pi按照從大到小進行排列,排序後的節點順序為M1,…,Mj,…,Mn ; 從j個節點中取前k個節點參與所述樣本事件的概率為Pm(k, j),所述Pm(k, j)由下述公式(4)遞推得出:
4.根據權利要求1-3任一所述的方法,其特徵在於,所述從社交網絡事件中獲取樣本事件,包括: 選取參與事件轉發的用戶數超過預設用戶數的事件為所述社交網絡事件; 根據所述社交網絡事件的轉發數量和事件類型,從所述社交網絡事件中獲取所述樣本事件。
5.根據權利要求1-4任一所述的方法,其特徵在於,所述對參與所述樣本事件的用戶進行篩選得到一用戶組之前,還包括: 獲取參與所述樣本事件的事件信息,所述事件信息包括:參與所述樣本事件的用戶名,用戶參與所述樣本事件的時間,用戶參與所述樣本事件過程中轉發和被轉發的關係。
6.根據權利要求1-5任一所述的方法,其特徵在於,所述對參與所述樣本事件的用戶進行篩選得到一用戶組,包括: 將參與事件的次數或粉絲數低於預設值的用戶進行篩除;和/或 對重複轉發相同信息且轉發次數大於預設轉發數的用戶進行篩除;和/或 對傳播惡意連結的用戶進行篩除。
7.根據權利要求1-6任一所述的方法,其特徵在於,所述從所述用戶組中選取用戶來構建所述社交監測子網之後,還包括: 根據新收集到的事件及參與所述事件的用戶信息,更新所述社交監測子網的用戶。
8.一種社交監測子網裝置,其特徵在於,所述裝置包括: 獲取模塊,用於從社交網絡事件中獲取樣本事件; 篩選模塊,用於對參與所述樣本事件的用戶進行篩選得到一用戶組,所述用戶組包括N個用戶,所述N為正整數; 子網模型構建模塊,用於根據構建社交監測子網的事件覆蓋度大於等於預設事件覆蓋度隊,且所述社交監測子網的事件監測概率大於等於預設事件監測概率匕,構建子網選取模型,所述子網選取模型用於確定構建所述社交監測子網應從所述用戶組中選取的用戶數量,其中,所述事件覆蓋度為參與同一事件的用戶數,所述事件監測概率是根據事件監測概率公式計算得到的; 子網選取模塊,用於根據所述子網選取模型確定的所述用戶數量,所述從所述用戶組中選取用戶來構建所述社交監測子網。
9.根據權利要求8所述的裝置,其特徵在於,所述子網模型構建模塊,包括: 處理單元,用於計算所述用戶組中每個用戶的事件參與概率Pi,根據所述Pi和下述所述事件監測概率公式(I)計算所述事件監測概率Pr (X1, χ2,…Xi,…,χΝ):
10.根據權利要求9所述的裝置,其特徵在於,所述子網選取模塊,包括: 排列單元,用於將所述用戶組中每個用戶的事件參與概率Pi按照從大到小進行排列,排序後的節點順序為M1,…,Mj,…,Mn ; 選取單元,用於從j個節點中取前k個節點參與所述樣本事件的概率為Pm (k, j),所述Pffl(k,j)由下述公式(4)遞推得出:
11.根據權利要求8-10任一所述的裝置,其特徵在於,所述獲取模塊具體用於:選取參與事件轉發的用戶數超過預設用戶數的事件為所述社交網絡事件; 根據所述社交網絡事件的轉發數量和事件類型,從所述社交網絡事件中獲取所述樣本事件。
12.根據權利要求8-11任一所述的裝置,其特徵在於,所述獲取模塊還用於:在所述篩選模塊對參與所述樣本事件的用戶進行篩選得到一用戶組之前,獲取參與所述樣本事件的事件信息,所述事件信息包括參與所述樣本事件的用戶名,用戶參與所述樣本事件的時間,用戶參與所述樣本事件過程轉發和被轉發的關係。
13.根據權利要求8-12任一所述的裝置,其特徵在於,所述篩選模塊具體用於:將參與事件的次數或粉絲數低於預設值的用戶進行篩除;和/或 對重複轉發相同信息且轉發次數大於預設轉發數的用戶進行篩除;和/或 對傳播惡意連結的用戶進行篩除。
14.根據權利要求8-13任一所述的裝置,其特徵在於,還包括: 更新模塊,用於根據新收集到的事件及參與所述事件的用戶信息,更新所述社交監測子網的用戶。·
【文檔編號】G06Q50/00GK103853848SQ201410121304
【公開日】2014年6月11日 申請日期:2014年3月27日 優先權日:2014年3月27日
【發明者】周異, 陳凱 申請人:華為技術有限公司