新四季網

一種社交網絡信息傳播檢測節點的選擇方法與流程

2023-10-11 22:38:59


本發明涉及信息傳播檢測方法,特別涉及一種社交網絡信息傳播檢測節點的選擇方法。



背景技術:

社會網絡(socialnetwork)是指社會個體之間通過社會關係結成的複雜網絡體系,它由社會中的個體以及個體之間的關係組成。近幾年,以twitter、facebook、微博、微信等為代表的在線社會網絡迅速發展,基於社會網絡的信息傳播(informationdiffusion)也越來越深入和廣泛,傳播對象包括新聞事件、社會熱點、時尚潮流,或者新發明、新創造、新思想,也有可能是網絡謠言等等。社會網絡中的信息傳播與傳統媒介中的信息傳播相比,呈現出大規模性、多模態性、實時性、快速性等特點,其對經濟社會和國家公共安全的影響越來越深入。在2011年爆發的「埃及革命」中,不法分子利用twitter和facebook等社會網絡或媒體大肆造謠,煽動民意,傳播惡意信息並組織犯罪活動,在社交媒體的推波助瀾下,騷亂被極度放大並快速演變。在2013年4月四川「雅安地震」爆發後,微博成為最有力的信息傳播媒體,各類政務微博、意見領袖、草根帳號等充分利用微博的信息擴散能力,發布地震救援提示,為抗震救災發揮積極作用.但是另一方面,也有不法分子利用微博傳播謠言,欺騙公眾,造成社會不安和民眾恐慌,帶來極壞的後果.對於社會網絡中的信息傳播,如何快速獲取其中的信息傳播態勢,及時發現當前流行的熱點事件或不良社會思潮,成為亟待解決的問題,這對於輿情監控和維護國家公共安全具有重要意義。對於大規模社會網絡和海量數據信息,為了降低檢測成本的同時保證檢測效果通常會選取傳播網絡中有限的節點作為觀察節點,通過跟蹤這些觀察節點的狀態變化或分析其發布的信息來檢測整個網絡中的信息傳播態勢。

在本發明作出之前,近幾年,有些研究學者已經對信息傳播檢測方法進行了研究,如:文獻physicalreviewletters,2012,109(6)中刊登的「locatingthesourceofdiffusioniniargescalenetwork」對網絡中如何確定信息傳播源進行了研究,通過在網絡中稀疏地布置傳感器,獲得觀察節點感染信息的不同時間,文章給出一個有效算法,對任意樹狀傳播網絡可以在o(n)時間內,對於任意傳播圖可以在o(n3)時間內以一定的精度確定信息傳播源。proceedingsofthe10thacmconferenceonelectroniccommerce刊登的「a.socialinfluenceandthediffusionofusercreatedcontent」對信息傳播的早期接受者(earlyadopter)研究表明,這些人通常不具有很多的關注者(節點入度較小),他們的社交網絡在線時間也低於平均在線時間.the18thacmsigkddinternationalconferenceonknowledgediscoveryanddatamining刊登的「」研究了趨勢發起者(trendsetter)的特點,趨勢發起者是網絡中出現的熱點趨勢的早期接受者和傳播者,文章結合時間演化因素,基於pagerank思想,給出了一個挖掘不同話題領域趨勢發起者的算法.the13thacmsigkddinternationalconferenceonknowledgediscoveryanddatamining上刊登的「costeffectiveoutbreakdetectioninnetworks」針對博客網絡中信息暴發檢測(outbreakdetection)提出了基於次模特性(submodularity)的貪心算法celf。文章將信息檢測問題抽象為一組需要最大化的目標函數r(a),a表示需要部署傳感器的觀察節點集合。r(a)可以是由k個節點檢測到的信息傳播級聯的數量,或者由此帶來的信息傳播感染人數的減少量.文章證明了r(a)具有次模特性,基於此提出一個啟發式貪心算法celf.chinesejournalofcomputers上刊登的「anovelalgorithmforinformationdiffusiondetectioninsocialnetwork」提出一種傳播能力排序算法diffrank,根據算法結果選取傳播能力最強的k個節點作為觀察節點來檢測整體網絡信息傳播態勢,

在現有的相關研究中,大部分算法以對社會網絡中的關係結構為出發點,忽略了交互結構,無法達到令人滿意的效果。



技術實現要素:

本發明的目的就在於克服上述缺陷,提供一種社交網絡信息傳播檢測節點的選擇方法。

本發明的技術方案是:

一種社交網絡信息傳播檢測節點的選擇方法,其主要技術特徵是:

4)定義話題相似性,關鍵詞相似性,並建立「用戶-話題-關鍵詞」三個層次的用戶話題興趣偏好模型;

5)融合節點關係和節點話題偏好的社會網絡中用戶節點的相似性計算方法;

6)基於隨機遊走策略的社會網絡信息傳播檢測節點排序方法。

所述建立「用戶-話題-關鍵詞」三個層次的用戶話題興趣偏好模型,其步驟:

1)從社會網絡的日誌文件中獲得每個用戶發布和接收的話題信息;

2)如果兩個用戶之間進行了通信,則產生一條從發送用戶到被發送用戶的有向邊;

3)當話題中包含一個關鍵詞時,則從主題到該關鍵詞產生一條無向邊;

4)用戶發布一個主題,則從用戶到話題建立一條有向連邊,如果用戶接收一個話題,則從話題到用戶建立一條有向連邊;

5)定義話題的相似性,如果兩個話題的相似性超過閾值則以這兩個主題為端點,建立一條無向邊;

6)定義關鍵詞的相似性,如果兩個關鍵詞的相似性超過閾值則以這兩個關鍵詞為端點,建立一條無向邊。

所述融合節點關係和節點話題偏好的社會網絡中用戶節點的相似性計算方法步驟是:

1)給出用戶結構相似性的計算方法;

2)給出用戶話題偏好相似性的計算方法;

3)給出融合用戶結構相似性和用戶話題偏好相似性的社會網絡用戶節點的相似性計算方法。

所述基於隨機遊走策略的社會網絡信息傳播檢測節點排序方法,具體包括步驟:

1)給出信息傳播概率的定義和計算公式;

2)結合用戶節點相似度和節點間傳播概率生成傳播概率圖及轉移概率矩陣;

3)在傳播概率圖上進行有偏隨機遊走,得到每個節點的傳播能力度量。

針對以上情況,本發明從社會網絡信息傳播的角度出發,提出一種融合節點結構關係和節點話題偏好的用戶節點重要性排序方法。

本發明的優點在於:社會網絡信息傳播檢測節點的選擇綜合考慮了用戶結構相似性和用戶話題偏好相似性,可以根據不同的社會網絡動態的調整平衡參數,具有更好的檢測效率,並從社會網絡中的關係結構和交互結構共同促進網絡演化方面為基礎,從更深層次考慮社會網絡關係結構和交互結構的關係問題,取得了比較滿意的效果。

附圖說明

圖1——本發明流程示意圖。

圖2——本發明建立用戶話題偏好模型示意圖。

具體實施方式

本發明的技術思路是:

1998提出了著名的pagerank算法,該算法用於對網絡頁面節點的重要性進行排序,並成功應用該算法創立了google搜尋引擎。該算法主要利用了馬爾可夫隨機遊走模型,為了將網頁與該隨機遊走模型對應,將網頁與模型中的粒子對應,將網頁的有向連結結構與粒子前進對應,這樣網頁的連結跳轉概率就被成功地轉換為了粒子前進的概率轉移。因為不同的網頁節點具有不同的中心度和影響力,因此網頁節點在馬爾可夫隨機遊走模型下獲得的點擊概率也可能不同,依據不同的點擊概率來對網頁節點進行排名是pagerank的主要思想。研究表明具有較高節點入度的節點並不一定具有很大的影響力。通過這些方法通常找到的是網絡中的核心節點,或是某領域的「意見領袖」。社會網絡中的信息傳播受節點影響力的影響,但是影響力最大並不一定就表示傳播能力最強,因為影響力分析算法沒有考慮節點對各種信息流的參與程度及發布文章或傳播信息的規模等因素。現有的算法對社會網絡中的關係結構和交互結構共同促進網絡演化方面考慮不足,沒有從更深層次考慮社會網絡關係結構和交互結構的關係問題。

本發明的主要技術特徵體現在:

1)建立「用戶-話題-關鍵詞」三個層次的用戶話題興趣偏好模型

具體技術路線是:1.用戶、話題和關鍵詞的相互關聯關係在它們之間建立邊;2.通過「用戶-話題-關鍵詞」三個層次的用戶話題興趣偏好模型可以完整地保存用戶的所有信息,為後續分析提供了基礎。

2)設計融合節點關係和節點話題偏好的社會網絡中用戶節點的相似性計算方法。

具體技術路線:1.定義用戶結構相似性的計算公式;2.定義用戶話題偏好相似性的計算公式;3.設定權衡參數來定義融合用戶結構相似性和用戶話題偏好相似性的社會網絡用戶節點的相似性計算方法。

下面具體說明本發明,其流程如「圖1——本發明流程示意圖」所示。

1)定義主題相似性,關鍵詞相似性,並建立「用戶-話題-關鍵詞」三個層次的用戶話題興趣偏好模型

用戶信息傳播分析建立在一個用戶話題興趣偏好模型中,然後利用網絡分析方法對其進行分析,具體的建立「用戶-話題-關鍵詞」三個層次用戶話題興趣偏好模型的方法步驟如下:

●從社會網絡網站的日誌文件中獲取每個用戶的活動信息,包括:通信信息、發送和接收話題信息等;

●建立一個三個層次的網絡模型,網絡中的節點包括:用戶、話題和關鍵詞,示意圖如「圖2——本發明建立用戶話題偏好模型示意圖」所示。

●節點之間的連接包括以下幾種情況:a)如果兩個用戶之間進行了通信,則產生一條從發送用戶到被發送用戶的有向邊;b)當話題中包含一個關鍵詞時,則從話題到該關鍵詞產生一條無向邊;c)用戶發布一個話題,則從用戶到主題建立一條有向連邊,如果用戶接收一個話題,則從主題到用戶建立一條有向連邊。d)定義話題的相似性,第i個主題和第j個主題的相似性計算公式為:式中表示第個i主題所包含的關鍵詞集合。當兩個主題的相似性超過閾值則以這兩個主題為端點,建立一條無向邊;e)定義關鍵詞的相似性,第i個關鍵詞和第j個關鍵詞的相似性sim(kdi,kdj)計算公式為:式中表示第i個關鍵詞出現話題的集合。當兩個關鍵詞的相似性超過閾值則以這兩個關鍵詞為端點,建立一條無向邊;

2)設計融合節點關係和節點話題偏好的社會網絡中用戶節點的相似性計算方法。

「物以類聚」的現象在社會網絡中廣泛存在,研究表明:節點之間的相似度與節點之間的影響力存在正相關關係,也是影響信息傳播的主要因素之一。節點vi和vj之間的相似度用sim(vi,vj)表示,本專利選取節點的結構相似度和用戶話題偏好相似性兩個維度來衡量節點的相似性。融合節點關係和節點話題偏好的社會網絡中用戶節點的相似性計算方法:

●用戶結構相似性使用公式計算得到;

●用戶話題偏好相似性通過計算兩個用戶話題偏好向量的內積得到,

●融合節點關係和節點話題偏好的社會網絡中用戶節點的相似性計算方。sims(vi,vj)=b×sims(vi,vj)+(1-b)×simt(vi,vj),其中參數b∈[0,1]用來權衡用戶結構相似和用戶話題偏好所佔的比例。

3)基於隨機遊走策略的社會網絡信息傳播檢測節點排序方法。

具體實現如下:

●首先給出傳播概率p(vi,vj)的計算公式:

定義1:在圖gr=(v,e)中,對於信息級聯c,若節點vi∈c,並且則信息從vi傳播到節點vj的概率用p(vi,vj)表示。

將c中所有信息級聯c進行分解,每個級聯都分解為l(c)個單步(vi→vj,ti),最後獲取gr=(v,e)中各邊對應的總傳輸次數nij。傳播概率高的節點之間通常會表現出更多的傳播次數,因此p(vi,vj)與vi到vj之間的傳播次數成正比,選取指數關係模型。因此有

●結合用戶節點相似度和節點間傳播概率可以生成基於gr=(v,e)的傳播概率圖,其鄰接矩陣用an×n表示,對an×n進行列歸一化得到隨機遊走的轉移概率矩陣qn×n,,其中

●在傳播概率圖上進行有偏隨機遊走,隨機遊走的每一步按照公式r=d×qr+(1-d)×e迭代進行,其中r是一個n維向量,每個分量r(i)代表隨機遊走結束後對應節點vi的被訪問概率,很多粒子同時在傳播概率圖上遊走,每個節點都是一個「吸引子」,其吸引力代表節點的傳播能力,遊走過程分為兩部,第1部分按概率d遊走到節點的鄰居節點;第2部分按照概率(1-d)隨機跳躍到網絡中的任意節點,各節點被隨機訪問的概率由向量e決定,有偏的隨機遊走通過對向量e的各個分量賦予不同的值,來表示離子隨機跳轉到各個節點的不同偏好,也就是各個「吸引子」的吸引力不同。對於信息傳播級聯c中的節點,其接收到消息越早,位置約靠近c的前端,表示其傳播力越強,對應的e(i)的取值也越大。根據e(i)的取值進行排序得到的結果即為基於隨機遊走策略的社會網絡信息傳播檢測節點的最終排序。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀