貝葉斯算法和MapReduce相結合的信任度量方法
2023-09-19 02:55:00 2
貝葉斯算法和MapReduce相結合的信任度量方法
【專利摘要】本發明涉及一種貝葉斯算法和MapReduce相結合的信任度量方法,包括以下步驟:S01:採用貝葉斯過濾算法對移動終端交互中產生的行為記錄進行信任度評估,通過統計訓練數據集中的先驗概率,利用貝葉斯公式計算出其後驗概率,選擇最大後驗概率作為行為記錄的信任度;S02:運用帶Dirichlet過程的貝葉斯推理算法對可信記錄做概率分布評估,得到對移動終端的可信度預測;S03:採用信息增益算法實現特徵值的選取。本發明藉助雲計算平臺在信任度計算與存儲過程中具有的高效性、安全性與中立性,保證數據的安全存儲與高性能計算。
【專利說明】貝葉斯算法和MapReduce相結合的信任度量方法
【技術領域】
[0001]本發明涉及一宗貝葉斯算法和MapReduce相結合的信任度量方法。
【背景技術】
[0002]現有網絡信任模型為移動終端間通信信任研究提供了可參考的理論依據,主要分為兩個類別:集中式信任度量和分布式信任度量。分布式信任度量是從主觀角度出發,結合信任概念對節點的行為屬性、行為的交互及結果進行判斷,一定程度上實現節點行為的主觀可信評估。目前該領域的研究已取得一些重要成果,其中比較有影響力的工作有:EigenTrust, PowerTrust, PeerTrust, R2BTM, DRS(Dirichlet Reputation Systems), FTE(Fuzzy-based Trust Evaluation),PRMGST等。其中DRS考慮到節點的信任評價隨時間而衰減,引入時間衰減因子,提出了一種基於Dirichlet概率分布的信任計算方法,有效抑制了惡意節點在累積一定信任度後對網絡或其它節點施加惡意行為。考慮到信任概念本身的模糊性,FTE利用模糊理論對信任管理問題進行建模,研究節點的信任初始化機制、信任度量算法,信任動態更新機制。上述研究成果從不同角度,利用不同理論和方法對節點的信任算法進行定義,綜合考慮歷史交易記錄中的直接信任以及推薦節點的間接信任,一定程度上實現節點間的安全互聯。
[0003]在集中式信任度量方案中,中心化的信任伺服器收集各個節點在每次交易完成後的相互信任評價,並對各個節點進行信任度統一計算與存儲。例如,ebay採用簡單的加權平均法對節點信任值進行計算;Sp0ra系統在ebay算法的基礎上,引入時間加權因子,對近期的信任評價賦予更高的權值;Wang在文獻中更引入模糊信任理論將節點的信任度按一星到五星5個級別進行劃分與計算,更形象地描述端點的信任值。在這些具體方案中,採用不同算法獲得的節點最終信任值將為下一次節點間的交互提供可參考的歷史依據。
[0004]以上信任度量機制在行動網路通信過程中存在一定的局限性。集中式信任度量方案具有結構簡單、易於實現等優點,但是該方案可能由於過度依賴少數中心化的信任伺服器,容易造成單點故障問題,影響系統的可靠性與可擴展性;其次在大規模、高連接頻率的通信服務中,高複雜度的信任度量算法與更新機制可能給信任伺服器帶來較大負擔;節點的網絡異構性(比如,移動接入)、連接頻率等因素可能會大大增加信任伺服器的接入與響應延遲,這降低了終端用戶的體驗度。相比集中式信任度量機制,分布式信任度量方案不存在單點故障問題,具有更高的可靠性與可擴展性;同時,將信任算法的計算分配給所有的網絡節點,因此在系統實際應用中不受信任算法複雜度的影響。但是,該方案也存在兩方面局限性:由於缺乏中心化的管理模式,節點間接信任度的獲取需要依靠大量的數據發送與採集工作,這增加節點負擔的同時也可能造成較高延遲。數據在異地節點存儲過程中難以保障數據的機要性、完整性、以及訪問過程的便利性,可能直接影響系統的安全性與實際應用性能。
【發明內容】
[0005]有鑑於此,本發明的目的是提供一種貝葉斯算法和MapReduce相結合的信任度量方法。
[0006]本發明採用以下方案實現:一種貝葉斯算法和MapReduce相結合的信任度量方法,其特徵在於,包括以下步驟:
[0007]SOl:採用貝葉斯過濾算法對移動終端交互中產生的行為記錄進行信任度評估,通過統計訓練數據集中的先驗概率,利用貝葉斯公式計算出其後驗概率,選擇最大後驗概率作為行為記錄的信任度;
[0008]S02:運用帶Dirichlet過程的貝葉斯推理算法對可信記錄做概率分布評估,得到對移動終端的可信度預測;
[0009]S03:採用信息增益算法實現特徵值的選取。
[0010]在本發明一實施例中,所述步驟SOl採用基於多變量的伯努利事件模型對行為記錄分解所得的屬性詞集進行處理。
[0011]在本發明一實施例中,貝葉斯公式中p(BiIA)表示求行為記錄A出現的概率下是Bi分類的概率,Bi的分類為可信記錄B1和不可信記錄B2,也就是我們所要求得的後驗概率,先驗概率P(Bi)可通過統計訓練數據獲得,似然概率P(AlBi)可轉換為屬性詞與分類的關係計算,設Xk (k=l,2...m)表示行為記錄A的屬性詞,Wk為屬性詞Xk在行為記錄A中出現的情況,Wk=I表示屬性詞出現,
Wk=O 表示屬性詞不出現;則有:
【權利要求】
1.一種貝葉斯算法和MapReduce相結合的信任度量方法,其特徵在於,包括以下步驟: 501:採用貝葉斯過濾算法對移動終端交互中產生的行為記錄進行信任度評估,通過統計訓練數據集中的先驗概率,利用貝葉斯公式計算出其後驗概率,選擇最大後驗概率作為行為記錄的信任度; 502:運用帶Dirichlet過程的貝葉斯推理算法對可信記錄做概率分布評估,得到對移動終端的可信度預測; 503:採用信息增益算法實現特徵值的選取。
2.根據權利要求1所述的貝葉斯算法和MapReduce相結合的信任度量方法,其特徵在於:所述步驟SOl採用基於多變量的伯努利事件模型對行為記錄分解所得的屬性詞集進行處理。
3.根據權利要求2所述的貝葉斯算法和MapReduce相結合的信任度量方法,其特徵在於:貝葉斯公式中P(BiIA)表示求行為記錄A出現的概率下是Bi分類的概率,Bi的分類為可信記錄B1和不可信記錄B2,也就是我們所要求得的後驗概率,先驗概率P (Bi)可通過統計訓練數據獲得,似然概率P (A| Bi)可轉換為屬性詞與分類的關係計算,設Xk (k=l,2...m)表示行為記錄A的屬性詞,Wk為屬性詞Xk在行為記錄A中出現的情況,Wk=I表示屬性詞
出現,Wk=O 表示屬性詞不出現;則有:p(A|B)=II (Wkp(xk|bi)+(1-wk)(1-p(xk|bi)))其中當xk出現的概率為P(XkIBi), Xk不出現的概率為(1-P(XkIBi)),那麼得:
4.根據權利要求1所述的貝葉斯算法和MapReduce相結合的信任度量方法,其特徵在於:所述步驟S02中,每個可信記錄被劃分為5個級別:完全信任,比較信任,一般信任,不大信任,不信任,並且每條可信記錄由貝葉斯過濾器劃分到這五個級別。
5.根據權利要求4所述的貝葉斯算法和MapReduce相結合的信任度量方法,其特徵在於:移動終端F與其他終端的可信記錄歷史信息,我們記為Hf,Hf= {H1;...,HJ,其中Hi表示每一次移動終端F與其他終端間交互產生的交互記錄;氏定義為一個元組<ei,屯,W ei為信任級別估計,表示每條行為記錄的可信評估,Cli表示可信記錄產生時間,ti記錄當前與移動終端F交互的目標節點。
6.根據權利要求5所述的貝葉斯算法和MapReduce相結合的信任度量方法,其特徵在於:Ee表示目標節點G的可信度,5 = (Cr丨..表示雲平臺上獲得的目標節點可信記錄分別為5個信任級別時的次數,假設每種級別出現的先驗概率分布為均勻分布,即每種出現的概率為1/k; =(和.//,Μ表示目標節點G可信記錄分別為5個級別時的隨機變量,且Σ μ i=l ;根據Dirichlet分布公式:
7.根據權利要求6所述的貝葉斯算法和MapReduce相結合的信任度量方法,其特徵在於:實際中,「不大信任」級別亦是可信度的負面級別,當其超過一定範圍時也可給用戶作出預警,因此,我們將對Ee作出修改得E』e,表示目標節點超出信任範圍的預警評估數,公式如
8.根據權利要求7所述的貝葉斯算法和MapReduce相結合的信任度量方法,其特徵在於:提出參數Conf,用於判斷E』 G是否可靠,
9.根據權利要求6所述的貝葉斯算法和MapReduce相結合的信任度量方法,其特徵在於:引入一個權重因子ω,表示時間因素對可信記錄的影響,每條可信記錄發生的時間為Cli,則有
10.根據權利要求6所述的貝葉斯算法和MapReduce相結合的信任度量方法,其特徵在
【文檔編號】G06N3/00GK103455842SQ201310397770
【公開日】2013年12月18日 申請日期:2013年9月4日 優先權日:2013年9月4日
【發明者】鄭相涵, 徐凌珊, 陳哲毅, 郭文忠, 陳國龍 申請人:福州大學