一種車載自組織網絡軌跡隱私保護方法及系統與流程
2023-05-23 19:00:11 1

本發明涉及一種車載自組織網絡軌跡隱私保護方法及系統,屬於車載自組織網絡技術領域。
背景技術:
當前車載自組織網絡(vehicularad-hocnetworks,簡稱vanets)已引起國內外政府、學術界和產業界的廣泛關注和深入研究。vanets是一個由車載節點、路邊基站和後端服務中心(器)組成的三層網絡架構,包含兩種新的通信模式:車-車通信(v2v)和車-路通信(v2i)。vanets收集的數據可用於交通管理、交通事故預警、輔助安全駕駛、和車載娛樂(infotainment)等應用。在信息廣播和多跳傳輸過程中,車輛不僅要廣播自己收集的信息,而且還必須轉發其他車輛的信息,為了降低通信成本、提高通信效率,數據聚合是必需的。
在vanets中車輛通過傳感器獲取速度、位置、裡程和時間戳。由於vanets受帶寬限制影響,車輛通常將新的觀察數據通過適當的加權平均產生新的聚合數據,車輛只發送聚合數據。儘管車輛發送的數據不包含明顯的個人數據,但是攻擊者能夠通過對比新舊兩條數據來推斷目標車輛的位置速度等信息。而車輛的位置信息可能包含個人的隱私信息,比如健康問題、生活方式、政治活動等。
通過向軌跡數據中添加隨機噪聲的方式可以實現對車輛隱私信息的保護,如差分隱私。dwork首次在統計資料庫中提出了差分隱私的概念,通過向查詢結果添加噪聲使查詢系統無法直接獲取某個元組的信息。差分隱私保護技術被公認為比較嚴格和強健的保護模型。無論攻擊者擁有任何背景知識。即使攻擊者已經掌握了除某一條記錄之外的所有記錄的信息該記錄的隱私也無法被披露。然而在vanets中引入差分隱私存在以下挑戰:車輛節點數目巨大、分布區域廣泛且不均勻,節點間的網絡拓撲變化頻繁,缺少集中的資料庫,因此傳統的差分隱私方法不適用於vanets。
軌跡隱私保護技術分為假軌跡法、抑制法和泛化法3類。基於假數據的軌跡隱私保護技術是指通過添加假軌跡對原始數據進行幹擾,同時又要保證被幹擾的軌跡數據的某些統計屬性不發生嚴重失真。文獻中提出的方法通過旋轉用戶的真實軌跡生成假軌跡。基於抑制法的軌跡隱私保護技術是指根據具體情況有條件的發布軌跡數據,限制發布軌跡上某些敏感位置或可能導致敏感信息洩露的軌跡片段以實現隱私保護。基於泛化法的軌跡隱私保護技術是指將軌跡上所有的採樣點都泛化為對應的匿名區域,以達到隱私保護的目的。
假軌跡隱私保護方法簡單、計算量小,但易造成假數據的存儲量大及數據可用性降低等缺點;基於泛化法的軌跡隱私保護技術可以保證數據都是真實的,然而計算開銷較大;基於抑制法的軌跡隱私保護技術限制發布某些敏感數據;實現簡單,但信息丟失較大。
技術實現要素:
本發明的目的是提供一種車載自組織網絡軌跡隱私保護方法及系統,以解決目前車載自組織網絡軌跡隱私保護過程中出現的數據存儲量大、計算開銷大以及信息丟失大的問題。
本發明為解決上述技術問題而提供一種車載自組織網絡軌跡隱私保護方法,該保護方法包括以下步驟:
1)在每個時間段內,車載自組織網絡中各車輛各自生成隨機數,且在每個時間段內,各車輛隨機共享一個設定值0,即各車輛的隨機數滿足下式:
其中r0,t代表聚合車輛在時間段t產生的隨機數,r1,t到rn,t分別為車輛1到n在時間段t生成的隨機數;
2)將每個時間段內生成獨立隨機數添加到車載自組織網絡中各對應移動車輛的數據中,對數據進行加密,加密後的數據為:
其中為車輛i在時間段t產生的隨機數,xi,t為車輛i在時間段t向聚合車輛發送的數據;
3)各車輛將其加密數據和對應時間段內生成的隨機數發送給聚合車輛,聚合車輛對接收到的數據進行聚合,聚合車輛最終的到的結果為
進一步地,每輛車獲取隨機數其中ski為每輛車的密鑰,h表示一個哈希映射。
進一步地,各移動車輛生成的隨機數ri滿足幾何分布其中δ為各移動車輛的敏感信息,ε>0,即|xi-xj|≤δ,xi為車輛i的數據,xj為車輛j的數據,ε表示隱私保護程度,ε越小隱私保護程度越高。
進一步地,所述的聚合方法為sum:=dn→o即其中每輛車擁有相同的隨機方法x(xi,ri):=xi+rimodp,xi為車輛i的數據,ri表示車輛i生成的隨機數,p為一個控制數值以確保數據的有效性不至於偏離真實數據。
本發明還提供了一種車載自組織網絡軌跡隱私保護系統,該保護系統包括隨機數生成模塊、隨機數添加模塊和聚合模塊,
所述的隨機數生成塊用於在每個時間段內,車載自組織網絡中各車輛各自生成隨機數,且在每個時間段內,各車輛隨機共享一個設定值0,即各車輛的隨機數滿足下式:
其中r0,t代表聚合車輛在時間段t產生的隨機數,r1,t到rn,t分別為車輛1到n在時間段t生成的隨機數;
所述的隨機數添加模塊用於將每個時間段內生成獨立隨機數添加到車載自組織網絡中各對應移動車輛的數據中,對數據進行加密,加密後的數據為:
其中為車輛i在時間段t產生的隨機數,xi,t為車輛i在時間段t向聚合車輛發送的數據;
所述的聚合模塊用於將聚合車輛接收到的各車輛加密數據和對應時間段內生成的隨機數進行聚合,聚合車輛最終的到的結果為
進一步地,每輛車獲取隨機數其中ski為每輛車的密鑰,h表示一個哈希映射。
進一步地,各移動車輛生成的隨機數ri滿足幾何分布其中δ為各移動車輛的敏感信息,ε>0,即|xi-xj|≤δ,xi為車輛i的數據,xj為車輛j的數據,ε表示隱私保護程度,ε越小隱私保護程度越高。
進一步地,所述聚合模塊採用的聚合方法為sum:=dn→o即其中每輛車擁有相同的隨機方法x(xi,ri):=xi+rimodp,xi為車輛i的數據,ri表示車輛i生成的隨機數,p為一個控制數值以確保數據的有效性不至於偏離真實數據。
本發明的有益效果是:本發明在每個時間段內生成獨立隨機噪聲添加到車載自組織網絡中各車輛的數據中,對數據進行加密;在每個時間段內,車載自組織網絡中各車輛各自生成隨機數,且在每個時間段內,各車輛隨機共享一個特定值;各車輛將其加密數據和對應時間段內生成的隨機數發送給聚合車輛,聚合車輛對接收到的數據進行聚合,以得到各車輛加密後的聚合結果。本發明保證了聚合車輛除了統計信息外無法獲取其他的消息,確保了接收車輛只獲取添加噪聲後的數據,保證了目標車輛的數據隱私,實現了其餘車輛節點不可知而且滿足分布式差分隱私。
附圖說明
圖1是vanets網絡模型結構示意圖;
圖2-a是實驗驗證中數據集1對應的隱私對比結果示意圖;
圖2-b是實驗驗證中數據集2對應的隱私對比結果示意圖。
具體實施方式
下面結合附圖對本發明的具體實施方式做進一步的說明。
本發明車載自組織網絡軌跡隱私保護方法的實施例
差分隱私最早是用在統計資料庫中,它的目標是保護個人數據,同時發布匯總信息。在現有的隱私保護機制中,差分隱私保護技術被公認為比較嚴格和強健的保護模型,該保護方法可以確保在某一數據集中插入或者刪除一條記錄的操作不會影響任何計算的輸出結果。另外,該保護模型不關心攻擊者所具有的背景知識,即使攻擊者已經掌握除某條記錄之外的所有記錄的信息,該記錄的隱私也無法被披露。該保護模型的基本思想是對原始數據的轉換或者是向統計結果中添加噪音從而達到隱私保護的效果。但是在vanet中,如圖1所示,個體的觀察數據在車輛和rsu中產生、傳輸,沒有中央資料庫,傳統的差分隱私並不適於vanet,因此,本發明採用分布式差分隱私,在移動車輛在發布聚合數據前加入適當的噪聲,以確保差分隱私。
本發明假設一個全局攻擊者,可以竊聽所有的車輛,攻擊者的先驗知識被表示為r=<v,a>,其中v是所有車輛的集合,a是所有聚合信息的集合。攻擊者的目標是找出目標車輛的敏感信息即位置和速度,為了實現這一目的,攻擊者通過連續的聚合信息的差來獲取敏感信息。攻擊者獲取目標車輛的敏感信息的能力可以由其先驗分布pr[oi]與後驗分布pr[oi|r]來衡量。
pr[oi|r]-pr[oi]=pr[oi|a]-pr[oi]
=pr[oi|ai,ai-1]-pr[oi]
如果pr[oi|r]-pr[oi]足夠小,那麼攻擊者除了先驗知識以外無法獲取其他隱私信息,pr[oi|a]、pr[oi|ai,ai-1]表示隱私被披露的風險。
假設一個不可信的車輛節點可以獲取任何輔助信息,例如:該車輛可以聯合多輛車進行組合攻擊,車輛可能會洩露它們的數據和添加的噪聲,這些都是輔助信息的一種形式。攻擊車輛可以通過其他手段(如網際網路,或個人知識了解特定的車輛信息)。本發明的目標是確保目標車輛的數據隱私,實現其餘車輛節點不可知而且滿足分布式差分隱私。為了實現這一目標,本發明採用了一個類似差分隱私的模型,該模型中車輛之間都是不可信的。該方法的具體實現過程如下。
1.在每個時間段內,車載自組織網絡中各移動車輛各自生成隨機數,且在每個時間段內,各移動車輛與聚合車輛隨機共享數字。
各移動車輛的隨機數滿足下式:
其中r0,t代表聚合車輛在時間段t產生的隨機數,r1,t到rn,t分別為車輛1到n在時間段t生成的隨機數。
車輛之間如何在沒有相互通信的情況下共享0呢。本發明的機制是以信任建立為基礎的,在該階段每輛車獲取屬於自己的密鑰ski,而且用h表示一個哈希方法,映射到一個數組集合。每輛車獲取隨機值因為ski的求和為0,因此本發明機制是建立在以上基礎上的,在信任建立階段後不需要其他的交互。
2.在每個時間段內生成獨立隨機數添加到車載自組織網絡中各移動車輛的數據中,對數據進行加密。
移動車輛在發布聚合數據前加入適當的隨機數,以確保差分隱私,車輛和rsu對接收到的數據進行聚合接著通過方法f:o×a對數據添加噪聲。每個節點生成獨立的隨機噪聲為ri∈ω,並通過隨機函數向數據進行添加噪聲,x:d×ω→d產生用於發布的數據其中xi∈dn,r∈dn,表示發布的數據,k表示移動車輛的子集,rk={ri|i∈k}表示隨機噪聲,表示k的補集,例如:
本實施例加密後的數據為:
其中ri,t為車輛i在時間段t生成的獨立隨機數,xi,t為車輛i在時間段t向聚合車輛發送的數據。
加密操作保證了聚合車輛除了統計信息外無法獲取其他的消息,因為聚合者無法獲取單條數據。然而單個數據仍存在洩漏的風險聚合者可以通過連續的聚合數據推斷出個人的信息。為了保證差分隱私一個標準的程序是在發布統計數據之前向數據添加一個適當的噪聲,在vanets中車輛之間是不可信的,因此不能簡單的把真正的聚合信息發送給接收車輛,必須確保接收車輛只獲取添加噪聲後的數據,本發明是在數據加密之前向數據添加噪聲,確保每輛車的數據滿足自身的差分隱私。
令x=(x1,…,xn)∈dn,r=(r1,…,rn)∈ωn分別代表車輛要發布的數據和隨機數。d=o=zp其中o代表聚合數據,在此我們定義聚合方法為sum:=dn→o即其中每輛車擁有相同的隨機方法x(xi,ri):=xi+rimodp,xi為車輛i的數據,ri表示車輛i生成的隨機數,p為一個控制數值以確保數據的有效性不至於偏離真實數據。
假設原始數據來自於集合{0,1,...,δ},那麼對於任意一個數據的變化對結果的影響至多為δ,換句話說求和的敏感度為δ,向發布數據中添加幾何分布噪聲那麼發布數據滿足差分隱私要求。對於本實施例而言,各移動車輛添加的噪聲ri滿足幾何分布其中δ為各移動車輛的敏感信息,ε>0,即|xi-xj|≤δ,xi為車輛i的數據,xj為車輛j的數據,ε表示隱私保護程度,ε越小隱私保護程度越高。
3.各移動車輛將其加密數據和對應時間段內生成的隨機數發送給聚合車輛,聚合車輛對接收到的數據進行聚合,聚合車輛最終的到的結果為
在時間段t∈n內聚合車輛接收到c1,t,...cn,t,聚合車輛接收到密文後通過簡單的求和計算:
因為所以聚合者最終的到的結果為
本發明車載自組織網絡軌跡隱私保護系統的實施例
本實施例中的車載自組織網絡軌跡隱私保護系統包括隨機噪聲生成模塊、隨機數添加模塊和聚合模塊,
隨機數生成塊用於在每個時間段內,車載自組織網絡中各車輛各自生成隨機數,且在每個時間段內,各車輛隨機共享一個設定值0,即
其中r0,t代表聚合車輛在時間段t產生的隨機數,r1,t到rn,t分別為車輛1到n在時間段t生成的隨機數;
隨機數添加模塊用於將每個時間段內生成獨立隨機數添加到車載自組織網絡中各對應移動車輛的數據中,對數據進行加密,加密後的數據為:
其中為車輛i在時間段t產生的隨機數,xi,t為車輛i在時間段t向聚合車輛發送的數據;
聚合模塊用於將聚合車輛接收到的各車輛加密數據和對應時間段內生成的隨機數進行聚合,聚合車輛最終的到的結果為
各模塊的具體實現手段已在方法的實施例中進行了詳細說明,這裡不再贅述。
實驗驗證
下面採用兩個數據集對本發明的可用性進行分析驗證。
實驗的硬體環境為:intel(r)xeon(r)[email protected],3.00gb內存,作業系統為microsoftwindows7,算法均在matlabr2014a下實現。
數據集1:使用brinkhoff軌跡生成器生成了1000條軌跡,共包含德國奧爾登堡市的51906個位置。
數據集2:使用一個收集自北京市的計程車移動軌跡作為本實驗的真實數據集,經過過濾操作,得到3473條軌跡信息,其中每條軌跡平均包含64.3個位置。使用該數據集的優勢在於它包含更大量的軌跡信息,而且這些軌跡信息都是真實的。
本實驗將本發明的隱私保護方法與傳統的k-匿名隱私保護機制進行比較,結果如圖2-a(數據集1)和圖2-b(數據集2)所示。其中x軸是參與者的數量,y軸顯示的是平均和標準偏差的誤差(絕對值)。傳統的k-匿名隱私保護機制可以保證單個數據的隱私,而不保證聚合數據的隱私安全。本實驗通過改變參與車輛的數量,來比較本發明與傳統k-匿名隱私保護機制(隱私參數分別為0.1和0.5)的效率。仿真結果表明,本發明的隱私保護方法的誤差不隨參與車輛數量的變化而變化,獨立於車輛的數量,且誤差接近於0。
因此,本發明保證了聚合車輛除了統計信息外無法獲取其他的消息,確保了接收車輛只獲取添加噪聲後的數據,保證了目標車輛的數據隱私,即使攻擊者擁有任何的背景知識仍能保證每輛車的數據在遭受攻擊時保護用戶隱私,保證發布的數據滿足差分隱私要求。