雙重信息非對稱環境下基於行為監督的協作通信激勵方法與流程
2023-10-27 11:48:52 1
本發明屬於無線協作通信系統技術領域,具體涉及一種雙重信息非對稱環境下基於行為監督的協作通信激勵方法。
背景技術:
無線通信技術的快速發展,使得頻譜資源緊缺問題日益嚴峻,目前已成為制約無線通信發展的瓶頸。協作通信技術藉助於無線節點之間的協作中繼,能夠有效提高無線頻譜的利用率。然而,在實際的認知網絡和協作無線網絡中,普遍存在著非對稱網絡信息現象,使得在眾多中繼節點中選擇出合適的、信道狀態好的、通信能力高的中繼節點相當困難。
針對非對稱性信息條件下的協作通信技術研究正得到研究者的關注,其中,基於頻譜合約共享策略的研究剛剛起步,現有文獻大多研究中繼用戶通信能力信息非對稱性引起的逆向選擇問題,對於中繼用戶通信努力行為信息非對稱性引起的道德風險問題關注較少。此外,非授權用戶(secondaryuser,su)的這些能力和努力信息不對稱現象常常同時並發,目前雙重信息非對稱環境下的協作通信激勵研究較少關注實時監測中繼節點的私有協作行為。通過文獻檢索,尚未發現現有文獻涉及到雙重信息非對稱環境下基於行為監督的協作通信激勵方法。
技術實現要素:
為了克服上述現有技術存在的不足,本發明的目的在於提出一種雙重信息非對稱環境下基於行為監督的協作通信激勵方法。
為了達到上述目的,本發明所採用的技術方案是:雙重信息非對稱環境下基於行為監督的協作通信激勵方法,其特徵在於,所述方法包括如下步驟:
步驟1,通過將協作通信網絡映射成勞動力市場,通過引入監督節點,建立中繼節點、監督節點和源節點模型;
步驟2,在此基礎上,考慮到源節點僱傭監督節點監測中繼節點的協作行為,監督節點可以獲得中繼節點準確的努力行為,因此,只需設計合適的契約以解決逆向選擇問題,建立基於契約理論的兩階段stackelberg博弈模型,在第一階段,源節點向監督節點提供契約條款,以獲得自身效用最大化,在第二階段,監督節點向中繼節點提供契約條款以獲得自身效用最大化,通過設置契約條款,從而有效地規避契約籤訂後中繼節點私有信息引起的逆向選擇問題,保證協作通信的實現。
進一步地,步驟1中,建立中繼節點模型實現過程包括:
由於第i個中繼節點協作中繼努力ei,源節點所獲得的可用收益為πi=θiei+δ,其中θi為每單位中繼努力所產生的收益,δ是服從正態分布的隨機變量δ~n(0,σ2);
採用線性共享策略,第i個中繼節點所獲得的報酬wi可表示為wi=αi+βiπi,
其中,αi為其固定報酬,βi∈[0,1]是該節點的提成比例;
由於中繼節點付出的努力越大,他所付出的中繼成本ci(ei)也越大,並且,中繼成本會隨著付出努力的增大而增大,於是,ci′(ei)>0andci「(ei)>0,一般地,中繼成本ci(ei)可簡單表示為其中,ci為第i個中繼節點的中繼係數以描述中繼傳輸信息,包括中繼信道狀態或電池性能;
於是,第i個中繼節點的收益可定義為其數學期望和方差分別為和
假設每個中繼節點具有絕對的風險厭惡偏好,那麼,其負指數效益函數可定義為其中,ρ表示中繼節點的arrow-pratt絕對風險厭惡程度,ρ越大,中繼節點越害怕風險,一般地,0≤ρ≤1,於是,基於上述假設,第i個中繼節點的期望效益為
進一步地,步驟1中,建立監督節點模型實現過程包括:
假設源節點僱傭監督節點監測中繼節點的協作行為,採用線性支付策略(u,v),則監督節點的效用可定義為:
其中,u為監督節點的基本工資,v∈[0,1]為該節點的提成比例。
進一步地,步驟1中,建立源節點模型實現過程包括:
考慮到監督節點的監測行為和中繼節點的協作行為,源節點的效用可表示為:
其中,u0為源節點直接通信所獲得的效用。
進一步地,步驟2中,所述中繼節點私有信息,所採取的實現過程包括:
假設中繼節點的私有信息θi在θ∈[θl,θh]範圍內隨機分布,其概率密度函數為fi(θi),分布函數為fi(θi),其中θl<θh,fi(θi)>0,為了方便後續計算,令
進一步地,步驟2中,協作通信激勵第二階段契約設計實現過程包括:
由於源節點僱傭監督節點監測中繼節點的協作行為,監督節點可以獲得中繼節點準確的努力行為,因此,他只需要設計合適的契約以解決逆向選擇問題,當私有信息θi的中繼節點選擇契約條款(αi(θi),βi(θi),ei(θi)),那麼該節點的效用可表示為:
於是,當監督節點向該中繼節點提供契約條款(αi(θi′),βi(θi′))時,該中繼節點在付出中繼努力ei(θi′)後所獲得的效用為:
由此,可知監督節點的效用:
監督節點需提供給中繼節點的契約(αi(θi),βi(θi))產生的回報要高於其保留效用即設計的契約要滿足下面的個人理性(ir)條件:
此外,為了激勵中繼節點忠實地向源節點反饋其能力類型信息,協作契約需滿足激勵相容(ic)約束,以確保能力類型為θi的中繼節點通過選擇第i個合約條款可實現期望效用最大,即
因此,在第二階段的契約設計優化問題為:在滿足中繼節點個人理性和激勵相容約束條件下,監督節點效用的最大化
進一步地,步驟2中,協作通信激勵模型第二階段的契約優化求解實現過程包括:
由於由ir條件可知,於是,有
於是,可以得到監督節點的期望效用:
通過改變上述積分的順序,可得
於是,可求得監督節點的期望效用:
令可知即m(βi(θi),ei(θi))為βi(θi)的單調減函數,於是可得到最優的提成係數
由可得到最優的協作努力和固定報酬
於是,中繼節點最優的效用為監督節點最優的期望效用為
進一步地,步驟2中,協作通信激勵第一階段契約設計實現過程包括:
在第一階段,源節點的期望效用為為了獲得源節點效用的最大化,最優的契約設計需滿足如下優化問題:
其中,ir條件使得監督節點至少能獲得保留效用
進一步地,步驟2中,協作通信激勵模型第一階段的契約優化求解實現過程包括:
由於是u的增函數而us是u的減函數,因此,要獲得最大的源節點效用,必須減少u,但至少要使得監督節點獲得保留效用於是,最優的固定報酬
於是,第一階段的契約設計問題可簡化為
令可知於是,可得到最優的契約條款:
進一步地,步驟2中,所述基於契約理論的兩階段stackelberg博弈模型的最優契約設計如下:
第一階段:
第二階段:
中繼節點最優效用:
監督節點最優的期望效用:
源節點最優的期望效用:
與現有技術相比,本發明的有益效果是:本發明提出的一種雙重信息非對稱環境下基於行為監督的協作通信激勵方法,該方法針對網絡信息的雙重非對稱性,通過引入監督節點,建立基於契約理論的兩階段stackelberg博弈模型,以實時監測中繼節點的協作行為,從而有效地規避契約籤訂後中繼節點私有信息引起的逆向選擇問題,保證協作通信的實現。並且,本發明提出的多用戶協作通信激勵方法易於實現,源節點和中繼節點之間的信息交互較少,因而該方法所需的信令開銷較少。
附圖說明
圖1是本發明的協作通信激勵方法的基於契約理論的兩階段stackelberg博弈模型原理框圖。
圖2是本發明的協作通信網絡映射成勞動力市場的原理模型。
具體實施方式
為了便於本領域普通技術人員理解和實施本發明,下面結合實施例對本發明作進一步的詳細描述,應當理解,此處所描述的實施示例僅用於說明和解釋本發明,並不用於限定本發明。
本實施例假設無線協作網絡是一個勞動力市場。其中,源節點是僱主,監督節點為源節點的僱員,用於實時監測中繼節點的協作行為,同時,監督節點是中繼節點的僱主,僱傭中繼節點為源節點提供中繼服務。具體過程如圖2所示。
本發明通過將協作通信網絡映射成勞動力市場,通過引入監督節點,建立中繼節點、監督節點和源節點模型。在此基礎上,考慮到源節點僱傭監督節點監測中繼節點的協作行為,監督節點可以獲得中繼節點準確的努力行為,因此,只需設計合適的契約以解決逆向選擇問題。建立基於契約理論的兩階段stackelberg博弈模型,如圖1所示,在第一階段,源節點向監督節點提供契約條款,以獲得自身效用最大化,在第二階段,監督節點向中繼節點提供契約條款以獲得自身效用最大化。通過設置契約條款,從而有效地規避契約籤訂後中繼節點私有信息引起的逆向選擇問題,保證協作通信的實現。
(1)中繼節點模型
由於第i個中繼節點協作中繼努力ei,源節點所獲得的可用收益為πi=θiei+δ,其中θi為每單位中繼努力所產生的收益,δ是服從正態分布的隨機變量δ~n(0,σ2)。
採用線性共享策略,第i個中繼節點所獲得的報酬wi可表示為wi=αi+βiπi,其中,αi為其固定報酬,βi∈[0,1]是該節點的提成比例。不同的中繼能力和中繼努力,中繼節點會獲得不同的固定報酬和提成。
由於中繼節點付出的努力越大,他所付出的中繼成本ci(ei)也越大,並且,中繼成本會隨著付出努力的增大而增大,於是,ci′(ei)>0andci″(ei)>0。一般地,中繼成本ci(ei)可簡單表示為其中,ci為第i個中繼節點的中繼係數以描述中繼傳輸信息,如中繼信道狀態或電池性能等。
於是,第i個中繼節點的收益可定義為其數學期望和方差分別為和
假設每個中繼節點具有絕對的風險厭惡偏好,那麼,其負指數效益函數可定義為其中,ρ表示中繼節點的arrow-pratt絕對風險厭惡程度,ρ越大,中繼節點越害怕風險,一般地,0≤ρ≤1。於是,基於上述假設,第i個中繼節點的期望效益為
(2)監督節點模型
假設源節點僱傭監督節點監測中繼節點的協作行為,採用線性支付策略(u,v),則監督節點的效用可定義為:
其中,u為監督節點的基本工資,v∈[0,1]為該節點的提成比例。
(3)源節點模型
考慮到監督節點的監測行為和中繼節點的協作行為,源節點的效用可表示為:
其中,u0為源節點直接通信所獲得的效用。
(4)中繼節點私有信息
假設中繼節點的私有信息θi在θ∈[θl,θh]範圍內隨機分布,其概率密度函數為fi(θi),分布函數為fi(θi),其中θl<θh,fi(θi)>0。為了方便後續計算,令
(5)協作通信激勵模型第二階段的契約設計
由於源節點僱傭監督節點監測中繼節點的協作行為,監督節點可以獲得中繼節點準確的努力行為,因此,他只需要設計合適的契約以解決逆向選擇問題。當私有信息θi的中繼節點選擇契約條款(αi(θi),βi(θi),ei(θi)),那麼該節點的效用可表示為:
於是,當監督節點向該中繼節點提供契約條款(αi(θi′),βi(θi′))時,該中繼節點在付出中繼努力ei(θi′)後所獲得的效用為:
由此,可知監督節點的效用:
監督節點需提供給中繼節點的契約(αi(θi),βi(θi))產生的回報要高於其保留效用即設計的契約要滿足下面的個人理性(individuallyrational,ir)條件:。
此外,為了激勵中繼節點忠實地向源節點反饋其能力類型信息,協作契約需滿足激勵相容(incentivecompatibility,ic)約束,以確保能力類型為θi的中繼節點通過選擇第i個合約條款可實現期望效用最大,即
因此,在第二階段的契約設計優化問題為:在滿足中繼節點個人理性和激勵相容約束條件下,監督節點效用的最大化。
(6)協作通信激勵模型第二階段的契約優化求解
由於由ir條件可知,於是,我們有
於是,可以得到監督節點的期望效用:
通過改變上述積分的順序,可得
於是,可求得監督節點的期望效用:
令m可知即m(βi(θi),ei(θi))為βi(θi)的單調減函數,於是可得到最優的提成係數
由可得到最優的協作努力和固定報酬
於是,中繼節點最優的效用為監督節點最優的期望效用為
(7)協作通信激勵模型第一階段的契約設計
在第一階段,源節點的期望效用為為了獲得源節點效用的最大化,最優的契約設計需滿足如下優化問題:
其中,ir條件使得監督節點至少能獲得保留效用
(8)協作通信激勵模型第一階段的契約優化求解
由於是u的增函數而us是u的減函數,因此,要獲得最大的源節點效用,必須減少u,但至少要使得監督節點獲得保留效用於是,最優的固定報酬
於是,第一階段的契約設計問題可簡化為
令可知於是,可得到最優的契約條款:
(9)協作通信激勵模型契約優化設計
上述兩階段stackelberg博弈模型的最優契約設計如下:
第一階段:v*=1,
第二階段:
中繼節點最優效用:
監督節點最優的期望效用:
源節點最優的期望效用:
應當理解的是,本說明書未詳細闡述的部分均屬於現有技術。
應當理解的是,上述針對較佳實施例的描述較為詳細,並不能因此而認為是對本發明專利保護範圍的限制,本領域的普通技術人員在本發明的啟示下,在不脫離本發明權利要求所保護的範圍情況下,還可以做出替換或變形,均落入本發明的保護範圍之內,本發明的請求保護範圍應以所附權利要求為準。