無線D2D中繼網絡中基於社會性‑信道信息的聯合中繼重選方法與流程
2023-07-15 23:35:26 1

本發明屬於無線通信技術領域,具體涉及一種無線D2D中繼網絡中基於社會性-信道信息的聯合中繼重選方法。
背景技術:
隨著無線D2D中繼網絡在下一代移動通信系統中越來越廣泛的應用,實現D2D中繼通信中更加穩定的數據傳輸成為最重要的研究問題之一。在D2D中繼網絡中,中繼多為用戶手持設備,由於用戶的社會屬性,在進行D2D中繼通信的過程中,中繼用戶產生移動是不可避免,為了避免移動性而產生的中繼中斷問題,科學有效的中繼重選方案十分必要;然而另一方面,備選中繼同樣存在移動的可能性,因而從長遠看來,在設計中繼重選方案時,需要考慮備選中繼的穩定性,從而從長遠的角度提升D2D中繼通信的穩定性。
綜合以上因素,目的用戶一方面要儘可能早的選擇新的中繼從而避免因當前中繼的移動產生D2D中繼通信的斷開;另一方面要探測足夠多的中繼,從而提升選擇到更加穩定備選中繼的概率。進一步的,由於D2D中繼網絡的不穩定性是由D2D中繼用戶的社會性決定的,因此,合理的分析中繼用戶的社會性信息對設計穩定的D2D中繼重選方法具有非常重要的意義。
技術實現要素:
本發明的目的在於提供一種無線D2D中繼網絡中基於社會性-信道信息的聯合中繼重選方法,該方法能夠在中繼移動的場景下實現更加穩定的D2D中繼通信。
本發明是通過以下技術方案來實現:
一種無線D2D中繼網絡中基於社會性-信道信息的聯合中繼重選方法,包括以下步驟:
1)構建無線D2D中繼網絡中的中繼移動場景下的D2D中繼通信系統模型,描述當前中繼移動模式及備選中繼分布狀態,並基於當前中繼移動模式及備選中繼分布狀態建立無線D2D中繼網絡數據傳輸模型,作為中繼重選過程的信道信息參考依據;
2)基於通信時長的概念,建立備選中繼平均重選通信時長模型,用以描述備選中繼建立D2D連接的社會穩定性,作為中繼重選過程的社會性信息參考依據;
3)基於無線D2D中繼網絡數據傳輸模型及備選中繼平均重選通信時長模型,引入最優停止理論,建立無線D2D中繼網絡中基於社會性-信道信息的聯合中繼重選方法,將其命名為基於社會性-信道信息的聯合最優停止策略。
步驟1)的具體操作,包括:
1-1)構建當前中繼勻速直線移動模式
定義dsD為目的用戶距熱點源距離,dsr(0)為初始時刻當前中繼距熱點源距離,drD(0)為初始時刻當前中繼距目的用戶距離;
從初始時刻開始,當前中繼以速度V做勻速直線運動,當前中繼移動方向與初始時刻當前中繼到熱點源的夾角為α;目的用戶檢測到當前中繼的移動後,進行備選中繼的探測,每次探測的時間為τ,並將該時間設定為單位時間;經過i個單位時間後,熱點源到當前中繼的距離為dsr(i),當前中繼到目的用戶的距離為drD(i);
1-2)構建備選中繼分布模式
在目的用戶進行中繼重選的過程中,有M個備選中繼可供選擇,將其編號為1、2、3…M;備選中繼i距熱點源為備選中繼距目的用戶的距離為備選中繼距目的用戶的距離服從均勻分布:
1-3)構建無線D2D中繼網絡數據傳輸模型,作為中繼重選過程的信道狀況信息
當前中繼支持下的無線D2D中繼網絡數據傳輸速率為:
其中,熱點源發射功率為Ps,中繼發射功率Pr,傳輸帶寬為W;經過i個單位時間後,當前中繼的傳輸速率為Xr(i),由於當前中繼正處於勻速直線運動狀態,則在不同的時間i,當前中繼下的無線D2D中繼網絡數據傳輸速率會不同;
備選中繼支持下的無線D2D中繼網絡數據傳輸速率:
其中,Pr為備選中繼的發射功率,假設所有備選中繼的發射功率相同,目的用戶進行中繼重選關注備選中繼能夠穩定進行D2D中繼通信的時間,在研究的時間範圍內,認為Xi為恆定值;
基於以上信道狀況的表達式,可以得到D2D中繼通信達到最大傳輸速率時中繼所處的位置信息,即通過求解:
得到當D2D中繼通信達到最大傳輸速度時,中繼到目的用戶之間的距離為dmin,此時的D2D中繼通信最大傳輸速度為:
以該位置為分界線,當中繼更靠近源時,中繼到目的用戶的信道狀況限制了通信速率,當中繼更靠近目的用戶時,中繼到源的信道狀況限制了通信速率。
步驟2)的具體操作,包括:
2-1)構建兩用戶通信時長模型
當兩個用戶i、j進入能夠通信的範圍內,並維持固定的位置後,網絡開始記錄用戶i與用戶j每次接觸所持續的時間{CTi}作為通信時長,直至兩用戶有其中任何一方開始持續移動;與此同時,網絡記錄兩用戶的接觸次數Ni,j,根據獲得的通信時長的歷史數據,能夠評估兩用戶通信時長的統計平均值Mi,j,如下所示:
進一步,能夠評估兩用戶通信時長的方差Ii,j,將其定義為兩用戶D2D通信不穩定性因子,具體描述如下:
基於以上通信時長的均值和方差,得到兩用戶通信時長服從的統計分布為:
得到通信時長分布的概率密度函數如下:
式中,
2-2)建立備選中繼平均重選通信時長模型,作為中繼重選過程中的社會信息:
備選中繼i與用戶j的平均通信時長設為Mi,j,方差設為Ii,j,則該備選中繼與所有N個用戶的通信時長平均值可表述為如下形式:
備選中繼與所有N個用戶的通信時長方差可表述為如下形式:
由於無法直接獲得備選中繼與目的用戶之間的通信時長統計信息,因此,將根據備選中繼與網絡中用戶的平均通信時長統計信息預測備選中繼與目的用戶通信時長的統計特性,即:基於備選中繼的Mi、Ii,獲得備選中繼與目的用戶通信時長的統計分布:
設目的用戶與備選中繼i的重選通信時長為隨機變量T,通信時長為X,若的用戶在X時間段內任意時刻C開始進行中繼重選,則有:
T=X-C;
備選中繼i與目的用戶通信時長X的概率密度函數fi(x;ki,θi),中繼重選時刻C服從均勻分布C~U(0,X),概率密度函數為:
則可推導得到重選通信時長T滿足:
其中,fX,C(x,c)=gC|X(c|x)fi(x;ki,θi);
進而得到,備選中繼i與目的用戶的重選通信時長的概率密度函數得到用戶i平均重選通信時長為Ti;網絡通過記錄所有備選中繼的重選通信時長的統計信息,獲得M個備選中繼平均重選通信時長的分布情況,針對不同的具體場景,該分部的均值和方差不同。
步驟3)的具體操作,包括:
3-1)設定中繼重選具體規則
規定目的用戶進行中繼重選的觸發條件:定義ΔX=|Xr(i)-Xr(0)|,隨著中繼的移動,ΔX的值逐漸變大,當ΔX≥ΔXth時,目的用戶開始進行中繼重選;
3-2)基於獲得的備選中繼的社會性信息以及信道狀況信息,建立無線D2D中繼網絡中繼重選優化目標
目的用戶在進行j次中繼探測後,選擇該次探測的備選中繼能夠獲得的決策收益為:
式中,τ為目的用戶進行一次中繼探測所需時間;Xr(i)為經過第i次中繼探測後,當前中繼可支持的D2D中繼通信速率;Xj為目的用戶在第j次中繼探測時,探測到的備選中繼可提供的D2D中繼通信速率,各備選中繼到目的用戶距離服從獨立同分布均勻分布;Tj為的用戶在第j次中繼探測時,探測到的備選中繼可提供的平均重選通信時長;
基於上述決策收益,提出的中繼重選方案的優化目標即為選擇合適的j*,使得:
3-3)基於無線D2D中繼網絡中繼重選優化目標,設計基於社會性-信道信息的聯合中繼重選策略
當目的用戶探測到第j個中繼後,決定停止中繼重選並通過該中繼建立新的D2D中繼通信時,採取該決策可獲得的即時收益為:
根據有限最優停止理論的逆向歸納法,得到在結束第j步中繼探測後最優等式:
Vj(Xj,Tj)=max{Rj(Xj,Tj),E{Vj+1(Xj+1,Tj+1)}};
式中,E{·}表示關於隨機變量Xj+1Tj+1的數學期望;
當停止中繼重選獲得的即時收益Rj(Xj,Tj)大於或等於繼續進行中繼重選的最優期望收益E{Vj+1(Xj+1,Tj+1)}時,目的用戶將停止進行中繼重選,連接至備選中繼進行新的D2D通信;否則,目的用戶將繼續進行中繼探測;
E{Vj+1(Xj+1,Tj+1)}為第j次中繼探測時,決策的閥值,即時收益大於閥值,目的用戶可停止探測,建立D2D通信連接,小於閥值則繼續探測;
因此,定義第j次中繼探測的決策閥值如下:
具體求解目的用戶進行中繼探測每一步探測的決策閥值為:
基於求得的中繼重選的決策閥值,得到基於社會性-信道信息的聯合中繼重選策略:中繼探測過程中,當以下情況發生時,目的用戶停止探測,與本次探測到的中繼建立D2D中繼通信,從統計意義上獲得最優的收益:
步驟3-1)中所述設定中繼重選具體規則,包括如下步驟:
(1)在整個中繼重選過程中,共有M個備選中繼供目的用戶選擇,目的用戶已知備選中繼的個數;
(2)目的用戶逐次檢測備選中繼,檢測順序隨機,在第i次檢測過程中,目的用戶向第i次檢測的備選中繼發送檢測信號,備選中繼將目的用戶到備選中繼的信道質量信息反饋給目的用戶,同時備選中繼向源發送檢測信號,源將備選中繼到源的信道質量信息反饋給備選中繼,備選中繼進一步將其反饋給目的用戶,同時,源也會將備選中繼的平均重選通信時長信息通過中繼反饋給目的用戶;
(3)每次探測到一個備選中繼的信息,目的用戶採取以下兩個決策:
放棄中繼重選,選擇該中繼作為新的中繼進行D2D中繼通信;
或者,放棄該中繼,繼續探測新的中繼;
(4)選擇或者放棄第i次探測到的備選用戶的策略只依據目的用戶前i-1次的中繼探測信息,未檢測到的中繼其具體信道狀況信息及社會屬性信息不可知;
(5)放棄的中繼無法進行回選;
(6)目的用戶第一次探測備選中繼時,能夠從網絡獲得備選的信道狀況及平均重選通信時長的統計分布;
(7)目的用戶通過CSI反饋或者GPS定位手段,能夠獲得當前中繼的勻速直線移動模式。
與現有技術相比,本發明具有以下有益的技術效果:
本發明公開的無線D2D中繼網絡中基於社會性-信道信息的聯合中繼重選方法,所構建的系統綜合考慮了當前中繼的突發移動以及各個備選中繼參差的社會穩定性這兩個方面的因素,通過調控目的用戶結束備選中繼探測過程的時間,從統計意義上實現最穩定最高效的D2D中繼通信;同時,引入其他三種D2D中繼通信中繼重選基準策略,只考慮備選中繼信道狀況信息的最優停止策略;基於備選中繼社會性信息的最優停止策略;依次探測所有備選中繼後作出抉擇的中繼全探測策略。通過與原策略進行比較,得出原策略在實現D2D中繼通信穩定性及高效性上的優勢。
進一步地,在分析備選中繼的社會屬性與備選中繼可實現的D2D中繼通信穩定性之間關係時,創造性的建立了平均重選通信時長這一社會屬性模型,通過收集備選中繼與其他用戶建立通信的時長歷史數據,建立統計模型,從而在統計意義上評估該備選中繼與目的用戶建立D2D中繼通信可實現的通信時長,進而作為判斷該備選中繼穩定性的標誌,為目的用戶進行中繼重選決策提供依據。
進一步地,引入最優停止理論指導目的用戶進行中繼重選,利用最優停止理論,目的用戶在進行中繼探測的過程中可以迅速的採取決策選擇新的備選中繼,從而實現了中繼重選時間成本與選擇較優備選中繼獲得的收益之間的折中。
附圖說明
圖1為本發明的系統模型圖;
圖2為中繼重選探測過程示意圖;
圖3為本發明的基於社會性-信道信息的聯合中繼重選方法的決策結構分析圖;其中:
(a)為中繼重選方案-聯合最優停止策略-決策閥值隨目的用戶中繼探測步數的變化情況;
(b)為當前中繼移動速度對聯合最優停止策略決策閥值的影響;
(c)為仿真角度體現當前中繼移動速度的變化對聯合最優停止策略停止時間的影響;
(d)為Tavg對聯合最優停止策略閥值變化趨勢的影響;
(e)為從系統仿真的角度,反映了備選中繼序列平均重選通信時長均值的變化對信道-社會性聯合最優停止策略停止時間的影響;
圖4為本發明的基於社會性-信道信息的聯合中繼重選策略與三個基本策略可實現的最優吞吐量性能比較;其中:
(a)為各方案平均最優吞吐量隨備選中繼數量的變化情況;
(b)為當前中繼移動速度對各方案平均最優吞吐量性能的影響;
(c)為備選中繼序列社會屬性的變化對各方案平均最優吞吐量的影響;
圖5為本發明的基於社會性-信道信息的聯合中繼重選策略與三個基本策略可實現的穩定性能比較;其中:
(a)為各方案的重新建立連接延遲時間隨備選中繼個數的變化情況;
(b)為在不同的移動速度下,信道-社會性聯合最優停止策略的重連時延均會隨備選中繼個數的變化趨勢;
(c)為隨著備選中繼個數的增大,不同方案選擇的新中繼可持續平均通信時長的變化。
具體實施方式
下面結合具體的實施例對本發明做進一步的詳細說明,所述是對本發明的解釋而不是限定。
本發明考察一個動態變化的D2D中繼通信場景,如圖1所示。在目的用戶利用當前中繼進行D2D中繼通信的過程中,當前中繼產生突發移動,目的用戶需進行中繼重選避免D2D中繼通信的斷開,各個備選中繼由於其社會屬性不同,具有不同的通信穩定性;網絡記錄每一個備選中繼通信時長的歷史數據進而分析備選中繼的平均重選通信時長,將其作為每個備選中繼的社會性信息;目的用戶發送探測信號進中繼探測,每次探測可獲得該備選中繼的社會性信息以及該備選中繼所處環境的信道狀況信行息,作為進行中繼重選的依據;噹噹前中繼移動到一定程度使得信道狀況無法維持D2D通信,且目的用戶未能找到新中繼時,D2D中繼通信斷開,等待新中繼建立新的連接。
針對以上系統模型,本發明的主要步驟包括:
針對以上系統模型,本發明的主要步驟包括:
1)構建無線D2D中繼網絡中中繼移動場景下的D2D中繼通信系統模型,描述當前中繼移動模式以及備選中繼分布狀態,並基於當前中繼移動模式以及備選中繼分布狀態建立無線D2D中繼網絡數據傳輸模型,作為中繼重選過程的信道信息參考依據;
2)基於通信時長的概念建立備選中繼平均重選通信時長模型,用以描述備選中繼建立D2D連接的社會穩定性,作為中繼重選過程的社會性信息參考依據;
3)基於無線D2D中繼網絡數據傳輸模型以及備選中繼平均重選通信時長模型,引入最優停止理論,建立無線D2D中繼網絡中基於社會性-信道信息的聯合中繼重選策略,將其命名為基於社會性-信道信息的聯合最優停止策略。
步驟1)的具體操作,包括:
1-1)構建當前中繼勻速直線移動模式
dsD為目的用戶距熱點源距離,dsr(0)為初始時刻當前中繼距熱點源距離,drD(0)為初始時刻當前中繼距目的用戶距離,從初始時刻開始,當前中繼以速度V做勻速直線運動,當前中繼移動方向與初始時刻當前中繼到熱點源的夾角為α;目的用戶檢測到當前中繼的移動後,進行備選中繼的探測,每次探測的時間為τ,並將該時間設定為單位時間;經過i個單位時間後,熱點源到當前中繼的距離為dsr(i),當前中繼到目的用戶的距離為drD(i)。
1-2)構建備選中繼分布模式
在目的用戶進行中繼重選的過程中,有M個備選中繼可供選擇,將其編號為1、2、3…M;備選中繼i距熱點源為備選中繼距目的用戶的距離為備選中繼距目的用戶的距離服從均勻分布:
1-3)構建無線D2D中繼網絡數據傳輸模型,作為中繼重選過程的信道狀況信息
當前中繼支持下的無線D2D中繼網絡數據傳輸速率:
其中,熱點源發射功率為Ps,中繼發射功率Pr,傳輸帶寬為W;經過i個單位時間後,當前中繼的傳輸速率為Xr(i),由於當前中繼正處於勻速直線運動狀態,則在不同的時間i,當前中繼下的無線D2D中繼網絡數據傳輸速率會不同;
備選中繼支持下的無線D2D中繼網絡數據傳輸速率:
其中,Pr為備選中繼的發射功率,假設所有備選中繼的發射功率相同。由之前的分析可知,目的用戶進行中繼重選關注備選中繼能夠穩定進行D2D中繼通信的時間,因此,在研究的時間範圍內,認為Xi為恆定值;
進一步的,基於以上信道狀況的表達式,可以得到D2D中繼通信達到最大傳輸速率時中繼所處的位置信息,即:
通過求解該等式,得到當D2D中繼通信達到最大傳輸速度時,中繼到目的用戶之間的距離為dmin,此時的D2D中繼通信最大傳輸速度為:
以該位置為分界線,當中繼更靠近源時,中繼到目的用戶的信道狀況限制了通信速率,當中繼更靠近目的用戶時,中繼到源的信道狀況限制了通信速率。由於這兩種情況是可以等價的,本發明只研究中繼到目的用戶的信道狀況限制通信速率的情形。
步驟2)的具體操作,包括以下步驟:
2-1)構建兩用戶通信時長模型
當兩個用戶i、j進入可通信範圍內,並維持固定的位置後,網絡開始記錄用戶i與用戶j每次接觸所持續的時間{CTi}作為通信時長,直至兩用戶有其中任何一方開始持續移動;與此同時,網絡記錄兩用戶的接觸次數Ni,j,根據獲得的通信時長的歷史數據,可評估兩用戶通信時長的統計平均值Mi,j,如下所示:
進一步,可評估兩用戶通信時長的方差Ii,j,將其定義為兩用戶D2D通信不穩定性因子,具體描述如下:
基於以上通信時長的均值和方差,得到兩用戶通信時長服從的統計分布為:
進一步,可得到通信時長分布的概率密度函數如下:
式中,
2-2)建立備選中繼平均重選通信時長模型,作為中繼重選過程中的社會信息:
備選中繼i與用戶j的平均通信時長設為Mi,j,方差設為Ii,j,則該備選中繼與所有N個用戶的通信時長平均值可表述為如下形式:
備選中繼與所有N個用戶的通信時長方差可表述為如下形式:
由於無法直接獲得備選中繼與目的用戶之間的通信時長統計信息,本發明將根據備選中繼與網絡中用戶的平均通信時長統計信息預測備選中繼與目的用戶通信時長的統計特性。即:基於備選中繼的Mi、Ii,獲得備選中繼與目的用戶通信時長的統計分布:
概率密度函數仍表述為以下形式:
另一方面,由於本發明主要研究的時間範圍為目的用戶開始進行中繼重選直至新中繼因不穩定而產生離開,考慮到目的用戶開始進行中繼重選可能位於目的用戶與備選中繼可通信時間的任意一個時間點,因而要對通信時間的概念做一定的變化:設目的用戶與備選中繼i的重選通信時長為隨機變量T,通信時長為X,若的用戶在X時間段內任意時刻C開始進行中繼重選,則有:
T=X-C;
由上文已知備選中繼i與目的用戶通信時長X的概率密度函數fi(x;ki,θi),中繼重選時刻C服從均勻分布C~U(0,X),概率密度函數為:
則可推導得到重選通信時長T滿足:
其中,fX,C(x,c)=gC|X(c|x)fi(x;ki,θi);
進而得到備選中繼i與目的用戶的重選通信時長的概率密度函數進而得到用戶i平均重選通信時長為Ti;進一步的,網絡通過記錄所有備選中繼的重選通信時長的統計信息,可以獲得M個備選中繼平均重選通信時長的分布情況,針對不同的具體場景,該分部的均值和方差不同。
所述步驟3)的具體步驟包括:
3-1)設定中繼重選具體規則
規定目的用戶進行中繼重選的觸發條件:定義ΔX=|Xr(i)-Xr(0)|,隨著中繼的移動,ΔX的值逐漸變大,當ΔX≥ΔXth時,目的用戶開始進行中繼重選。
依據如圖2所示的中繼重選探測過程,目的用戶進行中繼重選的具體規則如下:
1)在整個中繼重選過程中,共有M個備選中繼供目的用戶選擇,目的用戶已知備選中繼的個數;
2)目的用戶逐次檢測備選中繼,檢測順序隨機,在第i次檢測過程中,目的用戶向第i次檢測的備選中繼發送檢測信號,備選中繼將目的用戶到備選中繼的信道質量信息反饋給目的用戶,同時備選中繼向源發送檢測信號,源將備選中繼到源的信道質量信息反饋給備選中繼,備選中繼進一步將其反饋給目的用戶,同時,源也會將備選中繼的平均重選通信時長信息通過中繼反饋給目的用戶;
3)每次探測到一個備選中繼的信息,目的用戶可以採取以下兩各決策:放棄中繼重選,選擇該中繼作為新的中繼進行D2D中繼通信;放棄該中繼,繼續探測新的中繼;
4)選擇或者放棄第i次探測到的備選用戶的策略只依據目的用戶前i-1次的中繼探測信息,未檢測到的中繼其具體信道狀況信息及社會屬性信息不可知;
5)放棄的中繼無法進行回選;
6)目的用戶第一次探測備選中繼時,即可從網絡獲得備選的信道狀況及平均重選通信時長的統計分布;
7)目的用戶通過CSI反饋或者GPS定位等手段,可以獲得當前中繼的勻速直線移動模式。
3-2)基於獲得的備選中繼的社會性信息以及信道狀況信息,建立無線D2D中繼網絡中繼重選優化目標:
目的用戶在進行j次中繼探測後,選擇該次探測的備選中繼能夠獲得的決策收益為:
式中,τ為目的用戶進行一次中繼探測所需時間;Xr(i)為經過第i次中繼探測後,當前中繼可支持的D2D中繼通信速率;Xj為目的用戶在第j次中繼探測時,探測到的備選中繼可提供的D2D中繼通信速率,各備選中繼到目的用戶距離服從獨立同分布均勻分布;Tj為的用戶在第j次中繼探測時,探測到的備選中繼可提供的平均重選通信時長;
基於上述決策收益,提出的中繼重選方案的優化目標即為選擇合適的j*,使得:
3-3)基於無線D2D中繼網絡中繼重選優化目標,設計基於社會性-信道信息的聯合中繼重選策略
當目的用戶探測到第j個中繼後,決定停止中繼重選並通過該中繼建立新的D2D中繼通信時,採取該決策可獲得的即時收益為:
根據有限最優停止理論的逆向歸納法,得到在結束第j步中繼探測後最優等式:
Vj(Xj,Tj)=max{Rj(Xj,Tj),E{Vj+1(Xj+1,Tj+1)}};
式中,E{·}表示關於隨機變量Xj+1Tj+1的數學期望;
當停止中繼重選獲得的即時收益Rj(Xj,Tj)大於或等於繼續進行中繼重選的最優期望收益E{Vj+1(Xj+1,Tj+1)}時,目的用戶將停止進行中繼重選,連接至備選中繼進行新的D2D通信;否則,目的用戶將繼續進行中繼探測;
E{Vj+1(Xj+1,Tj+1)}為第j次中繼探測時,決策的閥值,即時收益大於閥值,目的用戶可停止探測,建立D2D通信連接,小於閥值則繼續探測;
因此,定義第j次中繼探測的決策閥值如下:
具體求解目的用戶進行中繼探測每一步探測的決策閥值為:
綜上所述,本發明提出的中繼重選方案:信道-社會性聯合最優停止策略具體描述如下:在D2D中繼通信過程中,噹噹前中繼發生移動後,目的用戶通過CSI信道反饋以及GPS定位等技術獲得當前中繼的勻速直線運動模式,因此目的用戶可預測當前中繼的移動性;當D2D中繼通信速率下降到閥值ΔX後,目的用戶開始進行中繼重選,在進行中繼探測之前,目的用戶會根據從網絡獲取的備選中繼信道狀況以及重選通信時長的統計信息,以及其對當前中繼移動性的預測,計算出每一步探測的閥值序列當目的用戶開始進行中繼探測後,在探測到第j步後得到在該步停止的即時收益Rj(Xj,Tj),比較該即時收益與閥值的大小,若即時收益大於閥值,則目的用戶停止中繼探測,選擇該次探測到的備選中繼進行新的D2D中繼傳輸;若即時收益小於閥值,則目的用戶繼續進行中繼探測。噹噹前中繼移動至中繼通信速率小於目的用戶與網絡直連速率時,無論目的用戶是否找到了合適的中繼,D2D中繼通信都將斷開。
最後,設計D2D中繼重選的基準策略,與本發明提出的信道-社會性聯合中繼重選策略進行比較,得出本發明提出的中繼重選策略的優越性。
基準策略一:中繼全探測策略
目的用戶依次探測所有備選中繼,並記錄所有備選中繼可提供的通信速率序列{Xj}與平均通信時長序列{Tj},在所有中繼探測完成後,在不考慮由當前中繼移動而產生的時間成本的情況下,按照如下原則選擇最優中繼:
然而,該方案獲得實際收益仍要考慮當前中繼移動及其帶來的時間成本的影響,因此,該方案的實際收益如下:
基準策略二:基於信道狀況最優停止策略
該策略一方面考慮當前中繼的移動及其帶來的時間成本,另一方面考慮備選中繼的信道狀況信息,但不考慮備選中繼的平均通信時長這一社會信息,仍然採用最優停止策略解決時間成本的問題,目的用戶根據如下探測停止所獲得的即時收益進行決策判斷:
式中,Tavg為各備選中繼平均重選通信時長的平均值。
採取最優停止策略求解得到最優解j*,該決策方案獲得的實際收益為:
基準策略三:基於社會信息最優停止策略
該策略一方面考慮當前中繼的移動及其帶來的時間成本,另一方面考慮備選中繼的平均通信時長這一社會信息,但不考慮備選中繼的信道狀況信息,仍然採用最優停止策略解決時間成本的問題,目的用戶根據如下探測停止所獲得的即時收益進行決策判斷:
式中,Xavg為備選中繼可提供的平均中繼通信速率。
採取最優停止策略求解得到最優解j*,該決策方案的實際收益為:
通過系統仿真,比較社會性-信道信息的聯合中繼重選策略:社會性-洗腦聯合最優停止策略,與三個基準策略性能,得出本發明提出的信道-社會性聯合中繼重選策略的優越性。
圖3給出了社會性-信道信息的聯合中繼重選方法的決策結構分析。
其中,圖3(a)反映了目的用戶在進行中繼探測過程中,閥值序列的變化情況。可以看出,隨著目的用戶進行中繼探測的步數越來越大,進行策略判斷的閥值將會越來越小。該變化趨勢的原因如下:
決策閥值反映了目的用戶跳過第j次檢測到的中繼,在第j+1次到第M次中繼探測尋找更好的中繼所能得到的期望最優收益;在任何情況下,第j+1次中繼探測相比於第j次中繼探測,備選中繼的數量都會減少,當中繼數量更少時,從統計意義上來講,存在提供更好性能的備選中繼出現的可能性將會更低;另一方面,隨著中繼探測的進行,目的用戶仍連接至當前移動中繼,所耗費的中繼探測時間越長,當前中繼由於不斷變差的信道質量,能夠提供的通信速率將不斷下降,與此同時,時間成本的增大使得備選中繼實際平均通信時長變小。因此,隨著目的用戶中繼探測步數的增多,備選中繼越來越少,當前中繼信道質量越來越差,時間成本越來越高,基於這三方面因素,目的用戶更趨向於停止進行中繼探測,選擇當下中繼進行新的D2D中繼傳輸。
圖3(b)反映了當前中繼移動速度對聯合最優停止策略閥值變化趨勢的影響,該圖反映出,隨著當前中繼移動速度的增加,決策閥值將會出現整體的下降,閥值出現整體下降的原因如下:由前文分析可知,當前中繼移動速度與時間成本存在緊密聯繫,隨著當前中繼移動速度的增加,由於現有D2D中繼通信速率下降速度增大,急需的到新的中繼建立新的通信連接,因而繼續進行中繼探測的成本將會增加,進而決策閥值整體下降,使得目的用戶能夠更早的選擇新的中繼,從而降低時間成本的影響。
圖3(c)通過系統仿真的角度,體現了當前中繼移動速度的變化對聯合最優停止策略停止時間的影響,印證了圖3(b)閥值趨勢變化的合理性。由該系統仿真結果圖可以直觀的看出,隨著當前中繼移動速度的增大,目的用戶傾向於更早的停止中繼探測,選擇新的中繼建立新的D2D通信。該變化趨勢從系統實際仿真的角度,對圖3(b)的決策閥值理論變化趨勢做了證明。說明了當中繼移動速度增加時,時間成本增大,更早的停止中繼探測有利於降低時間成本對收益的影響。
圖3(d)反映了Tavg對聯合最優停止策略閥值變化趨勢的影響。有圖可看出,隨著通信時長的均值不斷變大,最優停止策略閥值整體變大,產生這種變化的原因在於:當Tavg增大時,從統計意義上講,各備選中繼的平均重選通信時長也會變大,這使得目的用戶停止中繼探測而建立新的D2D中繼連接所獲得的即時收益增大,由信道-社會性聯合最優停止策略決策閥值的推導過程可知,閥值會隨著即時收益的增加而增大,因此,當備選中繼序列平均重選通信時長的均值Tavg變大時,聯合最優停止策略的閥值將會整體增大。
圖3(e)從系統仿真的角度,反映了備選中繼序列平均重選通信時長均值的變化對信道-社會性聯合最優停止策略停止時間的影響,與圖3(c)反映的情況不同,在圖3(e)中,雖然決策閥值整體上升,但這並沒有導致目的用戶最優停止策略的停止時間產生明顯的變化,該現象的出現是合理的:雖然網絡中備選中繼的平均重選通信時長發生了整體的變化,但本質上,這並沒有導致中繼探測時間成本的增大。收益與閥值產生了相同的變化趨勢,因而並沒有對決策產生本質的影響。
圖4為本發明的基於社會性-信道信息的聯合中繼重選策略與三個基本策略可實現的最優吞吐量性能比較。其中,圖4(a)反映了各方案平均最優吞吐量隨備選中繼數量的變化情況,由該圖可以看出:
(1)當備選中繼數量較小時,隨著中繼數量的增加,各方案平均最優吞吐量持續上升,直至當備選中繼個數達到7個左右時,吞吐量性能接近飽和。出現這種變化趨勢的原因在於,從統計意義上講,當中繼數量較小時,出現最優備選中繼的可能性相對較小,隨著中繼數量的增加,出現可實現更加優秀性能的備選中繼的可能性不斷上升,從而使各個決策方案在最開始吞吐量逐漸上升,在第7個中繼達到飽和說明當網絡中有7個備選中繼時,基本可以包括了可以實現最優性能的中繼;
(2)當備選中繼數量較小時,中繼全探測策略與畢業設計中提出的信道-社會性聯合最優停止策略性能相近,這是由於中繼數量較小時,進行中繼全探測的時間成本較小。當備選中繼數量增大時,中繼全探測時間成本增大,因此中繼全探測策略可實現的平均最優吞吐量會隨著備選中繼數量的增加而急劇下降;
(3)由於信道-社會性聯合最優停止策略、基於信道最優停止策略、基於社會性最優停止都採取了最優停止策略理論,因此這三個方案都有效的解決了時間成本的問題,因此,隨著備選中繼個數增多,這三個方案均能保持穩定的平均最優吞吐量。
圖4(b)反映了當前中繼移動速度對各方案平均最優吞吐量性能的影響,有該圖可以看出:
(1)信道-社會性聯合最優停止方案可以實現最優異的性能;
(2)由於三個最優停止策略方案均有效解決了由於當前中繼的移動而產生的時間成本問題,隨著中繼速度的增大目的用戶提前停止探測,因此,隨著中繼移動速度的增大,這三個最優停止策略方案均能保持比較穩定的平均最優吞吐量性能。
(3)由於中繼全探測策略未考慮時間成本的影響,因此隨著中繼移動速度的增加,中繼全探測策略可實現的平均最優吞吐量急劇下降。
圖4(c)反映了備選中繼序列社會屬性的變化對各方案平均最優吞吐量的影響,由該圖可以看出,備選中繼平均通信時長增大時,備選中繼的社會穩定性增強,因而可維持更長時間的通信,顯然有各方案的平均最優吞吐量會隨著備選中繼平均通信時長的增加而增加;
圖5為本發明的基於社會性-信道信息的聯合中繼重選策略與三個基本策略可實現的穩定性能比較。
其中,圖5(a)反映了各方案的延遲時間隨備選中繼個數的變化情況,由該圖可以看出:
(1)當備選中繼個數較少時,目的用戶進行中繼探測過程中不會出現D2D連接斷開的情況,隨著備選中繼個數的增多,中繼探測的時間會更長,從而出現D2D連接斷開的可能性也更大,因此,隨著備選中繼個數的增多,重連延遲時間將會增大;
(2)相比於中繼全探測策略,其餘三個最優停止策略均能實現更小的重連時延,原因在於最優停止策略充分考慮了時間成本的影響,儘早的選擇了備選中繼建立新的連接。
圖5(b)反映了在不同的移動速度下,信道-社會性聯合最優停止策略的重連時延均會隨備選中繼個數的增多而增大,這是由中繼探測的時間變大所致;另一方面,中繼移動速度增大時,相同備選中繼個數下,重連時延也會增大,然而,當備選中繼較大時,信道-社會性聯合最優停止策略的重選時延會趨於相同,並不像直觀感受的那樣速度越快延遲明顯增大。
圖5(c)反映了隨著備選中繼個數的增大,不同方案選擇的新中繼可持續平均通信時長的變化,由該圖可以看出:
(1)信道-社會性聯合最優停止策略以及基於社會性最優停止策略可以實現新中繼通信較長時間的平均實際通信時長。相比之下,中繼全探測策略以及基於信道最優停止策略選擇的新中繼平均實際通信時長隨著備選中繼個數的增大而降低。產生該變化趨勢的原因在於:信道-社會性聯合最優停止策略以及基於社會性聯合最優停止策略在進行決策時,充分考慮了備選中繼的平均重選通信時長這一社會性信息以及時間成本;而中繼全探測策略雖然考慮了備選中繼的平均重選通信時長這一社會性信息,但沒有考慮時間成本,因此隨著備選中繼個數的增多,中繼全探測策略可實現的實際平均通信時長逐漸減小;基於信道的最優停止策略雖然考慮了時間成本,但並沒有考慮備選中繼的平均重選通信時長,因而最無法保證新通信的穩定性,在這四個方案中,該方案性能最差;
(2)基於社會性最優停止策略與基於信道最優停止策略相比有更加優異的性能,這是因為基於社會性最優停止策略只關注備選中繼的平均重選通信時長這一社會性信息,而信道-社會性聯合最優停止策略需要綜合考慮備選中繼信道狀況及社會性信息兩個方面的因素,因此僅就通信時長這一社會性信息而言,性能相對較差。