異構網絡中的網絡選擇方法
2023-07-11 09:22:06 4
專利名稱:異構網絡中的網絡選擇方法
技術領域:
本發明涉及通信技術領域,尤其涉及一種異構網絡中的網絡選擇方法。
背景技術:
目前,隨著無線網絡技術高速發展,出現了許多新型的無線異構網絡,其融合多種 無線接入技術,各種無線接入技術相互補,為多媒體用戶提供隨時隨地的最優接入。如 圖l所示,無線異構網絡的無線接入技術,如以蜂窩網絡為代表的無線廣域網,以WiMAX (World Interoperability for Microwave Access,微波存取全球互通)網絡為代表的 無線城域網,以及以IEEE 802.11 (IEEE制定的一個無線區域網標準)網絡為代表的無線 區域網等。
提出如下在異構網絡中選擇網絡的方法
如,在某一時刻,用戶請求接入網絡,可以根據用戶偏好、應用類型等確定各個網 絡之間的權重,最終為用戶選擇最優網絡作為接入網絡;又如,通過一套網絡選擇和決 策過程為網絡排序,最終為用戶選擇最優網絡作為接入網絡,等等方法。 在實現本發明過程中,發明人發現現有技術中至少存在如下問題 上述各種異構網絡中網絡選擇的方法,由於在時間段內,各個網絡的狀態是可能變 化的,而且某一時刻的各個網絡的狀態變化與上一時刻各個網絡的狀態有關,所以,如 果每次有用戶請求接入網絡的時刻,都選擇最優網絡作為用戶的接入網絡,而沒有考慮 在時間段內各個網絡的狀態變化的相關性,可能會導致選擇的最優網絡不能實現為用戶 提供最佳效果,異構網絡的系統能力不佳。
發明內容
本發明的實施例提供了一種異構網絡中的網絡選擇方法,提高系統收益。 一種異構網絡中的網絡選擇方法,包括
通過各網絡在各狀態的收益、狀態轉移概率和狀態概率向量,確定在各個決策時刻 的接入網絡;
4通過所述各個決策時刻的接入網絡,異構網絡獲得最大系統收益,所述決策時刻為 用戶向各網絡發送接入請求或離開請求的時刻,所述網絡的狀態為各網絡中可能接入的 各類型用戶的個數。
由上述本發明的實施例提供的技術方案可以看出,由於考慮在時間段內各個網絡的 狀態變化的相關性,通過連續多個決策時刻中各決策時刻各網絡在各狀態的收益、狀態 轉移概率和狀態概率向量,確定在各個決策時刻的接入網絡,使得異構網絡在包含所述
連續多個決策時刻的決策期間獲得最大系統收益。
為了更清楚地說明本發明實施例的技術方案,下面將對實施例描述中所需要使用的 附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對於 本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得 其他的附圖。
圖l為現有技術中異構網絡構成示意圖2為本發明實施例異構網絡中的網絡選擇方法的流程圖一;
圖3為本發明實施例異構網絡中的網絡選擇方法的流程圖二;
圖4為本發明實施例異構網絡中的網絡選擇方法的流程圖三。
具體實施例方式
下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整 地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基 於本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有 其他實施例,都屬於本發明保護的範圍。
現有的異構網絡中網絡選擇的方法,沒有考慮在時間段內各個網絡的狀態變化的相 關性,會導致選擇的最優網絡不能實現為用戶提供最佳效果。
本發明實施例提供一種異構網絡中的網絡選擇方法,通過各網絡在各狀態的收益、 狀態轉移概率和狀態概率向量,確定在各個決策時刻的接入網絡,以使異構網絡獲得最 大系統收益,所述決策時刻為用戶向各網絡發送接入請求或離開請求的時刻,所述網絡 的狀態為各網絡中可能接入的各類型用戶的個數。
而且,現有的各種異構網絡中網絡選擇的方法,由於主要考慮網絡層的QoS(Quality of Service,服務質量),例如阻塞概率、效用等,來確定用戶請求接入網 絡時刻的最優網絡,而都忽略了應用層的QoS,使得為用戶選擇的接入網絡不能為用戶提 供很好的體驗效果。
進一步地,本發明實施例提供的異構網絡中的網絡選擇方法,由於從用戶體驗的角 度,應用層的QoS在目前網絡中非常有前景,尤其是應用層層視頻失真及接入價格,所 以,通過對網絡優化應用層層視頻失真及接入價格,獲得最大系統收益,如獲得最優視 頻失真和最佳接入價格的平衡。
具體地,本發明實施例提供的異構網絡中的網絡選擇方法,考慮在時間段內各個網 絡的狀態變化的相關性,將網絡選擇問題以可變狀態模型(Restless Bandits)以及原 始-雙重(Primal-Dual)啟發式算法得以解決,極大減小計算複雜度。
Restless Bandits可以理解為,在時間段內,^個對象中的^個為活躍對象,而這
所有^個對象的狀態都可以改變,在某一時刻,每個對象都可能獲得收益。進一步,給 出了Restless Bandits的一種啟發式的Primal-Dual算法,可以稱為Restless Bandits的 索引特性,即在某一時刻對象是否為活躍對象,是根據其索引值確定的,其索引值是通 過對象的狀態、狀態轉移概率和收益等通過線性規劃鬆弛計算得到的,可以極大減小計 算複雜度。
如圖2所示,如下,具體介紹本發明實施例的一種異構網絡中的網絡選擇方法,包
括
步驟10:通過各網絡在各狀態的收益、狀態轉移概率和狀態概率向量,確定在各個 決策時刻的接入網絡;
步驟20:通過所述各個決策時刻的接入網絡,異構網絡獲得最大系統收益,所述決 策時刻為用戶向各網絡發送接入請求或離開請求的時刻,所述網絡的狀態為各網絡中可 能接入的各類型用戶的個數。
所述各網絡在各狀態的收益為各網絡應用層為用戶提供的服務質量QoS的收益。而 且,所述應用層QoS可以包括應用層視頻失真及接入價格。
如圖3所示,進一步,通過連續多個決策時刻中各決策時刻各網絡在各狀態的收益、 狀態轉移概率和狀態概率向量,確定在各個決策時刻的接入網絡的步驟IO,包括
步驟101:將各網絡在各狀態的收益、狀態轉移概率和狀態概率向量進行線性規劃松 弛計算,得到各網絡在各狀態的索引值;
步驟102:根據所述各網絡在決策時刻的狀態,得到對應的索引值,將所述索引值最
6小的網絡作為接入網絡。
這裡,可以根據所述各網絡應用層為用戶提供的服務質量QoS為用戶劃分類型。 上述步驟101中各網絡在各狀態的轉移概率及狀態概率向量,可以如下方式獲得 根據所述各網絡的所有狀態得到所述各網絡的狀態空間;
根據所述各網絡的狀態空間按照馬爾科夫鏈進行狀態轉移,得到所述各網絡的各狀 態轉移概率;
根據所述所有網絡中所有狀態的概率,得到各網絡在各狀態的狀態概率向量。
值得注意的是,某網絡在某一狀態的狀態概率向量,是根據所有網絡中所有狀態的 概率得到的向量,即由所有網絡處於第一種可能狀態的概率、處於第二種可能狀態的概 率……處於最後一種可能狀態的概率組成的向量。原因在於,異構網絡中的網絡選擇方 法,並行對多個網絡進行計算,以為用戶選擇一個網絡接入,即在某一時刻,某網絡處 於某一狀態,而其他網絡可能處於任何可能的狀態,這樣,需要根據所有網絡中所有狀 態的概率得到各網絡的狀態概率向量。
而且,在為用戶選擇網絡時,可以根據各網絡在決策時刻的狀態(即各網絡在決策 時刻的狀態概率),得到狀態概率向量,並通過狀態概率向量得到對應的索引值,將所 述索引值最小的網絡作為接入網絡,具體見後文敘述。
另外,進一步,還可以通過所述各網絡的各狀態轉移概率得到各網絡的狀態轉移概 率矩陣。
具體而言,所述應用層QoS可以包括應用層視頻失真及接入價格,而且,上述步驟 102中各網絡在各狀態的收益,可以這樣獲得-
根據源編碼速率和丟包率,優化各網絡的視頻編碼內刷新率; 通過各網絡的視頻編碼內刷新率獲得最小應用層視頻失真;
根據所述最小應用層視頻失真及各網絡的接入價格,得到所述各網絡在各狀態的收
-、^
所述應用層視頻失真為發送視頻與接收解碼視頻之間的均方誤差。 由於各網絡狀態的時變特性, 一般可以採用自適應動態調節視頻編碼內刷新率來得
到最小應用層視頻失真,獲得最優視頻失真和最佳接入價格的平衡收益。
在將各網絡在各狀態的收益、狀態轉移概率和狀態概率向量進行線性規劃鬆弛計
算,得到各網絡在各狀態的索引值的步驟101之後,可以為所述各網絡分別存儲各自的索
引值表,所述索引值表,可以包括所述索引值與狀態轉移概率、收益以及狀態概率向量的對應關係。
如圖4所示,進一步,根據所述各網絡在決策時刻的狀態,得到對應的索引值,將所 述索引值最小的網絡作為接入網絡的步驟102,包括
步驟1021根據在決策時刻是否有用戶到達或離開網絡,分別確定所述各網絡在決策 時刻的狀態,並通知給其他各網絡;
步驟1022:根據所述各網絡在決策時刻的狀態,得到所述各網絡在決策時刻的各所 述狀態概率向量;這是因為在且僅在決策時刻,網絡的狀態發生改變。
步驟1023:根據各所述狀態概率向量,從所述各網絡的索引值表中分別確定所述各 網絡決策時刻狀態對應的索引值,並通知給其他各網絡;
步驟1024:選擇所述索引值最小的網絡作為下一決策時刻用戶的接入網絡。
也就是,在每個決策時刻,將索引值最小的那個網絡被設為接入網絡,其他網絡為 非接入網絡。在下一個決策時刻,如果有新的用戶到達,則接入接納此新用戶;如果有 用戶離開網絡,則只需相應的網絡進行用戶離網的相關操作。
下面說明上述網絡選擇方法的各步驟中涉及的計算參數及模型
簡單地對使用的符號進行說明
網絡編號為";
網絡總數為^;
接入網絡的編號為"。; 用戶編號為";
源編碼速率為; 網絡丟包率為^;
內刷新率為《;
最優內刷新率為^ ;
視頻失真為";
最小視頻失真為"^
動作為",就是在當前決策時刻所做出的網絡選擇,即選擇一個接入網絡; 策略為^,就是多個決策時刻的動作的集合;
網絡"在狀態Z'、動作"時的收益為A ;
網絡"的接納控制集合為S";網絡"從狀態z'到狀態7'的轉移概率為^二 ;
折扣因子為",為常量係數; 狀態概率向量為";
網絡"在狀態z'時的索引值為《;
決策時刻為";
用戶類型編號為" 用戶類型總數為Z; 1、狀態空間
各網絡的狀態空間用於表示各網絡的所有可能的狀態,而所有可能的狀態都可以包
含在接納控制集合S",所以可以參考文獻,Y. Kuo, C. Lu, E. Wu, and G. Chen, "An admission control strategy for differentiated services in IEEE 802.11, ,, in Proc. IEEE Globecom, 03, (San Francisco, CA), pp. 707 - 712, Dec. 2003. (IEEE 802. ll區分服務的一種接納控制策略,全球通信大會論文集,(美國加利福尼亞州舊金 山市),第707-712頁,2003年12月)。
H. Zhu and I. Chlamtac, "A call admission and rate control scheme for multimedia support over IEEE 802.11 wireless LANs," Wireless. Netw. , vol. 12, pp. 451 - 463, July 2006. (IEEE 802. ll無線區域網中支持多媒體的一種呼叫接納 和速率控制方法,無線網絡,第12巻第451-463頁,2006年7月)。
IEEE Std. 802. 16-2004, "IEEE standard for local and metropolitan area networks, part 16: Air interface for fixed broadband wireless access systems," Oct. 2004. (IEEE局域和城域網標準,第16部分固定寬帶無線接入系統的 空中接口, 2004年10月)。
Q. Liu, S. Zhou, and G. B. Giannakis, "Queuing with adaptive modulation and coding over wireless links: Cross-layer analysis and design," IEEE Trans. Wireless Co誦un. , vol. 4, no. 3, pp. 1142 - 1153, May 2005.(無線鏈路的 自適應編碼調製排隊跨層分析和設計,IEEE無線通信彙刊,第4巻第3期第1142-1153 頁,2005年5月)。
A. I. Elwalid and D. Mitra, "Effective bandwidth of general Markovian traffic sources and admission control of high speed networks, " IEEE/ACM
9Trans. Netw. , vol. 1, no. 3, pp. 329 - 343, Jun. 1993.(高速網絡中一般馬爾科夫 流量源和接納控制的有效帶寬,IEEE/ACM網絡彙刊,第l巻第3期第329-343頁,1993年6 月)。
H. Holma and A. Toskala, WCDMA for UMTS: Radio Access for Third Generation Mobile Communications. NY: Wiley, 2004. (UMTS中的WCDMA:第三代移動 通信的無線接入,紐約Wiley出版社,2004年。)
可以得到,無線區域網的接納控制集合為
S =(")e : # (")》T5'("), W (")《7^ (")},其中# (")表示對於網絡
"中的用戶類型為z的業務的吞吐量的約束,"(")^(")表示對於網絡"中的用戶類型 為Z的業務的時延的約束。
微波存取全球互通WiMAX網絡的接納控制集合為
、="(")e《如'(")『'(")S C (")}
L w 」,其中"("是WiMAX網絡"中用戶類型為Z的用
戶的個數,『'(")是網絡"中用戶類型為Z的用戶所佔用的帶寬,e(")是WiMAX的網絡容 蜂窩網絡的接納控制集合為
。"^"e《'/^—^ },其中A 是基站可提供的最大功率,A是基站保證QoS
時的發射功率最小值。
2、狀態轉移概率《厶
設在決策時刻",網絡"中類型為z的用戶數為V(",4)。定義決策時刻^時網絡"的
狀態為""'"—("'"]碎'"'4,其中Z為用戶類型的總數。因此網絡"的狀態空間為 接納控制集合S"。網絡"在動作"的作用下按照馬爾科夫鏈進行狀態轉移,從狀態 'V 7 L 'V "Hi'2工'4轉移到狀態八^ L A "帥'2^}的概率是; ''八")。把兩個決策時
刻間的時間間隔的平均值定義為""'=£(4+1—4—'("'"),也就是總的事件速率的倒數這樣,可以通過狀態轉移概率P"獲得狀態轉移概率矩陣P'::
把在採用動作"時的網絡"的狀態轉移概率矩陣定義為屍("X^"(")],河"、其中
s(")為網絡"的所有可能狀態總數。用7(0, 1《"丄表示第/個元素為i、其餘/-i各元
素為o的共有z個元素的行向量,則採用動作"時的網絡"從狀態z'到狀態7'的轉移概率為
0)=
",h("))"r', 0,
若 (")^(") + Z(/), 若、(")=《(")-,(/),
-")(")//V,, 若~ (") = & ("),否則.
其中《G)定義為
"^ = io,否則.
3、應用層的視頻失真"
可以通過仿真獲得所述各網絡的內刷新率《(即視頻編碼內刷新率)及其對應的視頻 失真"(即應用層視頻失真),進而通過最優的內刷新率^得到最小視頻失真"';還可 以,通過源編碼速率^s和丟包率^,獲得最優的內刷新率^ ,進而得到最小視頻失真 D*。
視頻失真"也就是發送視頻與接收解碼視頻之間的均方誤差。
視頻失真"包括兩部分,其一為量化視頻失真(源視頻失真),由視頻編碼器引 入,只要視頻數據速率有限,量化視頻失真就一定存在;另一為信道視頻失真,為信道 差錯引入。
源視頻失真由下式給出
Ds (& ,《)=A (A, 0) + "1 -;/+ W) [ A (A, 1) - Ds (//s, O)]
其中A為源編碼速率,《為內刷新率,7為由多媒體序列特徵決定的常數。
A(A,fO和A(A,0分別是時間平均的全內/間編碼模式選擇,定義如下
11formula see original document page 12
其中《為在時間段々內的間/內幀個數。
信道視頻失真由下式給出
"c旨〔TT^〕fe〕麵")]
其中^為丟包率,"為編碼濾波器的能量損失率,。2為由多媒體文件內容運動隨機
性決定的常數,E[&",y^)]為幀間差距&^J-0在時間段上的的平均值。
由上述的源視頻失真和信道視頻失真表達式可以得到視頻失真^為
"(A,^^ = "S(A'。 + "C(^0。則為了最小化視頻失真,最優的內刷新率《'為
《* = argminZ)(i/s,y,《)
一般採用自適應動態內刷新率《來達到實時最小視頻失真"。
4、收益^("):
示例性的,以《")為時刻^用戶"的收益為例 《(,),5(。) = lg (D(")) - c,(") + c3 ] T,
其中"(")是用戶"的視頻失真,^(")是用戶"需要付的接入價格,這個接入價格是 與為其提供接入服務的網絡有關的,不贅述。A^Q, 6^G和&為常量係數。通過調節 A, e2和q可以達到視頻失真和接入價格的平衡。
則收益"^")為採用動作"後網絡中所有用戶的《")的總和。
這樣,系統收益,可以
r-1
其中T為所討論的決策時刻總個數。
由上所述,可以知道,由於考慮在時間段內各個網絡的狀態變化的相關性,通過連 續多個決策時刻中各決策時刻各網絡在各狀態的收益、狀態轉移概率和狀態概率向量,確定在各個決策時刻的接入網絡,使得異構網絡在包含所述連續多個決策時刻的決策期 間獲得最大系統收益。
而且,由於從用戶體驗的角度,應用層的QoS在目前網絡中非常有前景,所以,根據 各網絡應用層為用戶提供的服務質量QoS優化各網絡在各狀態的收益,提高了用戶的體驗效果。
下面,參考P. Whittle, "Restless bandits: activity allocation in a changing world, ,, in A Celebration of Applied Probability (J. Gani, ed.), vol. 25 of J. Appl. Probab., pp. 287 - 298, Applied Probability Trust, 1988.
(狀態可變的賭博機變化的世界中的活躍分配,1988年應用概率學學報,25巻第287 -298頁),以及D. Berstimas and 工 Nift o-Mora,"Restless bandits, linear programming relaxations, and a primal-dual index heuristic, ,, Operations Research, vol. 48, no. 1, pp. 80 - 90, 2000.(狀態可變的賭博機、線性規劃、鬆弛 和原始-雙重索引啟發式算法,運籌學,48巻第80 - 90頁)。
網絡選擇方法通過可變狀態模型(Restless Bandits)得以解決。 為了解決Restless Bandits問題,首先需要基於馬爾科夫決策鏈(Markov Decision Chain, MDC)的線性規劃(Linear Programming, LP)的建模,給定一系列的越來越緊 的線性規劃鬆弛。
首先,引入""),其定義為如果在決策時刻^,網絡的動作為",狀態為7',則
C") = i。否則^")"o。有了這個"h),令
EC
(乂)=a
a)
表示使用策略^ 、狀態為J 、動作為"時,總的折扣時間。用
D ={(/,o):/eS ,aeA }表示狀態—動作空間,系統收益可以寫作
Z* = max Z i X (J)
^ C ", (2)
其中《為網絡"在狀態^、動作"時的收益。對於^eJ ,引入性能向量 x(小(;c;(J)) Z*,,《《X'。
V 乂 V八,顛。於是可以重寫式(2) : ,其中
I = {X(")'"eU L可以把式(l)分解為兩個動作
13formula see original document page 14
因此RestlessBandits問題可以轉換成線性規劃問題
A" -Ep,L,W}, eS " 頓 ,其中 I、"
解此問題的方法是構建一個多項的I,是線性規劃的鬆弛。用^^Z表示這個松
弛,不是在原始變量^的空間上,而是在更高維的空間上,包含了新的輔助變量。 於是,這個一階鬆弛可以表示為一個線性規劃-
formula see original document page 14
此線性規劃中,共有G(WS籠卩個變量和G(^ISmaxl)個限制條件。其中
|S mav I = max |S I
—i",^ i為多項式的大小。
式(3)的Dual (雙重)為:
formula see original document page 14
表示這個一階鬆弛(式(3))和其Dual (式(4))的一對最優Primal
和Dual解(原始-雙重)。令
表示相應的最優代價係數:
(5)《和《都必須是非負的。此外,《和《還分別表示為每個單位中,式(3)的線性規
劃的目標值< 和^的減小的速率。
由網絡","eN的狀態轉移概率定義一個有向圖《(S",4j,其中, 4-K、,厶)lp,L〉0,pL〉0,w"e Sj。根據式(5)計算的代價係數,網絡"在狀態4下
的索引值定義為《=《—《。
優先級-索引值的方法規則就是將所有網絡中具有最小索引值的網絡作為用戶接入的 網絡。
實施例一
下面具體結合圖卜4,詳細說明本發明實施例異構網絡中的網絡選擇方法,其中,省 略了異構網絡中的每個網絡如何獲得其所有狀態的索引值表的過程,主要說明決策時刻
的狀態下,如何確定每個網絡中的接入網絡
每個網絡將其決策時刻的狀態Z'"共享給其他的所有網絡; 每個網絡根據各網絡的狀態Z'"得到自己的狀態概率向量";
每個網絡根據其狀態概率向量"査其索引值表,確定對應的索引值《,並共享其索 引值氣給其他的所有網絡。
每個網絡按照從小到大的順序排列所有的索引值《,如果自己的索引值處在第一 位,則將自己設為接入網絡,在下一決策時刻,可以接入用戶;
在下一決策時刻,希望到達網絡或希望離開網絡的用戶向異構網絡中的每個網絡發 送請求;
如果有用戶希望到達網絡,且當前接入網絡"。(通過索引值排序,得到網絡"。的索
引值最小)按照其接納控制方案s"。,可以接納新用戶時,則網絡"。接納新用戶,這時,
由於有新用戶達到該網絡"",網絡^的狀態發生變化,網絡"。需要更新其狀態,以為查 找新的對應索引值;
如果有用戶希望到達網絡"。,但當前接入網絡""按照其接納控制方案s"。,不能接納
新用戶時,則新用戶被拒絕接入。如果有用戶希望離開網絡"。,則進行用戶離網操作,由於有用戶離開該網絡"",更
新網絡"。的狀態,以為查找新的對應索引值。
由於考慮在時間段內各個網絡的狀態變化的相關性,通過連續多個決策時刻中各決 策時刻各網絡在各狀態的收益、狀態轉移概率和狀態概率向量,確定在各個決策時刻的 接入網絡,使得異構網絡在包含所述連續多個決策時刻的決策期間獲得最大系統收益;
而且,由於從用戶體驗的角度,應用層的QoS在目前網絡中非常有前景,所以,根據 各網絡應用層為用戶提供的服務質量QoS優化各網絡在各狀態的收益,提高了用戶的體驗 效果;
還有,考慮在時間段內各個網絡的狀態變化的相關性,將網絡選擇問題以可變狀態 模型(Restless Bandits)以及原始-雙重(Primal-Dual)啟發式算法得以解決,極大 減小計算複雜度;
該異構網絡中的網絡選擇方法,在鬆耦合、緊耦合下都可以適用。
鬆耦合、緊耦合可以如是理解如圖1所示,在使用鬆耦合的異構網絡中,來自作為 補充的網絡的數據流直接流向核心IP網,而與蜂窩網之間只有信令交互;在使用緊耦合 的異構網絡中,作為補充的網絡與蜂窩網直接通信,共享用戶資料庫等信息。
以上所述,僅為本發明較佳的具體實施方式
,但本發明的保護範圍並不局限於此, 任何熟悉本技術領域的技術人員在本發明揭露的技術範圍內,可輕易想到的變化或替 換,都應涵蓋在本發明的保護範圍之內。因此,本發明的保護範圍應該以權利要求的保 護範圍為準。
1權利要求
1、一種異構網絡中的網絡選擇方法,其特徵在於,包括通過各網絡在各狀態的收益、狀態轉移概率和狀態概率向量,確定在各個決策時刻的接入網絡;通過所述各個決策時刻的接入網絡,異構網絡獲得最大系統收益,所述決策時刻為用戶向各網絡發送接入請求或離開請求的時刻,所述網絡的狀態為各網絡中可能接入的各類型用戶的個數。
2、 根據權利要求l所述的網絡選擇方法,其特徵在於,所述各網絡在各狀態的收益 為各網絡應用層為用戶提供的服務質量QoS的收益。
3、 根據權利要求l所述的網絡選擇方法,其特徵在於,所述應用層QoS包括應用層視 頻失真及接入價格。
4、 根據權利要求l所述的網絡選擇方法,其特徵在於,通過各網絡在各狀態的收 益、狀態轉移概率和狀態概率向量,確定在各個決策時刻的接入網絡,包括將各網絡在各狀態的收益、狀態轉移概率和狀態概率向量進行線性規劃鬆弛計算,得到各網絡在各狀態的索引值;根據所述各網絡在決策時刻的狀態,得到對應的索引值,將所述索引值最小的網絡 作為接入網絡。
5、 根據權利要求4所述的網絡選擇方法,其特徵在於,所述方法,還包括 根據所述各網絡應用層為用戶提供的QoS為用戶劃分類型; 根據所述各網絡的所有狀態得到所述各網絡的狀態空間;根據所述各網絡的狀態空間按照馬爾科夫鏈進行狀態轉移,得到所述各網絡的各狀 態轉移概率;根據所述所有網絡中所有狀態的概率,得到各網絡在各狀態的狀態概率向量。
6、 根據權利要求4所述的網絡選擇方法,其特徵在於,所述方法,還包括根據源 編碼速率和丟包率,優化各網絡的視頻編碼內刷新率;通過各網絡的視頻編碼內刷新率獲得最小應用層視頻失真;根據所述最小應用層視頻失真及各網絡的接入價格,得到所述各網絡在各狀態的收顯。
7、 根據權利要求4所述的網絡選擇方法,其特徵在於,所述方法還包括將各網絡在各狀態的收益、狀態轉移概率和狀態概率向量進行線性規劃鬆弛計算,得到各網絡在 各狀態的索引值之後,為所述各網絡分別存儲各自的索引值表,所述索引值表包括所 述索引值與狀態轉移概率、收益以及狀態概率向量的對應關係。
8、 根據權利要求4所述的網絡選擇方法,其特徵在於,根據所述各網絡在決策時刻 的狀態,得到對應的索引值,將所述索引值最小的網絡作為接入網絡,包括根據在決策時刻是否有用戶到達或離開網絡,分別確定所述各網絡在決策時刻的狀 態,並通知給其他各網絡;根據所述各網絡在決策時刻的狀態,得到所述各網絡在決策時刻的各所述狀態概率根據各所述狀態概率向量,從所述各網絡的索引值表中分別確定所述各網絡決策時 刻狀態對應的索引值,並通知給其他各網絡;選擇所述索引值最小的網絡作為下一決策時刻用戶的接入網絡。
9、 根據權利要求3或6所述的網絡選擇方法,其特徵在於,所述應用層視頻失真為發 送視頻與接收解碼視頻之間的均方誤差。
全文摘要
本發明實施例提供一種異構網絡中的網絡選擇方法,包括通過各網絡在各狀態的收益、狀態轉移概率和狀態概率向量,確定在各個決策時刻的接入網絡;通過所述各個決策時刻的接入網絡,異構網絡獲得最大系統收益,所述決策時刻為用戶向各網絡發送接入請求或離開請求的時刻,所述網絡的狀態為各網絡中可能接入的各類型用戶的個數。由於考慮在時間段內各個網絡的狀態變化的相關性,通過連續多個決策時刻中各決策時刻各網絡在各狀態的收益、狀態轉移概率和狀態概率向量,確定在各個決策時刻的接入網絡,使得異構網絡在包含所述連續多個決策時刻的決策期間獲得最大系統收益。
文檔編號H04W28/16GK101562843SQ200910085559
公開日2009年10月21日 申請日期2009年5月25日 優先權日2009年5月25日
發明者非 於, 司鵬搏, 屹 李, 曦 李, 李希金, 旭 毛, 王成金, 紅 紀 申請人:北京郵電大學