新四季網

基於Markov演化博弈的網絡防禦策略選取方法及其裝置與流程

2023-05-29 16:10:46

本發明屬於網絡安全
技術領域:
:,特別涉及一種基於markov演化博弈的網絡防禦策略選取方法及其裝置。
背景技術:
::直面網絡空間安全領域的挑戰,增強網絡安全防禦能力,確保網絡空間安全已成為亟待解決的迫切問題。網絡安全的本質在攻防對抗,因此從攻防對抗的角度出發,研究探索網絡安全分析方法和防禦技術體系,具有重要現實意義,已成為近年來的研究重點。博弈論是研究決策主體之間行為直接相互作用時的決策問題的理論。網絡攻防具有的目標對立性、關係非合作性、策略依存性特點均與博弈論的基本特徵吻合,博弈模型應用於網絡攻防分析成為近年來新的研究方法和熱點,並取得了部分成果。但總體來說,基於博弈論的網絡空間安全問題研究起步較晚,目前的研究方法仍然不夠系統,已有研究成果大都以傳統博弈模型為主,其模型方法建立在完全理性的條件下,而現實網絡攻防無法滿足,從而降低了研究成果實用價值。目前,基於博弈理論的網絡安全防禦大多採用傳統博弈理論為主,而傳統博弈理論以行為者完全理性為前提,博弈雙方在博弈過程中通過最大化自身利益,選取最優防禦策略進行網絡安全防禦。而信號博弈就是傳統博弈理論中的一種,局中人分別是信號的發出者和信號的接收者。信號發出者的類型並不為信號接收者所知,但接受者對信號發出者的類型有先驗判斷。接收者利用信號對發出者的類型做出修正,形成後驗判斷,進而選擇最優行動。傳統博弈理論中的行為者完全理性前提假設與實際情況不符。傳統博弈理論建立在行為者完全理性的前提假設下,而現實中由於人的決策能力是有限的,即決策者實際屬於非完全理性個體。傳統博弈理論中忽視行為者有限理性條件會對最終的博弈結果產生重大影響,使最終的博弈均衡結果與實際相差較大,從而降低了模型和方法的有效性。傳統博弈理論以矩陣博弈為基礎,未能體現出實際網絡攻防博弈的動態演化過程。傳統博弈理論採用矩陣博弈形式,通過對收益矩陣的分析和計算,得出最終的博弈均衡,從而用於網絡安全防禦策略的選取,但該分析方法僅僅對博弈過程中的某一個博弈階段進行了分析。在實際網絡攻防過程中,攻防雙方的博弈均衡會隨著攻防策略集以及系統運行環境的改變而被打破,從而開始下一階段的博弈演化。針對現實社會中攻防雙方的攻防過程的動態變化特徵,其應用價值有限。技術實現要素:針對現有技術中的不足,本發明提供一種基於markov演化博弈的網絡防禦策略選取方法及其裝置,採用博弈理論構建一種有效的網絡安全主動防禦技術來彌補傳統被動防禦技術存在的不足,能夠分析有限理性的攻擊者和防禦者之間的動態對抗過程,最優防禦策略選取的實用性和和指導意義更強。按照本發明所提供的設計方案,一種基於markov演化博弈的網絡防禦策略選取方法,包含:根據網絡攻防過程中動態攻防博弈,構建多階段markov攻防演化博弈模型,該模型包含多個子博弈階段;針對多階段markov攻防演化博弈模型,採用最優防禦策略選取算法求解攻防博弈各個階段的最優防禦策略並輸出。上述的,多階段markov攻防演化博弈模型表示為:m2ade=(n,t,b,p,ξ,s0,s,η,u),其中,n=(nd,na)是演化博弈的參與者空間,nd為防禦方,na為攻擊方;t是多階段博弈的階段總數,當前階段博弈過程用g(k)表示,k={1,2,…,t},b=(ds,as)是攻防行動空間,表示攻擊方在第k個階段的可選策略,表示防禦方在第k個階段的可選策略;是博弈信念集合,表示在第k個階段選擇攻擊策略的概率,且表示在第k個階段選擇防禦策略的概率,且ξ是折現因子,其表示在博弈階段k中的收益相較初始階段的折現比例,0≤ξ≤1;是攻防過程中初始安全狀態集合,s={s1…sk…st}是攻防過程中安全狀態集合,集合s0與s中的狀態與博弈階段一一對應;η表示安全狀態轉移概率,ηij=η(sj|si)表示系統從狀態si跳變至狀態sj的概率;是博弈收益函數集合,和代表第k個博弈階段中防禦者和攻擊者的收益函數。優選的,採用最優防禦策略選取算法求解攻防博弈各個階段的最優防禦策略,包含如下內容:a)、根據多階段markov攻防演化博弈模型,求解每個子博弈階段攻防雙方收益;b)、通過引入折現因子將未來階段的收益折算成基於初始階段的折扣收益,將多階段博弈均衡求解問題,轉化為以整體收益為目標的動態規劃問題;c)、對動態規劃問題進行求解,得到多階段博弈均衡策略集合併輸出。優選的,所述的步驟a包含如下內容:構建每個子博弈階段的演化博弈樹並計算該階段的博弈收益,通過循環迭代直至完成所有的子博弈階段的演化博弈樹構建和博弈收益計算。優選的,構建每個子博弈階段的演化博弈樹並計算該階段的博弈收益,包含:a1、構建當前循環子博弈階段的博弈信念集合;a2、針對該子博弈階段的攻防策略對,分別計算攻防雙方收益值;a3、根據博弈信念集合及攻防雙方收益值,分別計算攻防雙方的期望收益;a4、根據博弈信念集合及攻防雙方的期望收益,分別計算攻防雙方的平均收益。優選的,所述的步驟b包含如下內容:b1、根據折現因子、安全狀態轉移概率及目標準則函數,計算未來階段的折扣收益;b2、根據未來階段的折扣收益、及每個子博弈階段攻防雙方求解結果,通過動態規劃方法將博弈均衡求解問題轉化為動態規劃求解問題。優選的,所述的目標準則函數採用折扣期望準則函數,其表示為:其中,ua、ud分別為子博弈階段g(k)中攻、防雙方的收益值,表示未來階段的折扣收益值。優選的,通過動態規劃方法將博弈均衡求解問題轉化為動態規劃求解問題,具體表示為:對k={1,2,…,t},,其中,在第k個子博弈階段,和分別代表防禦方和攻擊方的複製動態方程,和分別代表防禦策略和攻擊策略的選取概率。一種基於markov演化博弈的網絡防禦策略選取裝置,包含:演化博弈模型構建模塊及模型求解輸出模塊,演化博弈模型構建模塊,用於根據網絡攻防過程中動態攻防博弈構建多階段markov攻防演化博弈模型,該模型包含多個子博弈階段;模型求解輸出模塊,用於針對演化博弈模型構建模塊中的多階段markov攻防演化博弈模型,通過採用最優防禦策略選取算法求解攻防博弈各個階段的最優防禦策略並輸出。上述的網絡防禦策略選取裝置中,所述的模型求解輸出模塊包含:階段收益求解單元、問題轉化單元及策略求解輸出單元,階段收益求解單元,用於根據演化博弈模型構建模塊中的多階段markov攻防演化博弈模型,求解每個子博弈階段中攻防雙方收益;問題轉化單元,用於根據階段收益求解單元中每個子博弈階段攻防雙方收益,並通過引入折現因子將未來階段的收益折算成基於初始階段的折扣收益,將多階段博弈均衡求解問題,轉化為以整體收益為目標的動態規劃問題;策略求解輸出單元,用於對問題轉化單元中的動態規劃問題進行求解,獲取多階段博弈均衡策略集合,依據博弈理論確定防禦方的最優防禦策略並進行輸出。本發明的有益效果:本發明解決傳統博弈模型應用於網絡防禦策略選取存在行為者完全理性以及無法描述實際網絡攻防過程的動態演化特性的問題;從攻防對抗的角度出發,研究探索網絡安全分析方法和防禦技術體系,通過將各個演化階段之間的狀態跳變描述為隨機過程,在借鑑markov過程的基礎上,將多階段演化博弈與markov決策方法相結合,構建多階段markov演化博弈;以博弈的折扣總收益為目標函數,針對多階段攻防過程中的收益衰減,引入折現因子ξ對不同階段的博弈收益進行折扣處理,在求解和分析多階段博弈均衡的基礎上,設計最優防禦策略選取算法,並通過仿真實驗驗證模型和方法的有效性。與已有研究成果相比,本發明成果能夠分析有限理性的攻擊者和防禦者之間的動態對抗過程,最優防禦策略選取的實用性和和指導意義更強。附圖說明:圖1為本發明的方法流程示意圖;圖2為信號博弈樹示意圖;圖3為多階段markov演化博弈模型架構示意圖;圖4為本發明的裝置示意圖;圖5為仿真實例實驗系統結構示意圖;圖6為仿真實例具體網絡攻防狀態轉移過程示意圖。具體實施方式:為使本發明的目的、技術方案和優點更加清楚、明白,下面結合附圖和技術方案對本發明作進一步詳細的說明。需要說明的是,在不衝突的情況下,本申請中的實施例及實施例中的特徵可以相互任意組合。顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。馬爾可夫分析法(markovanalysis):又稱為馬爾可夫轉移矩陣法,是指在馬爾可夫過程的假設前提下,通過分析隨機變量的現實變化情況來預測這些變量未來變化情況的一種預測方法,主要應用於隨機事件變化趨勢的研究,該理論在目前科研領域有著十分重要的意義。馬爾可夫鏈(markovchain):是指時間和狀態都是離散的馬爾可夫過程,簡稱馬氏鏈,記為{xn=x(n),n=0,1,2,…}。其可以看作在時間集t={0,1,2…}上對離散狀態的馬氏過程相繼觀察的結果。狀態轉移概率(statetransitionprobability):假設在時間集t中,馬氏鏈的狀態空間為i={a1,a2,…},ai∈r。針對鏈的情形,馬爾可夫性通常用條件分布律來表示,即對和0≤t1<t2…<tr<m;ti,m,n+m∈t,有其中,a.∈i,記上式右端為pij(m,m+n)。稱條件概率pij(m,m+n)=p(xm+n=aj|xm=ai)為馬氏鏈在時刻m處於狀態ai條件下,在時刻m+n轉移到狀態aj的狀態轉移概率。演化博弈論(evolutionarygametheory):源於darwin的生物進化論,繼承了生物學對於物種進化的理論闡述,從個體有限理性條件出發,以群體行為為研究對象,在闡述生物物種的發展歷程和進化選擇中,解釋了生物行為的進化博弈過程。通過長期的試錯、模仿和改進,所有的博弈方都會趨於某個穩定的策略,該策略可能在群體組織中長期穩定下來,這種穩定的策略均衡就與生物進化的進化穩定策略非常相似,以達到一種相對和諧的博弈均衡狀態。演化穩定策略(ess,evolutionarystablestrategy):是指在具有明確定義下不會被突變體入侵的策略,是演化博弈中具有真正穩定性和較強預測能力的均衡策略。它是生物進化理論中具有較強抗幹擾能力且在受到幹擾後仍能「恢復」的穩健性均衡概念,是演化博弈分析中最核心的均衡概念。本發明實施例提供了一種基於markov演化博弈的網絡防禦策略選取方法,參見圖1所示,包含:101、根據網絡攻防過程中動態攻防博弈,構建多階段markov攻防演化博弈模型,該模型包含多個子博弈階段;102、針對多階段markov攻防演化博弈模型,採用最優防禦策略選取算法求解攻防博弈各個階段的最優防禦策略並輸出。解決傳統博弈模型應用於網絡防禦策略選取存在行為者完全理性以及無法描述實際網絡攻防過程的動態演化特性的問題;通過多階段markov攻防演化博弈模型模擬網絡攻防動態演化過程,從攻防對抗的角度出發,研究探索網絡安全分析方法和防禦技術體系,具有重要現實意義。在本發明的另一個實施例中,多階段markov攻防演化博弈模型表示為:m2ade=(n,t,b,p,ξ,s0,s,η,u),其中,n=(nd,na)是演化博弈的參與者空間,nd為防禦方,na為攻擊方;t是多階段博弈的階段總數,當前階段博弈過程用g(k)表示,k={1,2,…,t},b=(ds,as)是攻防行動空間,表示攻擊方在第k個階段的可選策略,表示防禦方在第k個階段的可選策略;是博弈信念集合,表示在第k個階段選擇攻擊策略的概率,且表示在第k個階段選擇防禦策略的概率,且ξ是折現因子,其表示在博弈階段k中的收益相較初始階段的折現比例,0≤ξ≤1;是攻防過程中初始安全狀態集合,s={s1…sk…st}是攻防過程中安全狀態集合,集合s0與s中的狀態與博弈階段一一對應;η表示安全狀態轉移概率,ηij=η(sj|si)表示系統從狀態si跳變至狀態sj的概率;是博弈收益函數集合,和代表第k個博弈階段中防禦者和攻擊者的收益函數。將多階段演化博弈模型與markov決策過程相結合,構建多階段markov演化博弈模型,將markov決策過程中的單個智能體擴展到多智能體,具體如圖3所示,在網絡攻防過程中,基於不完全理性假設,攻防決策者可以通過向他人學習的方法,不斷改進、提高自身策略,使自身收益達到最優,屬於一個多狀態且狀態隨時間動態改變的演化過程。在一定時間階段內,網絡攻防系統會達到某個穩定均衡狀態,但該狀態並不能一直維持下去,隨著時間推移,博弈要素和系統環境都可能發生改變,穩定的均衡狀態被破壞,網絡系統以概率η從穩定狀態跳變到另一個非穩定狀態,系統將打破均衡從而開始下一階段的演化。從攻防過程的全局視角出發,系統處於「演化—跳變—演化」的動態過程中,在分析多階段網絡攻防博弈過程的基礎上,構建多階段markov攻防演化博弈模型。在本發明的再一實施例中,採用最優防禦策略選取算法求解攻防博弈各個階段的最優防禦策略,包含如下內容:a)、根據多階段markov攻防演化博弈模型,求解每個子博弈階段攻防雙方收益;b)、通過引入折現因子將未來階段的收益折算成基於初始階段的折扣收益,將多階段博弈均衡求解問題,轉化為以整體收益為目標的動態規劃問題;c)、對動態規劃問題進行求解,得到多階段博弈均衡策略集合併輸出。網絡攻防博弈模型中包含多個子博弈過程,本發明的又一實施例中,根據多階段markov攻防演化博弈模型,求解每個子博弈階段攻防雙方收益,包含如下內容:構建每個子博弈階段的演化博弈樹並計算該階段的博弈收益,通過循環迭代直至完成所有的子博弈階段的演化博弈樹構建和博弈收益計算。基於博弈理論的網絡安全防禦大多採用傳統博弈理論為主,而傳統博弈理論以行為者完全理性為前提,博弈雙方在博弈過程中通過最大化自身利益,選取最優防禦策略進行網絡安全防禦。而信號博弈就是傳統博弈理論中的一種,局中人分別是信號的發出者和信號的接收者。信號發出者的類型並不為信號接收者所知,但接受者對信號發出者的類型有先驗判斷。接收者利用信號對發出者的類型做出修正,形成後驗判斷,進而選擇最優行動,其信號博弈樹如圖2所示,按以下步驟來求解網絡攻防雙方的精煉貝葉斯均衡。(1)求解攻擊者推斷依存的子博弈精煉均衡策略當m=m1時,因為o1+o2+o3=1,令即可得到假設並且則有以下三種情況若原式=a12·o1+a42·o2+a72·o3,a(m1)=a1若原式=a22·o1+a52·o2+a82·o3,a(m1)=a2若原式=a32·o1+a62·o2+a92·o3,a(m1)=a3同理可得若a(m2)=a1;若a(m2)=a2;若a(m2)=a3。同理可得若a(m3)=a1;若a(m3)=a2;若a(m3)=a3。(2)求解防禦者推斷的子博弈精煉均衡策略當t=t1時當時原式=max{ud(m1,a(m1),t1),ud(m2,a(m2),t1),ud(m3,a(m3),t1)}=max{a11,a23,a35},由此可求得m(t1)。同理可得情況下的m(t1)。且可以得到t2、t3類型的子博弈精煉均衡策略。(3)求解信號博弈的精煉貝葉斯均衡在已知m*(t),a*(m)的條件下,可以求出滿足貝葉斯法則的攻擊者對防禦者類型的推斷若p(t|m)與不衝突,即可得出信號博弈的精煉貝葉斯均衡策略依據博弈理論可知,精煉貝葉斯納什均衡下的混合策略即為雙方的最優選擇。優選的,本發明的又一實施例中,構建每個子博弈階段的演化博弈樹並計算該階段的博弈收益,包含:a1、構建當前循環子博弈階段的博弈信念集合;a2、針對該子博弈階段的攻防策略對,分別計算攻防雙方收益值;a3、根據博弈信念集合及攻防雙方收益值,分別計算攻防雙方的期望收益;a4、根據博弈信念集合及攻防雙方的期望收益,分別計算攻防雙方的平均收益。在多階段博弈均衡策略求解的問題上,本發明的另一實施例中,通過引入折現因子將未來階段的收益折算成基於初始階段的折扣收益,將多階段博弈均衡求解問題,轉化為以整體收益為目標的動態規劃問題,包含如下內容:b1、根據折現因子、安全狀態轉移概率及目標準則函數,計算未來階段的折扣收益;b2、根據未來階段的折扣收益、及每個子博弈階段攻防雙方求解結果,通過動態規劃方法將博弈均衡求解問題轉化為動態規劃求解問題。目標準則函數r用於判斷攻防雙方策略的優劣。常用目標準則函數有折扣期望準則函數和平均回報準則函數。由於博弈收益與時間有關,在本發明的又一個實施例中,通過引入折現因子,採用折扣期望準則函數,其表示為:其中,ua、ud分別為子博弈階段g(k)中攻、防雙方的收益值,表示未來階段的折扣收益值。目標準則函數是博弈階段g(k)中收益值ua、ud與未來折扣收益值之和,攻防雙方的目標是使各自的目標函數達到最大值。在網絡對抗過程中,攻防雙方都儘可能最大化自身收益,對於多階段markov攻防演化博弈,當處於演化博弈階段g(k)時,攻防雙方的策略分別為和根據演化博弈均衡定理,若為第k階段的演化穩定策略,則對於任意的攻防策略滿足:基於m2ade模型研究多階段網絡攻防過程,由於網絡攻防由多個子博弈過程構成,每個狀態都會受之前階段攻防博弈中行為策略的影響,根據markov決策準則,參與人必有一個markov最優響應策略。因此,若為markov最優響應策略,則使目標函數和達到最大值,即對任意階段k均滿足下列條件:狀態轉移概率η直接影響折扣收益值的計算,進而影響目標函數的取值,對於攻防雙方最優策略的選取具有直接作用。當η發生變化後,若變化程度較大,可能直接導致最優策略改變。部分已有研究成果均設置固定的狀態轉移概率,並依據歷史數據和專家經驗確定具體取值,本發明使用同樣的方法。由於攻防過程由有限的k個階段博弈構成,同時每個階段中的策略集dsk和ask是有限的,並且攻防雙方的博弈收益也是有限的,因此,多階段markov攻防演化博弈模型m2ade為多狀態-多智能體的有限markov演化博弈模型。m2ade博弈由多個獨立且相似的單階段演化博弈構成。一方面,由於每個獨立的單階段演化博弈均屬於有限博弈,因此,必定存在混合策略下的納什均衡。另一方面,由多階段markov演化博弈模型的定義,依據轉移概率和收益函數可知,存在與m2ade等價的有限隨機博弈,且收益函數為凸函數。根據有限隨機博弈的均衡策略存在性定理可知,該有限隨機博弈存在混合策略下的納什均衡。綜上,m2ade存在混合策略下的納什均衡。通過求解每個子博弈階段演化博弈均衡,針對多階段攻防過程中的收益計算問題,通過引入折現因子,將未來階段的收益折算成基於初始階段的折扣收益,在此基礎上,在本發明的其他實施例中,通過動態規劃方法將博弈均衡求解問題轉化為動態規劃求解問題,具體表示為:對k={1,2,…,t},,其中,在第k個子博弈階段,和分別代表防禦方和攻擊方的複製動態方程,和分別代表防禦策略和攻擊策略的選取概率。求解上述動態規劃問題可以得到最優解集合即為多階段博弈的均衡策略集合。依據博弈理論,混合策略是第k階段攻防雙方的最優選擇,因此防禦方應將作為最優防禦策略。與上述方法對應,本發明實施例還提供了一種基於markov演化博弈的網絡防禦策略選取裝置,如圖4所示,包含:演化博弈模型構建模塊201及模型求解輸出模塊202,演化博弈模型構建模塊201,用於根據網絡攻防過程中動態攻防博弈構建多階段markov攻防演化博弈模型,該模型包含多個子博弈階段;模型求解輸出模塊202,用於針對演化博弈模型構建模塊中的多階段markov攻防演化博弈模型,通過採用最優防禦策略選取算法求解攻防博弈各個階段的最優防禦策略並輸出。在本發明的另一個實施例中,所述的模型求解輸出模塊包含:階段收益求解單元、問題轉化單元及策略求解輸出單元,階段收益求解單元,用於根據演化博弈模型構建模塊中的多階段markov攻防演化博弈模型,求解每個子博弈階段中攻防雙方收益;問題轉化單元,用於根據階段收益求解單元中每個子博弈階段攻防雙方收益,並通過引入折現因子將未來階段的收益折算成基於初始階段的折扣收益,將多階段博弈均衡求解問題,轉化為以整體收益為目標的動態規劃問題;策略求解輸出單元,用於對問題轉化單元中的動態規劃問題進行求解,獲取多階段博弈均衡策略集合,依據博弈理論確定防禦方的最優防禦策略並進行輸出。在上述分析的基礎上,多階段markov攻防演化博弈的最優防禦策略選取算法描述如下:input:多階段markov攻防演化博弈模型m2adeoutput:多階段最優防禦策略begin1.初始化m2ade=(n,t,b,p,ξ,s0,s,η,u);2.構建防禦行為空間ds和攻擊行為空間as;3.構建攻防博弈各階段的狀態集合和s={s1…sk…st};4.初始化狀態轉移概率ηij=η(sj|si);5.for(k=1;k≤t;k++){//構建不同階段的演化博弈樹並計算博弈收益;6.構建博弈信念集合且且7.針對攻防策略對計算攻防收益值8.計算策略的期望收益9.計算攻防雙方的平均收益}10.利用折現因子ξ,計算折扣收益11.基於動態規劃方法,以和為目標函數,求解得到博弈均衡解12.return//輸出攻防博弈各階段的最優防禦策略end算法時間複雜度為o(k(m+n)2),空間消耗主要集中在收益值和均衡求解中間結果的存儲上,其空間複雜度為o(knm)。根據該算法,可以分析單階段策略選取隨時間變化的情況以及策略的收益情況,然後通過折現準則求出k個階段的折扣收益,利用動態規劃求解多階段攻防過程的最優防禦決策,用於多階段網絡攻防的行為分析與防禦決策。為進一步驗證本發明的有效性,下面通過,具體實例做進一步解釋說明:構建如圖5示的信息系統進行實驗驗證,實驗系統主要由安全防禦設備、web伺服器、文件伺服器、資料庫伺服器和客戶終端組成,安裝windows、linux等作業系統,web伺服器提供http服務,文件伺服器提供ftp服務,資料庫伺服器運行oracle11系統,客戶終端具有電子郵件、文件下載、視頻點播等功能。針對建立的網絡信息實驗系統結構,設定網絡攻防過程分為八個階段,具體網絡攻防狀態轉移過程如圖6所示,其中,為初始狀態,sk為演化狀態。實線箭頭表示單階段內的攻防博弈過程,虛線箭頭表示從某一階段跳變到下一階段初始狀態的過程。具體狀態包括:sk={s1:獲取web伺服器的access權限;s2:獲取f2的access權限;s3:通過d1獲取對f1的access權限;s4:獲取d1的user權限;s5:獲取f1的root權限;s6:獲取c2的root權限;s7:通過c1獲取d2的access權限;s8:獲取f2的root權限}。針對不同階段之間的狀態跳變,假設狀態轉移概率固定,並依據歷史數據和專家經驗確定各階段之間的轉移概率,具體如表1所示,其中ηij=η(sj|si)表示從狀態si跳變至狀態sj的概率。表1各階段之間的狀態轉移概率訪問控制規則限制非本網絡的主機只能訪問web伺服器,系統內web伺服器、應用伺服器可以對資料庫伺服器進行訪問。通過nessus掃描實驗信息系統,結合國家信息安全漏洞庫(cnnvd)信息,在分析路由文件、漏洞信息的基礎上,構建各博弈階段的攻防策略集,具體如表2所示:表2不同博弈階段的攻防行動可選集針對每一個攻防策略對(asi,dsj),根據策略成本/回報量化方法和策略收益計算方法,分別給出各階段的攻防收益矩陣,如表3所示:表3各階段的攻防收益矩陣設折現因子ξ=0.5,採用matlab2012軟體編程實現本發明中的策略選取算法,計算得到各個階段的均衡策略,如表4所示,其中,為防禦者在各階段的最優防禦策略。表4各階段博弈均衡策略上述實驗過程中系統狀態數為16,博弈分為8個階段,每個階段攻防雙方各有3個策略,各階段之間共有15種狀態轉移概率,為實現不同階段的最優防禦策略選取,需要計算16個收益矩陣,算法運算時間為32.7s。實驗分析以文件伺服器f1、f2為攻擊目標,只要攻擊方獲取伺服器f1、f2的root權限即認為達到攻擊目標。通過分析上述仿真過程可知,存在兩條主要攻擊路徑:和其中第一條攻擊路徑可以獲取伺服器f2的root權限,第二條攻擊路徑可以獲取伺服器f1的root權限。第1階段攻擊行動可選集和防禦行動可選集見表3(下同),最優防禦策略為混合策略防禦收益為-30.5。第2階段當系統以概率η(2|1)=0.8從狀態s1跳變至後開始本階段博弈,最優防禦策略為混合策略防禦收益為-20.4。第3階段當系統以概率η(8|2)=0.4從狀態s2跳變至後開始本階段博弈,最優防禦策略為混合策略防禦收益為-27.5。第1階段攻擊行動可選集和防禦行動可選集見表3(下同),最優防禦策略為混合策略防禦收益為-30.5。第2階段當系統以概率η(6|1)=0.6從狀態s1跳變至後開始本階段博弈,最優防禦策略為混合策略防禦收益為-40.3。第3階段當系統以概率η(3|6)=0.8從狀態s6跳變至後開始本階段博弈,最優防禦策略為混合策略防禦收益為-43.2。第4階段當系統以概率η(5|3)=0.9從狀態s3跳變至後開始本階段博弈,最優防禦策略為混合策略防禦收益為-19.5。針對兩條攻擊路徑,分別計算攻防總收益,則路徑①的攻擊總收益為防禦總收益為路徑②的攻擊總收益為防禦總收益為可知且顯然路徑①更加符合防禦方的期望,防禦方應當儘量避免路徑②。對比分析路徑①和②可以發現,其第1階段相同,都要經歷從系統狀態演化到狀態s1的過程,但在跳轉到第2階段時,路徑①從狀態s1跳變至而路徑②從狀態s1跳變至為降低路徑②的發生可能,需要減小狀態s1跳變至的概率,若系統無法抵達狀態則路徑②將不會實現,可以滿足防禦方的期望,沿路徑①開展攻防對抗。進一步分析可知,第1階段攻防博弈結束後,路徑①跳變至狀態路徑②跳變至狀態這兩種情況下存在不同的攻擊動作集,詳見表2。由於策略集和系統運行環境的變化是引起狀態跳變的重要原因,針對對應的as={oracletnslistener,wu-ftpsockprintf,installsqllistenerprogram},防禦者可以在攻防博弈中利用動態調整網絡訪問埠、增設白名單等方式改變訪問控制規則或者增加新的針對性防禦策略,降低該攻擊動作集的實施可能性,減小跳變至的概率,降低路徑②的發生可能。本說明書中各個實施例採用遞進的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似部分互相參見即可。對於實施例公開的裝置而言,由於其與實施例公開的方法相對應,所以描述的比較簡單,相關之處參見方法部分說明即可。結合本文中所公開的實施例描述的各實例的單元及方法步驟,能夠以電子硬體、計算機軟體或者二者的結合來實現,為了清楚地說明硬體和軟體的可互換性,在上述說明中已按照功能一般性地描述了各示例的組成及步驟。這些功能是以硬體還是軟體方式來執行,取決於技術方案的特定應用和設計約束條件。本領域普通技術人員可以對每個特定的應用來使用不同方法來實現所描述的功能,但是這種實現不認為超出本發明的範圍。本領域普通技術人員可以理解上述方法中的全部或部分步驟可通過程序來指令相關硬體完成,所述程序可以存儲於計算機可讀存儲介質中,如:只讀存儲器、磁碟或光碟等。可選地,上述實施例的全部或部分步驟也可以使用一個或多個集成電路來實現,相應地,上述實施例中的各模塊/單元可以採用硬體的形式實現,也可以採用軟體功能模塊的形式實現。本發明不限制於任何特定形式的硬體和軟體的結合。對所公開的實施例的上述說明,使本領域專業技術人員能夠實現或使用本申請。對這些實施例的多種修改對本領域的專業技術人員來說將是顯而易見的,本文中所定義的一般原理可以在不脫離本申請的精神或範圍的情況下,在其它實施例中實現。因此,本申請將不會被限制於本文所示的這些實施例,而是要符合與本文所公開的原理和新穎特點相一致的最寬的範圍。當前第1頁12當前第1頁12

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀