新四季網

一種無人直升機時變增益自抗擾優化控制方法

2023-04-25 14:53:59



1.本發明屬於飛行器魯棒優化控制技術領域,具體是一種無人直升機時變增益自抗擾優化控制方法。


背景技術:

2.無人直升機具有隱蔽性好、慢速飛行、垂直上升下降等明顯優勢,因此被廣泛應用於救災搜尋、偵察監視、探查航拍等領域,在軍事和民用方面都有著非常重要的實用價值。在軍事方面,無人直升機可以進行對地攻擊、中繼通信、火力支援、敵情監測等;在民用商用中,無人直升機可以代替人力進行高難度危險的電力巡航,對受損或老化的設備進行替換;還可以清理高壓電線上的漂浮物質、對海洋中的溺水者和船舶進行搜索並投入救生器材、新聞和影視航拍、快件運輸等。因此對無人直升機進行研究具有深遠的學術價值和現實意義。
3.無人直升機在飛行過程中不可避免地會受到外部幹擾的影響。目前,已有相當量的文獻對無人直升機展開了抗擾控制研究,其中最為常見的自抗擾控制技術。但是,傳統的自抗擾技術是基於固定增益擴張狀態觀測器設計的,這導致觀測器參數無法隨著幹擾的變化而變化。此外,固定增益擴張狀態觀測器還存在初始時刻增益過大導致系統計算量爆炸的問題。隨著航天航天、自動化和人工智慧等技術的飛速發展,現今人們已不滿足於無人直升機單純的完成任務,而是期望它能以某種最優的性能指標實現要求,如油耗最小、時間最短、速度最快等。因此,對傳統固定增益自抗擾技術進行改進並設計無人直升機的最優控制器是現實的迫切需求。


技術實現要素:

4.本發明的目的是提供一種無人直升機時變增益自抗擾優化控制方法,保證無人直升機在具有良好魯棒性能的同時,能夠以能耗最小的方式完成跟蹤任務。
5.為實現上述目的,本發明的技術方案具體分為以下步驟:
6.1)首先,針對無人直升機高度姿態複合系統中存在的幹擾,設計時變增益擴張狀態觀測器來對未知幹擾進行實時估計;
7.2)其次,通過等效變換將無人直升機跟蹤優化控制問題轉換為優化鎮定問題處理:
8.3)最後,基於自適應動態規劃方法和單評價神經網絡技術設計最優飛行控制器,所述最優飛行控制器包括最優虛擬反饋控制器和最優反饋控制器。
9.進一步的,上述步驟(1)所述的無人直升機高度姿態複合動力學模型為:
[0010][0011][0012]
[0013]
其中,po=[ρ,σ
t
]
t
表示高度和姿態混合向量,ρ和σ=[φ,θ,ψ]
t
分別表示無人直升機的垂直高度和姿態角向量,σ=diag{1,γ(σ)}和γ(σ)∈r3×3是姿態運動學矩陣,qo=[h,ω
t
]
t
表示速度和角速度混合向量,h和ω=[p,q,r]
t
分別是垂直速度和姿態角速度向量,g是重力加速度,j0=diag{j
0x
,j
0y
,j
0z
}為慣性矩陣,m表示總質量,是待設計的控制輸入,fu和tu∈r3分別是作用在無人直升機上的力和力矩,d∈r4是未知幹擾,y0是系統輸出。
[0014]
進一步的,上述步驟(1)中,時變增益擴張狀態觀測器設計如下:
[0015][0016]
其中和分別表示p0,q0和rd的估計值,表示p0的估計誤差,k1=diag{k
11
,k
12
,k
13
,k
14
},k2=diag{k
21
,k
22
,k
23
,k
24
},k3=diag{k
31
,k
32
,k
33
,k
34
},k
ij
(i=1,2,3,j=1,2,3,4)是設計的正常數,μ(t)是時變增益,其形式為:
[0017][0018]
其中μ0和a為正常數。
[0019]
進一步的,上述步驟(2)中,等效變換方法的具體步驟如下:選擇候選lyapunov函數如下所示
[0020][0021]
對vo進行求導可得
[0022][0023]
其中*表示零矩陣,e
λ
=λ
max
(e1),),
[0024]
從上式可以看出,如果設計的最優反饋控制器uo能夠使如下動態系統穩定
[0025][0026]
則可以確保(38)右側第一項的穩定性;同時如果(n
nm-e
λ
)>0成立,整個閉環系統最終一致有界。
[0027]
進一步的,上述步驟(3)中,提出虛擬控制律為:
[0028][0029]
其中q
dfo
是設計的前饋虛擬控制器,q
dbo
是設計的最優虛擬反饋控制器;
[0030]
前饋虛擬控制器q
dfo
設計為
[0031][0032]
實際控制律uu設計為
[0033][0034]
其中u
un
是設計的前饋控制器,u
uo
是設計的最優反饋控制器;
[0035]
前饋控制器u
un
設計為
[0036][0037]
其中f
*
=f-f(q
do
);
[0038]
代價函數選取為:
[0039][0040]
其中和是選定的具有適當維數的正定矩陣;
[0041]
針對代價函數(40)定義hjb方程為
[0042][0043]
其中
[0044]
最優代價函數j
*
(ξ)的估計為
[0045][0046]
其中和分別是j
*
(ξ)以及sa的估計;
[0047]
最優控制器和hjb方程設計為
[0048][0049][0050]
其中γe是殘餘誤差。
[0051]
進一步的,上述步驟(3)中,神經網絡權值矩陣的自適應更新律設計為:
[0052][0053]
其中γs>0是設計的正常數,χ1和χ2是設計的具有適當維數的參數矩陣,
υs=μs/κs。
[0054]
與現有技術相比,本發明帶來的有益效果是:
[0055]
(1)本發明所提出的時變增益自抗擾技術,解決了傳統固定增益自抗擾技術存在的初始時刻計算量爆炸和觀測器增益無法隨時間變化的問題,提高了系統的瞬態性能;為了處理無人直升機高度姿態複合模型中的時變幹擾,本發明採用時變參數設計了新型擴張狀態觀測器,並全面證明了任意時刻下系統均穩定,時變參數擴張狀態觀測器的性能優於固定不變參數的擴張狀態觀測器;
[0056]
(2)本發明利用自適應動態規劃技術和神經網絡技術所設計的最優控制器,包含了最優虛擬反饋控制器和最優反饋控制器,解決了傳統飛行控制設計中單純完成跟蹤任務的問題,而是能夠保證無人直升機以能耗最小的代價完成飛行任務,大大提高了飛行性能;
[0057]
(3)本發明所提出的設計方案,能同時兼顧無人直升機的抗擾能力和性能最優指標,更加符合實際任務背景。
附圖說明
[0058]
圖1為本發明的系統控制流程圖。
具體實施方式
[0059]
為了使本發明的目的、技術方案和優點更加清楚,下面將結合附圖和實施例對本發明作進一步地詳細描述,顯然,所描述的實施例僅是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其它實施例,都屬於本發明保護的範圍。
[0060]
本發明公開了一種無人直升機時變增益自抗擾優化控制方法。設計了新型時變增益自抗擾觀測器,保證了無人直升機的瞬態性能;並將系統的最優跟蹤控制問題等效轉換為優化鎮定問題,藉助於自適應動態規劃技術和神經網絡技術,設計了最優控制器以實現能耗最小。
[0061]
參見圖1,在建立無人直升機高度姿態複合模型後,首先傳感器會將採集到的系統輸出信號送到時變增益擴張狀態觀測器和神經網絡中;而後,採用自適應動態規劃技術和神經網絡的輸出,設計虛擬最優反饋控制器;信號經處理後,與虛擬前饋控制器的輸出聯合設計虛擬控制律;同樣地,採用自適應動態規劃技術和神經網絡的輸出,設計最優反饋控制器;信號經處理後,與虛擬控制律、前饋控制器的輸出聯合設計實際控制律;最終,將該控制律用於解決無人直升機的最優跟蹤控制問題。
[0062]
實施例,一種無人直升機時變增益自抗擾優化控制方法,包括以下的具體步驟:
[0063]
步驟(1):針對無人直升機高度姿態複合系統中存在的幹擾,設計時變增益擴張狀態觀測器來對未知外部幹擾進行實時估計
[0064]
步驟1.1建立受擾的無人直升機姿態高度混合模型
[0065]
考慮到垂直起降的典型運動模態,受到幹擾影響的無人直升機高度姿態組合非線性動力學模型可以表示為:
[0066]
[0067][0068][0069]
其中po=[ρ,σ
t
]
t
表示高度和姿態混合向量,ρ和σ=[φ,θ,ψ]
t
分別表示無人直升機的垂直高度和姿態角向量,σ=diag{1,γ(σ)}和γ(σ)∈r3×3是姿態運動學矩陣,qo=[h,ω
t
]
t
表示速度和角速度混合向量,h和ω=[p,q,r]
t
分別是垂直速度和姿態角速度向量,j0=diag{j
0x
,j
0y
,j
0z
}為慣性矩陣,g是重力加速度,m表示無人直升機的總質量,表示待設計的控制輸入向量,fu和tu∈r3分別是作用在無人直升機系統上的力和力矩,d∈r4是總的未知幹擾,y0是系統輸出。
[0070]
本發明的控制目標是設計自適應最優控制器,使得系統輸出yo圍繞在期望信號p
do
的附近,同時保證飛行過程能耗最小。為此下面列出一些必要的假設和引理:
[0071]
假設1:假設未知擾動d及其一階導數是有界的。也就是說,存在正常數和使得和
[0072]
假設2:由於無人直升機的特殊旋翼結構,假設其姿態角在合理範圍內變化。此外參考軌跡p
do
及其導數是有界的。
[0073]
引理1:採用神經網絡逼近任何未知的光滑函數m(ε),其形式為:
[0074][0075]
其中ε∈r
l
是神經網絡輸入向量,是m(ε)的估計;表示最優權重矩陣且滿足且滿足是選定合適的基函數向量且滿足k
t
(ε)k(ε)≤km;和km為正常數。因此,未知的光滑函數m(ε)可以進一步描述為:
[0076][0077]
其中是逼近誤差且滿足是逼近誤差且滿足是正常數。
[0078]
步驟1.2設計時變增益擴張狀態觀測器
[0079]
首先將外部幹擾d擴展為一個新的狀態rd,則受幹擾無人直升機的非線性動力學(1)可以進一步描述為
[0080][0081]
其中d=rd。根據假設1,可以得出λ有界且
[0082]
基於上述描述,新型時變增益擴張狀態觀測器構造如下:
[0083][0084]
其中和分別是p0,q0和rd的估計值,是p0的估計誤差。k1=diag{k
11
,k
12
,k
13
,k
14
},k2=diag{k
21
,k
22
,k
23
,k
24
},k3=diag{k
31
,k
32
,k
33
,k
34
},k
ij
(i=1,2,3,j=1,2,3,4)是設計的正常數,μ(t)是時變增益,其形式為:
[0085][0086]
其中μ0和a為正常數。
[0087]
定義估計誤差為和然後引用(4)和(5)得到:
[0088][0089][0090][0091]
為了便於分析,引入新的輔助變量βi(i=1,2,3),由下式給出
[0092][0093]
因為時變增益μ(t)是分段函數,所以討論分為兩種情況。首先,當成立,已知μ(t)=μ0。輔助變量βi(i=1,2,3)可以重寫為
[0094][0095]
結合(7)-(10)並取βi(i=1,2,3)對時間求導可得
[0096][0097][0098][0099]
通過定義可以得出
[0100][0101]
其中*表示零矩陣,r4×4,i4×4表示單位矩陣,bk=μ0(∑-i4×4),
[0102][0103]
選擇適當的參數k
ij
以確保ac是hurwitz矩陣。也即存在正定矩陣mc,使得
[0104][0105]
其中nc是正定矩陣。
[0106]
選擇lyapunov函數為
[0107][0108]
代入(15)並求v
β
的導數得
[0109][0110]
其中||mcb1||≤c1,||mcb2||≤c2,c1和c2為正常數,n
n1
=λ
min
(μ0n
c-2c1i
i-ii),ii∈r
12
×
12
是單位矩陣。
[0111]
另一種情況是成立,我們有μ(t)=(1+a)
at
。在這種情況下,考慮(7)-(10)並取βi(i=1,2,3)的時間導數
[0112][0113][0114][0115]
類似地,結合β的定義,可以給出
[0116][0117]
其中bh=μ(t)(σ-i4×4),
[0118]
現在,我們選擇相同的候選lyapunov函數(17),它的時間導數變為
[0119][0120]
其中||mcb3||≤c3,c3>0。
[0121]
這裡注意到μ(t)=(1+a)
at
是的指數函數。由於1+a>1始終成立,因此得出μ(t)是單調遞增函數的結論。顯然μ(t)的變化範圍為μ(t)∈(1,μm),其中
我們由此可以得到:
[0122][0123]
將(24)代入(23)可得
[0124][0125]
其中n
n2
=λ
min
(n
c-2c3i
i-ii)。
[0126]
綜合結論(18)和(25),得
[0127][0128]
其中n
nm
=max{n
n1
,n
n2
}。
[0129]
步驟(2).通過等效變換方法將無人直升機跟蹤優化控制問題轉換為優化鎮定問題
[0130]
考慮到(1),我們將跟蹤誤差定義為
[0131][0132][0133]
其中p
do
是期望的軌跡信號,q
do
是設計的虛擬控制器。
[0134]
對e1的時間求導
[0135][0136]
與傳統的反步法相比,本發明提出的虛擬控制律如下
[0137][0138]
其中q
dfo
是設計的前饋虛擬控制律,q
dbo
是待設計最優虛擬反饋控制器。顯然,如果我們讓q
dbo
=0,方程(30)將退化為標準的反步法控制結構。
[0139]
首先,將前饋虛擬控制器q
dfo
設計為
[0140][0141]
將(30)和(31)代入(29)得到
[0142][0143]
對e2的時間求導
[0144][0145]
然後,實際控制輸入uu表示為
[0146][0147]
其中u
un
是設計的前饋控制器,u
uo
是設計的最優反饋控制器。
[0148]
前饋控制器u
un
設計為
[0149][0150]
其中f
*
=f-f(q
do
)。
[0151]
利用(34)和(35),方程(33)可以改寫為
[0152][0153]
選擇候選lyapunov函數,如下所示:
[0154][0155]
考慮(26)、(32)和(36)並對vo進行微分
[0156][0157]
其中e
λ
=λ
max
(e1),),
[0158]
從(38)可以看出,如果設計的最優反饋控制器uo可以使以下的動態系統穩定
[0159][0160]
則可以確保(38)右側第一項的穩定性。同時如果(n
nm-e
λ
)>0成立,我們可以得出整個閉環系統最終一致有界的結論。這樣原始的最優跟蹤控制問題被轉化為系統(39)的最優穩定問題。也即,通過這種等效變換方法將無人直升機的最優跟蹤控制問題轉換為系統鎮定問題來處理。
[0161]
步驟(3).基於自適應動態規劃方法和單評價神經網絡技術設計的最優飛行控制器,包括虛擬前饋控制器和最優反饋控制器的設計,以保證無人直升機的性能滿足預設的能量指標函數。
[0162]
結合動態系統(39),選取代價函數:
[0163][0164]
其中和是選定的具有適當維數的正定矩陣。
[0165]
定義1:考慮具有代價函數(40)的非線性誤差系統(39)。如果控制律uo能夠同時保證誤差系統(39)穩定和代價函數(40)的有界性,則uo被稱為(39)中的容許控制輸入。同時所有的可容許的控制輸入構成了一個可容許的集合描述為
[0166]
針對代價函數(40),定義哈密爾頓方程為
[0167][0168]
其中
[0169]
根據最優解的存在條件最優控制輸入使代價函數(40)最小
[0170][0171]
其中j*(ξ)是當j
*
(0)=0時的最小代價函數。
[0172]
通過設並代入(42),我們得到以下hjb方程
[0173][0174]
其中
[0175]
由於hjb方程(43)是一個複雜的非線性偏微分方程,很難獲得解析解。因此將神經網絡技術與adp方法相結合來克服這一困難。此外,給出如下假設:
[0176]
假設3:對於誤差系統(39)和相應的最優控制器存在一個有界正定矩陣以及正函數使得
[0177][0178][0179]
其中和l(ξ)是選擇的lyapunov函數。
[0180]
基於引理1,採用nn技術來近似最優代價函數j
*
(ξ),可以描述為
[0181][0182]
其中sa∈r
l
是理想權值向量,ha(ξ)∈r
l
表示nn的激勵函數,是近似誤差。
[0183]
對(46)求關於ξ的偏導數
[0184][0185]
其中
[0186]
假設4:假設理想權值向量sa,激勵函數ha(ξ)和近似誤差在緊集λj上是範數有界的。同時假設ha(ξ)和的偏導數是範數有界的。也即存在正常數s
am1
,h
am1
,h
am2
和使得||sa||≤s
am1
,||ha(ξ)||≤h
am1
,和成立。
[0187]
調用(47),最優控制器(42)和相應的hjb方程(43)可以進一步改寫為
[0188][0189][0190]
其中
[0191]
考慮到以下實際情況:
[0192][0193]
其中根據假設3,注意到c
λ
是有界的。換句話說存在正的常數cm,使得||c
λ
||≤cm。
[0194]
進而hjb方程(49)變為
[0195][0196]
其中
[0197]
由於理想權值矩陣sa未知,因此採用nn的方法來估計最優代價函數j
*
(ξ):
[0198][0199]
其中和分別是j
*
(ξ)和sa的估計值。
[0200]
考慮(52),最優控制器(48)和hjb方程(51)的近似值可以表示為
[0201][0202][0203]
其中γe是殘餘誤差。
[0204]
顯然,如果神經網絡的權值矩陣能夠被充分訓練並以令人滿意的方式近似於理想權值矩陣sa,則可以得到最小化目標函數:
[0205][0206]
結合上述分析,設計的自適應更新定律為:
[0207]
[0208]
其中γs>0是設計的正常數,χ1和χ2是設計的具有適當維度的參數,υs=μs/κs。
[0209]
定義作為估計誤差。引用(56)得
[0210][0211]
考慮(51)和(54),我們得到
[0212][0213]
將(58)代入(57)得
[0214][0215]
通過定義方程(59)可以進一步表示為
[0216][0217]
其中
[0218]
這裡可以選擇合適的參數χ1和χ2,使得ma是正定矩陣。同時基於上述分析,可以得出ma和na的範數都是有界的。然後我們得到
[0219][0220]
其中ω1=λ
min
(ma),
[0221]
下面對上述實施例的穩定性進行驗證
[0222]
上述控制器設計過程可以歸納為如下定理1的形式:
[0223]
定理1:考慮包含擾動的無人直升機非線性動力學(1)滿足假設1-3,設計時變增益擴張狀態觀測器為(5),神經網絡的權重更新律設計為(56)。採用包含前饋控制器(35)和最優反饋控制器(53)的控制輸入(34),閉環系統的所有誤差信號最終都是一致有界的,並且代價函數(40)最小。
[0224]
證明:選取lyapunov函數為
[0225][0226]
其中l(ξ)的定義已在假設3中給出。本發明中,選擇為
[0227]
調用(38)和(61),並取v
γ
的時間導數,我們得到
[0228][0229]
結合(48)和(53)得到
[0230][0231]
考慮假設3-4並將(64)代入(63),得到
[0232][0233]
其中和
[0234]
在此如果可以選擇相應的參數,使得n
nm-e
λ
>0,且
[0235][0236]
則可以得到表示閉環系統的所有誤差信號都是有界的。證明完成。
[0237]
以上應用了具體個例對本發明進行闡述,只是用於幫助理解本發明,並不用以限制本發明。任何熟悉該技術的人在本發明所揭露的技術範圍內的局部修改或替換,都應涵蓋在本發明的包含範圍之內。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀