一種基於滑模控制和神經網絡的衛星機動自主定軌方法與流程
2023-09-27 06:48:25 2
技術領域:
:本發明涉及一種基於滑模控制和神經網絡的衛星機動自主定軌方法,屬於航天衛星導航系統領域。
背景技術:
::滑模控制與自適應、模糊和神經網絡等智能算法控制的結合,可以提高整個系統的性能。滑模變結構已經用於解決更加複雜的問題,如解決運動跟蹤、模型跟蹤、不確定系統控制等一系列問題,並和lyapunov穩定性理論、超穩定性理論、模型參考自適應理論相結合。神經自適應控制的一個發展是從採取bp網絡發展到採用其他類型的神經網絡。如採用rbf網絡的自適應控制,採用遞歸神經網絡的自適應控制和採用模糊神經網絡的自適應控制。作為地—月系重要的動力學平衡點—拉格朗日點,在其附近布置導航衛星,構建導航星座,對我國深空探測的發展具有重要的戰略意義,並有其獨有的優越性。用來描述拉格朗日點衛星運動的動力學模型均採用圓型限制性三體問題模型,儘管採用這種近似模型有利於拉格朗日點周期軌道的求解,但用圓型限制性三體問題模型求解的周期軌道對初值誤差和空間攝動非常敏感,若要將衛星保持在周期軌道上需要高頻或連續的軌道控制。高頻或連續的軌道機動控制必然會對拉格朗日導航衛星的定軌精度產生影響,如何實現拉格朗日導航衛星軌道機動期間的高精度軌道確定是關係到拉格朗日衛星導航系統的高精度、連續性等導航定位服務性能提升的核心技術問題。本發明將利用神經網絡技術實現拉格朗日導航衛星的機動軌道確定,拉格朗日導航衛星的控制利用滑模控制方法實現。技術實現要素::本發明針對上述軌道機動控制的不足,設計了一種基於滑模控制和神經網絡的衛星機動自主定軌方法。本發明所採用的技術方案有:一種基於滑模控制和神經網絡的衛星機動自主定軌方法,包括:(1)滑模保持控制算法滑模控制器可以分為兩個方面:離散時間滑模面設計和自適應滑模控制器設計;①離散時間滑模面設計其中x=[rt,vt]t,和分別為位置偏差和速度偏差,為a的分塊;令滑模面為s(k)=cx(k)=c1r(k)+c2v(k)其中c=[c1,c2],當系統狀態到達滑模面時,有c1r(k)+c2v(k)=0通過設置c1和c2的值構造離散時間滑模面;②自適應滑模控制器設計對某一時刻tk+1,有s(k+1)=cx(k+1)進一步可得s(k+1)=cax(k)+cbδv(k)δv(k)=-(cb)-1{cax(k)-(i3-tk)s(k)+tdsgn[(s(k)]}其中為採樣時間,為符號函數,d和k中的參數取值為(2)神經網絡自適應觀測器考慮如下非線性時變系統:其中,u∈ei,y∈rm,x∈rn;f(·)為已知的非線性函數;g(·)為已知的非線性觀測函數;β(k)表示系統隨時間變化的參數,它是一個隨時間慢變的非線性函數;從非線性時變系統的輸入uk及輸出yk估計系統的狀態,用bp網絡動態系統構成狀態觀測器,系統的輸出作為估計器的輸入,動態方程如下:其中zk∈rn為bp網絡動態系統的狀態,θ為bp網權值和閾值向量。本發明具有如下有益效果:(1).本發明結合滑模控制和神經網絡觀測器,用滑模控制的控制量δv(k)結合對衛星距離的觀測量來準確輸出衛星的位置信息,實現更精確地定軌。(2).滑模控制設計的是控制率。傳統的控制,都是設定控制狀態為零,實現狀態的跟蹤。但是滑模控制不是將控制誤差為零作為控制目標,而是要把誤差控制到一個滑模面上。然後設計滑模面使得一旦狀態到達滑模面,就會自動收斂到零,精確度更高。(3).滑模控制沒有較大的位置偏差,具有較強的魯棒性。halo軌道滑模保持控制的monte-carlo仿真結果(10年)統計量δv(m/s)tmax(day)nδvpm(km)最大值19.03516.060630.998均值16.9179.760418.883最小值14.9388.060012.522標準值0.7661.71.23.089δv(m/s)為衛星的10年總能量消耗,tmax(day)為相繼兩次衝量的最長時間間隔,nδv為10年的控制總次數,pm(km)為10年的最大位置偏差。(註:halo軌道是一類圍繞日-地系統平動點的周期性振動軌道)根據上面表格,在多種誤差影響下,滑模控制仍能實現各軌道的長期保持,但與標準軌道仿真結果相比,10年總能量消耗和位置偏差都增加了一個量級。滑模控制的各halo軌道年均消耗為1.2m/s,halo軌道的位置偏差pm在15.8-18.9km附近,,這正說明了滑模控制具有較強的魯棒性。(4).神經網絡算法滿足實時性,具有良好的跟蹤性能。一定程度上克服了傳統代數方法設計觀測器時增益過大、重複計算以及不能滿足適時性。(5).圓型限制性三體問題模型求解的周期軌道對初值誤差和空間攝動非常敏感,若要將衛星保持在周期軌道上需要高頻或連續的軌道控制,高頻或連續的軌道機動控制必然會對拉格朗日導航衛星的定軌精度產生影響。滑模控制和神經網絡緊密結合,可以實時地實施機動控制並顯示衛星的狀態量,更好地實現朗格朗日衛星的定軌。具體實施方式:本發明基於滑模控制和神經網絡的衛星機動自主定軌方法包括:(1)滑模參數的設定c1r(k)+c2v(k)=0定義一個指標其中q=qt為加權陣,且引入一個變量v(k)=q22-1q21r(k)+v(k)代入到上式得如下式子:其中v(k)是名義上的控制量,且有上述方程的解為其中p為下列矩陣方程的隱式解結合上述兩個方程,最後解出(2)自適應滑模控制器設計最為關鍵的速度控制量的表達式如下:δv(k)=-(cb)-1{cax(k)-(i3-tk)s(k)+tdsgn[(s(k)]}首先我們得確定一些滑模控制器的參數q11=diag[2,2,2],q12=diag[1,1,1]q21=diag[1,1,1],q22=diag[4,4,4]k=diag[5x10-3,5x10-3,5x10-3]然後進行monte-carlo仿真,現引入軌道誤差捕獲誤差、導航誤差和執行誤差,考慮三種誤差分布情況:(i)較小的位置導航誤差和較小的速度導航誤差;(ii)較小的位置導航誤差和較大的速度導航誤差;(iii)較大的位置導航誤差和較大的速度導航誤差;仿真的結果如下表所示:誤差δv(m/s)tmax(day)nδvpm(km)i16.9179.760418.883ii148.0398.9605167.074iii160.3009.0604191.429(3)神經網絡觀測器的搭建本發明一個優點就是只需要觀測衛星與朗格朗日衛星之間的距離的量測量,一定程度上避免了量測量複雜導致神經網絡訓練過度麻煩的情況。下面將進一步說明如何來確定權值矩陣的值:為了正確估計系統的狀態,bp網絡的權,閾值通過極小化代價函數ek來進行調整,式中bp網絡採用誤差反向傳播的算法來修正權值和閾值,修正量表示為δθ=-ηkgradek,其中,ηk為學習因子,gradek為ek的梯度。通過修正量經過一段時間的訓練學習,會找到最佳的權值矩陣。以上面測出的控制量和與衛星的距離的量測量為神經網絡的輸入,衛星的實時狀態作為輸出,利用標稱軌道的數據進行神經網絡的訓練,選擇最為合適的權值矩陣的值,來最好地實現神經網絡的觀測效果,實時輸出衛星的狀態,並以此狀態作為下一個時間滑模控制的輸入,循環控制,從而實現衛星的精確定軌。以上所述僅是本發明的優選實施方式,應當指出,對於本
技術領域:
的普通技術人員來說,在不脫離本發明原理的前提下還可以作出若干改進,這些改進也應視為本發明的保護範圍。當前第1頁12