新四季網

一種基於神經網絡的深空探測器自主任務規劃方法

2023-05-07 09:02:16 2

一種基於神經網絡的深空探測器自主任務規劃方法
【專利摘要】本發明涉及一種基於神經網絡的深空探測器自主任務規劃方法,屬於深空探測【技術領域】。本發明方法通過建立深空探測器系統模型,定義深空探測器系統自主任務規劃問題,確定自主任務規劃系統的輸入輸出,建立神經網絡模型,利用深空探測器仿真系統產生的仿真數據對神經網絡進行訓練,訓練後的神經網絡能夠在給定一組輸入後,得到理想的輸出。本發明能在多個子系統需要協調的情況下、滿足探測器實時性要求;能夠快速得到規劃解,彌補採用地面站控制的通訊延遲的缺點,有助於大大提高深空探測器自主任務規劃的效率,滿足探測器實時性要求,規劃時間短、效率高,更加適合實時性要求高的深空探測器。
【專利說明】-種基於神經網絡的深空探測器自主任務規劃方法

【技術領域】
[0001] 本發明設及一種基於神經網絡的深空探測器自主任務規劃方法,屬於深空探測技 術領域。

【背景技術】
[0002] 在深空環境下,深空探測器根據空間環境的感知和認識及深空探測器本身的能力 和狀態,利用計算機軟體技術、人工智慧技術等,依據一段時間內的任務目標,對若干可供 選擇的動作及所提供的資源約束施行推理,自動地生成一組時間有序動作序列,稱一個"規 劃"(plan),該規劃一旦執行,便可W將探測器的狀態成功轉移到期望的目標狀態。
[0003] 對於自主任務規劃問題,能夠在動態變化環境下快速規劃是智能行為的一大能 力。並且深空探測器與目標距離遠、飛行時間長、所處環境動態多變,傳統地面站-太空飛行器 該樣的控制方法已經無法滿足操作費用、實時性、通訊網絡等各項要求。為達到較高的實時 性要求,當前使用的方法是基於啟發式的規劃方法,將規劃問題看作捜索問題,利用啟發式 函數引導捜索,從而實現快速規劃的目的。目前,已有相關規劃技術應用到了探索太空的項 目中,如深空一號中自治遠程代理系統、哈勃天文望遠鏡長期任務調度軟體SPIKE等。隨著 任務量的增加,利用啟發式的任務規劃方法顯得有所欠缺,比如在編碼之前需要清楚知道 系統及環境特點,採用合適的算法W及啟發式函數,但是合適的啟發式函數並不容易找到。 此外隨著任務複雜度的增加,捜索空間增大,規劃速度減慢等。
[0004] 神經網絡作為除符號式人工智慧之外另一條實現人工智慧的主要途徑,因具有計 算並行性、學習能力強、解決複雜問題的特點受到各個領域的歡迎。目前神經網絡在規劃 領域主要應用於機器人的路徑規劃。例如,Baomin化ng提出了神經網絡模型用於空間機 器人的魯椿控制,而提出的ANN利用RBF處理各種不確定性。化usse巧assil利用多層感 知器進行探測器的路徑規劃,對探測器進行導航,從而避開路面的障礙順利達到目標。Roy Glasius等人曾利用化pfield神經網絡在靜態和動態環境中為機器人選出一條合適的路 徑,使機器計算能力加快。


【發明內容】

[0005] 本發明針對深空探測器自主任務規劃問題,為克服現有的基於啟發式的規劃方 法中設計啟發式困難、捜索空間大、規劃速度減慢等缺點,提出一種基於神經網絡的深空探 測器自主任務規劃方法,能在多個子系統需要協調的情況下、滿足探測器實時性要求。
[0006] 本發明通過設計神經網絡模型實現,具體實現步驟如下:
[0007] 步驟1,建立深空探測器系統模型。
[000引深空探測器系統SYS具有m個子系統:
[0009] SYS = {sys。sys2, . . . , sys。. . .,sySiJ, (1《i《m)
[0010] 其中sySi表示第i個子系統。
[0011] 深空探測器系統活動狀態指m個子系統可能處於的狀態集合,設第i個子系統的 狀態集合為S =W,s;,...,",s;,如...X表示第i個子系統的n-1個可能的狀態,則整個探測器 系統的狀態集合為S =怯。S2,. . .,S。. . .,S。}。
[0012] 對於給定的一個任務Gk,與之對應的目標狀態為gk,即在完成任務Gk後探測器處 於的狀態,且其中gkE S。
[0013] 為了完成任務,達到目標狀態,各個子系統需要採取相應的動作,那麼第i個子系 統能供選擇的動作集合為4 = ,其中X為該子系統總共能夠執行的動作數,每個 子系統X的值不同;。(表示第i個子系統可執行的第1個任務,a;表示第i個子系統可執行 的第2個任務,<表示第i個子系統可執行的第X個任務。那麼整個探測器動作集合為A (Ai, A2,. . . , Ai,. . . , Ami。
[0014] 給定任務目標Gk後,深空探測器系統將當前所處狀態作為初始狀態s。(當前所處 狀態為S中的一個元素)。在自主規划過程中,每個子系統在一時間點上只執行一個動作, 各個子系統間動作具有並行性,且有充足的時間執行完本子系統動作。
[0015] 步驟2,根據步驟1中建立的深空探測器系統模型,定義深空探測器系統自主任務 規劃問題,確定自主任務規劃系統的輸入輸出。
[0016] 在對規劃問題進行描述時,需要包括深空探測器的狀態、可W執行的動作、狀態之 間的轉換關係、需要完成的任務。採用經典規劃理論對深空探測器自主任務規劃問題進行 定義。自主任務規劃系統的輸入是:初始狀態、任務目標、領域知識。輸出是;一個最佳規劃 解,即開始於初始狀態、滿足於星上的各種約束條件並能在成功執行後將深空探測器狀態 轉移到目標狀態的一個動作序列。
[0017] 將深空探測器上狀態轉移問題2用一個S元組進行表示:
[001 引 Z = ^A,Y)
[0019] 其中,S表示整個探測器系統的狀態集合,A表示探測器動作集合,丫為狀態轉移 函數,用於描述狀態之間的轉換關係。
[0020] 那麼,深空探測器上的自主任務規劃問題用一個S元組表示:
[0021] P=(2,s〇,gk)
[0022] 深空探測器上任務規劃問題P的解是由多個深空探測器可執行的活動組成的規 劃序列,表示為
[002引 n =
[0024] 31 j.為探測器系統執行的第j個動作序列,h指探測器系統一共需要執行h個動作 序列;且氣"7 >,其中。;e人表示第i個子系統在第j個動作序列應該執行 的活動。狀態轉移函數如下式所示:
[0025]

【權利要求】
1. 一種基於神經網絡的深空探測器自主任務規劃方法,其特徵在於:具體包括如下步 驟: 步驟1,建立深空探測器系統模型; 深空探測器系統SYS具有m個子系統: SYS=Isys1,sys2, . . . ,Sysi, . . . ,sysj,I^i^m其中Sysi表示第i個子系統; 深空探測器系統活動狀態指m個子系統可能處於的狀態集合,設第i個子系統的狀態 集合為&=?;,...X}X表示第i個子系統的n-1個可能的狀態,則整個探測器系統 的狀態集合為S= (S1,S2,…,Si,…,SJ; 對於給定的一個任務Gk,與之對應的目標狀態為gk,即在完成任務Gk後探測器處於的 狀態,且其中gkGS; 第i個子系統能供選擇的動作集合為4 =〖?,…X】,其中X為該子系統總共能夠執行 的動作數,每個子系統X的值不同;a;表示第i個子系統可執行的第1個任務,<表示第i 個子系統可執行的第2個任務,<表示第i個子系統可執行的第X個任務;那麼整個探測器 動作集合為A=U1,A2,…,Ai,…,AJ; 給定任務目標Gk後,深空探測器系統將當前所處狀態作為初始狀態sM在自主規划過 程中,每個子系統在一時間點上只執行一個動作,各個子系統間動作具有並行性,且有充足 的時間執行完本子系統動作; 步驟2,根據步驟1中建立的深空探測器系統模型,定義深空探測器系統自主任務規劃 問題,確定自主任務規劃系統的輸入輸出; 將深空探測器上狀態轉移問題2用一個三元組進行表示: 2 = (S,A,y) 其中,y為狀態轉移函數; 深空探測器上的自主任務規劃問題用一個三元組表示: P= (2 ,s〇,gk) 深空探測器上任務規劃問題P的解是由多個深空探測器可執行的活動組成的規劃序 列,表示為 n--〈2,? --冗j,? --冗h〉 」為探測器系統執行的第j個動作序列,h指探測器系統一共需要執行h個動作序列; 且?=<?),《),--<_,其中e'表示第i個子系統在第j個動作序列應該執行的活動; 狀態轉移函數如下式所示:
當規劃序列的解為空時,狀態不轉移,仍為Stl;當規劃序列的解非空,且第一個動作JT:對當前狀態Stl可執行,則相繼執行動作序列,直到最後的狀態; 步驟3,建立神經網絡模型,利用深空探測器仿真系統產生的仿真數據對神經網絡進行 訓練,訓練後的神經網絡能夠在給定一組輸入後,得到理想的輸出;步驟2中定義的任務規 劃問題P和動作序列、分別為神經網絡的輸入和輸出; 步驟4,步驟3中建立的神經網絡模型加入自主任務規劃系統,用於動作選取;將深空 探測器當前狀態Smw和任務目標Gk作為神經網絡的輸入,經神經網絡的選擇,輸出下一步要 執行的動作; 進行第一次動作選取時,輸入為深空探測器當前狀態Smw=s^ 步驟5,對步驟4中神經網絡選取的動作進行可執行判斷,判斷條件為選取的動作是否 與上一步選取的動作相同,若相同則不可執行;若可執行,則直接得到下一步的狀態,若不 能執行,則要經過恢復原始狀態的處理後得到新的動作,然後重新輸入神經網絡得到下一 個新狀態; 步驟6,對得到的新狀態進行判斷,是否達到了目標狀態,若達到,則可直接輸出動作序 列,若沒有達到,則將新狀態作為神經網絡輸入,重複步驟4-6,直至找到合適的動作序列為 止。
2.根據權利要求1所述的一種基於神經網絡的深空探測器自主任務規劃方法,其特徵 在於:所述神經網絡採用三層感知器模型,並利用學習率可變的動量誤差反向傳播算法進 行訓練;神經網絡的輸入為當前需要解決的規劃問題Pntw= [SnOT,Gk],其中Smw表示當前探 測器各個子系統的狀態集合,且表示第i個子系統當前所處 的狀態; 神經網絡在任務規劃系統中主要根據探測器當前狀態選取深空探測器下一步可執行 的動作,因此神經網絡的輸出層輸出為每個系統需執行的動作集合 Output=Tt) = [O1j,a),…,a'),…,a";' 組織具有代表性的數據進行神經網絡訓練,訓練數據由深空探測仿真得到;當神經網 絡經過訓練達到誤差限定時,再用於自主任務規劃系統。
【文檔編號】G06Q10/06GK104504520SQ201410812327
【公開日】2015年4月8日 申請日期:2014年12月23日 優先權日:2014年12月23日
【發明者】徐瑞, 李朝玉, 崔平遠, 朱聖英, 尚海濱 申請人:北京理工大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀