一種基於神經網絡的深空探測器自主任務規劃方法
2023-05-07 09:02:16 2
一種基於神經網絡的深空探測器自主任務規劃方法
【專利摘要】本發明涉及一種基於神經網絡的深空探測器自主任務規劃方法,屬於深空探測【技術領域】。本發明方法通過建立深空探測器系統模型,定義深空探測器系統自主任務規劃問題,確定自主任務規劃系統的輸入輸出,建立神經網絡模型,利用深空探測器仿真系統產生的仿真數據對神經網絡進行訓練,訓練後的神經網絡能夠在給定一組輸入後,得到理想的輸出。本發明能在多個子系統需要協調的情況下、滿足探測器實時性要求;能夠快速得到規劃解,彌補採用地面站控制的通訊延遲的缺點,有助於大大提高深空探測器自主任務規劃的效率,滿足探測器實時性要求,規劃時間短、效率高,更加適合實時性要求高的深空探測器。
【專利說明】-種基於神經網絡的深空探測器自主任務規劃方法
【技術領域】
[0001] 本發明設及一種基於神經網絡的深空探測器自主任務規劃方法,屬於深空探測技 術領域。
【背景技術】
[0002] 在深空環境下,深空探測器根據空間環境的感知和認識及深空探測器本身的能力 和狀態,利用計算機軟體技術、人工智慧技術等,依據一段時間內的任務目標,對若干可供 選擇的動作及所提供的資源約束施行推理,自動地生成一組時間有序動作序列,稱一個"規 劃"(plan),該規劃一旦執行,便可W將探測器的狀態成功轉移到期望的目標狀態。
[0003] 對於自主任務規劃問題,能夠在動態變化環境下快速規劃是智能行為的一大能 力。並且深空探測器與目標距離遠、飛行時間長、所處環境動態多變,傳統地面站-太空飛行器 該樣的控制方法已經無法滿足操作費用、實時性、通訊網絡等各項要求。為達到較高的實時 性要求,當前使用的方法是基於啟發式的規劃方法,將規劃問題看作捜索問題,利用啟發式 函數引導捜索,從而實現快速規劃的目的。目前,已有相關規劃技術應用到了探索太空的項 目中,如深空一號中自治遠程代理系統、哈勃天文望遠鏡長期任務調度軟體SPIKE等。隨著 任務量的增加,利用啟發式的任務規劃方法顯得有所欠缺,比如在編碼之前需要清楚知道 系統及環境特點,採用合適的算法W及啟發式函數,但是合適的啟發式函數並不容易找到。 此外隨著任務複雜度的增加,捜索空間增大,規劃速度減慢等。
[0004] 神經網絡作為除符號式人工智慧之外另一條實現人工智慧的主要途徑,因具有計 算並行性、學習能力強、解決複雜問題的特點受到各個領域的歡迎。目前神經網絡在規劃 領域主要應用於機器人的路徑規劃。例如,Baomin化ng提出了神經網絡模型用於空間機 器人的魯椿控制,而提出的ANN利用RBF處理各種不確定性。化usse巧assil利用多層感 知器進行探測器的路徑規劃,對探測器進行導航,從而避開路面的障礙順利達到目標。Roy Glasius等人曾利用化pfield神經網絡在靜態和動態環境中為機器人選出一條合適的路 徑,使機器計算能力加快。
【發明內容】
[0005] 本發明針對深空探測器自主任務規劃問題,為克服現有的基於啟發式的規劃方 法中設計啟發式困難、捜索空間大、規劃速度減慢等缺點,提出一種基於神經網絡的深空探 測器自主任務規劃方法,能在多個子系統需要協調的情況下、滿足探測器實時性要求。
[0006] 本發明通過設計神經網絡模型實現,具體實現步驟如下:
[0007] 步驟1,建立深空探測器系統模型。
[000引深空探測器系統SYS具有m個子系統:
[0009] SYS = {sys。sys2, . . . , sys。. . .,sySiJ, (1《i《m)
[0010] 其中sySi表示第i個子系統。
[0011] 深空探測器系統活動狀態指m個子系統可能處於的狀態集合,設第i個子系統的 狀態集合為S =W,s;,...,",s;,如...X表示第i個子系統的n-1個可能的狀態,則整個探測器 系統的狀態集合為S =怯。S2,. . .,S。. . .,S。}。
[0012] 對於給定的一個任務Gk,與之對應的目標狀態為gk,即在完成任務Gk後探測器處 於的狀態,且其中gkE S。
[0013] 為了完成任務,達到目標狀態,各個子系統需要採取相應的動作,那麼第i個子系 統能供選擇的動作集合為4 = ,其中X為該子系統總共能夠執行的動作數,每個 子系統X的值不同;。(表示第i個子系統可執行的第1個任務,a;表示第i個子系統可執行 的第2個任務,<表示第i個子系統可執行的第X個任務。那麼整個探測器動作集合為A (Ai, A2,. . . , Ai,. . . , Ami。
[0014] 給定任務目標Gk後,深空探測器系統將當前所處狀態作為初始狀態s。(當前所處 狀態為S中的一個元素)。在自主規划過程中,每個子系統在一時間點上只執行一個動作, 各個子系統間動作具有並行性,且有充足的時間執行完本子系統動作。
[0015] 步驟2,根據步驟1中建立的深空探測器系統模型,定義深空探測器系統自主任務 規劃問題,確定自主任務規劃系統的輸入輸出。
[0016] 在對規劃問題進行描述時,需要包括深空探測器的狀態、可W執行的動作、狀態之 間的轉換關係、需要完成的任務。採用經典規劃理論對深空探測器自主任務規劃問題進行 定義。自主任務規劃系統的輸入是:初始狀態、任務目標、領域知識。輸出是;一個最佳規劃 解,即開始於初始狀態、滿足於星上的各種約束條件並能在成功執行後將深空探測器狀態 轉移到目標狀態的一個動作序列。
[0017] 將深空探測器上狀態轉移問題2用一個S元組進行表示:
[001 引 Z = ^A,Y)
[0019] 其中,S表示整個探測器系統的狀態集合,A表示探測器動作集合,丫為狀態轉移 函數,用於描述狀態之間的轉換關係。
[0020] 那麼,深空探測器上的自主任務規劃問題用一個S元組表示:
[0021] P=(2,s〇,gk)
[0022] 深空探測器上任務規劃問題P的解是由多個深空探測器可執行的活動組成的規 劃序列,表示為
[002引 n =
[0024] 31 j.為探測器系統執行的第j個動作序列,h指探測器系統一共需要執行h個動作 序列;且氣"7 >,其中。;e人表示第i個子系統在第j個動作序列應該執行 的活動。狀態轉移函數如下式所示:
[0025]
【權利要求】
1. 一種基於神經網絡的深空探測器自主任務規劃方法,其特徵在於:具體包括如下步 驟: 步驟1,建立深空探測器系統模型; 深空探測器系統SYS具有m個子系統: SYS=Isys1,sys2, . . . ,Sysi, . . . ,sysj,I^i^m其中Sysi表示第i個子系統; 深空探測器系統活動狀態指m個子系統可能處於的狀態集合,設第i個子系統的狀態 集合為&=?;,...X}X表示第i個子系統的n-1個可能的狀態,則整個探測器系統 的狀態集合為S= (S1,S2,…,Si,…,SJ; 對於給定的一個任務Gk,與之對應的目標狀態為gk,即在完成任務Gk後探測器處於的 狀態,且其中gkGS; 第i個子系統能供選擇的動作集合為4 =〖?,…X】,其中X為該子系統總共能夠執行 的動作數,每個子系統X的值不同;a;表示第i個子系統可執行的第1個任務,<表示第i 個子系統可執行的第2個任務,<表示第i個子系統可執行的第X個任務;那麼整個探測器 動作集合為A=U1,A2,…,Ai,…,AJ; 給定任務目標Gk後,深空探測器系統將當前所處狀態作為初始狀態sM在自主規划過 程中,每個子系統在一時間點上只執行一個動作,各個子系統間動作具有並行性,且有充足 的時間執行完本子系統動作; 步驟2,根據步驟1中建立的深空探測器系統模型,定義深空探測器系統自主任務規劃 問題,確定自主任務規劃系統的輸入輸出; 將深空探測器上狀態轉移問題2用一個三元組進行表示: 2 = (S,A,y) 其中,y為狀態轉移函數; 深空探測器上的自主任務規劃問題用一個三元組表示: P= (2 ,s〇,gk) 深空探測器上任務規劃問題P的解是由多個深空探測器可執行的活動組成的規劃序 列,表示為 n--〈2,? --冗j,? --冗h〉 」為探測器系統執行的第j個動作序列,h指探測器系統一共需要執行h個動作序列; 且?=<?),《),--<_,其中e'表示第i個子系統在第j個動作序列應該執行的活動; 狀態轉移函數如下式所示:
當規劃序列的解為空時,狀態不轉移,仍為Stl;當規劃序列的解非空,且第一個動作JT:對當前狀態Stl可執行,則相繼執行動作序列,直到最後的狀態; 步驟3,建立神經網絡模型,利用深空探測器仿真系統產生的仿真數據對神經網絡進行 訓練,訓練後的神經網絡能夠在給定一組輸入後,得到理想的輸出;步驟2中定義的任務規 劃問題P和動作序列、分別為神經網絡的輸入和輸出; 步驟4,步驟3中建立的神經網絡模型加入自主任務規劃系統,用於動作選取;將深空 探測器當前狀態Smw和任務目標Gk作為神經網絡的輸入,經神經網絡的選擇,輸出下一步要 執行的動作; 進行第一次動作選取時,輸入為深空探測器當前狀態Smw=s^ 步驟5,對步驟4中神經網絡選取的動作進行可執行判斷,判斷條件為選取的動作是否 與上一步選取的動作相同,若相同則不可執行;若可執行,則直接得到下一步的狀態,若不 能執行,則要經過恢復原始狀態的處理後得到新的動作,然後重新輸入神經網絡得到下一 個新狀態; 步驟6,對得到的新狀態進行判斷,是否達到了目標狀態,若達到,則可直接輸出動作序 列,若沒有達到,則將新狀態作為神經網絡輸入,重複步驟4-6,直至找到合適的動作序列為 止。
2.根據權利要求1所述的一種基於神經網絡的深空探測器自主任務規劃方法,其特徵 在於:所述神經網絡採用三層感知器模型,並利用學習率可變的動量誤差反向傳播算法進 行訓練;神經網絡的輸入為當前需要解決的規劃問題Pntw= [SnOT,Gk],其中Smw表示當前探 測器各個子系統的狀態集合,且表示第i個子系統當前所處 的狀態; 神經網絡在任務規劃系統中主要根據探測器當前狀態選取深空探測器下一步可執行 的動作,因此神經網絡的輸出層輸出為每個系統需執行的動作集合 Output=Tt) = [O1j,a),…,a'),…,a";' 組織具有代表性的數據進行神經網絡訓練,訓練數據由深空探測仿真得到;當神經網 絡經過訓練達到誤差限定時,再用於自主任務規劃系統。
【文檔編號】G06Q10/06GK104504520SQ201410812327
【公開日】2015年4月8日 申請日期:2014年12月23日 優先權日:2014年12月23日
【發明者】徐瑞, 李朝玉, 崔平遠, 朱聖英, 尚海濱 申請人:北京理工大學