一種室內移動機器人增強地圖學習路徑規劃方法
2023-06-05 02:51:01
一種室內移動機器人增強地圖學習路徑規劃方法
【專利摘要】本發明公開了一種室內移動機器人增強地圖學習路徑規劃方法,其步驟為:(1)獲取周圍環境信息,建立障礙概率密度模型;(2)利用貪心算法和增強地圖學習方法進行路徑規劃;(3)室內移動機器人路徑選擇及自適應速度調整策略。採用的增強地圖學習路徑規劃能夠根據室內移動機器人的當前狀況和機器人固有的非完整約束,實時規劃當前最佳路徑,同時自適應的速度調整策略可以兼顧室內移動機器人的越障能力,目標點收斂能力和規劃效率,使室內移動機器人能夠安全有效的到達指定位置。
【專利說明】一種室內移動機器人增強地圖學習路徑規劃方法
【技術領域】
[0001] 本發明涉及地面輪式機器人的自主導航領域,特別涉及一種室內移動機器人增強 地圖學習路徑規劃方法。
【背景技術】
[0002] 隨著機器人技術的發展和人工智慧研究的不斷深入,智慧機器人在人類生活中扮 演越來越重要的角色。作為常見生活機器人的一種,室內移動機器人作為服務人員的代替 者多用於室內移動展會,家庭服務,酒店大廳引導等複雜動態環境。在這類環境中,環境信 息非結構化,靜態動態障礙物交錯存在,環境信息變化明顯,這些因素對室內移動機器人的 工作能力提出了極大的挑戰和要求。為較好地完成服務任務,室內移動機器人需要具有探 測障礙物,區分識別障礙物,實時規劃可行路徑,穩定控制行動的能力。隨著傳感器技術、計 算機技術和網絡通信技術的不斷發展,實時路徑規劃作為智慧機器人的大腦成為室內移動 機器人研究的重中之重。
[0003] 室內移動機器人在環境中的任務可以理解為從哪兒來?到哪兒去?怎麼去?去 做什麼?而路徑規劃能夠統籌傳感器獲得的環境信息做出最符合機器人當前狀況的路徑 決策,即怎麼去。常規的路徑規劃可以分別靜態規劃和動態規劃,靜態規劃是指機器人已具 備全局環境信息,機器人通過離線計算得到全局環境下最優的規劃路徑,而動態路徑規劃 多針對動態未知環境中的路徑選擇,機器人對環境信息理解有限且環境可能發生改變,與 真實情況具有高度的相似性。對於室內移動機器人,我們期望其能夠實現在室內移動動態 環境中的實時最佳路徑選擇和動態障礙物躲避。
[0004] 作為控制和規劃的對象,室內移動機器人是一類具有時變、強耦合和非完整性的 多輸入多輸出非線性系統。由於環境多變複雜且需要考慮較多因素,其規劃決策變的十分 複雜。在現有的技術中,常規的路徑規劃,如模糊規劃,遺傳算法,蟻群算法,神經網絡等,往 往不能同時滿足動態環境和實時性的要求。另外,輪式移動機器人存在的非完整性也制約 著室內移動機器人的路徑選擇。因此,研究具有學習能力的路徑規划算法成為現階段實時 動態路徑規劃研究的一個主流趨勢。而設計一種簡單可靠、實時性好、便於實現、能夠應付 多類動態未知環境的室內移動機器人規劃方法是保證服務工作正常有效進行的關鍵技術 和現實難題。
【發明內容】
[0005] 本發明針對上述現有技術中現在路徑規劃方法中難以同時滿足動態未知環境規 劃和實時規劃的要求,採用增強地圖學習的路徑規劃方法,隨著室內移動機器人的移動,不 斷加深理解新獲得的周圍環境信息,迭代計算隨機選取路徑的代價函數,學習計算得出當 前時刻最優的路徑,保證了室內移動機器人的靜態障礙下的良好避障性能,而且滿足了動 態障礙出現時的實時規劃功能,達到具有較高智能化的室內移動機器人的自主導航和路徑 規劃方法。
[0006] -種室內移動機器人增強地圖學習路徑規劃方法,包括以下幾個步驟:
[0007] 步驟1 :建立已探測區域受障礙物影響的概率模型;
[0008] 首先,通過室內移動機器人自身攜帶的聲吶傳感器,獲得室內移動機器人的周圍 環境信息;其次,將室內移動機器人所經過的區域作為已探測區域,依據所述的周圍環境信 息建立已探測區域受障礙物影響的概率模型,並依據聲吶傳感器實時採集的周圍環境信息 實時更新已探測區域受障礙物影響的概率模型;
[0009] 所述已探測區域受障礙物影響的概率模型如下:
[0010]
【權利要求】
1. 一種室內移動機器人增強地圖學習路徑規劃方法,其特徵在於,包括以下幾個步 驟: 步驟1 :建立已探測區域受障礙物影響的概率模型; 首先,通過室內移動機器人自身攜帶的聲吶傳感器,獲得室內移動機器人的周圍環境 信息;其次,將室內移動機器人所經過的區域作為已探測區域,依據所述的周圍環境信息建 立已探測區域受障礙物影響的概率模型,並依據聲吶傳感器實時採集的周圍環境信息實時 更新已探測區域受障礙物影響的概率模型; 所述已探測區域受障礙物影響的概率模型如下:
其中,室內移動機器人工作空間信息集合為3,所述空間信息包括所有目標位置及所 有障礙物位置;當前探測範圍內工作空間信息集合為3_.,已探測出的工作空間信息集合 為 J ^now - ^detected - ^ f {(X,Y)}為已探測區域K k 3de_/丨;在3的地圖上探測 到有M個障礙物,fi(X,Y)為第i個障礙物的對室內移動機器人路徑選擇的影響函數,採用 正態分布表示如下: 1 (-τ-] f;{XJ)=n^e -σ ^2πσ? 其中,〇 i為第i個障礙物的影響範圍係數,取值範圍為[〇, 1] ;Di為第i個障礙物到已 探測區域內所有位置的距離矩陣,矩陣大小與地圖大小一致為N*N ; 步驟2 :基於貪心算法和增強學習迭代策略,在設定的最大迭代次數kmax內,迭代更新 當前位置Pn(W(t)與目標位置PgMl之間的路徑代價函數,以達到收斂的路徑代價函數對應的 路徑作為當前時刻的最佳路徑,具體過程如下: 步驟2. 1 :令k = 1,k表示迭代次數; 步驟2. 2:判斷當前迭代次數是否已超過設定的最大迭代次數,若超過,則返回步驟 2. 1,;否則,進入步驟2. 3 ; 步驟2.3 :從獲得的周圍環境信息對應的已知地圖中,隨機選擇一個位置 Pk插入室內移動機器人所在當前位置P_(t)與目標位置PgMl,其中,P k滿足條件 丨/>,.Π ,{pj為之前迭代最佳路徑代價函數下的路徑點集合,3為室內移 動機器人工作空間信息集合;按以下公式計算第k次迭代得到的路徑代價函數: 其中,第k-1次迭代得到的路徑代價函數,且=1 + ·,Rp-pPt 為已知地圖上當前位置PMW(t)與所選位置Pk之間的連接權值,(?為採用貪心算法獲得的在 第k次迭代完成後獲得的從位置pk到目標位置pgMl的最佳路徑代價函數:
其中,為目標位置PgMi的代價函數,且0^?, = 0 ; ,為已知地圖上在第k次所 選位置點Pk和第k-Ι次所選位置Ph之間的連接權值; 在已知地圖中任意兩位置?3和^之間的連接權值^ 由兩位置之間的直線距離和該 直線上穿過的障礙物影響概率構成:+DH
其中,為位置Pa到位置Pb兩點之間的物理位置距離;為位置Pa到位置P b的 路徑點集合,ds為路徑積分單元;max 為最大值求函數; 步驟2. 4 :判斷迭代後得到的路徑代價函數是否已經達到收斂,如果收斂,則退 出迭代過程,將已收斂的路徑代價函數對應的路徑作為最佳路徑進入步驟3 ;否則,將迭代 次數k加1,返回步驟2. 2 ; 步驟3 :以步驟2得到的最佳路徑作為室內移動機器人當前的預選擇路徑,依據預選擇 路徑和室內移動機器人的位置和速度矢量判斷室內移動機器人的偏轉角是否滿足輪式 機器人不能側向滑動的非完整約束,確定室內移動機器人是否按照預選擇路徑方向移動: 若不滿足,則返回步驟2;若滿足則以設定的室內移動機器人移動速度沿當前時刻規 劃出的最佳路徑方向移動,進入下一時刻的路徑規劃,t = t+Ι,返回步驟1,直到室內移動 機器人移動到目標位置,完成路徑規劃; 所述室內移動機器人的偏轉角是否滿足輪式機器人不能側向滑動的非完整約束是 指:(]5t e [〇, 60。] U [120。,180。];
Pt和Ph分別為室內移動機器人當 前位置和上一時刻所在位置,瓦+1為在t時刻,室內移動機器人由規劃得到的最佳路徑中第 一個路徑點,即室內移動機器人在t+Ι時刻的預抵達位置; Pt-ι由Pt-i = Pt_vt得到,v為設定的室內移動機器人移動速度。
2.根據權利要求1所述的室內移動機器人增強地圖學習路徑規劃方法,其特徵在於, 所述步驟2中插入室內移動機器人所在當前位置pnOT(t)與目標位置pgMl之間的位置p k的選 取依據如下: 1) 當目標位置出現在室內移動機器人當前已探測範圍內巧_ e3_,則將目標位置作 為第1次迭代時選取的位置必=PgMl ;從第2次迭代即k = 2開始,pk為在地圖範圍內隨 機選取的位置,且需滿足條件{Λ 其中,{pj為之前迭代最佳路徑代價函數 下的路徑點集合,3為室內移動機器人工作空間信息集合; 2) 當目標位置未出現在室內移動機器人當前已探測範圍內時,則每次迭代過程中位置 Pk為從已知地圖中隨機選取的位置。
3. 根據權利要求2所述的室內移動機器人增強地圖學習路徑規劃方法,其特徵在於, 所述步驟1中室內移動機器人自身所攜帶聲吶傳感器是指所採用底盤Pi〇nee r-2DX自身攜 帶的聲吶探測雷達。
4. 根據權利要求3所述的室內移動機器人增強地圖學習路徑規劃方法,其特徵在於, 所述已知地圖中任意兩位置Pa和P b之間的連接權值Ava按以下公式計算:
其中,km為障礙物影響放大係數有利於提高機器人的避障效果,取值範圍為 [50, 1000]。
5. 根據權利要求1-4任一項所述的室內移動機器人增強地圖學習路徑規劃方法,其特 徵在於,所述步驟4中設定的室內移動機器人v按以下公式進行自適應調整:
其中,PbmiCT為障礙物位置,ν〇為室內移動機器人移動的基礎速度設定值,3_為當前 探測範圍內工作空間信息集合,包括當前探測範圍內的障礙物位置,目標點位置,和可移動 區域地圖位置信息。
【文檔編號】G05B13/04GK104298239SQ201410512492
【公開日】2015年1月21日 申請日期:2014年9月29日 優先權日:2014年9月29日
【發明者】王耀南, 陳彥傑, 鍾杭, 潘琪 申請人:湖南大學