新四季網

一種室內移動機器人增強地圖學習路徑規劃方法

2023-06-05 02:51:01

一種室內移動機器人增強地圖學習路徑規劃方法
【專利摘要】本發明公開了一種室內移動機器人增強地圖學習路徑規劃方法,其步驟為:(1)獲取周圍環境信息,建立障礙概率密度模型;(2)利用貪心算法和增強地圖學習方法進行路徑規劃;(3)室內移動機器人路徑選擇及自適應速度調整策略。採用的增強地圖學習路徑規劃能夠根據室內移動機器人的當前狀況和機器人固有的非完整約束,實時規劃當前最佳路徑,同時自適應的速度調整策略可以兼顧室內移動機器人的越障能力,目標點收斂能力和規劃效率,使室內移動機器人能夠安全有效的到達指定位置。
【專利說明】一種室內移動機器人增強地圖學習路徑規劃方法

【技術領域】
[0001] 本發明涉及地面輪式機器人的自主導航領域,特別涉及一種室內移動機器人增強 地圖學習路徑規劃方法。

【背景技術】
[0002] 隨著機器人技術的發展和人工智慧研究的不斷深入,智慧機器人在人類生活中扮 演越來越重要的角色。作為常見生活機器人的一種,室內移動機器人作為服務人員的代替 者多用於室內移動展會,家庭服務,酒店大廳引導等複雜動態環境。在這類環境中,環境信 息非結構化,靜態動態障礙物交錯存在,環境信息變化明顯,這些因素對室內移動機器人的 工作能力提出了極大的挑戰和要求。為較好地完成服務任務,室內移動機器人需要具有探 測障礙物,區分識別障礙物,實時規劃可行路徑,穩定控制行動的能力。隨著傳感器技術、計 算機技術和網絡通信技術的不斷發展,實時路徑規劃作為智慧機器人的大腦成為室內移動 機器人研究的重中之重。
[0003] 室內移動機器人在環境中的任務可以理解為從哪兒來?到哪兒去?怎麼去?去 做什麼?而路徑規劃能夠統籌傳感器獲得的環境信息做出最符合機器人當前狀況的路徑 決策,即怎麼去。常規的路徑規劃可以分別靜態規劃和動態規劃,靜態規劃是指機器人已具 備全局環境信息,機器人通過離線計算得到全局環境下最優的規劃路徑,而動態路徑規劃 多針對動態未知環境中的路徑選擇,機器人對環境信息理解有限且環境可能發生改變,與 真實情況具有高度的相似性。對於室內移動機器人,我們期望其能夠實現在室內移動動態 環境中的實時最佳路徑選擇和動態障礙物躲避。
[0004] 作為控制和規劃的對象,室內移動機器人是一類具有時變、強耦合和非完整性的 多輸入多輸出非線性系統。由於環境多變複雜且需要考慮較多因素,其規劃決策變的十分 複雜。在現有的技術中,常規的路徑規劃,如模糊規劃,遺傳算法,蟻群算法,神經網絡等,往 往不能同時滿足動態環境和實時性的要求。另外,輪式移動機器人存在的非完整性也制約 著室內移動機器人的路徑選擇。因此,研究具有學習能力的路徑規划算法成為現階段實時 動態路徑規劃研究的一個主流趨勢。而設計一種簡單可靠、實時性好、便於實現、能夠應付 多類動態未知環境的室內移動機器人規劃方法是保證服務工作正常有效進行的關鍵技術 和現實難題。


【發明內容】

[0005] 本發明針對上述現有技術中現在路徑規劃方法中難以同時滿足動態未知環境規 劃和實時規劃的要求,採用增強地圖學習的路徑規劃方法,隨著室內移動機器人的移動,不 斷加深理解新獲得的周圍環境信息,迭代計算隨機選取路徑的代價函數,學習計算得出當 前時刻最優的路徑,保證了室內移動機器人的靜態障礙下的良好避障性能,而且滿足了動 態障礙出現時的實時規劃功能,達到具有較高智能化的室內移動機器人的自主導航和路徑 規劃方法。
[0006] -種室內移動機器人增強地圖學習路徑規劃方法,包括以下幾個步驟:
[0007] 步驟1 :建立已探測區域受障礙物影響的概率模型;
[0008] 首先,通過室內移動機器人自身攜帶的聲吶傳感器,獲得室內移動機器人的周圍 環境信息;其次,將室內移動機器人所經過的區域作為已探測區域,依據所述的周圍環境信 息建立已探測區域受障礙物影響的概率模型,並依據聲吶傳感器實時採集的周圍環境信息 實時更新已探測區域受障礙物影響的概率模型;
[0009] 所述已探測區域受障礙物影響的概率模型如下:
[0010]

【權利要求】
1. 一種室內移動機器人增強地圖學習路徑規劃方法,其特徵在於,包括以下幾個步 驟: 步驟1 :建立已探測區域受障礙物影響的概率模型; 首先,通過室內移動機器人自身攜帶的聲吶傳感器,獲得室內移動機器人的周圍環境 信息;其次,將室內移動機器人所經過的區域作為已探測區域,依據所述的周圍環境信息建 立已探測區域受障礙物影響的概率模型,並依據聲吶傳感器實時採集的周圍環境信息實時 更新已探測區域受障礙物影響的概率模型; 所述已探測區域受障礙物影響的概率模型如下:
其中,室內移動機器人工作空間信息集合為3,所述空間信息包括所有目標位置及所 有障礙物位置;當前探測範圍內工作空間信息集合為3_.,已探測出的工作空間信息集合 為 J ^now - ^detected - ^ f {(X,Y)}為已探測區域K k 3de_/丨;在3的地圖上探測 到有M個障礙物,fi(X,Y)為第i個障礙物的對室內移動機器人路徑選擇的影響函數,採用 正態分布表示如下: 1 (-τ-] f;{XJ)=n^e -σ ^2πσ? 其中,〇 i為第i個障礙物的影響範圍係數,取值範圍為[〇, 1] ;Di為第i個障礙物到已 探測區域內所有位置的距離矩陣,矩陣大小與地圖大小一致為N*N ; 步驟2 :基於貪心算法和增強學習迭代策略,在設定的最大迭代次數kmax內,迭代更新 當前位置Pn(W(t)與目標位置PgMl之間的路徑代價函數,以達到收斂的路徑代價函數對應的 路徑作為當前時刻的最佳路徑,具體過程如下: 步驟2. 1 :令k = 1,k表示迭代次數; 步驟2. 2:判斷當前迭代次數是否已超過設定的最大迭代次數,若超過,則返回步驟 2. 1,;否則,進入步驟2. 3 ; 步驟2.3 :從獲得的周圍環境信息對應的已知地圖中,隨機選擇一個位置 Pk插入室內移動機器人所在當前位置P_(t)與目標位置PgMl,其中,P k滿足條件 丨/>,.Π ,{pj為之前迭代最佳路徑代價函數下的路徑點集合,3為室內移 動機器人工作空間信息集合;按以下公式計算第k次迭代得到的路徑代價函數: 其中,第k-1次迭代得到的路徑代價函數,且=1 + ·,Rp-pPt 為已知地圖上當前位置PMW(t)與所選位置Pk之間的連接權值,(?為採用貪心算法獲得的在 第k次迭代完成後獲得的從位置pk到目標位置pgMl的最佳路徑代價函數:
其中,為目標位置PgMi的代價函數,且0^?, = 0 ; ,為已知地圖上在第k次所 選位置點Pk和第k-Ι次所選位置Ph之間的連接權值; 在已知地圖中任意兩位置?3和^之間的連接權值^ 由兩位置之間的直線距離和該 直線上穿過的障礙物影響概率構成:+DH
其中,為位置Pa到位置Pb兩點之間的物理位置距離;為位置Pa到位置P b的 路徑點集合,ds為路徑積分單元;max 為最大值求函數; 步驟2. 4 :判斷迭代後得到的路徑代價函數是否已經達到收斂,如果收斂,則退 出迭代過程,將已收斂的路徑代價函數對應的路徑作為最佳路徑進入步驟3 ;否則,將迭代 次數k加1,返回步驟2. 2 ; 步驟3 :以步驟2得到的最佳路徑作為室內移動機器人當前的預選擇路徑,依據預選擇 路徑和室內移動機器人的位置和速度矢量判斷室內移動機器人的偏轉角是否滿足輪式 機器人不能側向滑動的非完整約束,確定室內移動機器人是否按照預選擇路徑方向移動: 若不滿足,則返回步驟2;若滿足則以設定的室內移動機器人移動速度沿當前時刻規 劃出的最佳路徑方向移動,進入下一時刻的路徑規劃,t = t+Ι,返回步驟1,直到室內移動 機器人移動到目標位置,完成路徑規劃; 所述室內移動機器人的偏轉角是否滿足輪式機器人不能側向滑動的非完整約束是 指:(]5t e [〇, 60。] U [120。,180。];
Pt和Ph分別為室內移動機器人當 前位置和上一時刻所在位置,瓦+1為在t時刻,室內移動機器人由規劃得到的最佳路徑中第 一個路徑點,即室內移動機器人在t+Ι時刻的預抵達位置; Pt-ι由Pt-i = Pt_vt得到,v為設定的室內移動機器人移動速度。
2.根據權利要求1所述的室內移動機器人增強地圖學習路徑規劃方法,其特徵在於, 所述步驟2中插入室內移動機器人所在當前位置pnOT(t)與目標位置pgMl之間的位置p k的選 取依據如下: 1) 當目標位置出現在室內移動機器人當前已探測範圍內巧_ e3_,則將目標位置作 為第1次迭代時選取的位置必=PgMl ;從第2次迭代即k = 2開始,pk為在地圖範圍內隨 機選取的位置,且需滿足條件{Λ 其中,{pj為之前迭代最佳路徑代價函數 下的路徑點集合,3為室內移動機器人工作空間信息集合; 2) 當目標位置未出現在室內移動機器人當前已探測範圍內時,則每次迭代過程中位置 Pk為從已知地圖中隨機選取的位置。
3. 根據權利要求2所述的室內移動機器人增強地圖學習路徑規劃方法,其特徵在於, 所述步驟1中室內移動機器人自身所攜帶聲吶傳感器是指所採用底盤Pi〇nee r-2DX自身攜 帶的聲吶探測雷達。
4. 根據權利要求3所述的室內移動機器人增強地圖學習路徑規劃方法,其特徵在於, 所述已知地圖中任意兩位置Pa和P b之間的連接權值Ava按以下公式計算:
其中,km為障礙物影響放大係數有利於提高機器人的避障效果,取值範圍為 [50, 1000]。
5. 根據權利要求1-4任一項所述的室內移動機器人增強地圖學習路徑規劃方法,其特 徵在於,所述步驟4中設定的室內移動機器人v按以下公式進行自適應調整:
其中,PbmiCT為障礙物位置,ν〇為室內移動機器人移動的基礎速度設定值,3_為當前 探測範圍內工作空間信息集合,包括當前探測範圍內的障礙物位置,目標點位置,和可移動 區域地圖位置信息。
【文檔編號】G05B13/04GK104298239SQ201410512492
【公開日】2015年1月21日 申請日期:2014年9月29日 優先權日:2014年9月29日
【發明者】王耀南, 陳彥傑, 鍾杭, 潘琪 申請人:湖南大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀