王紀云 邵杭



摘要:移動機器人在工業生產和社會生活中逐步得到應用。路徑規劃是移動機器人完成其任務的前提和基礎,也是機器人導航的核心技術。針對移動機器人在現有局部路徑規劃中無法自適應復雜環境、規劃路徑不合理等問題,提出基于權值自適應的局部路徑規劃方法。利用傳感器信息自動獲取合理的目標函數權值,實現具有較高實時性、安全性和魯棒性的局部路徑規劃。實驗結果表明,改進的動態窗口法能有效自適應復雜環境,規劃的路徑安全、合理、平滑,算法效率明顯提升,計算量和迭代次數明顯減少,總運行時間縮短20%以上。
關鍵詞:機器人;局部路徑規劃;權值自適應;導航
DOI.10.11907/rjdk.191246
中圖分類號:TP301 文獻標識碼:A 文章編號:1672-7800(2019)012-0011-03
0引言
移動機器人廣泛應用在生產、生活、醫療、國防等領域,路徑規劃是機器人的基礎技術之一,要求在一定的評價原則下找到一條從起始點到終點無碰撞的最優或次優路徑…。而局部路徑規劃主要目的是使機器人根據環境信息以較少的時間或路程代價避開障礙物到達目標點,它受機器人自身物理及環境條件限制,因此要求實時性好、運行速度快。
目前經典的局部路徑規劃方法主要有人工勢場法(Ar-tificial Potential Field,APF)、向量場直方圖算法(VectorField Histogram,VFH)等。在人工勢場法中,目標點對機器人表示吸引勢能,障礙物為排斥勢能,將兩者勢能進行疊加即可得到構造空間的勢能分布,將疊加勢能進行微分即表示為機器人的驅動力。向量場直方圖算法則是以移動機器人為中心建立二維極線直方圖表示環境,對線速度和角速度分別進行控制,較好解決了勢場法的不足。但是VFH沒有考慮機器人的尺寸、動力學和運動學等特性,在狹窄通道存在抖動問題。Borenstein等提出了改進的VFH+方法,之后又提出了VFH*算法,使機器人能夠選擇一個局部較優的運動方向。
以上傳統算法無法直接得到機器人避障時的最優速度,且未考慮機器人自身物理限制。Fox等提出了較完善的動態窗口法,將機器人的物理限制、環境約束以及當前速度等因素添加到目標函數中,取得了較好效果。但這種方法有一定局限,例如在復雜環境下,機器人得到的軌跡不夠平滑,在稠密障礙物區域,路徑規劃不合理,可能繞開稠密區域從而導致路徑過長,或者在狹窄區域太靠近障礙物,容易發生碰撞等,降低了安全性和可靠性。主要原因是動態窗口法采用的是固定權值,難以適應多變的環境。
局部路徑規劃算法如強化學習屬于機器學習方法,可用在復雜的未知環境中搜索最優路徑。為提高導航準確度,將Kinect與聲吶測得的障礙物信息融合,得到精確的障礙物位置信息,有助于提高動態環境中運動規劃的準確性和魯棒性。Rezaee等提出了基于虛擬行為結構的移動機器人隊形控制方法。建立一種虛擬結構,每個移動機器人采用電荷模型建模,自主尋找編隊中的位置,并且在移動機器人數量改變的情況下編隊可以自動改變;Guzzi等提出了一種基于人類學的新型機器人局部路徑算法,實現了互相避讓的啟發式算法;Flacco等描述了一個實時的人機共融機器人導航方法,引入了深度空間評價機器人與移動障礙物(包括人類)之間的距離計算方法;Digani等基于自動導引車(Automated Guided Vehicle,AGV)提出了一種新的避障算法,采用樣條曲線、車道變換曲線和線段生成新的路徑,可避開原路線上的障礙物。在人機共處環境中,不僅要避開障礙物,還要在穿越人群時確保每人有合適的空間;Sgorbissa等提出將先驗環境與機器人自我感知相結合的一種導航方法,確保機器人實現最優路徑;Roussos等介紹了一種多機器人的分布式導航方法,為每個機器人創造一個潛在的領域,設計了一種反饋控制方法實現全部機器人的路徑規劃和避撞;Kim等通過模擬人的路徑軌跡,在動態障礙物中建立一種具有社會適應性的路徑規劃方法,設計了智能化、人性化的路徑規劃方法;Lopes等提出一個新穎的路徑規劃方法,考慮全局和局部規劃,并采用平滑技術實現路徑的連貫和平滑,在狹窄通道中實現較可靠的運行。以上方法在路徑規劃中,考慮了舒適性和人性化,但對機器人的物理限制和運行效率未作考慮。Ahhoff介紹了一種自動駕駛中汽車安全路徑檢測方法,通過檢測公路上的車輛和其它障礙物驗證車輛運行的安全性,在卡內基梅隆大學機器人研究所的自動駕駛儀上驗證了該方法的有效性。但是上述算法大多需要較多傳感器信息和數據,計算量較大且比較耗時。
本文針對動態窗口法的現有問題,采用較簡單的傳感器獲取環境信息,自動調整復雜環境下的目標函數權值,實現具有較高實時性、安全性和魯棒性的機器人局部路徑規劃。不僅實現合理避障,而且在穿越人群時保持與人合理的“社交距離”。
1參數自適應路徑規劃
動態窗口法引入了速度空間概念,將機器人控制問題轉化為速度控制,將二維空間的避障問題轉化為速度空間帶約束的優化問題,同時考慮機器人速度和加速度約束、環境和障礙物約束,因此得到的速度可以直接為機器人使用。
然而,現有的動態窗口法還存在一些問題,具體表現為:①現有DWA算法在進行剎車判斷時會忽略速度的方向性,把一些可行速度判斷為不可行速度,導致最優速度被剔除,從而使機器人選擇不合理的速度,例如在密集障礙物區域出現繞行;②在某些情況下,太小的速度權值使優化得到的速度和航向角不合理,導致路徑過于靠近一側障礙物,安全性較低,缺少人性化。反之,太大的速度權值使軌跡不夠平滑,機器人繞障礙物密集區域的外圍行走導致路程過長。
1.2改進的路徑規劃方法流程
改進的動態窗口法流程如下:
(1)利用傳感器信息,獲得t時刻機器人與障礙物的距離D,和航向角。
(2)利用公式(1)計算線速度的動態權值Kv。
(3)自動搜索速度空間:①根據機器人當前t時刻速度和物理約束,獲得t+1時刻機器人的可達速度、所有可達速度;②由t時刻的(v,ω)生成運行軌跡;③利用物理、環境和障礙物約束,推算t+l時刻的全部可行速度(v,ω)。
(4)將動態權值yd代人目標函數式(3),目標函數的3個輸入需要歸一化,利用最大化目標函數獲得t+1時刻的最優速度組合。
(5)運行一個時間間隔,如果未到達目標點,返回步驟(1),進人下一時刻循環,否則結束。
2仿真實驗結果與分析
為驗證提出方法的有效性和適用范圍,在3種不同情況下對避障效果進行仿真對比并分析結果。
2.1仿真實驗參數
根據機器人實際情況,選取的參數見表1。權值kh=1,KD=5,K分別取20,2和動態可調,DTh為0.8m,其它參數aO和b分別為2和14,Kmax為20。
2.2改進后避障對比實驗
在同一地圖中進行避障對比實驗,結果如圖l所示。圖l(a)為速度權值為20時的運行軌跡,路徑12.8m,步數142,歷時14.5s。A處過于接近障礙物,安全性較低;圖1(b)中的速度權值2,軌跡長12.86m,運行步數216,歷時22.3s,步數和時間高于高權值時。在通過狹窄通道A處時機器人從障礙物中間通過,安全性較高。改進算法的機器人軌跡如圖l(c)所示,軌跡長12.8m,步數165,時間16.52s。和高權值圖1(a)對比,不但運行速度較高,而且安全性高,和低權值圖1(b)對比,步數和時間都降低,效率明顯提高。圖l(d)為3種權值軌跡,其中速度權值為2,與動態時軌跡基本重合,路徑合理,表示動態權值與低權值的安全性相同。
從實驗可以看出,算法改進后,機器人可以同時在安全和效率兩個方面得到保證,計算量(迭代次數)降低24%,總運行時間下降23%。
3結語
本文針對動態窗口法中存在的問題,提出了權值自適應的局部路徑規劃方法。利用傳感器獲取的距離信息,通過權值的自動調整,實現在多障礙物區域自動推算出最優的線速度和角速度,解決機器人在多障礙物區域的繞行及軌跡不平滑問題,從而實現安全、高效和可靠的機器人局部避障算法,使機器人運行軌跡更加合理、安全和有效。