權(quán)值自適應(yīng)的局部路徑規(guī)劃方法及應(yīng)用

2019-02-07 05:32:15王紀(jì)云邵杭

軟件導(dǎo)刊 2019年12期

王紀(jì)云邵杭

摘要：移動(dòng)機(jī)器人在工業(yè)生產(chǎn)和社會(huì)生活中逐步得到應(yīng)用。路徑規(guī)劃是移動(dòng)機(jī)器人完成其任務(wù)的前提和基礎(chǔ)，也是機(jī)器人導(dǎo)航的核心技術(shù)。針對(duì)移動(dòng)機(jī)器人在現(xiàn)有局部路徑規(guī)劃中無法自適應(yīng)復(fù)雜環(huán)境、規(guī)劃路徑不合理等問題，提出基于權(quán)值自適應(yīng)的局部路徑規(guī)劃方法。利用傳感器信息自動(dòng)獲取合理的目標(biāo)函數(shù)權(quán)值，實(shí)現(xiàn)具有較高實(shí)時(shí)性、安全性和魯棒性的局部路徑規(guī)劃。實(shí)驗(yàn)結(jié)果表明，改進(jìn)的動(dòng)態(tài)窗口法能有效自適應(yīng)復(fù)雜環(huán)境，規(guī)劃的路徑安全、合理、平滑，算法效率明顯提升，計(jì)算量和迭代次數(shù)明顯減少，總運(yùn)行時(shí)間縮短20%以上。

關(guān)鍵詞：機(jī)器人;局部路徑規(guī)劃;權(quán)值自適應(yīng);導(dǎo)航

DOI.10.11907/rjdk.191246

中圖分類號(hào)：TP301 文獻(xiàn)標(biāo)識(shí)碼：A 文章編號(hào)：1672-7800（2019）012-0011-03

0引言

移動(dòng)機(jī)器人廣泛應(yīng)用在生產(chǎn)、生活、醫(yī)療、國防等領(lǐng)域，路徑規(guī)劃是機(jī)器人的基礎(chǔ)技術(shù)之一，要求在一定的評(píng)價(jià)原則下找到一條從起始點(diǎn)到終點(diǎn)無碰撞的最優(yōu)或次優(yōu)路徑…。而局部路徑規(guī)劃主要目的是使機(jī)器人根據(jù)環(huán)境信息以較少的時(shí)間或路程代價(jià)避開障礙物到達(dá)目標(biāo)點(diǎn)，它受機(jī)器人自身物理及環(huán)境條件限制，因此要求實(shí)時(shí)性好、運(yùn)行速度快。

目前經(jīng)典的局部路徑規(guī)劃方法主要有人工勢(shì)場(chǎng)法（Ar-tificial Potential Field，APF）、向量場(chǎng)直方圖算法（VectorField Histogram，VFH）等。在人工勢(shì)場(chǎng)法中，目標(biāo)點(diǎn)對(duì)機(jī)器人表示吸引勢(shì)能，障礙物為排斥勢(shì)能，將兩者勢(shì)能進(jìn)行疊加即可得到構(gòu)造空間的勢(shì)能分布，將疊加勢(shì)能進(jìn)行微分即表示為機(jī)器人的驅(qū)動(dòng)力。向量場(chǎng)直方圖算法則是以移動(dòng)機(jī)器人為中心建立二維極線直方圖表示環(huán)境，對(duì)線速度和角速度分別進(jìn)行控制，較好解決了勢(shì)場(chǎng)法的不足。但是VFH沒有考慮機(jī)器人的尺寸、動(dòng)力學(xué)和運(yùn)動(dòng)學(xué)等特性，在狹窄通道存在抖動(dòng)問題。Borenstein等提出了改進(jìn)的VFH+方法，之后又提出了VFH*算法，使機(jī)器人能夠選擇一個(gè)局部較優(yōu)的運(yùn)動(dòng)方向。

以上傳統(tǒng)算法無法直接得到機(jī)器人避障時(shí)的最優(yōu)速度，且未考慮機(jī)器人自身物理限制。Fox等提出了較完善的動(dòng)態(tài)窗口法，將機(jī)器人的物理限制、環(huán)境約束以及當(dāng)前速度等因素添加到目標(biāo)函數(shù)中，取得了較好效果。但這種方法有一定局限，例如在復(fù)雜環(huán)境下，機(jī)器人得到的軌跡不夠平滑，在稠密障礙物區(qū)域，路徑規(guī)劃不合理，可能繞開稠密區(qū)域從而導(dǎo)致路徑過長(zhǎng)，或者在狹窄區(qū)域太靠近障礙物，容易發(fā)生碰撞等，降低了安全性和可靠性。主要原因是動(dòng)態(tài)窗口法采用的是固定權(quán)值，難以適應(yīng)多變的環(huán)境。

局部路徑規(guī)劃算法如強(qiáng)化學(xué)習(xí)屬于機(jī)器學(xué)習(xí)方法，可用在復(fù)雜的未知環(huán)境中搜索最優(yōu)路徑。為提高導(dǎo)航準(zhǔn)確度，將Kinect與聲吶測(cè)得的障礙物信息融合，得到精確的障礙物位置信息，有助于提高動(dòng)態(tài)環(huán)境中運(yùn)動(dòng)規(guī)劃的準(zhǔn)確性和魯棒性。Rezaee等提出了基于虛擬行為結(jié)構(gòu)的移動(dòng)機(jī)器人隊(duì)形控制方法。建立一種虛擬結(jié)構(gòu)，每個(gè)移動(dòng)機(jī)器人采用電荷模型建模，自主尋找編隊(duì)中的位置，并且在移動(dòng)機(jī)器人數(shù)量改變的情況下編隊(duì)可以自動(dòng)改變;Guzzi等提出了一種基于人類學(xué)的新型機(jī)器人局部路徑算法，實(shí)現(xiàn)了互相避讓的啟發(fā)式算法;Flacco等描述了一個(gè)實(shí)時(shí)的人機(jī)共融機(jī)器人導(dǎo)航方法，引入了深度空間評(píng)價(jià)機(jī)器人與移動(dòng)障礙物（包括人類）之間的距離計(jì)算方法;Digani等基于自動(dòng)導(dǎo)引車（Automated Guided Vehicle，AGV）提出了一種新的避障算法，采用樣條曲線、車道變換曲線和線段生成新的路徑，可避開原路線上的障礙物。在人機(jī)共處環(huán)境中，不僅要避開障礙物，還要在穿越人群時(shí)確保每人有合適的空間;Sgorbissa等提出將先驗(yàn)環(huán)境與機(jī)器人自我感知相結(jié)合的一種導(dǎo)航方法，確保機(jī)器人實(shí)現(xiàn)最優(yōu)路徑;Roussos等介紹了一種多機(jī)器人的分布式導(dǎo)航方法，為每個(gè)機(jī)器人創(chuàng)造一個(gè)潛在的領(lǐng)域，設(shè)計(jì)了一種反饋控制方法實(shí)現(xiàn)全部機(jī)器人的路徑規(guī)劃和避撞;Kim等通過模擬人的路徑軌跡，在動(dòng)態(tài)障礙物中建立一種具有社會(huì)適應(yīng)性的路徑規(guī)劃方法，設(shè)計(jì)了智能化、人性化的路徑規(guī)劃方法;Lopes等提出一個(gè)新穎的路徑規(guī)劃方法，考慮全局和局部規(guī)劃，并采用平滑技術(shù)實(shí)現(xiàn)路徑的連貫和平滑，在狹窄通道中實(shí)現(xiàn)較可靠的運(yùn)行。以上方法在路徑規(guī)劃中，考慮了舒適性和人性化，但對(duì)機(jī)器人的物理限制和運(yùn)行效率未作考慮。Ahhoff介紹了一種自動(dòng)駕駛中汽車安全路徑檢測(cè)方法，通過檢測(cè)公路上的車輛和其它障礙物驗(yàn)證車輛運(yùn)行的安全性，在卡內(nèi)基梅隆大學(xué)機(jī)器人研究所的自動(dòng)駕駛儀上驗(yàn)證了該方法的有效性。但是上述算法大多需要較多傳感器信息和數(shù)據(jù)，計(jì)算量較大且比較耗時(shí)。

本文針對(duì)動(dòng)態(tài)窗口法的現(xiàn)有問題，采用較簡(jiǎn)單的傳感器獲取環(huán)境信息，自動(dòng)調(diào)整復(fù)雜環(huán)境下的目標(biāo)函數(shù)權(quán)值，實(shí)現(xiàn)具有較高實(shí)時(shí)性、安全性和魯棒性的機(jī)器人局部路徑規(guī)劃。不僅實(shí)現(xiàn)合理避障，而且在穿越人群時(shí)保持與人合理的“社交距離”。

1參數(shù)自適應(yīng)路徑規(guī)劃

動(dòng)態(tài)窗口法引入了速度空間概念，將機(jī)器人控制問題轉(zhuǎn)化為速度控制，將二維空間的避障問題轉(zhuǎn)化為速度空間帶約束的優(yōu)化問題，同時(shí)考慮機(jī)器人速度和加速度約束、環(huán)境和障礙物約束，因此得到的速度可以直接為機(jī)器人使用。

然而，現(xiàn)有的動(dòng)態(tài)窗口法還存在一些問題，具體表現(xiàn)為：①現(xiàn)有DWA算法在進(jìn)行剎車判斷時(shí)會(huì)忽略速度的方向性，把一些可行速度判斷為不可行速度，導(dǎo)致最優(yōu)速度被剔除，從而使機(jī)器人選擇不合理的速度，例如在密集障礙物區(qū)域出現(xiàn)繞行;②在某些情況下，太小的速度權(quán)值使優(yōu)化得到的速度和航向角不合理，導(dǎo)致路徑過于靠近一側(cè)障礙物，安全性較低，缺少人性化。反之，太大的速度權(quán)值使軌跡不夠平滑，機(jī)器人繞障礙物密集區(qū)域的外圍行走導(dǎo)致路程過長(zhǎng)。

1.2改進(jìn)的路徑規(guī)劃方法流程

改進(jìn)的動(dòng)態(tài)窗口法流程如下：

（1）利用傳感器信息，獲得t時(shí)刻機(jī)器人與障礙物的距離D，和航向角。

（2）利用公式（1）計(jì)算線速度的動(dòng)態(tài)權(quán)值Kv。

（3）自動(dòng)搜索速度空間：①根據(jù)機(jī)器人當(dāng)前t時(shí)刻速度和物理約束，獲得t+1時(shí)刻機(jī)器人的可達(dá)速度、所有可達(dá)速度;②由t時(shí)刻的（v，ω）生成運(yùn)行軌跡;③利用物理、環(huán)境和障礙物約束，推算t+l時(shí)刻的全部可行速度（v，ω）。

（4）將動(dòng)態(tài)權(quán)值yd代人目標(biāo)函數(shù)式（3），目標(biāo)函數(shù)的3個(gè)輸入需要?dú)w一化，利用最大化目標(biāo)函數(shù)獲得t+1時(shí)刻的最優(yōu)速度組合。

（5）運(yùn)行一個(gè)時(shí)間間隔，如果未到達(dá)目標(biāo)點(diǎn)，返回步驟（1），進(jìn)人下一時(shí)刻循環(huán)，否則結(jié)束。

2仿真實(shí)驗(yàn)結(jié)果與分析

為驗(yàn)證提出方法的有效性和適用范圍，在3種不同情況下對(duì)避障效果進(jìn)行仿真對(duì)比并分析結(jié)果。

2.1仿真實(shí)驗(yàn)參數(shù)

根據(jù)機(jī)器人實(shí)際情況，選取的參數(shù)見表1。權(quán)值kh=1，KD=5，K分別取20，2和動(dòng)態(tài)可調(diào)，DTh為0.8m，其它參數(shù)aO和b分別為2和14，Kmax為20。

2.2改進(jìn)后避障對(duì)比實(shí)驗(yàn)

在同一地圖中進(jìn)行避障對(duì)比實(shí)驗(yàn)，結(jié)果如圖l所示。圖l（a）為速度權(quán)值為20時(shí)的運(yùn)行軌跡，路徑12.8m，步數(shù)142，歷時(shí)14.5s。A處過于接近障礙物，安全性較低;圖1（b）中的速度權(quán)值2，軌跡長(zhǎng)12.86m，運(yùn)行步數(shù)216，歷時(shí)22.3s，步數(shù)和時(shí)間高于高權(quán)值時(shí)。在通過狹窄通道A處時(shí)機(jī)器人從障礙物中間通過，安全性較高。改進(jìn)算法的機(jī)器人軌跡如圖l（c）所示，軌跡長(zhǎng)12.8m，步數(shù)165，時(shí)間16.52s。和高權(quán)值圖1（a）對(duì)比，不但運(yùn)行速度較高，而且安全性高，和低權(quán)值圖1（b）對(duì)比，步數(shù)和時(shí)間都降低，效率明顯提高。圖l（d）為3種權(quán)值軌跡，其中速度權(quán)值為2，與動(dòng)態(tài)時(shí)軌跡基本重合，路徑合理，表示動(dòng)態(tài)權(quán)值與低權(quán)值的安全性相同。

從實(shí)驗(yàn)可以看出，算法改進(jìn)后，機(jī)器人可以同時(shí)在安全和效率兩個(gè)方面得到保證，計(jì)算量（迭代次數(shù)）降低24%，總運(yùn)行時(shí)間下降23%。

3結(jié)語

本文針對(duì)動(dòng)態(tài)窗口法中存在的問題，提出了權(quán)值自適應(yīng)的局部路徑規(guī)劃方法。利用傳感器獲取的距離信息，通過權(quán)值的自動(dòng)調(diào)整，實(shí)現(xiàn)在多障礙物區(qū)域自動(dòng)推算出最優(yōu)的線速度和角速度，解決機(jī)器人在多障礙物區(qū)域的繞行及軌跡不平滑問題，從而實(shí)現(xiàn)安全、高效和可靠的機(jī)器人局部避障算法，使機(jī)器人運(yùn)行軌跡更加合理、安全和有效。

軟件導(dǎo)刊2019年12期

軟件導(dǎo)刊的其它文章: 多媒體環(huán)境中課堂教學(xué)效果影響因素識(shí)別與分析; 計(jì)算機(jī)基礎(chǔ)核心課程“三位一體”教學(xué)模式研究; 面向Echarts的高校學(xué)籍信息可視化研究; TPACK理論視域下的職前教師信息化教學(xué)能力培養(yǎng)研究; 生成性理念指導(dǎo)下的探究式教學(xué)活動(dòng)設(shè)計(jì); MOOC熱的冷思考