王淑玲 卓麗



摘 要:路徑規劃是移動機器人研究領域的熱點問題。針對不同的規劃需求,已經提出許多種路徑規劃的算法。本文考慮機場飛行場地環境,應用Q學習算法規劃出點到點的靜態安全避障路徑。為進一步優化上述規劃結果,提出了一種改進Q學習算法的方法,通過比較改進前后的路徑規劃結果,驗證了改進方法的有效性。研究成果不僅給出該機場飛行場地環境中靜態路徑規劃的方法,也為相關移動機器人的研發提供了理論依據。
關鍵詞:移動機器人;Q學習算法;飛行場地;路徑規劃
1.引言
路徑規劃是移動機器人研究領域的熱點問題,在很多方面都有應用,如無人機的避障飛行,巡航導彈躲避雷達搜索,GPS導航等,是完成復雜導航及其他任務的前提。路徑規劃可以描述為:移動機器人依據某些優化原則在運動空間中找到一條從起始狀態到目標狀態、可以避開障礙物的最優或接近最優的路徑。起初,移動機器人路徑規劃技術主要集中在靜態全局路徑規劃的研究,提出的算法包括柵格法、Dijkstra算法、A*算法等。后來,研究人員將重心傾向于局部路徑規劃上,而局部路徑規劃主要解決動態情況下完全未知或者局部未知工作環境的路徑規劃問題,這對路徑規劃算法的實時性有了更高的要求,已提出的算法包括人工勢場法、遺傳算法、蟻群算法等[1-7]。近年來,基于強化學習的路徑規劃在移動機器人的導航研究中變得越來越重要,成為國內外研究的熱點[8-11]?!?br>