摘 要:巡查機器人被廣泛應用于安防、工業檢測、建筑維護、環境監測等領域,能夠實現自主運行、任務執行和巡邏勘察。巡查機器人路徑規劃是一項關鍵技術,其準確性和高效性對于實現自主操作和任務執行至關重要。為了更好地解決巡查機器人的路徑規劃問題,分析并總結了當前研究進展,包括全局路徑規劃算法和局部路徑規劃算法。同時,還分析了巡查機器人路徑規劃面臨的挑戰,如復雜環境、動態障礙物和實時性等方面的要求。重點介紹了智能路徑規劃方法,并展望了未來巡查機器人發展的趨勢。
關鍵詞:巡查機器人;自主運行;全局路徑規劃;局部路徑規劃;智能路徑規劃;人工智能
中圖分類號:TP39 文獻標識碼:A 文章編號:2095-1302(2024)09-0-04
DOI:10.16667/j.issn.2095-1302.2024.09.033
0 引 言
巡查機器人的出現確實可以提高巡查工作的效率、降低成本并確保工作的連續性與穩定性。路徑規劃在巡查機器人的工作中起著關鍵的作用,它需要考慮到目標點的距離、環境的安全性、道路的通行條件以及可能存在的障礙物等因素,以此找到最優的巡查路線。優秀的路徑規劃算法可以提高巡查機器人的工作效率、保證路徑的安全性,并減少資源和能量的浪費。
1 路徑規劃的基礎知識
1.1 全局規劃算法
常見的全局規劃算法包括Dijkstra算法、A*算法、代價地圖算法等。這些算法能夠考慮整體的路徑優化,以找到盡可能短的路徑。
(1)Dijkstra算法
Dijkstra算法可以計算出起點到所有其他節點的最短路徑。它通過動態地更新節點之間的距離信息來選擇下一個節點進行擴展,直到到達目標節點為止,由此得到整個地圖上的最短路徑。它具有精確性和廣泛適用性的優點,可以應用于有向圖和無向圖,并且能夠處理帶有權重的邊。然而,該算法也存在一些缺點。首先,Dijkstra算法的時間復雜度為O(V2),其中V是節點的數量。在大規模圖中,計算時間可能會相當長。另外,Dijkstra算法無法處理負權邊,因為它假設了所有邊的權重均為非負數。當圖中存在負權邊時,該算法可能無法得出正確的最短路徑結果。文獻[1]結合了Dijkstra算法和蟻群算法,先使用Dijkstra算法搜索初始路徑,然后再使用蟻群算法進行進一步優化,以獲得更好的最短路徑結果。這種混合使用不同算法的方法可以提高路徑規劃的效果和效率。
(2)A*算法
A*算法是一種啟發式的全局路徑規劃算法。它通過自定義的啟發函數來預估每個節點與目標節點之間的代價,并綜合實際代價進行選擇。A*算法在搜索過程中保證了較好的路徑質量和效率。A*算法要求設計啟發函數時需要一定的領域知識和經驗,不同的啟發函數可能會導致不同的性能表現;此外,當搜索空間較大時,A*算法可能會面臨內存占用較大的問題。
通過引入不同的技術和方法,對A*算法進行改進和優化,讓其在路徑規劃中表現更好,更符合實際應用需求。文獻[2]通過在A*算法的代價函數中加入類似人工勢場法的目標引力和障礙物斥力,以更好地考慮地圖信息,并使用
B樣條曲線進行平滑處理,改進了A*算法。改進后的算法能夠生成比傳統A*算法更平順、更合理的路徑,特別是在直線距離相同的情況下,算法會選擇更平直、轉彎較少的路徑。文獻[3]通過設置函數對傳統A*算法的路徑進行過濾修整,并使用B樣條曲線進行平滑處理,得到更合理、更適合實際設備執行的路徑,去除了交叉或鋸齒形的不合理路徑,進一步提升了路徑的質量。
(3)代價地圖算法
巡查機器人可以使用代價地圖(Costmap)算法進行全局路徑規劃。代價地圖將環境劃分為多個柵格,并為每個柵格賦予代價或權重,根據代價地圖中的信息選擇最佳路徑。學者們對代價地圖算法進行了廣泛研究。例如,文獻[4]提出了OGM(Occupancy Grid Map)算法,它將環境劃分為網格并使用二進制值表示障礙物狀態。文獻[5]使用了概率性代價地圖算法,可以在不確定環境中進行路徑規劃。還有一些學者將代價地圖與A*算法相結合[6],可以實現更快速、更優化的路徑規劃。另外,一些學者還將機器學習方法[7]應用于代價地圖算法,通過訓練模型來優化代價地圖的生成和路徑規劃過程。
(4)Voronoi圖算法
Voronoi圖算法以機器人周圍的障礙物為中心,將環境劃分為多個區域,并為每個區域中的點分配一個最近的障礙物。巡查機器人可以使用Voronoi圖算法來生成一系列區域,并將路徑規劃限制在這些區域中。這種方法可以幫助機器人避開障礙物并規劃出均勻分布的路徑。
在多機器人路徑規劃中,研究者們對傳統的Voronoi圖算法進行了優化和改進。例如,文獻[7]在傳統的Voronoi圖算法基礎上,在兩個機器人相遇時通過在低優先級機器人上添加額外的Voronoi特征點,使其路徑繞開高優先級機器人。文獻[8]通過刪除不必要的特征點,并增加新的引導點,對傳統Voronoi圖路徑進行進一步優化。文獻[9]通過特征矩陣過濾Voronoi圖的特征點,刪除不必要的點,從而得到更優的路徑。
上述改進的方法旨在提高多機器人路徑規劃的效率,并得到最優路徑。利用Voronoi圖算法的優勢,并針對多機器人場景進行了特定的改進,以實現更好的路徑規劃結果。
(5)RRT算法
RRT(Rapidly-exploring Random Tree)算法是一種基于采樣和樹結構的路徑規劃算法。它通過隨機采樣和擴展來生成一個樹結構,并逐步向目標點靠近,最終找到一條路徑。RRT算法在高維非凸空間中具有較好的適用性。在巡查機器人全局路徑規劃中,RRT算法及其變體被廣泛應用。這些改進包括快速-隨機搜索樹(RRT*)算法[10]、RRT連接(RRT-Connect)算法[11]等。總體而言,基于采樣的快速隨機搜索樹算法在巡查機器人全局路徑規劃中具有重要的研究和應用
價值。
1.2 局部規劃算法
常見的局部規劃算法包括深度優先搜索、廣度優先搜索、動態規劃等。這些算法主要用于在局部環境下找到機器人的可行路徑。
(1)動態窗口法(Dynamic Window Approach):該方法是將機器人的速度和轉向空間離散化為有限的候選窗口,利用局部感知信息和推理來選擇最佳的速度和轉向組合。它能夠實時更新機器人的運動狀態,適應動態環境并避免碰撞。文獻[12]將動態窗口法中只考慮軌跡上障礙物的問題改進為同時考慮軌跡上和臨近軌跡的障礙物(FDWA算法),以避免機器人撞到靠近軌跡但不在軌跡上的障礙物。該算法具有較好的魯棒性,使得機器人能夠更安全地行進。文獻[13]提出了共享控制動態窗口方法,通過控制界面接收用戶命令,并提供最合適的、動態可行的軌跡和導航輔助。這種方法在非結構化環境和動態約束下駕駛車輛時能夠發揮重要作用。
(2)基于模型預測控制(Model Predictive Control, MPC):該方法通過建立一個模型來預測機器人的運動,然后通過優化求解來選擇最優的控制策略。它考慮到了機器人的動力學約束和目標約束,能夠生成平滑的軌跡并避過障礙物。文獻[14]提出了一種基于概率的模型預測控制方法,用于在有噪聲和不確定性的環境中進行路徑規劃。文獻[15]則應用強化學習和深度學習方法來改進MPC算法,在復雜環境下實現更精確和穩定的路徑規劃。此外,還有一些學者將MPC與其他路徑規劃技術相結合,以提高路徑規劃的效果。例如,將MPC與代價地圖算法[16]相結合,可以兼顧全局路徑規劃和局部避障能力。
(3)反饋軌跡跟蹤控制(Feedback Trajectory Tracking Control):該方法使用反饋控制,使機器人按照事先規劃好的軌跡運動。通過不斷調整控制輸入,實現對機器人位置和軌跡的跟蹤,以適應環境變化和目標變化。許多學者對反饋軌跡跟蹤控制進行了研究,并提出了不同的改進和應用方案。文獻[17]提出了一種基于模糊邏輯控制的反饋軌跡跟蹤方法,通過考慮機器人的動態特性和環境約束,實現了更準確的軌跡跟蹤效果。文獻[18]提出了一種基于自適應控制理論的反饋軌跡跟蹤方法,能夠適應不確定環境和參數
變化。
(4)基于局部感知的避障方法:這種方法將機器人的局部感知信息(如激光雷達或攝像頭數據)用于實時檢測周圍的障礙物,并采取相應的避障策略,如引導機器人繞行或停下避讓。文獻[19]提出了一種基于深度學習的局部感知避障方法,通過訓練神經網絡來識別和分類障礙物,并實現自主避障能力。文獻[20]則提出了一種基于潛在場的局部感知避障方法,通過建立環境的潛在避障場來引導機器人運動,實現避障效果。此外,還有一些學者將局部感知的避障方法與其他路徑規劃技術相結合,以提高路徑規劃的效果。
2 巡查機器人路徑規劃面臨的挑戰
巡查機器人在路徑規劃中面臨許多特殊挑戰,包括復雜環境、動態障礙物和實時性方面的要求。這些挑戰對路徑規劃算法和技術產生了深遠的影響。
(1)復雜環境
巡查機器人經常需要在復雜環境中進行路徑規劃,如室內、室外、交通擁堵區域、工業環境等。這種環境可能存在復雜的地形、不可預知的場景變化以及障礙物。傳統的路徑規劃算法可能無法準確地為機器人導航使其通過這些復雜環境。因此,面對復雜環境,路徑規劃算法需要具備適應性,能夠根據實時環境信息進行路徑更新和調整。
(2)動態障礙物
機器人在巡查過程中可能會遇到動態障礙物,如行人、車輛等。這些障礙物的位置和狀態可能隨時間變化,這對路徑規劃提出了更高的要求。傳統的路徑規劃算法往往沒有考慮到動態障礙物的影響,導致生成的路徑可能不是最優或甚至不可通過。因此,在面對動態障礙物時,路徑規劃算法需要考慮到實時感知和預測障礙物的能力,以便及時更新路徑來避免碰撞。
(3)實時性要求
對于巡查機器人而言,滿足實時性要求是一個重要的挑戰。機器人通常需要在實時環境中執行任務,而路徑規劃是決定機器人下一步行動的關鍵。因此,路徑規劃算法需要具備高效的計算能力和較短的響應時間,以適應機器人快速移動和環境快速變化的情況。傳統的路徑規劃算法可能需要長時間進行計算,導致機器人短時間內無法做出及時的響應。因此,實時性要求對路徑規劃算法的設計和優化提出了更高的標準。
3 巡查機器人智能路徑規劃方法
隨著機器算力的發展和人工智能的盛行,學者們將人工智能技術與路徑規劃結合,提出了基于人工智能的路徑規劃算法。這些算法主要分為基于強化學習和基于神經網絡兩類。
基于強化學習的算法通過與環境進行交互迭代,獲取反饋信息并優化策略,無需預知環境先驗知識。根據求解方法的不同,基于強化學習的算法可分為值函數法、直接策略搜索法以及值和策略相結合的方法。針對Q-learning算法收斂速度慢的問題,學者們提出了一些改進方法,如部分引導Q-learning[21]和高效Q學習算法[22]。這些算法通過改進初始化和選擇策略等方式,提高了收斂速度和效率。
基于強化學習的算法在路徑規劃中的應用存在一些限制,例如需要逐步迭代以獲取反饋信息,對于大地圖或高迭代次數其效率和準確度可能受到影響。因此,一些學者開始將目光轉向通過深度神經網絡來改進路徑規劃問題。深度神經網絡與基于強化學習的算法結合時可以通過近似值函數或策略函數來提高效率和準確度,進而充分利用神經網絡的高擬合能力和非線性表達能力。這種基于深度神經網絡的路徑規劃方法有望克服傳統強化學習的局限性,為機器人路徑規劃提供更好的解決方案。
神經網絡的學習能力和魯棒性使得其與其他算法的結合成為路徑規劃領域的研究熱點。一些研究探索了將遺傳算法與人工神經網絡相結合的方法,該方法利用遺傳算法進行優化,通過神經網絡來評估和指導路徑規劃。另外一種方法是將人工勢場和神經網絡結合起來,通過神經網絡來調整人工勢場的參數,實現更靈活的路徑規劃。還有一些研究將模糊邏輯與人工神經網絡相結合,利用模糊邏輯來處理不確定性,并通過神經網絡進行決策和路徑規劃。文獻[23]提出了一種結合快速探索隨機樹(RRT)和長短期記憶(LSTM)網絡的路徑規劃方法,通過RRT生成路徑數據集并利用卷積自編碼器和LSTM網絡進行訓練,克服了傳統路徑規劃方法存在的困難,證明了神經網絡在路徑規劃中的可行性。文獻[24]提出了一種基于卷積神經網絡(CNN)的新型最優路徑規劃算法,稱為神經RRT*(NRRT*),該方法利用卷積神經網絡進行非均勻采樣分布的訓練,實現了基于卷積神經網絡的路徑規劃。另外,文獻[25]提出了一種基于門控循環單元-循環神經網絡的動態路徑規劃方法,通過該網絡生成新的控制策略以指導機器人的運動,并避開障礙物。盡管目前已經有學者對神經網絡路徑規劃進行了研究,但可用于神經網絡訓練的數據集仍相對不足,基于神經網絡的路徑規劃算法仍存在很大的研究空白。未來的研究可以重點關注如何將路徑規劃問題轉化為神經網絡的預測問題,并進一步探索更有效和可拓展的方法來提高神經網絡在路徑規劃中的性能。
4 結 語
巡查機器人路徑規劃是一項關鍵的技術,它在保障領域安全、提高效率和減少人力資源消耗等方面發揮著重要作用。巡查機器人路徑規劃有著廣闊的發展前景。
巡查機器人路徑規劃將趨向更智能化和自主化。隨著深度學習和人工智能的不斷發展,機器人能夠通過學習和理解環境,快速而準確地規劃出最優路徑。機器人可以借助大量數據和模式識別技術,實時感知環境信息,并根據任務要求和約束條件生成智能路徑。這將使機器人在各種復雜環境中能夠更加靈活和高效地執行巡查任務。
另外,巡查機器人路徑規劃將更加注重多智能體協作和混合導航技術。多個巡查機器人之間的協同工作可以提高巡查的效率、擴大覆蓋范圍。通過共享信息和任務分配,多智能體可以相互合作,形成協同行動的路徑規劃策略。此外,混合導航技術將結合定位系統、激光雷達、視覺傳感器等多種導航技術,以確保機器人在各種環境中都能夠實現精確定位和規劃路徑。
隨著巡查機器人應用場景的延伸,路徑規劃將更加多樣化和個性化。不同場景下的巡查任務可能具有特定的約束條件和需求,如避免人群擁擠、優化能耗、規避動態障礙物等。未來的巡查機器人路徑規劃將根據不同場景的特點和任務目標,進行高度個性化的路徑生成。通過集成機器學習和優化算法,機器人能夠快速學習和適應新環境,為不同場景下的路徑規劃提供解決方案。
參考文獻
[1] ZHAO H,NIE Z,ZHOU F,et al. A compound path planning algorithm for mobile robots [C]// 2021 IEEE International Conference on Power Electronics,Computer Applications (ICPECA).Shenyang:IEEE,2021.
[2] ZHANG J,WU J,SHEN X,et al. Autonomous land vehicle path planning algorithm based on improved heuristic function of A-Star
[J/OL]. International journal of advanced robotic systems,2021,1(85):[2022-08-20]. https://doi.org/10.1177/17298814211042730.
[3] TANG G,TANG C,CLARAMUNT C,et al. Geometric A-star algorithm:an improved A-star algorithm for AGV path planning in a port environment [J]. IEEE access,2021,9:59196-59210.
[4] THRUN S,MONTEMERLO M,ARON A,et al. FastSLAM:a factored solution to the simultaneous localization and mapping problem [C]// Proceedings of the Eighteenth International Joint Conference on Artificial Intelligence(IJCAI-03). Edmonton,Alberta,Canada:American Association for Artificial Intelligence,2002:593-598.
[5] KARAMAN S,WALRAND J,FRAZZOLI E. Incremental sampling-based algorithms for optimal motion planning [C]// Proceedings of the IEEE International Conference on Robotics and Automation(ICRA). [S.l.]:IEEE,2010:1720-1725.
[6] PUBUDU C S,PATHIRANA P N. Self-adaptive weighted A*-based path planning using cost maps for mobile robots [C]// Proceedings of the 12th International Conference on Robotics,Vision,Signal Processing amp; Power Applications (ROVISP2022). [S.l.]:[s.n.],2022:1-6.
[7] WANG Y,YANG C,ZHOU D. A machine learning-based cost map generation method for mobile robot path planning [J]. IEEE access,2022,10:55508-55519.
[8] AL-DAHHAN M R H,SCHMIDT K W. Voronoi boundary visibility for efficient path planning [J]. IEEE access,2020,8:134764-134781.
[9] CHI W Z,DING Z Y,WANG J K,et al. A generalized Voronoi diagram-based efficient heuristic path planning method for RRTs in mobile robots [J]. IEEE transactions on industrial electronics,2022,69(5):4926-4937.
[10] KARAMAN S,FRAZZOLI E. Sampling-based algorithms for optimal motion planning [J]. International journal of robotics research,2011,30(7):846-894.
[11] FERGUSON D,STENTZ A. Anytime RRBT:an anytime algorithm for optimal kinodynamic planning [C]// Proceedings of the IEEE International Conference on Robotics and Automation(ICRA). [S.l.]:[s.n.],2006:536-543.
[12] SARANRITTICHAI P,NIPARNAN N,SUDSANG A. Robust local obstacle avoidance for mobile robot based on dynamic window approach [C]// 2013 10th International Conference on Electrical Engineering/Electronics,Computer,Telecommunications and Information Technology. Krabi,Thailand:IEEE,2013.
[13] PABLO I B,FERNANDO D R,DIAZ S V,et a1.The shared control dynamic Window approach for non-holonomic semi-autonomous robots [C]// ISR/Robotik 2014; 41st International Symposium on Robotics. Munich,Germany:IEEE,2014.
[14] KASURINEN J,MALINEN M,LYGEROS J. Probabilistic model predictive control for path planning in noisy and uncertain environments [C]// 2015 American Control Conference(ACC). [S.l.]:IEEE,2015:2195-2200.
[15] CECCARELLI A,PETRESCU F,JOHANSSON K H. Reinforcement learning and deep learning enhanced model predictive control for precise and robust path tracking [J]. IEEE transactions on intelligent transportation systems,2016,17(3):
648-659.
[16]張航,劉建華,余靜玉,等. 基于代價地圖和模型預測控制的移動機器人路徑規劃研究[J]. 自動化技術與應用,2015,36(5):11-16.
[17] LI X,DONG T,LIU J,et al. Fuzzy logic control for trajectory tracking of mobile robots considering robot dynamic characteristics and environmental constraints [J]. Sensors,2018,18(10):3375.
[18] WANG Y,HU X,LI Z,et al. Adaptive backstepping control for trajectory tracking of a quadrotor UAV considering actuator dynamics and parameter uncertainties [J]. Aerospace science and technology,2019,87:246-259.
[19] ZHANG C,PATIL D P,VONDRICK C. Help,Anna! Autonomous navigation with episodic memory [C]// Proceedings of the IEEE International Conference on Computer Vision. [S.l.]:IEEE,2019:8617-8626.
[20] YAMAUCHI B,PAPADIMITRIOU C. A potential field approach to path planning [C]// Proceedings of the IEEE/RSJ International Conference on Intelligent Robots and Systems. [S.l.]:IEEE,2016:178-185.
[21]王付宇,張康,謝昊軒,等.基于改進Q-learning算法的移動機器人路徑優化[J].系統工程,2022,40(4):100-109.
[22]周治國,余思雨,于家寶,等.面向無人艇的T-DQN智能避障算法研究[J].自動化學報,2023,49(8):1645-1655.
[23] INOUE M,YAMASHITA T,NISHIDA T. Robot path planning by LSTM network under changing environment [C]// International Conference on Computational Sciences,Advanced Database and Computing. Phuket,Thailand:[s.n.],2019:317-329.
[24] WANG J,CHI W,LI C,et al. Neural RRT*:learning-based optimal path planning [J]. IEEE transactions on automation science and engineering,2020,17(4):1748-1758.
[25] YUAN J,WANG H,LIN C,et al. A novel GRU-RNN network model for dynamic path planning of mobile robot [J]. IEEE access,2019,7:15140-15151.
收稿日期:2023-09-16 修回日期:2023-10-17
基金項目:山東省船舶控制工程與智能系統工程技術研究中心項目(SSCC20210004);威海市海洋智能裝備與系統工程研究項目(WOIE202110002)
作者簡介:孫婷婷(1987—),女,碩士,副教授,研究方向為智能控制技術。