顏明重,黃冰逸,朱大奇
(上海海事大學 a.水下機器人與智能系統實驗室;b.信息工程學院,上海 201306)
基于神經動力學的水下目標觀測路徑規劃
顏明重a,黃冰逸b,朱大奇a
(上海海事大學 a.水下機器人與智能系統實驗室;b.信息工程學院,上海 201306)
針對水下工程應用中的自治水下機器人目標觀測的路徑需求問題,提出基于生物啟發神經動力學的路徑規劃方法,在二維柵格地圖的基礎上,建立二維生物啟發神經網絡模型,引入來自目標觀測任務區域的激勵信號和障礙物的抑制信號,任務區域能夠全局地吸引機器人,障礙物對機器人具有局部排斥作用,從而使得機器人能夠近距離觀測目標。仿真結果表明,在未知的動態水下環境中,機器人能夠有效規避障礙物,自主規劃出目標觀測路徑和返航路徑。
海洋工程;路徑規劃;生物啟發神經動力學;水下機器人
自治水下機器人(autonomous underwater vehicle, AUV)以自主的管理和控制方式來執行水下任務,具有長航程和大范圍活動的優點,主要應用于海洋資源勘探、海洋科學調查和軍事海防等。路徑規劃是AUV自主完成任務所需的關鍵技術之一。AUV的航行路徑與其任務密切相關,最常見的路徑規劃是從起點到目標位置的一條無碰路徑,這類路徑規劃常用于AUV的布放和回收,已經有了較廣泛和深入的研究[1-4]。另一種路徑規劃是對目標區域的全覆蓋探測,這種路徑規劃要求AUV對局部區域進行無遺漏的訪問,主要用于搜尋和發現水下相關目標,或者用于探測水下目標區域的某些信息,比如地形地貌等[5-6]。隨著應用領域的不斷拓寬,AUV所承擔的任務更加多樣,其航行路徑也越發復雜,比如AUV在執行水下結構體的表面檢查[7]、水下管線跟蹤排查[8]以及海底火山觀測[9]等任務時,其路徑必須近距離環繞各種不規則目標物的表面。針對這種路徑的規劃,一般是根據具體的任務采取離線規劃的方法,在普遍適用性和實時應對未知狀況方面仍然需要進一步改善。
為此,提出一種普遍適用、能夠應對未知環境的在線動態路徑規劃方法,旨在滿足AUV執行水下目標物觀測任務時的路徑需求。AUV的路徑規劃模型采用基于生物啟發神經動力學(bio-inspired neurodynamics)的二維神經網絡來表示,神經網絡的激勵輸入來自于任務線路(區域),抑制輸入來自于障礙物。AUV根據神經網絡的動態輸出(神經元活性值)在線規劃出符合任務需求的路徑,當AUV完成目標觀測任務后,也能自動規劃出返航路徑。
1.1 模型基本原理
以二維柵格地圖表示AUV的工作環境,每個柵格的狀態為“Free”或“Occupied”,分別表示自由空間和障礙物,如圖1a)所示。對于AUV所要觀測的目標物,由于AUV不能與之相碰撞,因此地圖上相應柵格的狀態視同障礙物,也標記為“Occupied”。在柵格地圖的基礎上,建立基于生物啟發神經動力學的二維神經網絡模型。網絡中的神經元與地圖柵格一一對應,神經元之間的連接與柵格的連通相對應,如圖1b)所示。
在神經網絡中,設計神經元的外部輸入信號如下。
(1)
式中:Ik為神經網絡中第k個神經元的外部輸入;E為正常數。
地圖中的目標物或障礙物標記為“occupied”,神經網絡中相應位置的神經元引入外部抑制信號-E;在AUV執行水下觀測任務中,目標物的邊緣是AUV必須訪問的區域(稱為任務區域),在該區域的神經元引入外部激勵E;地圖中其他區域為自由空間,相應位置的神經元外部輸入為0。
神經網絡中,每個神經元活性值的變化規律由生物啟發神經動力學方程來表示[10]:
(2)

(3)
1.2 模型特性分析

圖2a)所示為一張20×20大小的柵格地圖,右下角為障礙物,左上角是目標物。根據該地圖,建立神經網絡模型,得到神經網絡的活性分布如圖2b)所示。任務區域的神經元由于激勵信號的作用,呈現較大的正活性,并且向相鄰的神經元傳遞,整個網絡的正活性分布呈現出任務區域處最高、越遠離任務區域越低的特征。障礙物區域的神經元由于抑制信號的作用而始終表現為負活性,在神經網絡活性分布圖中位于低谷處。
2.1 路徑規劃流程
在執行水下目標物觀測的任務時,AUV的目標觀測路線(任務路徑)與目標物的外形有關。在完成觀測任務后,還要求AUV能夠自動返航,以確保安全回收,見圖3。由此可知,AUV的路徑規劃必須具備避開障礙物、沿著任務路線航行和返航等3個功能。
為規劃AUV的任務路徑,制定如圖4所示的路徑規劃流程。AUV首先從任務模塊接受目標觀測任務,接下來判斷是否突發緊急事件,比如硬件故障、系統運行錯誤或者電源不足等。如果AUV突發事故,則啟動任務重規劃,進入返航路徑規劃。如果AUV工作正常,則啟動任務路徑規劃,并調用避碰規劃模塊來協助任務直至完成,最后進入返航規劃。AUV執行返航任務時,同樣調用避碰規劃模塊來協助返航。
2.2 任務路徑規劃
AUV的水下工作環境用離散的二維柵格地圖表示,地圖柵格與神經網絡中的神經元在空間位置上呈現對應關系。任務路徑規劃以神經元的活性大小來確定,具體算法見圖5。
AUV路徑下一步選擇規則定義為[7]
(4)
這種策略是從AUV當前位置的鄰域中找出神經元活性值最大的位置,作為路徑的下一步。
如果AUV完成當前任務,則根據式(4)找出下一步路徑,將當前神經元的外部輸入置零,AUV進入下一步位置,繼續探測環境、更新地圖和神經網絡。當AUV完成觀測任務,則進入返航規劃。式(4)保證了AUV始終趨向任務區域(最大正活性)而遠離障礙物(負活性)。從神經網絡活性值的空間分布來看,AUV是沿著神經網活性最大梯度的方向“往上爬”,障礙物處于低谷,必然不會成為AUV的路徑選擇,由此AUV能夠自動避障。
2.3 返航路徑規劃
AUV與水面不具有物理連接且自帶能源有限,因此路徑規劃不僅要考慮任務的執行,還必須考慮返航,以確保設備安全回收。在AUV完成目標觀測任務后,或者遇到突發緊急情況,AUV獲得返航指令,開啟返航路徑規劃,步驟如下。
1)接受返航指令,確定回收點的位置。
2)神經元的外部激勵置零(任務未完成時)。
3)在回收位置處的神經元輸入激勵信號。
4)更新神經網絡。
5)由式(4)確定返航路徑。
6)重復執行步驟4)和5),直至AUV到達回收點。
3.1 靜態已知環境下的路徑規劃
設AUV的水下工作環境以20×20的二維柵格地圖來表示(如圖6a)所示),環境中的障礙物與目標物信息為已知,AUV起始位置是(1,1),設定返航點在(1,20)。AUV的任務是從起點出發,執行近距離環繞目標物的觀測任務,完成任務后返航至回收位置(1,20)。圖6a)顯示了AUV的工作環境地圖,圖6b)顯示障礙物及目標物所占據區域的神經元活性為負,任務區域的神經元活性則處于最高位。AUV按“往高處爬”的策略,從起點出發,自動避開障礙物,逐漸接近任務區域。圖7顯示了AUV完成目標觀測并實現返航的路徑效果。當AUV完成目標觀測后,任務區域神經元的外部激勵消失,活性值下降,如圖7b)所示。
3.2 動態環境中的路徑規劃
水下環境往往復雜且不確定,難以預料的動態障礙物可能會影響水下機器人的正常作業任務。因此,AUV必須考慮對動態障礙物進行實時規避。基于生物啟發神經動力學的神經網絡是一個動態變化的系統,能夠根據地圖信息實時更新,從而指導AUV實時規劃路徑和避障。
圖8所示的地圖中,1為動態障礙物,2和3為靜態障礙物。AUV從起點位置(1,1)出發,航行至(4,8),障礙物1由右至左移動到其正前方(占據了(3,9)(4,9)及(5,9)),正好攔住其前進路徑,如圖8a)所示。此時神經網絡隨地圖信息的變化實時更新,動態障礙物區域的神經元活性變為負值。按路徑選擇策略,AUV立刻避開該障礙區域,右拐到達(5,8),接著繼續向(6,8)和(7,9)航行,逐漸接近目標區域,安全避開了障礙物,如圖8b)所示。
3.3 未知環境中的路徑規劃
在未知的水下環境中,目標物及障礙物的位置和形狀是由AUV的相關傳感器探測所得,局部的目標物和障礙物的信息,同樣能支持AUV實現目標觀測及返航的局部路徑規劃。
水下環境地圖的初始狀態首先設置為“Free”,神經網絡中的所有神經元初始激勵和抑制輸入均設為0,AUV隨機尋找下一步路徑。當AUV的傳感器探測到局部的目標或者障礙物時,柵格地圖的局部信息和神經網絡的局部輸入同步更新,AUV開始按式(4)規劃路徑。圖9顯示了AUV從起始位置(1,1)出發,當前航行至(6,4)的路徑效果。圖9a)可見地圖更新了在傳感器有限的探測范圍內的部分目標物信息,圖9b)顯示被探測到的局部目標物在神經網絡中的活性值處于低谷,而任務區域的神經元活性值處于高位。隨著地圖信息與神經網絡的實時更新,AUV沿著任務區域,不斷向前航行,在目標物邊緣形成一條觀測線路,直至任務完成。當AUV完成觀測任務,最終到達(2,4)位置,此時任務區域的激勵全部消失,神經元的正活性值逐漸衰減歸零,見圖10。
本文提出了基于生物啟發神經動力學的神經網絡模型,用于解決AUV觀測水下目標的路徑問題。該神經網絡具有無需樣本數據訓練和學習的優點,其抑制輸入的局部停留和激勵輸入的全局傳播特性,使得AUV能夠有效避開動態障礙物,實時規劃出滿足任務需求的路徑。未來的研究工作可將該神經網絡模型拓展到三維,以解決水下空間中的三維路徑規劃問題。
[1] LIU C, FAN S, LI B, et al. Path planning for autonomous underwater vehicle docking in stationary obstacle environment[C]. Proceedings of OCEANS, Shanghai,2016.
[2] HERNANDEZ J D, VIDAL E, VALLICROSA G, et al. Online path planning for autonomous underwater vehicles in unknown environments[C]. IEEE Conference on Robotics and Automation,2015.
[3] 李曄,姜言清,張國成,等.考慮幾何約束的AUV回收路徑規劃[J].機器人,2015,37(4):478-485.
[4] 溫志文,蔡衛軍,楊春武.基于改進蟻群算法的UUV三維路徑規劃方法[J].魚雷技術,2016,24(2):120-125.
[5] URA T, KURIMOTO Y, KONDO H, et al. Observation behavior of an AUV for ship wreck investigation[C].Proceedings of MTS/IEEE OCEANS,2005:2686-2691.
[6] 顏明重,鄧志剛,申雄,等.小型水下機器人在復雜水下地形中的目標搜尋應用[J].船海工程,2012,41(2):174-177.
[7] MAKI T, URA T, SAKAMAKI T. Map based path-planning and guidance scheme of an AUV for inspection of artificial structures[C].Proceedings of MTS/IEEE OCEANS,2009:1-7.
[8] BAGNITSKY A, INZARTSEV A, PAVIN A, et al. Side scan sonar using for underwater cables & pipelines tracking by means of AUV[C].IEEE Symposium on and Workshop on Scientific Use of Submarine Cables and Related Technologies,2011:1-10.
[9] ANDONIAN M, CHYBA M, GRAMMATICO S, et al. Using geometric control to design trajectories for an AUV to map and sample the summit of the Loihi submarine volcano[C]. IEEE/OES Autonomous Underwater Vehicles,2010:191-200.
[10] LUO C M, YANG S X. A bioinspired neural network for real-time concurrent map building and complete coverage robot navigation in unknown environments[J]. IEEE transactions on neural networks,2008,19(7):1 279-1 298.
A Novel Path Planning Algorithm Based on Neurodynamics for Observation of Underwater Structures
YAN Ming-zhonga, HUANG Bing-yib, ZHU Da-qia
(a.Laboratory of Underwater Vehicles and Intelligent Systems; b.School of Information Engineering,Shanghai Maritime University, Shanghai 200015, China)
A novel path planning based on bio-inspired neurodynamics for autonomous underwater vehicles (AUVs) to carry out observation of underwater structures at close range was proposed. The model was topologically expressed in a 2D neural network based on a 2D grid map. In the model, the excitatory and inhibitory inputs to the neurons in the network were generated from the target surroundings of underwater structures and obstacles respectively. Obstacles locally push the AUVs away by negative neural activity in the network, while the AUV was globally attracted through the positive neural activity to reach the target near surroundings of the objects. The AUV choosed its path from the dynamically changing activity landscape of the neural network to continue its observation mission. The simulation results showed that the proposed path planning is effective for AUVs to implement close-range observations of underwater structures with obstacle avoidance in an unknown dynamic underwater environment, and it also can plan the path of the return voyage when missions are completed.
ocean engineering; path planning; bio-inspired neurodynamics; autonomous underwater vehicle
10.3963/j.issn.1671-7953.2017.02.024
2016-08-31
國家自然科學基金(51575336)
顏明重(1977—),男,博士,講師
TP183;TP249
A
1671-7953(2017)02-0103-06
修回日期:2016-09-21
研究方向:水下機器人路徑規劃與水下視覺技術