姜登耀 苑明哲 劉繼海 段 勇
(1.沈陽工業大學信息科學與工程學院 沈陽 110870)(2.廣州工業智能研究院 廣州 510000)(3.廣州工業智能研究院院士專家工作站 廣州 510000)
無人艇(Unmanned Surface Vehicle,USV)是一種具有環境感知、自主航行能力,并能夠自主完成相應任務的小型海上平臺。因其具有可執行更長時間、更危險的任務,維護成本低、人員安全性高,重量輕、體積小,機動性和可部署性強等優勢,近年來被廣泛的應用于海上科學考察、海上搜救和水質監測等領域。根據賽迪顧問的研究顯示,2018年、2019年及2020年我國民用無人艇市場規模分別為1.3億元、2.0億元和3.3億元。預計至2023年,我國民用無人艇市場規模約為32.2億元,市場前景廣闊。
由于USV所處的任務環境十分復雜,不僅包含靜態障礙物,同時受海面浪流、其他動態障礙物的影響,避碰成為影響USV自主航行的關鍵技術因素。其已經成為業界的主要研究熱點之一,但大多數綜述論文尚未對USV避碰技術進行系統性的介紹,因此有必要對USV避碰技術的不同部分進行系統的論述,將不同部分之間建立聯系,分析現有技術的優劣,以推動理論向實際應用的轉換。文章將從USV環境感知、路徑規劃和航向控制三個部分對所采用的算法和方法進行歸納總結,并對USV避碰技術未來發展方向提出展望。
環境感知能力是USV實現避碰、自主執行任務的前提和基礎。USV的環境感知方式主要包括主動式感知、被動式感知和融合式感知三種。主動式感知是傳感器主動向外界發送探測信號并接收返回信號進行感知的方式,其主要包括毫米波雷達感知技術[1~3]、激光雷達感知技術[4~6];被動式感知是通過傳感器被動接收外界信號進行感知的方式,其主要包括視覺相機感知技術[7~12]和全景視覺感知技術[13~16]等;信息融合感知技術[17~20]是利用多個傳感器獲取的關于對象和環境全面、完整信息,并在一定的準則下加以自動分析和綜合,從而產生對觀測對象的一致性認知和決策的信息處理過程。它能夠綜合利用多傳感器信息源的不同特點,多方位地獲得相關事物的信息,增強數據可信度,提高感知的可靠性和精度,是當前研究熱點。
2.1.1 毫米波雷達感知技術
毫米波雷達是工作在毫米波(30GHz~300GHz頻域、波長為1mm~10mm)波段的雷達。其具有探測范圍廣、穿透能力強、體積小等特點。由于海上目標數量多以及障礙物散射強度不同將會受到噪聲的干擾容易造成虛警。針對此問題李瑞偉[1]等提出一種基于歐氏距離的點跡凝聚方法,解決了對于雷達數據存在無效點跡而產生的目標點分裂和虛警問題。Cao Lin[2]等提出了一種無需聯合校準即可識別海洋障礙物和毫米波雷達傳感器信息的方法,用來檢測和識別海洋障礙物目標。該方法提取目標作為特征向量的位置和速度,并設計匹配評估函數,從兩個傳感器的數據信息中找到最佳匹配,提升了海洋障礙物目標識別效率。針對毫米波雷達的目標缺失現象,Zhai G[3]提出了一種基于自適應Sage-Husa卡爾曼濾波的目標跟蹤算法,驗證了算法估計的目標信息的準確性。毫米波雷達還具有目標本身的多樣性和障礙物的散射強度不同,雷達會受到噪聲的干擾的缺點。
2.1.2 激光雷達感知技術
激光雷達是以激光作為載波,激光是光波波段電磁輻射。其具有更好的分辨率和靈敏度,探測精度高等特點[4]。Wang S[5]等提出了一種基于船載激光雷達點云數據(PCD)的船舶與海岸線識別方法。對內河目標回波數據和噪聲進行了分析和濾波,基于這三個魯棒目標特征(相對長度、縱橫比、點云的規模),采用K-Nearest Neighbors(KNN)分類方法對障礙物進行識別。但是對于移動的船只上非常明顯的特征比如直線的長度,此方法效果較差。針對此問題,王肖[6]等對于動態目標感知進行了研究,考慮目標點云分布特性的狀態觀測及跟蹤方法。采用了動態參考點、分塊聚類等方法進行建模。并且在多目標的跟蹤中提出決策樹-跟蹤門解決了復雜環境的關聯模糊性,提升了動態目標的檢測效率。激光雷達還具有受到天氣因素影響大,不能在雪雨等極端天氣下工作的缺點。
2.2.1 視覺相機感知技術
視覺相機是通過鏡頭投影到傳感器的圖像傳送到能夠儲存、分析的設備上。其具有重量輕、功耗低、信息豐富等特點。在針對障礙物的檢測方面。Han Wang[8]通過使用單眼和立體視覺方法,在航速達12節的高速USV中實現了檢測和定位30m~100m范圍內的多個障礙物的能力。隨后其又對此方法進行了改進[9],融合了岸基障礙物探測設備,實現了對障礙物30m~300m障礙物的探測,但探測距離上還是不足以在實踐中應用。為此該團隊[10]提出了一種檢測高清圖像(2736×2192)由粗到精的方法,實現實時500m內的成功目標跟蹤范圍。但是目前只考慮了單個目標的檢測,未來可以將此方法應用到多目標檢測中。
在針對水面環境檢測方面。梁秀梅[11]等使用改進的mean-shift的自適應圖像分割算法、特征提取方法與目標圖像識別技術。建立了海上障礙物和船只圖像數據庫,考慮了不同天氣下對圖像的影響,使用BP神經網絡算法對其進訓練,對障礙物和船只圖片的識別率的目標達到了89.67%。但是效率較低,精確度差。張伊輝[12]等針對水面復雜環境不斷變化的問題,在目標圖像識別的預處理過程進行了濾波和直方圖增強。處理后的圖像進行自適應Otsu方法的目標分割和目標特征提取。利用獲得的特征對LVQ神經網絡進行USV視覺圖像目標識別的訓練和測試,對目標的識別率達到了94.44%。相比于前述方法提高了準確度。Feng T[7]等使用視覺相機對海天線水岸線進行檢測,提出了一種適用于不同環境的魯棒形態河岸線方法,可以在復雜的環境下提升檢測的效率。視覺相機還具有光學圖像中的海洋目標容易受到天氣因素的影響,魯棒性較差的缺點。
2.2.2 全景視覺感知技術
全景視覺是通過在設備周圍安裝的攝像頭來獲取設備周圍的圖像,從而提供更多的視覺信息[13]。其具有較大水平視場的多方向成像系統,能夠獲取豐富的環境信息,具有常規視覺相機無法比擬的優勢,但目前在USV上應用較少。尹義松[14]通過全景視覺圖像對利用海天線邊緣梯度信息對附近的小目標進行了識別,可以在海霧、陽光直射等天氣下對小目標進行檢測。馮閃閃[15]等研究了魚眼攝像頭的成像模型,通過三維全景圖像拼接、融合等技術,建立三維全景視覺輔助系統,有效的識別出障礙物并實施避碰。隨著算力性能的提升和算法的優化,全景視覺系統趨向于更高的圖像分辨率、更高的靈敏度、更好的實時性。未來以旋轉式、多相機拼接式為代表的高精度全景視覺系統有望在USV航行障礙物檢測與識別領域得到應用[16]。全景視覺同樣還具有目標容易受到環境多種因素的影響,可見光圖像的特征提取困難的缺點。
信息融合感知技術是對多個傳感器的信息進行關聯、相關和綜合處理。其具有強魯棒性、高準確性和高空間分辨力等特點。王亞麗[17]等使用毫米波雷達對捕獲前方目標的距離、速度和加速度的信息,將信息傳給攝像頭建立感興趣區域。使用Adaboost方法完成目標的識別,實現了毫米波雷達與機器視覺獲取數據在空間和時間上的融合。但是未考慮到在夜間光線不足時的情況。針對此問題的目標識別方法,程蕾[18]等利用毫米波雷達和相機進行了進一步的研究。利用雷達初步獲取有效信號,排除干擾信號,使用相機進一步檢測目標的尾燈信息,再將信息融合對行進的目標進行檢測。許大光[19]等將毫米波雷達應用于無人艇目標檢測,使用經典卡爾曼濾波實現對目標的跟蹤,結合YOLO神經網絡達成對目標識別的功能。最后采用了信息融合方法,依據信息融合規則得到障礙物相關信息。Yuan J[20]等采用雷達和機器視覺融合來檢測目標,并設計了粒子濾波器來跟蹤目標。該方法采用樣本多樣性改進程序來解決樣本短缺問題,但跟蹤精度隨著粒子數量的增加而提高,計算量大。信息融合感知信息之間的關系和結構層次復雜,具有不同傳感器受到噪聲影響容易產生虛警,信息的高維度和大尺度導致計算量龐大的缺點。總地來說信息融合技術是目前環境感知技術的趨勢,因此針對信息融合的不足提出一些改進方向:
1)對信息融合系統進行系統性建模綜合集成,并整體優化。
2)利用算法冗余來降低不確定性[21]。
3)對算法進行優化和數據降維處理,提高信息融合的效率。
針對全景視覺、毫米波雷達、激光雷達技術以及信息融合的優缺點如表1所示。

表1 各感知技術的比較
局部避碰規劃是基于已知環境感知信息實時規劃出一條滿足USV動力學約束的無碰撞路徑。在USV航行的過程中,傳感器實時采集的信息和通信系統實時告知艇體附近的障礙物、船舶和突發信息,使得USV在保證能完成原任務的同時駛離原路徑進行合理規避[22]。常見的局部規劃算法有人工勢場法、蟻群算法、細菌覓食優化、人工神經網絡算法等。
人工勢場法(APF)是智能體在環境中運動,其與目標點之間產生引力,與障礙物之間產生斥力,最后通過合力來控制智能體運動。其具有計算簡單、效率高的特點。Xie S[23]等提出了一種改進的避障算法,修正了引力場函數。在改進型APF中,USV能夠繞過目標周圍的障礙物成功到達終點,只花費了和原算法近似相同的時間,但其不是最優解。APF還存在障礙物復雜環境下陷入局部最優的缺點。
粒子群優化(PSO)算法即源于對鳥群捕食行為的研究,一群鳥隨機搜尋食物,若此區域里只有一塊食物,找到食物的最簡單有效的策略就是搜尋目前距離食物最近的鳥的周圍區域[24]。其具有簡單有效的達到收斂區域。但是PSO存在著精度較低,容易陷入局部極小點的缺點。針對此問題Xia G[25]利用量子力學提出了改進的量子PSO,不僅收斂速度相比原算法更快,而且有效地避免了陷入局部最優的狀態,但是存在著精度較低的缺點。
蟻群算法(ACO)來源于螞蟻在尋找食物過程中發現路徑的行為。其具有過程直觀、求解思路簡單的優點。Liu X[26]基于ACA和聚類算法(CA),針對USV的動態避障和路徑規劃問題,構建了一種適用于復雜海洋環境的自動避障方法?;贏CO和CA兩種智能算法的動態路徑規劃和避障算法,具有收斂時間短、計算負載均衡、綜合性能指標好的特點。但ACO還存在穩定性差,求解函數困難的缺點。
細菌覓食優化算法(BFO)是受細菌的覓食行為啟發而提出的算法,將每個細菌看作帶求解問題的可行解,通過細菌的趨向、聚集、繁殖和遷徙的四種行為完成最優解的搜索。其具有簡單、所需經驗少的優點。但有仍易于陷入局部最優的問題,針對此問題,龍洋[27]等將模擬退火算法的機制引入到細BFO中,計算更新前后的遷移個體的適值度,接受優化解的同時以一定概率接受劣解,使得BFO能夠較好地跳出局部最優。但BFO還存在著單個細菌個體之間的信息交流不足和搜索步長的固定影響著算法的收斂速度,不滿足在復雜環境下USV避碰實時性的缺點。
人工神經網絡(ANN)是對人腦神經元網絡進行抽象并建立模型,按不同的連接方式組成不同的網絡。其具有尋得最優解的能力,模型建立簡單的特點。其被廣泛并成功地應用于各種機器人問題。如機器人在導航任務中選擇一個具有連續值的轉向角,神經網絡機器人控制器會盡量在導航任務中像生物一樣[28],然而USV的運動規劃不僅僅是避免碰撞和到達目標點,其運動穩定性高也是成功執行任務的關鍵。USV運動的穩定性是一個在大多數相關工作中被忽略的關鍵屬性,其要求USV的轉向角盡可能為合理值,以免轉向角在運動過程中突然大角度改變。Shamsfakhr F[29]等使用ANN的反向傳播算法使得其驗證的機器人在遇到拐角時也能進行穩定的運動。Woo J[30]提出了一種基于深度強化學習的USV避碰方法。該方法將COLREGs,對于不同的情況有不同的回避要求設計獎勵函數。適用于避碰決策階段,決定是否需要避碰,如需要,決定避碰行動的方向。但是未考慮到多船(艇)會遇和兩船(艇)通過協商繞開COLREGs進行避碰的情況。ANN還具有對模型的求解困難,需要強大的算力進行模型訓練的缺點。
針對局部避碰規劃算法的優缺點以及改進方法如表2所示。

表2 局部路徑規劃算法的優缺點以及改進策略
在USV完成避碰的局部路徑規劃后需要交由航向控制系統實施避碰,其是USV避碰的關鍵。航向控制是根據航向偏差求解目標力矩,是一個時變、非線性、多擾動的復雜系統,其可以使得USV能夠在航線上出現障礙物時快速準確改變航向來確保安全航行。目前常見的航向控制算法主要有PID 算法[31~32]、滑模控制[33~35]、模型預測控制[36~37]和模糊控制[38~39]。
PID算法是一種經典的控制算法,只需調節KP、KI、KD的參數即可快速準確完成系統的控制。其具有工程實現方便、魯棒性強等特點[31]。使用PID控制航向要仔細調節控制參數才能達到最佳的控制效果,須事先測得USV所有水動力參數并將其輸入系統,難以建立精確的數學模型。Yunsheng F[32]提出了一種USV航向控制的模糊自適應PID控制算法,通過模糊推理實現PID航向控制參數在線整定,且此方法對參數變動和外部擾動具有良好的魯棒性。但PID算法還具有參數調節需要精細化的缺點。
滑模控制(SMC)是一類特殊的非線性控制,具有快速響應、對應參數變化及擾動不靈敏、無需系統在線辨識、物理實現簡單的特點。然而現有的控制器大多是基于線性動態模型設計,沒有很好地考慮非線性、各種不確定性。針對此問題Kim HyunWoo[33]研究提出了一種新的帶擾動和狀態觀測器的魯棒滑模控制方法,用于控制USV水射流系統的噴嘴角。在控制反饋回路中加入狀態觀測器和干擾觀測器以提高跟蹤性能可以實現對USV航向的良好控制,從而增加USV避碰的成功率。Chen Z[34]一種滑模控制器來跟蹤直線和其他形狀的任意期望軌跡,并利用飽和函數來避免抖振現象。與其它控制器相比,該控制器具有更快的響應速度、更好的暫態響應和魯棒性。Wang R[35]提出了一種基于積分反推SMC的USV航向徑向基函數(RBF)網絡控制算法,實現了轉向過程中船舶的準確、穩定的跟蹤。SMC還具有當狀態軌跡到達滑動模態面,難以嚴格沿著滑動模態面向平衡點滑動,產生抖振的缺點。
模型預測控制(MPC)是當前的控制動作是在每一個采樣瞬間通過求解一個有限時域開環最優控制問題而獲得。MPC能處理PID較難解決的多變量約束優化控制問題。為解決USV如何穩定地避障問題,王浩[37]等設計了一種基于準無限時域MPC的軌跡跟蹤控制器。雖然在仿真的條件下可以很快的收斂到期望的航跡,但是未考慮到各類干擾的情況。柳晨光[36]驗證了在相同的環境干擾和初始條件下,非線性模型預測控制(NMPC)的控制效果比線性模型預測控制(LMPC)的控制效果更好,得益于計算機計算速度的提升,對非線性的求解速率也得到提升。
模糊控制(FC)是一種使用模糊數學理論的控制方法。其具有比傳統的控制理論更強的控制能力,對于過于復雜的系統具有很好的適應力的特點。FC的核心是建立一個合適的模糊控制規則庫。在USV航行期間,障礙物的分布將影響船體的速度和航向[38]。但是FC精度不高,趙東明[39]等提出了一種應用模糊神經網絡算法的航向控制器設計方法。通過仿真此設計方法具有控制精度高和魯棒性好的特點。為了提高水面USV在未知、復雜環境下的連續避障性能,林政[38]等提出一種具有速度反饋的模糊避障算法,不僅考慮了所有障礙物的分布情況,設計了更為全面的模糊控制表,在保證USV避障性能的基礎上降低了USV控制系統的復雜度。FC還具有控制系統復雜度高,控制精度不高的缺點。
目前大部分USV的控制還是使用的傳統PID控制,雖然可快速準確完成系統的控制,但其魯棒性較差,在不同環境下需要進行大量的調參。未來可以嘗試不同的控制方法來對USV的控制系統進行控制。
針對PID、滑模控制、模糊控制以及模型預測控制的優劣做以下總結,如表3。

表3 航向控制技術優劣總結
本文從環境感知、局部路徑規劃和航向控制三個方面對USV避碰技術發展現狀進行了闡述,總結了近年來USV避碰技術領域取得的成果和不足,分析了各算法的特性及缺陷。由于USV工作環境的復雜性和未知性,需要不斷改進和完善現有的避碰技術,提升對未來的預測能力,加強系統的自主學習能力,使USV系統更具有前瞻性?;赨SV避碰技術的研究現狀,提出如下展望:
1)在環境識別方面,目前僅使用單種類型的傳感器進行采集數據所獲得的信息遠不足以支撐USV進行環境識別。未來應使用多傳感器信息融合方法對環境進行精確的建模,采用魯棒性強的算法對采集的相關信息進行識別。
2)在局部路徑規劃方面,雖然近十幾年來智能算法得到了極大的進步,但是在USV的避碰規劃方面應用大多還停留在理論或仿真階段。未來應在進行局部路徑規劃時將任務區的水文狀況特征考慮在內,這樣可以更貼近于真實的任務區狀態,從而提高路徑規劃算法在USV領域的實用性。
3)目前USV的避碰還未將編隊和避障問題相結合,暫未考慮衛星定位信號中斷或雷達、AIS設備失效的情況。一些文獻的研究僅限于在開闊水域和可見度良好的情況下,未考慮到風浪流對船航行的干擾。這些將會是未來研究的重點方向。