李 娟, 張秉健, 楊莉娟, 王蒙迪
(1. 哈爾濱工程大學水下機器人技術重點實驗室, 黑龍江 哈爾濱 150001; 2. 哈爾濱工程大學自動化學院, 黑龍江 哈爾濱 150001; 3. 江南造船(集團)有限責任公司, 上海 201913)
隨著現代科學技術的不斷發展,越來越多的國家利用自主水下航行器(autonomous underwater vehicles, AUV)系統來進行海洋開發和水下目標搜索[1-2],AUV已經成為許多國家海洋戰略研究中的重要技術領域。當AUV處于完全未知的區域中時,由于水下環境變化復雜,水下通信的信號微弱、環境噪聲對AUV的任務干擾性大等特點[3],要求AUV能夠利用對外界環境的感知[4],自主高效地實時規劃任務航線來對該區域實現目標搜索。在完全未知的水下環境中執行目標搜索任務時,還要求其能夠識別目標,并通過觀測獲取目標特征信息。近年來,傳統方法以搜索論為基礎,實現水下梳子型掃描,或者預先離線設計覆蓋任務區域的多AUV搜索航跡[5-7]。在未知環境中,目標的環境信息未知,無法進行預先規劃,只能根據任務執行過程中實時感知的環境信息進行在線航跡決策。
未知環境下目標搜索和定位問題[8-11]備受國內外學者的關注。文獻[12]提出了基于預測控制思想的協同區域搜索算法,研究了各種通信限制對區域搜索功能的影響,提高了區域搜索效能;文獻[13]提出了分散控制算法,用于細菌啟發性搜索目標,提高計算效率;文獻[14]提出了強魯棒性蟻群優化和杜鵑搜索優化方法,該方法建立在三維路徑規劃時,其路徑長度優于其他算法;文獻[15]針對洋流對AUV目標搜索的影響,提出了基于粒子群優化和速度合成算法,進一步提高AUV工作效率,降低能量消耗;文獻[16]提出分步方案來解決多體協同搜素和區域覆蓋,搜索機器人提供先驗的環境概況,而服務機器人則根據先驗信息來完成后驗更新,提高了搜索效率,但增加了能源消耗;文獻[17-18]通過未知環境中移動機器人用于監視任務最大化,提出了自適應算法,該方法通過不斷地適應性調整來完成監視任務,但該算法在航跡規劃中,對視域范圍內獲取信息的情況有很強的依賴性。近年來,智能仿生算法在AUV路徑規劃中的應用十分廣泛,常見的的算法包括蟻群算法[19-20]、粒子群優化算法[21]、神經網絡算法[22]與遺傳算法[23-24]等。相比于傳統搜索論,這些方法雖然在已知環境下的全局優化搜索方面較為明顯,但在未知環境下缺乏靈活規劃航跡能力,不能較全面地觀測目標特征,搜索效率較低,適應性差。
本文首先分配分布式結構體系的多AUV協同搜索目標,考慮到傳感器與運動過程中非線性噪聲影響,分析未知環境下的目標特性,采用基于感知自適應算法為AUV提供最優一步的航跡規劃,在此基礎上將自適應算法與貝葉斯估計融合,在無目標狀態下利用分區域柵格值優化搜索策略,提出了基于分區域自主搜索目標的感知自適應算法,其能夠實現多AUV自適應搜索并定位目標。最后通過仿真實驗驗證了該算法相對于傳統梳子型搜索以及離線全局優化算法,保障了有效的定位精度的同時搜索效率提高。
假設每艘AUV均裝配聲吶、像機和通信設備,并且由這些AUV對某未知水下任務區域進行目標搜索與定位,由于水下所有的環境特征信息預先未知,前視聲吶與AUV自身運動控制中出現的非線性噪聲影響,會降低AUV搜索效率,嚴重干擾任務的順利進行。
傳統的梳子形區域目標搜索中,在有限的能源下AUV搜索效率很低,而在全局優化算法的離線設計任務航跡中,并沒有考慮到前視聲吶的非線性影響,如圖1所示。

圖1 離線軌跡的目標搜索Fig.1 Offline trajectory target search
圖1中共設有9個未知目標點,由A出發到達B點,AUV在離線的優化路徑作用下,前視聲吶的視域范圍內,搜索到任務目標的數量為6個,有3個目標被遺漏。比較目標6與目標1,搜索過程距離目標6較近,視覺受限小,定位效果相比目標1要好。說明在完全未知環境下,離線設計AUV全局優化路徑并不能遍歷所有目標點,且不能有效觀測到目標特征,容易遺漏重要數據,降低AUV搜索效率。
因此,考慮到上述問題,AUV執行未知區域的搜索任務時,還應滿足以下任務要求:
(1) 在有限條件下AUV搜索到更多的任務目標信息。
(2) 不僅要求AUV探測到任務目標,還需較為精確地獲取位置信息等。
(3) AUV面對未知復雜的環境能夠實時自主地規劃航跡。
(4) AUV要根據不同的目標特性做出不同的任務決策。
本文研究目的是尋求一種搜索策略,在滿足定位精度要求的條件下,自適應面對外界環境變化,盡可能獲取更多的未知目標信息,擴大區域覆蓋范圍,提高多AUV搜索效率。
本文擬采用SeaBat6012前視聲納,其工作視域R為150 m,水平開角α為120°,垂直開角β為15°,水平波束數目為80條,垂直波束數目為3層,共240條探測波束。前視聲納能夠探測到在其視域內所有的目標,并求得目標與240條波束的交點坐標和交點到聲納的距離[25]。
前視聲吶獲取信息的方法是利用柵格的方法,將前視聲吶的視域劃分為一個二維的柵格數組,通過填充每個柵格來表示該柵格內有無探測到目標,如圖2所示。

圖2 前視聲納模型Fig.2 Front view sonar model
建立前視聲吶視域的數學模型,假設(xc,yc,zc)為質心,(xs,ys,zs)是前視聲吶安裝點的坐標,Lcs為前視聲吶安裝點到AUV質心的距離,其中(xc,yc,zc)=(0,0,0),(xs,ys,zs)=(Lcs,0,0),則AUV前視聲吶的視域范圍為
(1)
式中,(xbs,ybs,zbs)可表示為
(2)
式中,(xabs,yabs,zabs)為目標在船體坐標系Oxsyszs下的坐標。
需要特別注意的是,由于AUV所配置前視聲吶在數據采集過程中容易受到水介質等影響,產生非線性干擾造成測量誤差。因此,前視聲納的非線性可表示為
(3)
式中,yx-q表示聲吶探測目標的特征信息;L表示前視聲吶的視域閾值;x與q分別表示AUV與目標的位置關系;h表示無噪聲的傳感器函數;d表示x與q的距離;ζ表示非線性高斯噪聲。當目標出現在前視聲納的視域范圍內,AUV對目標位置估計的不確定度與其距離成正比。
若把AUV視為一個質點,(x,y,z)是AUV在k時刻的坐標。暫時不考慮深度參數,則其運動模型可以描述為
(4)
式中,x表示經度;y表示緯度;T為過程時間;Vk是由DVL測得的速度;φk是由羅盤測量的艏向角。
在上述運動模型中,真實輸入為
(5)

模型可以描述為
Xk+1=f(Xk,uk,ωk)=Xk+Γ(uk+ωk)
(6)
式中,Xk=(xkykφ)T代表AUV在k時刻的位置,Γ(uk+ωk)是非線性項。
在運動方程中,非線性項噪聲對AUV航位推算的準確性有較大影響,長期干擾會出現累計誤差,造成航位推算失效。
AUV搜索的目標分為靜態目標和動態目標,當未知目標出現在視域范圍時,要求AUV能夠識別其目標特性,并針對不同的目標特性,做出不同的任務決策。
當靜態目標出現在AUV的視域范圍內時,AUV首先判斷該目標信息是否已經存在數據庫中,若不存在,將該目標信息添加至數據庫中。反之,利用目標信息與數據庫中相應信息作對比分析,記入較為準確的數據。靜態目標的特征模型可以表示為

(7)
當動態目標出現在AUV的視域范圍內時,AUV首先分析該目標的運動特性,根據其運動特性預測航跡信息,隨后可實現跟蹤或摧毀任務。假設動態目標為CT模型[26],即角速度為常值的轉彎模型,其狀態向量可表示為
(8)
在直角坐標系下,運動目標數學模型的離散時間方程為
(9)
式中,ω是轉彎角速度;T為采樣時間。
在未知環境下,目前優化方法中多數是基于離線設計的全局路徑優化,由于AUV只能沿著預設航跡執行搜索,不能實時面對復雜的隨機環境,因此提出基于分區域的感知自適應搜索算法。
基于感知的自適應算法(cognitive-based adaptive optimization, CAO)搜索是一個動態局部優化過程[27],與傳統優化方案相比,其能夠實時獲得優化標準函數的最佳一步法解決方案,因此自適應算法總是能夠有效地將AUV快速移動到最優標準函數的位置。
首先定義一個優化標準函數,即
(10)
式中,x與q分別表示AUV與目標的位置信息;v表示AUV的視域范圍;D表示任務區域;K為人為定義常數,優化標準函數是使AUV能夠靠近并看清目標的代價約束條件。函數第1項表示AUV視域內出現目標后,利用優化函數規劃航跡,使其不斷靠近目標位置,函數第2項則是利用攝像機等設備近距離觀測目標特征信息。
將上述定義函數用于多AUV的優化標準,滿足一些合理的局部路徑約束條件[28](如避障)及存在非線性WGN(nonlinear WGN,NWGN)的影響下,多AUV的優化標準函數為
(11)
式中,N表示任務中AUV的數量;ζk為零均值NWGN。雖然假設噪聲序列ζk是隨機的零均值信號,但他不滿足加性WGN(additive WGN,AWGN)的屬性。
該算法能夠有效地處理優化問題,其中目標函數和約束的顯式形式是未知的,但是在每個時間節點處可獲得這些函數的噪聲測量估計,使用函數近似估計每個時刻k處的未知目標函數J,根據:
(12)

(13)
AUV的下一步位置集合被選為如下R個候選位置,即
(14)

舍去違背AUV正常運行軌跡的預測數據后,計算新的AUV位置如下,即
(15)

AUV不斷感知環境,自適應搜索到的目標,還需將目標信息標記存儲,可利用貝葉斯估計來定位目標的位置信息。如下為AUV的運動方程與觀測方程,即
(16)
觀測方程具體表示為
(17)
AUV的目標定位可以表示為對每一時刻聯合后驗概率密度的估計,即
p(xv,k,θ|z0∶k,u0∶k,xv,0)
(18)
上述各個變量及其內容如表1所示。

表1 貝葉斯估計變量及其內容
假設AUV的狀態轉移過程是馬爾可夫(Markov)過程[29],根據貝葉斯估計理論[30],已知AUV的運動模型和觀測模型,可以通過二階遞歸的時間更新和量測更新來完成。
(1) 時間更新
p(xv,k,θ|z0∶k-1,u0∶k,xv,0)=
p(xv,k-1,θ|z0∶k-1,u0∶k,xv,0)dxv,k-1=
(19)
(2) 量測更新
p(xv,k,θ|z0∶k,u0∶k,xv,0)=
(20)
根據0到k時刻的控制輸入u0∶k及0到k時刻的觀測值z0∶k遞歸計算k時刻AUV的狀態xv,k,同時計算當前觀測過程中,所有已觀測的目標特征狀態θ的聯合后驗概率密度p(xk,θ|z1∶k,u0∶k,x0)得
p(xk,θ|z0∶k,u0∶k,x0)=
p(xv,k-1,θ|z0∶k-1,u0∶k-1,xv,0)dxv,k-1
(21)
式中,η表示歸一化常數,概率p(xv,k-1,θ|z0∶k-1,u0∶k-1,xv,0)為k-1時刻的條件概率密度,p(xv,k,θ|z0∶k,u0∶k,xv,0)為k時刻的條件概率密度。
當AUV視域范圍內無任何目標或其他特征信息時,為了讓AUV能夠合理地執行區域覆蓋與目標搜索任務,可以根據AUV自身的設備條件將區域分割,本文假設未知環境為大范圍的矩形區域,將該矩形區域劃分為若干個子區域,每個子區域的邊界值約為AUV視域的2倍。
子區域利用柵格法設有獨立的代價值,AUV根據每個子區域的代價值和到達距離,決定選擇搜索區域的優先級,任務區域以任務鎖定的方式執行,當AUV在進入該區域前,會首先判斷該區域是否被設置為任務鎖定,即

(22)
若區域未鎖定,將此區域定位為下一步的任務區域;反之,判斷此區域被鎖定的執行者是否屬于該AUV,即
Task={1,2…..,n}
(23)
式中,n為任務AUV的數量。
若鎖定區域為該AUV任務區域,則其將針對駛向本區域執行航跡規劃,反之,計算其他未被鎖定的任務區域,計算區域優先級,選擇最優區域執行航跡規劃。
在AUV執行區域選擇的過程時,將每個區域的區域點設在形心處,AUV優先選擇代價值最小且滿足路徑代價最短的區域作為任務區,運用分區域策略可以提高AUV感知自適應算法的搜索效率及其覆蓋面積。
實驗仿真環境為900×900 m的未知水下區域環境,AUV的任務航跡均由感知自適應算法實時規劃,目標個數與目標點的位置為隨機設計,實驗預設3個AUV,并以分布式結構體系執行未知環境下的目標搜索與定位任務,仿真實驗實際參數如下。
AUV:AUV分別從x方向(150,0),(450,0),(750,0)作為初始任務位置,速度為2節。
航位推算系統:采樣時間為1 s,速度誤差為0.025 m/s,位置誤差0.25 m,艏向最大偏轉角不超過60°,觀測噪聲設為WGN。
隨機設計目標的位置信息后,將柵格法應用在未知環境中,根據AUV所配置的傳感器視域范圍,將該區域分為9個子區域,初始化所有子區域,每個子區域有獨立的代價值和區域鎖定值,多AUV協同搜索任務開始時,未知環境下會在隨機位置中出現動態目標,按照恒定角速度做勻速曲線運動,如圖3所示。

圖3 AUV任務開始Fig.3 AUV task start
本實驗仿真中,AUV以分布式結構體系搜索靜態目標,未知動態目標出現在3號AUV視域范圍內時,3號AUV結束當前的搜索狀態,調整搜索模式后,預測動態目標軌跡并保持動態目標在視域范圍內,如圖4所示。

圖4 發現動態目標Fig.4 Discover dynamic targets
假設動態目標為敵方AUV,我方AUV與動態目標達到某一程度后銷毀動態目標,進而繼續按照感知自適應算法搜索靜態目標。為了驗證算法的效率和可靠性,將實驗結束的條件設定為區域內所有靜態目標被搜索,且全部達到預設的定位精度,則任務結束時的搜索狀態如圖5和圖6所示。

圖5 任務結束Fig.5 End task

圖6 觀測矩陣協方差Fig.6 Observation matrix covariance
如圖6所示,AUV進行自適應目標搜索與定位的過程中,AUV的聯合概率密度協方差是逐漸減小且趨于穩定的,避免了累計誤差的出現,且達到了設定目標定位允許的誤差范圍。應用此算法時,考慮到前視聲吶傳感器非線性的影響,即通過算法優化使得AUV能夠在一定范圍內靠近目標,保障前視聲吶較為準確地看清區域目標位置,使得所探測到目標都能夠滿足定位精度要求,與全局靜態路徑規劃相比,減少關鍵目標位置的遺失。此次仿真任務所用時間為2 940步,若選用梳子形掃描并達到定位精度,則每個AUV至少需要4 450步才能完成搜索任務,在進行100次實驗過程中,所用時間都低于梳子形掃描的時間,相對于傳統的搜索模式,在搜索效率上明顯提高,如圖7所示。

圖7 實驗數據比較Fig.7 Comparison of experimental data
在未知復雜的水下環境中,利用多AUV對外界隨機環境的感知,實時規劃任務航線,對該區域執行目標搜索與定位任務。基于分區域的感知自適應算法對區域目標進行搜索,在搜索過程中盡可能接近并看清目標的位置信息,保障每個探測過的目標位置均達到預設精度,且相比較傳統搜索算法和離線設計全局優化路線,能夠更好地提高搜索效率,減少關鍵信息的遺漏。通過實驗仿真驗證了該方法在未知領域內搜索的可行性和有效性。