郭琳鈺, 高劍, 焦慧鋒, 宋允軒, 陳依民, 潘光
(1.西北工業大學 航海學院, 陜西 西安 710072; 2.西北工業大學 無人系統技術研究院, 陜西 西安 710072;3.中國船舶科學研究中心, 江蘇 無錫 214082)
自主水下航行(AUV)因其航程遠、作業精準度高、可重復使用等特點,成為了人類認識和探索海洋領域必不可缺的工具,在近些年逐漸被廣泛應用。精確路徑跟蹤控制是AUV實現自主航行的關鍵技術之一,受到國內外學者的廣泛關注。
在路徑跟蹤控制問題上,早期的運動控制方法為比例-積分-微分(PID)控制,文獻[1]使用PID控制器實現了路徑跟蹤,并通過大量的海上實驗證明了該控制器的魯棒性和穩定性。
水下航行器多為欠驅動、強耦合的非線性系統,并受到未建模動態和環境擾動的影響。為提高水下航行器運動控制面對多種不確定因素的魯棒性,研究人員提出了基于自適應控制[2-4]、滑??刂芠5-6]、反步控制[7-8]、神經網絡控制[9-10]等路徑跟蹤控制方案。
Gao等[11]研究了水平面AUV非線性路徑跟蹤控制問題。以路徑上自由參考點為起點的Serret-Frenet坐標來描述路徑跟蹤誤差及其動態方程,解決了經典方法中的奇異性問題。Sun等[12]基于改進的反步法和滑??刂圃?研究了考慮未知環境干擾下的欠驅動水下航行器的路徑跟蹤控制問題。通過數值仿真驗證了濾波反步滑模控制器的控制效果。與傳統的反步滑??刂破飨啾?控制器輸出的抖振明顯減小,跟蹤誤差收斂更快,達到穩定跟蹤狀態所需的時間更短,穩定性更高。然而,AUV水下作業環境復雜,需要考慮各種約束條件,上述控制器難以處理約束問題。
模型預測控制(MPC)是一種基于模型的閉環優化控制策略,相對于傳統控制方法的優勢在于能夠在控制器設計范圍內系統地處理帶約束條件的多輸入多輸出問題,目前己經成為了自動控制領域的主流研究方向之一。
在AUV的路徑跟蹤控制方面,模型預測控制發揮著重要作用。文獻[13]考慮了有輸入約束條件下的欠驅動AUV直線路徑跟蹤問題,提出了基于MPC的AUV路徑跟蹤控制器,并比較了線性預測模型、時變線性預測模型和非線性預測模型的方案,結果表明3種方案均具有良好的跟蹤性能和魯棒性。文獻[14]針對含障礙物的受限工作空間,提出了一種新型非線性模型預測控制方案,引導AUV朝著特定方向前進,并在控制器設計中考慮了各種約束條件(如:障礙物位置、工作空間邊界、推進器飽和速度限制等)。Shen等[15]針對AUV軌跡跟蹤問題提出了基于李雅普諾夫穩定性的模型預測控制(LMPC)框架,在LMPC框架中考慮了驅動器飽和、推力分配等實際性的約束問題。Gao等[16]針對全驅動水下航行器的視角約束、執行器約束和模型不確定性,提出了一種基于滑動模態觀測器的模型預測控制策略。劉昌鑫等[17]針對欠驅動AUV的約束路徑跟蹤問題,設計了一種MPC路徑跟蹤控制器,采用REMUS AUV的模型參數對提出的控制律進行了仿真研究,實驗結果表明控制器在顯式處理約束的同時,表現出良好的跟蹤效果。在文獻[15]的基礎上,Shen等[18]研究了AUV的路徑跟蹤問題,將路徑跟蹤作為首要任務優先完成,提出了一種新的多目標模型預測控制框架。
MPC控制策略能處理多輸入多輸出并帶約束的復雜系統,且具有較強的可靠性和魯棒性。MPC優異的控制效果依賴于精確的模型,但是AUV模型具有多自由度、非線性、強耦合性的特點,而且AUV運動數學模型中的部分水動力附加質量、慣性矩和阻尼系數是難以精確建模的。另外,AUV在航行過程中,經常會受到外界(如:未知深層流和表面流)的干擾,上述特點使得AUV路徑跟蹤控制增添了許多不確定性。
徑向基(RBF)神經網絡能快速逼近系統動力學模型,結構更簡單,與其他神經網絡算法相比,RBF神經網絡在解決實時函數逼近問題上有一定的優勢。因此,本文針對AUV的模型不確定性引入RBF神經網絡算法,通過提升預測模型的精度進而優化路徑跟蹤控制效果。
針對AUV的路徑跟蹤控制問題,首要工作是建立AUV的數學模型。本文研究水平面上的欠驅動AUV路徑跟蹤控制問題,為了方便后續的研究分析,忽略欠驅動AUV水平面運動和垂直面運動帶來的耦合效應,忽略動力學模型中的非線性二次阻尼項,建立欠驅動AUV的水平面三自由度運動方程。
通常使用2個坐標系來描述AUV的運動(如圖1所示):地面坐標系和運載體坐標系。地面坐標系的原點O固定在地球上一處,規定OX向北為正,OY向東為正。運載體坐標系的原點OB選擇在AUV的浮心,規定OBXB沿著AUV的縱軸并指向艏向,OBYB與之垂直,向右為正。

圖1 AUV水平面坐標系


(1)

(2)
式中:M為含附加質量的慣性矩陣;C(v)為哥氏力和向心力矩陣;D(v)為阻尼矩陣;τ是在3個自由度上的輸入力、推進器產生的推力以及操縱面產生的操縱力。
在(1)~(2)式中,AUV的質量、水動力附加質量、慣性矩和阻尼系數等通常隨工作條件(包括任務和環境)的變化而變化,在實踐中難以確定。此外,海洋環境擾動往往是不可預測的、多變的。因此,AUV的運動數學模型受到諸多不確定因素的影響。
假設AUV的縱剖面、橫剖面分別對稱,有

(3)

(4)
(5)

(6)

由此可得,欠驅動AUV在水平面上的運動學方程和動力學方程,分別表示為
(7)
和
(8)
式中:m11=M11,m22=M22,m33=M33,d11=D11,d22=D22,d33=D33。
令向量x表示AUV的狀態,u表示控制輸入,則AUV的狀態更新方程描述為
xk+1=f(xk,uk)
(9)

由于AUV模型中參數的不確定性,令Δf(xk,uk)表示AUV模型中的不確定項,fnom(xk,uk)表示名義模型,則真實系統ftrue(xk,uk)表示為
xk+1=fnom(xk,uk)+Δf(xk,uk)=ftrue(xk,uk)
(10)
因此可以將AUV路徑跟蹤控制問題描述為以下帶約束的動態優化問題
(11)
滿足
xk+1=fnom(xk,uk)+Δf(xk,uk)
(12)
e(k+1)=xk+1-xref
(13)
umin≤uk≤umax,k=1,…,Nc
(14)
x0=xk
(15)
式中:R和Q分別為路徑跟蹤狀態偏差的權重矩陣和控制輸入權重矩陣,(12)式表示不斷更新的AUV模型;(13)式中xk+1表示補償后模型的6個狀態;xref是參考狀態;u為控制輸入力X和力矩N;(15)式中模型預測的初始狀態x0為真實系統的當前狀態xk反饋。
MPC控制器在AUV進行路徑跟蹤時通過傳感器獲得當前時刻的AUV狀態值;然后根據預測模型對AUV在預測時域內的狀態值進行預測,通過構建目標函數(11)式并結合約束條件(12)式和(14)式優化求解預測時域內的控制序列;最后選取求解得到控制序列的第一個元素作為系統的控制輸入。這一時刻結束后在下一個采樣時刻重新獲取AUV的狀態,繼續下一周期的滾動優化。
在實際航行過程中,AUV的結構參數經常發生變化。除此之外,由于水下航行器系統的強非線性和強耦合性,也導致AUV實際上難以建立精確的實際系統模型,影響了其跟蹤的預設路徑的精度。因此,針對模型不確定項Δf(xk,uk),采用RBF神經網絡來進行逼近。
RBF網絡結構如圖2所示,該結構包括3個不同的層,其中n是輸入層節點的個數,m是隱藏層節點的個數,l是輸出層節點的個數。

圖2 RBF網絡原理圖
該結構中第一層是輸入層,輸入層X=[xi]T,其目的是將n個輸入分配給第二層隱藏層的m個節點,隱藏層輸出H=[hj]T,其中x和hj分別是系統輸入和隱藏層的第j個輸出,本文選擇高斯函數作為激活函數,即

(16)
式中,‖x-cj‖表示x和cj之間的歐幾里得距離,RBF神經網絡采用中心cj和寬度σj為參數的高斯基函數。
RBF第三層輸出層為網絡的輸出,通過線性組合隱藏層來計算網絡的預測輸出,從而有計算方式
(17)
式中,wjq是第j個隱藏層節點到第q個輸出層節點的權重,采用梯度下降法辨識wjq。
結合(17)式,AUV模型不確定性可表示為
Δf(xk,uk)=WTH(xk)+ε
(18)
式中:W是隱藏層到輸出層的權重矩陣;H是由(16)式計算得到的向量;ε是偏差項。權重矩陣W和H分別為m×l和m×1的矩陣,m和l分別表示輸入層、隱藏層和輸出層的節點數量。


圖3 RBF-MPC結構圖


表1 模型參數表
為驗證基于RBF-MPC的路徑跟蹤控制方法的有效性,先將參考路徑選擇為波形圖進行測試,波形表達式選擇為
yl=6sin(0.05xl)
(19)
式中:xl為目標橫坐標;yl為目標縱坐標。
AUV的初始位置為(0 m,0 m),初始航向角為0 rad,控制器的采樣間隔為T=0.1,預測步長為N=50,仿真時間為150 s。跟蹤波形的仿真結果如圖4~6所示。

圖4 波形跟蹤控制結果 圖5 x方向跟蹤誤差對比 圖6 y方向跟蹤誤差對比
從圖4可以明顯看出,采用RBF神經網絡的MPC控制器明顯誤差更小一些,在橫向100 m以內即可跟蹤上波形,不僅收斂速度更快,而且橫縱位置的偏差更小;而MPC控制器在橫坐標大約為180 m處才能在一定誤差內跟蹤上波形。
為進一步清晰看出MPC控制器和RBF-MPC控制器的跟蹤效果差異,將橫縱向位置的跟蹤偏差結果展示在圖5~6。MPC控制器在x方向達到穩態的時間大致為72 s,位置偏差最高可達26.0 m;而RBF-MPC控制器x方向達到穩態時間縮短為大約50 s, 位置偏差減少到13.0 m,位置誤差減少大約50%。 因此,在控制器參數、AUV模型和初始狀態等其他條件均相同的情況下,RBF-MPC控制器收斂速度更快,超調量更小。
圖7~8展示了使用MPC控制器和RBF-MPC控制器跟蹤正弦波時,控制輸入力和力矩的變化。

圖7 控制輸入力的變化曲線

圖8 控制輸入力矩的變化曲線
從變化趨勢上來看,RBF-MPC控制器產生的輸入波動更小,特別在30,59,70 s峰值處差異較為明顯,且在穩態階段,RBF-MPC控制器得到的控制輸入比較平穩。
采用2種控制器跟蹤正弦波形,驗證了本文提出的RBF-MPC控制器的可行性。該控制器能夠有效減小模型不確定性帶來的擾動,減小系統的超調和穩態誤差。
設置AUV初始位置為(10 m,-10 m),依次到達目標點位置為(17 m,-56 m),(187 m,-146 m),(208 m,-234 m),(334 m,-414 m),(488 m,-488 m),(980 m,-980 m),初始航向角0,控制器的采樣間隔T=0.1,預測步長N=50,仿真時間為360 s。
由圖9可以看出,2種控制器都能較好地完成跟蹤任務,從局部放大圖可以看出,2種控制器都能產生平滑的運動軌跡,但是在轉向點處,二者的差異非常明顯。不論是在橫坐標為30~80 m的第一次拐角路徑跟蹤段,還是在橫坐標為350~400 m的第二次拐角處路徑跟蹤段, RBF-MPC控制器都比MPC控制器具有更小的超調量,能更快速地減少與期望的參考路徑之間誤差,具有更好的跟蹤性能。

圖9 路徑跟蹤控制結果 圖10 x方向跟蹤誤差對比圖11 y方向跟蹤誤差對比
為進一步清晰看出MPC控制器和RBF-MPC控制器的跟蹤效果差異,將橫縱向位置的跟蹤偏差結果展示在圖10~11。
MPC控制器在x方向的位置偏差最高可達15.5 m,而RBF-MPC控制器可以將誤差減少到6.9 m,誤差減少將近50%,在y方向的位置誤差上RBF-MPC控制器的優勢也很顯著,特別是在第18 s到第75 s之間。因此,可以看出模型不確定性使MPC控制器存在較大的穩態誤差,加入神經網絡補償后,超調量明顯減少,更快達到穩定狀態。
圖12~13展示了使用MPC控制器和RBF-MPC控制器時,控制輸入力和力矩的變化。從變化趨勢上來看,RBF-MPC控制器產生的輸入波動更小,特別在10,59,66 s峰值處差異較為明顯,且在穩態階段,RBF-MPC控制器得到的控制輸入比較平穩,所耗能量更少,更利于AUV長時間水下作業。

圖12 控制輸入力的變化曲線

圖13 控制輸入力矩的變化曲線
綜上所述,在存在模型不確定和擾動的情況下,RBF-MPC在控制效果方面具有更小的路徑跟蹤超調量和更小的穩態誤差;在控制輸入方面,具有更小輸入幅值,更加節能。與傳統的MPC控制器相比,綜合優勢明顯。
本文中,針對AUV的路徑跟蹤控制問題,提出了基于RBF神經網絡的模型預測控制器,使用RBF神經網絡補償AUV模型不確定性。仿真結果表明,在模型存在建模誤差和顯著不確定性的情況下,RBF-MPC控制器可以將跟蹤誤差減少到6.9 m,誤差減少將近50%;加入神經網絡補償后,超調量明顯減少,更快達到穩定狀態。而且RBF-MPC控制器得到的控制輸入比較平穩,所耗能量更少。綜合比較, RBF-MPC控制器具有更好的跟蹤性能。