徐 海 祥, 瞿 洋, 余 文 曌1,
( 1.武漢理工大學 高性能船舶技術教育部重點實驗室, 湖北 武漢 430063;2.武漢理工大學 交通學院, 湖北 武漢 430063 )
船舶動力定位反步逆最優控制
徐 海 祥*1,2, 瞿 洋2, 余 文 曌1,2
( 1.武漢理工大學 高性能船舶技術教育部重點實驗室, 湖北 武漢 430063;2.武漢理工大學 交通學院, 湖北 武漢 430063 )
針對動力定位船舶定點定位過程中的高低頻運動特性,設計了一種基于無源濾波的反步逆最優控制器.首先建立船舶的非線性方程,再利用線性化方程對應的Riccati方程對船舶非線性方程進行反步變換,最后基于Lyapunov函數設計了未建模擾動環境力自適應律和漸進穩定的控制律,同時滿足了局部性能指標和全局性能指標.該方法從一個新的角度解決定點定位過程中船舶非線性系統最優控制的問題,避免了傳統H∞魯棒控制需要求解Hamilton-Jacobi-Isaacs(HJI)方程的問題,保證了整個濾波和控制系統的穩定性.同時還研究了誤差和控制權矩陣Q和R對系統性能的影響,確保了船舶低速定位過程中的能耗最優.動力定位船舶定點定位的仿真結果驗證了該方法的有效性.
動力定位;無源濾波;反步變換;最優控制
動力定位技術已廣泛用于深水鉆井、海底管線的檢測和調查、水下機器人作業、水下工程施工、油井增產措施和維修、平臺供應、穿梭油船、浮式采油(有或無儲油設備)等作業中.對于海上長時間定位的船舶,船舶的濾波和最優控制問題對于節省燃料和減少污染具有重要意義.
傳統動力定位(DP)系統通常假定運動方程在36個艏向角每隔10°可線性化,并利用線性Kalman濾波濾除船舶的高頻運動.對于每10°的線性化運動方程,最優的Kalman濾波器相關參數和反饋控制器增益都需要隨著線性化過程不斷調整[1],并且相應的噪聲協方差矩陣需要在線自適應估計[2].相較于Kalman濾波,無源濾波參數易整定,并且實船試驗也驗證了其有效性[1].此后,Fossen論述了在低速和恒定速度時,船舶系統具有良好的無源性,克服了無源理論在船舶控制系統中應用的局限性[3].在無源理論的基礎上,卜德華等結合PID控制器驗證了無源濾波器對濾除船舶位置和艏搖角高頻信息的有效性[4].針對船舶定點狀態環境最優問題,Fossen等提出了環境最優艏向控制,使船舶能根據外部緩變環境力自動調節艏向,從而達到減小能耗的目的[5].對于固定艏向定位作業,最優控制問題通過設計H∞魯棒控制器來解決,但此方法需要求解復雜的Hamilton-Jacobi-Isaacs(HJI)方程[6-7].為了克服環境荷載對船舶系統的影響,Ngongi等利用H∞魯棒控制來抵抗外荷載,并用TS模糊模型來逼近DP系統,最后通過求解LMI方程來保證該TS模糊控制器的穩定性[8].相較于H∞魯棒控制,反步積分控制設計過程簡單,被廣泛應用于船舶動力定位系統的設計當中[9-10].為了滿足執行機構動態特性的要求,Morishita等以及徐海祥等將執行機構的動態特性考慮到反步積分控制器的設計過程中,使控制輸出更加平滑,減小了執行機構的磨損[11-12].由于反步積分控制器的設計基于船舶數學模型,模型的準確性對控制效果有一定的影響.為了避免求解HJI方程,Ezal等針對單輸入單輸出系統,首先提出了一種反步逆最優控制器,將H∞最優控制理論和反步積分控制理論相結合,同時滿足了局部最優和全局最優的性能指標[13].在Ezal等的基礎上,Strand等將單輸入單輸出的反步逆最優控制理論推廣到多輸入多輸出的錨泊輔助動力定位中[14].隨后,Strand等又將反步逆最優控制器和無源濾波相結合,進一步推廣了反步逆最優理論并保證了整個系統輸入狀態的穩定(input-to-state stable)[15].由于多輸入多輸出的錨泊輔助動力定位系統不具有一般性,Kim等在Ezal和Strand等的基礎上,推導了多輸入多輸出系統的一般理論形式[16].謝文博等在Strand等的基礎上,根據船舶動力定位循跡控制中時變期望位置的特點,推廣設計了時變反步逆最優控制[17].
以上文獻大都側重于濾波器或者控制器的設計穩定,而較少考慮到濾波和控制器之間的相互影響,有時無法保證整個濾波和控制系統的穩定性.在Strand等的研究基礎之上,本文結合動力定位定點控制的具體要求,進一步完善反步逆最優控制理論在船舶動力定位系統中的應用,研究誤差和控制權矩陣Q和R對系統性能的影響,設計一種自適應反步逆最優控制器,以保證整個濾波和控制系統的穩定性,降低船舶低速定位過程中的能耗.
1.1 船舶動力定位數學模型
建立如圖1所示的3個坐標系.在大地坐標系XEYEZE下,船舶當前低頻運動位置和船舶期望位置分別為η=(xyψ)T和ηd=(xdydψd)T.在船舶運動坐標系XYZ下,船舶當前低頻運動速度和期望速度分別為v=(uυr)T和vd=(udυdrd)T,其坐標系原點位于船中縱剖面與重心G相距xg處.船舶固定坐標系XDYDZD原點OD位于(xd,yd),相對于北東坐標系旋轉了ψd.船舶固定坐標系實際是為控制器的設計而引入的,可以認為是一個“控制坐標系”,其避免了船舶期望位置ηd對控制器的影響,使得船舶在期望位置ηd附近擁有良好的控制效果[14].
大地坐標系和船舶運動坐標系下,船舶動力定位數學模型為[18]

(1)

(2)

(3)

(4)
y=η+Cωξ
(5)
式中:Aω為包含波浪主頻率ω0和相對阻尼ζ的定常矩陣;ωω和Eω分別為高斯白噪聲及其幅值矩陣;J(η)為坐標系轉換矩陣;b∈R3×1,是作用于船體上的環境擾動力,包括二階波浪慢漂力、風和流的作用力;T為大時間常數矩陣;ωb為均值為零的高斯白噪聲矩陣;Eb為高斯白噪聲的幅值矩陣;M∈R3×3,為船舶慣性矩陣;D∈R3×3,為線性阻尼矩陣;τ∈R3×1,為作用于船體上的推力;y為船舶測量位置;Cωξ為船舶高頻運動位置,Cω=(0I).模型中相關矩陣的具體形式為


M=m-Xu.000m-Yυ.mxg-Yr.0mxg-Nυ.Iz-Nr.?è?????÷÷÷,
當船舶前進速度不為零時,矩陣D一般是非線性的;但對于零速或者恒定速度,矩陣D可以假定為線性的[1].

圖1 大地、船舶運動和船舶固定坐標系
1.2 基于數學模型的無源濾波器設計
20世紀90年代,機器人等領域的無源控制已得到了較大的發展[19],而船舶無源控制直到90年代后期才得到應用,限制無源理論在船舶中應用的原因是船舶的附黏水質量和阻尼項會隨著船舶在海浪中的遭遇頻率以及船速的變化而變化[3].在利用無源理論設計船舶的濾波器時,需要考慮船舶是否具有無源性.Fossen已論證了當船速較低時船舶具有良好的無源性[3].在一般工況下,環境擾動力矩對船艏的擾動角度在1°以內,而極限海況的擾動角度在5°以內,因此可以做出如下的合理假設:
J(η)≈J(y)
(6)
根據文獻[1]和[18],利用式(6)并結合船舶動力定位數學模型可設計如下船舶無源濾波器:

ξ^.=Aωξ^+K1y
(7)

η^.=J(y)v^+K2y
(8)

b^.=-T-1b^+K3y
(9)

Mv^.+Dv^=τ+JT(y)b^+JT(y)K4y
(10)

(11)

:y =y-y^
式中;K1∈R6×3,K2,K3,K4∈R3×3,為濾波器增益矩陣.為使濾波器穩定,結合Kalman-Yakubovich-Popov引理并利用頻域理論可以確定濾波器的相關增益矩陣[1].
1.3 低頻運動數學模型的變換
在大地坐標系XEYEZE和船舶運動坐標系XYZ下,無源濾波器設計用到的是低頻運動數學模型(8)和(10).為了避免船舶期望位置ηd對控制器設計的影響,控制器設計所用到的低頻運動模型為船舶固定坐標系XDYDZD和船舶運動坐標系XYZ下的變換模型.在XDYDZD下,偏差向量可以表示為[14]
e=JT(ηd)(ηd-η)
(12)
記Jd=J(ηd),Je=JT(ηd)J(η),并考慮如下關系:

(13)
(14)
對式(12)求導有

(15)
在定點定位和狀態保持控制中,期望位置偏差ed=(exdeydeψd)T和定位點處期望速度vd均為0,且濾波器的輸出是控制器的輸入.因此,式(15)可以簡化為

e^.=-Jev^-JTdK2y
(16)
同時,式(10)可以寫為

v^.=-M-1Dv^+M-1u+JTeJTdK4y
(17)
式中

u=τ+JTeJTdb^
(18)


x.=f(x)+Bu+Hy
(19)
式中

f(x)=-Jev^-M-1Dv^?è????÷÷,B=0B2?è???÷=0M-1?è???÷,

x.=Ax+Bu+H0y
(20)
式中
式(19)和(20)為船舶低頻運動方程(8)和(10)的變換形式,兩式均計及了船舶的期望位置ηd,避免了ηd對控制器設計的影響.
2.1 控制目標
(1)局部最優目標
系統在所設定的期望位置xd=0附近時,要實現的控制目標是對于式(20)的線性系統,設計一個穩定的控制律,以滿足如下的性能指標:
(21)
式中:誤差權矩陣Q和控制權矩陣R均為對稱正定矩陣.對于最優的衰減系數γ*,衰減系數γ應滿足γ>γ*.
(2)全局最優目標
系統最終要實現的控制目標是對于式(19)的非線性系統,設計一個全局漸進穩定的控制律,以滿足如下的性能指標:
(22)
式中:q(x)和R*(x)為非線性系統中待確定的正定部分,其在反步逆最優設計過程中滿足以下局部約束條件[15]:
R*(0)=R
(23)
(24)
因此,當船舶靠近設定點xd=0時,全局漸進穩定的控制律將退化為線性H∞(LQ)控制律,此時局部最優目標得到滿足.
2.2 線性反步變換
局部最優性能指標Jl所對應的廣義Riccati代數方程為
(25)
正定矩陣P可以分解為
P=LTΔL
(26)
式中:L為下三角矩陣,Δ為正定分塊對角矩陣,
利用式(26),可將式(25)轉化為
(27)
式中
設定新的變量z,通過反步變換,滿足全局目標的非線性系統式(19)有如下映射關系[20]:

(28)


z.=Az+B0ul+H0y
(29)
考慮如下Lyapunov函數:
V=zTΔz
(30)
對式(30)求導并結合式(29)的線性系統,局部最優目標所對應的線性H∞控制律為
(31)
此時,Lyapunov導函數滿足

V.≤-zTQz-uTRu+γ2y Ty
(32)
在后文的控制器設計中,將會用到非線性反步逆最優設計方法來構建與式(29)相類似的非線性變換方程.在非線性反步逆最優構造過程中,都會確定每一步的虛擬控制量αi,最終存在全局最優目標所對應的控制律:
(33)
滿足

V.≤-q(z)-uT?R?(z)u?+γ2y Ty
(34)
其中q(z)和R*(z)的正定過程將會在后文中給出.
2.3 非線性反步變換
反步逆最優控制器的設計首先通過構建與式(29)相類似的非線性變換方程,再利用Lyapunov函數(30)推導反步逆最優控制律.非線性變換方程的推導過程總共可分兩步進行.
步驟1 定義第一個偏差向量為

(35)
對式(35)求導得

z.1=α1+(-Jev^-α1)+H1y
(36)

αh=-Π(z1)z1

Ω(z1)=diag{3ρ1z1,3ρ2z2,3ρ3z3}
式中:z1=(z1z2z3)T,ρ1、ρ2、ρ3為正常數.
定義第2個偏差向量為

A12z2=-z2=-Jev^-α1
(37)
因此

z.1=α1-z2+H1y
(38)
步驟2 對式(37)求導得

(39)
式中

J.eJTe=(r-rd)S=(r^+δ-rd)S
(40)

(41)


(42)
式中


G2(r^,z)=-JeM-1DJTe+r^S-A11-A22
綜合式(38)和(42)可得與式(29)相類似的非線性變換方程:

z.=Az+Bu+Gz+Hy +Σ
(43)
式中
2.4 反步逆最優控制器設計
若用無源濾波器中的式(9)作為未建模環境力的估計,則可選取和式(30)相同的Lyapunov函數.雖然式(9)能夠實現對未建模環境力的跟蹤,但是為了獲得較好的濾波效果,式(9)中的增益矩陣會受到限制,使得未建模環境力的跟蹤效率并不高.為了提高環境力的跟蹤效率,這里采用另外一種積分操作,可以取如下Lyapunov函數:
(44)

(45)

B2u+H2y +Σ2)+2zT1Δ1H1y -2b TΓ-1b^.
(46)
將式(27)代入上式,則

(47)


b^.=ΓJdJeBT2Δ2z2
(48)

(49)

(50)
式中


反步逆最優控制律可以取為
(51)
若令

(52)
則有

(53)
式中:q(z)應該滿足正定條件,在假設船舶速度v和高頻運動艏向角速度δ有界的情況下,存在有界正實數β1和β2使得Υ滿足[15]
(54)
為了使整個系統穩定,q(z)需滿足
(55)
結合式(54)和(55),存在0<θ<1,使式(53)滿足

V.≤-(1-θ)q(z)-uT?R?u?+γ2y Ty
(56)
若q(z)滿足正定條件,則
(57)
方式一
(58)

方式二
(59)
式中χ為正定矩陣,可取為

(60)
方式三

R-T?=u1(r^,z)I+u2(r^,z)R-1
(61)

(62)

u2(r^,z)=1;λ1≥-λ2(1+λ1+λ2k)-1;k>0,λ1<-λ2{
(63)
(64)
(65)
式中:λmax(*)表示求取*的最大特征值.為了操作的簡便,這里選用第3種選取方式.
下面將通過計算機仿真來驗證無源濾波和反步逆最優算法的有效性.如圖2所示,本文仿真模型為縮尺比為1∶20的平臺供應船模,船舶的慣性矩陣和阻尼矩陣通過CFD理論計算得到,船舶模型相關參數、環境力參數以及控制器等相關參數如表1所示,環境荷載的加載方式詳見文獻[18].
為檢驗未建模環境力自適應律效果,使船舶狀態保持控制,初始時刻船舶位置為η0,期望位置也為η0,初始時刻船舶3個方向未建模環境力和力矩均設置為零.船舶在時刻t=200 s時受到表1中的環境力作用,在t=1 800 s環境力消失.船舶在東向、北向和艏向的位置如圖3所示.固定坐標系下3個方向的自適應未建模環境力如圖4所示.相應的權矩陣選取為


圖2 平臺供應船模


表1 相關參數設定值
為檢驗權矩陣Q和R對DP系統的能耗影響,使船舶作中近距離定點定位控制,初始時刻船舶位置為η0,期望位置為ηd=(5 m 5 m π/4)T,無環境力干擾.選取4組權矩陣.




為了比較權矩陣對船舶能耗的影響,取如下總推力性能指標:

(b) 船舶狀態保持北向位置

(c) 船舶狀態保持艏向位置

圖4 船舶狀態保持自適應未建模環境力
權矩陣為參數1、2、3和4時,總推力性能指標如圖5所示,船舶低頻東向位置、低頻北向位置和低頻艏向位置如圖6所示.
針對本文中所涉及的無源濾波器,狀態保持仿真實驗展示了相應的濾波效果和未建模環境力

圖5 總推力性能指標


(a) 船舶低頻東向位置

(b) 船舶低頻北向位置

(c) 船舶低頻艏向位置
圖6 不同權矩陣下的控制效果
Fig.6 The control results of different positive cost matrices
自適應律的效果.在突變未建模環境力的作用下,圖4展示了環境力自適應律良好的跟蹤效果.圖3展示了在自適應未建模環境力和實際環境力相近時,船舶的位置和艏向濾波效果良好,在很大程度上濾除了高頻運動.在t=200 s至t=1 800 s,自適應未建模環境力和實際環境力存在較大偏差,導致船舶位置估計尤其是艏向角估計和實際低頻位置存在一定的偏差.造成未建模環境力和實際環境力有偏差的原因往往是突風、大浪或者激流等.由于控制是響應緩變環境力,變化較大且頻繁的外部環境力對船舶控制將會是一個巨大的挑戰.
圖5展示了不同權矩陣所對應的總推力性能指標,船舶的低速運動意味著船舶較長的響應時間,與此同時相應的能耗也較小.圖6給出了不同權矩陣對定位效果的影響.根據權矩陣的定義可知,參數Q的前3個元素對應船舶的位置權重,而后3個元素對應船舶的速度權重;參數R對應控制器的輸出推力權重.參數2相較于參數1增大了位置權重,船舶的速度有所增大,相應的超調量和響應時間等系統響應特性都得到了改善.參數3相較于參數1增大了推力權重,船舶位置的響應時間變長和超調量有所增加,這是由于增大推力權重會在一定程度上限制控制器的推力輸出.參數4相較于參數1增大了船舶速度權重,船舶位置的響應時間明顯變長,且基本無超調,這是因為增大速度權重限制了船舶速度.值得注意的是,過大的船舶速度會破壞船舶系統的無源性,即船舶的附加質量和阻尼明顯的非線性,將會對船舶系統的穩定性有著明顯的影響.因此,為了使整個動力定位控制系統穩定,控制船舶的速度不宜過高是十分必要的.
本文針對動力定位船舶定點定位問題設計了一種基于無源濾波的自適應反步逆最優控制器,避免了H∞魯棒控制器設計過程中需要求解HJI方程的問題,滿足了局部最優和全局最優的性能指標,對外界緩變未建模環境力進行補償的同時,也保證了無源濾波和控制整個系統的穩定性.不同權矩陣Q和R對動力定位控制系統的響應時間、超調量等動態特性和控制推力有著直接的影響,在滿足系統穩定性的條件下,可通過優化性能權函數Q和R以達到提高控制精度與降低能耗的目的.
[1] FOSSEN T I, STRAND J P. Passive nonlinear observer design for ships using Lyapunov methods:full-scale experiments with a supply vessel [J]. Automatica, 1999, 35(1):3-16.
[2] FOSSEN T I, PEREZ T. Kalman filtering for positioning and heading control of ships and offshore rigs [J]. IEEE Control Systems, 2010, CST-29(6):32-46.
[3] FOSSEN T I. Nonlinear passive control and observer design for ships [J]. Modeling, Identification and Control, 2000, 21(3):129-184.
[4] 卜德華,徐海祥,李文娟,等. 基于非線性無源濾波器的船舶動力定位仿真[J]. 武漢理工大學學報, 2013, 35(10):69-73.
BU Dehua, XU Haixiang, LI Wenjuan,etal. Simulation of ship dynamic positioning based on nonlinear passive filter [J]. Journal of Wuhan University of Technology, 2013, 35(10):69-73. (in Chinese)
[5] FOSSEN T I, STRAND J P. Nonlinear passive weather optimal positioning control (WOPC) system for ships and rigs:experimental results [J]. Automatica, 2001, 37(5):701-715.
[6] WU Huaining, LUO Biao. Neural network based online simultaneous policy update algorithm for solving the HJI equation in nonlinear control [J]. IEEE Transactions on Neural Networks and Learning Systems, 2012, 23(12):1884-1895.
[7] CHEN W, ANDERSON B D O. On the convergence rate of the Leake-Liu algorithm for solving Hamilton-Jacobi-Bellman equation [J]. IFAC Proceedings Volumes, 2011, 44(1):8064-8069.
[8] NGONGI W E, DU J, WANG R. Robust fuzzy controller design for dynamic positioning system of ships [J]. International Journal of Control Automation & Systems, 2015, 13(5):1294-1305.
[9] Jr. ZAKARTCHOUK A, MORISHITA H M. A backstepping controller for dynamic positioning of ships:numerical and experimental results for a shuttle tanker model [J]. IFAC Proceedings Volumes, 2009, 42(18):394-399.
[10] WITKOWSKA A. Control system design for dynamic positioning using vectorial backstepping [J]. Scientific Journals of the Maritime University of Szczecin, 2013, 108(36):182-187.
[11] MORISHITA H M, SOUZA C E S. Modified observer backstepping controller for a dynamic positioning system [J]. Control Engineering Practice, 2014, 33:105-114.
[12] 徐海祥,瞿 洋,余文曌,等. 基于動態執行機構的欠驅船舶循跡控制[J]. 武漢理工大學學報(交通科學與工程版), 2016, 40(1):6-10.
XU Haixiang, QU Yang, YU Wenzhao,etal. Path following for underactuated marine craft with actuator dynamics [J]. Journal of Wuhan University of Technology (Transportation Science & Engineering), 2016, 40(1):6-10. (in Chinese)

[14] STRAND J P, EZAL K, FOSSEN T I,etal. Nonlinear control of ships:a locally optimal design [M] // Preprints of the IFAC NOLCOS 1998. Enschede:The Netherlands, 1998:732-738.
[15] STRAND J P, FOSSEN T I. Nonlinear output feedback and locally optimal control of dynamically positioned ships:Experimental results [C] // Proceedings of IFAC Conference on Control Application in Marine Systems. Fukuoka:IFAC, 1998:89-95.
[16] KIM H, BACK J, SHIM H,etal. Locally optimal and globally inverse optimal controller for multi-input nonlinear systems [C] // Proceedings of 2008 American Control Conference. Seattle: AACC, 2008:4486-4491.
[17] 謝文博,付明玉,張 健,等. 動力定位船舶自適應反步逆最優循跡控制[J]. 中國造船, 2013, 54(3):58-69.
XIE Wenbo, FU Mingyu, ZHANG Jian,etal. Adaptive backstepping inverse optimal tracking control of dynamic positioning vessel [J]. Shipbuilding of China, 2013, 54(3):58-69. (in Chinese)
[18] FOSSEN T I. Handbook of Marine Craft Hydrodynamics and Motion Control [M]. New York:John Wiley & Sons, 2011.
[19] BERGHUIS H, NIJMEIJER H. Passivity approach to controller-observer design for robots [J]. IEEE Transactions on Robotics & Automation, 1993, 9(6):740-754.
[20] FOSSEN T I, STRAND J P. Tutorial on nonlinear backstepping:Applications to ship control [J]. Modeling, Identification and Control, 1999, 20(2):83-135.
Inverse optimal backstepping control of dynamic positioning ships
XU Haixiang*1,2, QU Yang2, YU Wenzhao1,2
( 1.Key Laboratory of High Performance Ship Technology of Ministry of Education, Wuhan University of Technology, Wuhan 430063, China; 2.School of Transportation, Wuhan University of Technology, Wuhan 430063, China )
In view of the characteristics of high and low frequency motion in ship dynamic locating and positioning, an inverse optimal backstepping controller is designed cascaded with a passive filter. Firstly, the nonlinear equation of the ship is established. Then, the Riccati equation corresponding to the linear equation is used to carry out the backstepping transformation of the nonlinear equation. Finally, the adaptive law and the asymptotic stable control law for disturbed environmental force without modeling are designed based on the Lyapunov function, which meets both the local cost function and global cost function. This new approach obtains a solution of the optimal control of nonlinear system in a new direction, avoids solving the Hamilton-Jacobi-Isaacs(HJI) equation in traditionalH∞controller design and simultaneously guarantees the stability of filter and controller. The influences of error and control weight matrixQandRon the system performance are discussed, and the optimal energy consumption during dynamic positioning of ship at slow speed is achieved. The simulation results of a dynamic locating and positioning ship show the effectiveness of this approach.
dynamic positioning; passive filter; backstepping transformation; optimal control
1000-8608(2017)01-0046-09
2016-01-07;
2016-09-20.
國家自然科學基金資助項目(61301279,51479158);中央高校基本科研業務費專項資金資助項目(163102006).
徐海祥*(1975-),男,教授,博士生導師,E-mail:qukaiyang@163.com;瞿 洋(1991-),男,碩士生,E-mail:yangqu91@163.com;余文曌(1989-),男,講師,E-mail:yuwenzhao1989@gmail.com.
U674.38
A
10.7511/dllgxb201701007