王 月, 何 真, 張建蘭, 袁 亮, 陸宇平
(1. 南京航空航天大學自動化學院, 江蘇 南京 211106; 2. 航空機電系統綜合航空科技重點實驗室, 江蘇 南京 211106)
與旋翼機相比,小型固定翼無人機在續航能力、飛行范圍以及巡航速度等方面具有明顯的優勢。但旋翼機可以做到垂直起落,而固定翼無人機一般通過滑行減速、撞網和傘落等方式進行降落。這幾種降落方式有場地空間需求大、地面輔助降落裝置復雜和落點不確定等缺點,限制了固定翼無人機的應用場合。人類從鳥類棲落過程中發現了靈感,如果固定翼無人機能像鳥類那樣實現棲落,就能突破固定翼飛行器降落條件的限制,從而擴大固定翼無人機的應用場合。我們觀察金雕的棲落過程,金雕在接近目標的前一刻,迅速拉起身體、張開翅膀并且雙腿前伸,這一套動作使金雕的飛行狀態從平飛進入過失速狀態,迅速減速并且實現精確棲落,整套動作敏捷而精準。固定翼無人機如果能模仿鳥類的棲落機動[1-5],利用大迎角產生的高阻力快速減速并實現精確地棲落,那么飛行器就可以隨時隨地棲落,這樣無人機就能提高續航能力和提升作戰性能。因此,棲落機動的研究具有重要的應用價值。
近年來,固定翼無人飛行器的棲落機動得到了越來越多的關注。文獻[6]設計了一種小型滑翔機,用實驗驗證了固定翼飛行器棲落在電線上的可能性。文獻[7]研究了變體無人機棲落機動縱向運動的多體動力學建模與仿真問題,并分析了變體結構對棲落機動性能的作用。文獻[8]為棲落機動設計了一種滑??刂破?。
上述文獻主要討論了棲落機動的軌跡控制器設計,沒有探討所設計控制器的局部穩定區域(即吸引域)的計算方法。對棲落機動而言,計算吸引域一方面可以確定飛行器偏離參考軌跡的容許范圍,另一方面可以保證容許范圍內的飛行器能夠在有限時間內準確地棲落在目標區域內。因此,吸引域計算對棲落機動的實現具有重要的意義。近年來,對局部穩定的非線性系統計算吸引域的問題得到了學術界的關注。文獻[9]利用線性矩陣不等式(linear matrix inequality,LMI)凸優化方法計算了Lyapunov函數,解決了光滑非線性系統的吸引域計算問題。文獻[10]提出運用平方和(sum-of-squares, SOS)的方法計算局部穩定系統的吸引域。文獻[11]運用基于仿真的方法計算局部穩定的系統的吸引域。與平方和最優化算法相比,這種方法更簡單更直接,并且不要求系統模型是多項式形式,但是這種方法計算量大,效率較低。以SOS方法為基礎,文獻[12]提出了一種固定翼飛行器棲落機動控制器綜合設計方法——LQR-Trees控制方法,并探討了該方法的魯棒性。
本文針對固定翼無人機棲落過程的非線性特性,以切換控制理論為基礎展開了棲落機動軌跡控制研究,并針對所設計的棲落機動切換控制律,設計了相應的SOS優化算法,計算了吸引域。首先沿著參考軌跡將棲落機動的非線性動力學模型線性化,構造出分段線性模型;然后結合最優控制理論與切換控制理論,對分段線性系統設計切換控制律。隨后針對所設計的棲落軌跡跟蹤切換控制律,改進設計了SOS優化算法以計算棲落軌跡吸引域Ω。這樣,只要系統的狀態量X∈Ω,則在所設計的軌跡跟蹤控制器的作用下,飛行器能夠準確地棲落在目標區域里。最后,對固定翼飛行器的棲落機動控制過程進行了仿真驗證。
以發動機的推力和升降舵的偏轉作為控制輸入。固定翼飛行機的縱向運動方程為
(1)
式中,V,μ,α,q分別表示飛行速度、航跡角、迎角和俯仰角速度;x和h分別表示飛行器的水平位置和高度;m是飛機的質量;Iy是轉動慣量;T是推力;L是升力;D是阻力;M是空氣動力矩。
飛行器的縱向空氣動力和力矩為
(2)
式中,CL、CD和CM分別是飛行器升力、阻力和力矩系數;ρ是空氣密度;S是飛行器的空氣動力表面積。
飛行器棲落過程中的空氣動力學系數由平板模型方法[13-15]得到,升力和阻力系數可由式(3)逼近。
(3)
俯仰力矩系數為
.8cosαsin(2α+2δe)+
1.4sinαsin2(α+δe)+0.1sinα)
(4)
式中,Se為升降舵的空氣動力表面積;δe是升降舵偏轉角;le是升降舵空氣動力重心到飛行器質心的距離。
飛行器棲落機動是迎角大范圍變化的非常規機動方式,因此需要設計控制器改善飛行器的棲落機動性能,保證飛行穩定,并實現定點棲落。在設計控制器之前,需要給定一條參考軌跡,優先設計參考軌跡的目的是將飛行器定點棲落控制問題轉化為軌跡跟蹤問題。參考軌跡可以利用GPOPS工具箱進行設計[16-17]。本小節主要對原非線性動力學模型作線性化處理,并且結合最優控制與切換控制對處理后的線性切換系統設計軌跡跟蹤控制器。
設飛行器棲落機動非線性模型為

,u)
(5)
針對非線性模型(5),應用GPOPS工具箱優化得到參考軌跡,記為(Xr,ur)。Xr與ur滿足飛行器棲落動力學模型(5),即Xr=f(Xr,ur),其中Xr=[vr,μr,αr,qr,xr,hr]T為狀態變量參考軌跡,ur=[Tr,δer]T為與狀態變量參考軌跡Xr相對應的參考輸入(在不引起混淆的情況下,本文將ur稱為參考輸入)。
將非線性模型(5)沿著參考軌跡(Xr,ur)進行泰勒展開,具體形式為


Ar(t)(X-Xr)+Br(t)(u-ur)+Ο=
Ar(t)ΔX+Br(t)Δu+Ο
(6)

為了得到Ar(t)與Br(t)的具體表達式,并且減輕計算量。定義[t0,tf]為整個棲落機動的時間范圍,在整個棲落過程中均勻地取N個時刻點。在每個時刻點對應的參考軌跡上的參考點附近,對棲落系統的非線性模型(1)進行線性化。例如,在ti時刻所對應的參考軌跡中的參考點附近進行線性化,計算得到線性化模型為

(7)
那么在整個棲落機動的時間范圍[t0,tf],棲落機動的線性時變模型為

(8)

(9)
則式(8)為棲落機動的分段線性化模型。

接下來設計切換系統跟蹤參考軌跡的切換控制律。
直接設計切換系統控制律的工作復雜,可以從切換系統的子系統入手,設計每一個子系統的最優控制律,這種方法大大降低了工作難度。因此,可以借鑒線性時不變(linear time invariant,LTI)系統的最優控制律理論,對切換子系統設計軌跡跟蹤切換控制律。令(tf-t0)/2N=Δt,在ti-Δt時刻,式(8)描述的切換系統切換到子系統為

(10)
針對式(10)描述的線性系統,需要尋找一個最優的控制uc,使得X能跟蹤上Xr。為了實現控制目標,引入關于系統狀態和控制參量的二次型性能指標,即
ΔuTRΔu+ΔXTQΔX)dt
(11)
設計控制律使J取極小值,其中R和Q是根據設計要求選定的權重矩陣,一般取對角常值矩陣。這是典型的線性二次型問題,設計系統的線性二次型調節器(linear quadratic regulator, LQR)。
為了計算滿足條件的控制輸入u*(t),引入哈密頓函數,即

λ(t)TAiΔX(t)+λ(t)TBiΔu(t)
(12)
根據駐值條件

(13)
得

(14)
由正則方程得

(15)

(16)
令協態方程(16)的解為
λ(t)=SiΔX(t), ?t∈[t0,tf]
(17)
式中,Si待定。結合式(14)~式(17),得Si應滿足矩陣方程,即黎卡提方程
(18)
設計最優控制輸入為
u*(t)=kiΔX(t)
(19)
其中控制增益為
ki=-R-1BiSi
(20)
以上設計了切換系統中每一個子系統的最優控制律,在此控制器作用下,每一個子系統穩定并且狀態量能收斂至參考點。然而,每一個子系統的穩定并不能保證整個切換系統的穩定,因此需要分析整個切換系統的穩定性。
切換系統的穩定性不僅取決于子系統的穩定性,還與切換規則息息相關。根據棲落機動的分段線性化過程可知其切換規則是受約束的,因此本節分析受約束作用下切換系統的穩定性。
對受約束作用下切換系統穩定性分析的方法主要包括:分段連續二次Lyapunov函數法(piecewise quadratic lyapunov function,PQLF)[18-19],類Lyapunov函數法[20],多重Lyapunov函數法(multiple lyapunov functions,MLFs)[21-22]。本文參考類Lyapunov函數法分析切換系統的穩定性。
對于線性切換系統的N個子系統,如果能找到每一個線性子系統對應的Lyapnov函數,并且滿足切換前時刻的Lyapunov函數值不小于切換后時刻的Lyapunov函數值這一條件,那么對應的線性切換系統全局穩定。因此,如果能找到式(10)描述的線性切換子系統的Lyapunov函數Vi(ΔX)=ΔXTPiΔX,滿足
(Ai+Biki)TPi+Pi(Ai+Biki)≤-Qi
(21)
Pi-1≥Pi
(22)
式中,Pi和Qi是正定對稱矩陣。那么滿足式(21)、式(22)的控制律ki(由式(20)得到)就是能保證切換系統穩定的子系統切換控制律。
在計算ki時,先根據式(20)確定ki,再由式(21)與式(22)核算此ki是否滿足切換系統的穩定性要求。如果不滿足,則調整式(18)中的權值Q與R,再次核算在此權值計算出的最優控制律ki是否滿足式(21)與式(22)。直到找到滿足式(21)、式(22)與式(20)的控制律ki。
同理,可分別計算出整個時間歷程N個切換子系統的控制律ki。則整個時間歷程的切換控制律的形式為
(23)
系統的吸引域即為系統的局部漸近穩定區域。第2節設計了棲落軌跡跟蹤控制器。此控制器是根據分段線性近似模型設計得到的,因此該控制器只能保證分段線性系統(8)全局穩定,而在此控制作用下的閉環非線性棲落系統是局部穩定的,因此分析系統的吸引域是重要問題。本小節運用SOS最優化方法[23-24]計算該閉環非線性棲落系統的吸引域Ω。即計算參考軌跡附近的特定區域Ω,當系統的狀態量X∈Ω時,則在所設計的軌跡跟蹤控制器作用下,飛行器最終能棲落在目標落點區域Ωf里。下面在第3.1節介紹切換控制的軌跡吸引域的計算方法;為了降低SOSTOOLS[25-26]計算軌跡吸引域的難度,提高準確度,第3.2節提出了計算棲落軌跡吸引域的一種降保守性的方法;第3.3節引入了基于質點模型計算吸引域的方法。
為了描述沿著參考軌跡的吸引域,我們定義時變區域為

(24)



(25)
式中,Ωf表示棲落終點的目標范圍。則此時的Ω(ρ,t)即為所求吸引域。
Ωf的具體定義為

(26)
式中,ρf是根據棲落終點的容許誤差范圍人為設定的。
為了保證條件(25)成立,需要滿足


(27)



,ti)≤ρ(ti)
(28)


同樣,如果系統在整個棲落時間[t0,tf]都滿足上述條件,那么式(24)表示的Ω(ρ,t)就是棲落系統在參考軌跡附近的吸引域,吸引域計算過程整理成為

(29)
為了將非線性系統(1)的軌跡吸引域求解條件轉化為SOS形式,先將式(29)表示的條件轉化為
(30)
進而,條件(30)等價于
(31)
為了將條件(31)轉化為SOS最優化問題,給出引理1。
引理1[27-28]給定多項式集{f1,…,fs},{g1,…,gt},{h1,…,hu}∈Rn,下面的兩個條件是等價的:
(2) 存在多項式f∈p{f1,…,fs},g∈M{g1,…,gt},h∈I{h1,…,hu}滿足f+g2+h=0,其中,Rn表示所有實數域上n元多項式的集合。
再根據引理1,條件(31)可轉化為
(32)
式中,s1,s3∈Σ,Σ表示平方和多項式。取s3=1,將條件(32)簡化,得到SOS最優化算法為
(33)
由于并不是所有的非負多項式都能用平方和的形式表示,因此算法(33)是算法(32)的充分條件。
因為SOS最優化方法適用于多項式系統,所以我們需要對式(1)中的f(X)進行泰勒展開,用泰勒展開的多項式系統去估計原非線性系統。
考慮算法(33)中的表達式為


(34)
式中,s2的系數是變量;ρ(t)是與t相關的變量。而SOS最優化方法要求約束條件中的未知量之間是線性關系,所以將算法(33)轉化為
(35)
為了簡化問題,在計算吸引域時,以時間取樣,將整個棲落時間[t0,tf]分為N段,比如計算時間范圍內[tf-1-Δt,tf-1+Δt]的吸引域,將[tf-1-Δt,tf-1+Δt]范圍內的ρf-1(t)用線性形式估計。因為ρf是由棲落終點的容許誤差范圍而人為設定的,所以ρf已知。設在[tf-1+Δt,tf]這一段時間內,吸引半徑不變等于ρf,那么只需要計算tf-1這一時刻的ρf-1,就可以計算出ρf-1(t)。按照上述方法,以t=ti時刻取樣,算法式(35)可簡化為
(36)
其中
(37)

?i∈[0,N](Ai+Biki)TSx+Sx(Ai+Biki)<0
(38)


為了解決由于Ω(ρ,ts)跳變帶來的吸引域計算失真的問題,需要保證式(39)成立。

(39)
此時解出的在ts這一時刻前后的吸引域才是符合要求的[29]。


(40)
最后,ρi(t)以分段線性形式估計表達為
, ?t∈[ti-Δt,ti+Δt)
(41)
ρi(t)即為系統在[ti-Δt,ti+Δt)這一時間段的吸引半徑。進而得到整個棲落時間范圍的分段線性表達式ρ(t)。

(42)
式中,av表示加速度;ωμ表示航跡角速度。
簡化后的質點模型輸入是加速度av與航跡角速度ωμ。為了使這兩個控制量符合實際六維系統的物理規律,需要添加輸入飽和約束。將此約束加入到SOS算法式(36)中,約束具體表達式為
(43)

仿真中固定翼飛行器的質量與轉動慣量分別為:m=0.8 kg,Iy=0.1 kg·m2。飛行器的其他物理參數見文獻[8]。仿真中采用的飛行器動力學模型為式(1)所表示的棲落機動非線性模型,其中,氣動參數由式(2)、式(3)和式(4)計算獲得。在設計控制律時,將整個棲落時間區域[0,2 s]均勻分為20段,在{0 s,0.1 s,0.2 s,0.3 s,…,1.9 s,2 s}這21個時刻的參考點處分別得到線性化模型以便于控制律設計。在計算最優控制律時,設定式(11)中的權重矩陣為Q=diag[1.5,8,1.5,1.5,20,15],R=diag[1,50];進而聯立式(20)~式(22)求解獲得控制律。將所設計的控制律應用于棲落運動非線性動力學模型(1)進行仿真。
飛行器棲落機動理想初始飛行狀態X*(t0)=[9.973 6,0,0.245 5,0,0,0],為了檢驗設計的控制律的狀態量跟蹤效果,設計實際的初始飛行速度具有偏差1 m/s,航跡角偏差為0.1 rad,迎角偏差為0.05 rad,俯仰角速度偏差為0.1 rad/s,高度與水平位置偏差都為1 m。仿真結果如圖1~圖3所示。其中,圖1對應狀態變量跟蹤曲線,圖2對應控制輸入曲線,圖3對應飛行器位置跟蹤曲線。圖1中藍色虛線對應參考軌跡,紅色實線對應切換控制響應曲線??梢?在切換控制器作用下,速度、航跡角、迎角、俯仰角速度、水平位置和高度均能跟蹤參考曲線,并在終點時刻收斂到滿足要求(|Δv|<0.5 m,|Δμ|<0.35 rad,|Δα|<0.35 rad,|Δx|<0.1 m,|Δh|<0.1 m)的范圍內。驗證了基于LQR與切換控制綜合設計的控制器的有效性。
控制輸入曲線如圖2所示,圖2中藍色虛線表示參考輸入曲線,紅色實線表示切換閉環控制輸入??梢?推力與升降舵偏轉量雖然沒有收斂到標稱值,但是與理想輸入值偏差范圍合理。
圖3描述了飛行器棲落機動位置跟蹤曲線。其中藍色虛線對應參考軌跡,綠色點劃線對應開環響應曲線,紅色實線對應切換控制閉環響應曲線。在棲落機動飛行結束時刻,參考棲落位置為(14.05,2.103),未加控制器的棲落位置為(13.6,2.518),切換控制下的棲落位置為(14.01,2.035)。
由此可見,在切換控制作用下,盡管初始位置偏差很大,但響應曲線最終能收斂到指定位置附近,符合棲落位置精度要求。而未加控制器的棲落位置與指定位置偏差較大,不符合棲落要求。驗證了設計軌跡跟蹤控制器的必要性與基于LQR與切換控制綜合設計的軌跡跟蹤控制器的有效性。

圖1 狀態變量跟蹤曲線Fig.1 Tracking curve of state variables

圖2 控制輸入曲線Fig.2 Tracking curve of control input

圖3 位置跟蹤曲線Fig.3 Tracking curve of position

,z=[ΔxΔhΔvΔμ]T
(44)
式中,U是4×4的實對稱矩陣,由10個決定變量構成[30]。
接著將控制輸入的約束條件(43)加入到SOS算法(36)中。根據六維模型仿真結果,對整個棲落機動過程的質點模型輸入量進行了分段約束,具體約束范圍如表1所示。
表1 棲落機動過程控制輸入約束范圍
Table 1 Scope of constraint of control input in perching process

在整個棲落時間[0,2 s]每隔0.1 s取一個時刻點,共取21個時刻點,聯立式(43)與式(36)分別算出21個時刻點的吸引域,注意計算是從終點時刻的收斂半徑計算開始的。對2 s這一終點時刻,期望終點誤差0≤Δv≤0.5 m/s,|Δμ|≤0.35 rad,|Δx|≤0.1 m和|Δh|≤0.1 m。根據期望誤差范圍,并結合式(26),設置ρf為0.15。定下ρf之后,聯立式(36)、式(37)與約束條件(43)算出1.9 s這一時刻的收斂半徑ρf-1,同理遞推計算出整個棲落過程的收斂半徑。最后根據式(41)寫出分段線性吸引半徑,為了形象直觀地表示吸引域,將其投影在xh平面,結果如圖4所示,其中綠色橢圓表示吸引域。

圖4 吸引域在xh平面的投影Fig.4 Projection of the domain of attraction in xh plane
圖4描述了分段線性吸引域在xh平面上的投影。每個橢圓代表對應時刻的吸引域,在軌跡跟蹤控制器的作用下,前一個時刻橢圓內的所有狀態量都會收斂到下一個時刻對應的橢圓吸引域內,進而可以推知,只要初始狀態在0 s對應的橢圓吸引域內,最終位置都會收斂到設置的目標棲落域Ωf內。
圖5描述了質點模型采樣棲落軌跡與吸引域在xh平面的關系。仿真時,選取了5個在0 s對應的橢圓吸引域內不同的初始狀態,仿真結果顯示,棲落軌跡全都在所求吸引域內,且終點位置都收斂到所設的目標棲落域Ωf內,驗證了對質點模型計算出的吸引域的有效性。

圖5 質點模型棲落軌跡與吸引域在xh平面的投影Fig.5 Perching trajectory of particle model and the projection of thedomain of attraction in xh plane
圖6描述了原六維非線性棲落機動模型棲落軌跡與吸引域在xh平面的關系。仿真時根據第2.2節相關內容設置切換控制器,使原六維模型的狀態變量(x,h,v,μ)快速跟蹤質點模型的狀態變量(xr,hr,vr,μr)。已知質點模型的棲落機動仿真曲線在吸引域內,則原六維非線性模型棲落機動仿真曲線也應在吸引域內。仿真結果顯示,原六維非線性模型的棲落軌跡全都在所求吸引域內,且終點位置都收斂到所設的目標棲落域Ωf內。

圖6 六維非線性模型棲落軌跡與吸引域在xh平面的投影Fig.6 Perching trajectory of 6-d nonlinear model and the projection of domain of attraction in xh plane
本文采用基于切換控制與最優控制相結合的綜合控制算法,設計飛行器棲落機動軌跡跟蹤控制律。然后,運用SOS最優化算法,計算了棲落軌跡吸引域。針對切換系統的特性,研究了降低吸引域計算保守性的方法。最后對飛行器棲落機動過程進行了仿真驗證。仿真結果表明,基于切換控制與最優控制設計的控制器使得飛行器可以跟蹤上參考軌跡,驗證了所設計的軌跡跟蹤控制器的有效性。仿真結果還表明,基于SOS算法沿著參考軌跡計算的吸引域Ω,當X∈Ω時,飛行器能棲落在目標范圍內,驗證了所計算的軌跡吸引域的正確性。