卜祥偉,姜寶續
(1.空軍工程大學 防空反導學院,西安 710051;2.空軍工程大學 研究生院,西安 710051)
乘波體飛行器(Waverider Vehicle, WV)飛行速度快、探測難度大、突防能力強,被認為是打破傳統空天防御模式的顛覆性武器[1-4]。控制系統是WV的“神經中樞”,對于保障其安全飛行和順利完成任務使命至關重要。控制系統的動態性能與穩態精度則是保證WV大機動飛行以及打破傳統導彈突防與攔截防御模式的關鍵[5-6]。
預設性能控制[5-8](Prescribed Performance Control, PPC)被認為是一種能夠在控制系統動態性能與穩態精度之間進行折中平衡的新理論,一經提出,便受到國際控制學界的廣泛關注。鑒于PPC能夠很好地保證WV大機動飛行時其控制系統所急需的動態性能與穩態精度,近年來,國內外科技人員對WV的PPC技術開展了系統而深入的研究。文獻[9-10]針對傳統PPC方法需要事先獲取誤差精確初值的苛刻條件,通過引入雙曲余割函數構造了一種新型性能函數,為WV提出了一種新型PPC方法;進一步,引入神經網絡對WV的未知模態進行在線逼近,保證了控制魯棒性。針對存在不確定參數的WV,文獻[11]采用反演方法設計了具有預設性能的虛擬控制律與實際控制律,并采用自適應投影算法保證了控制系統對不確定參數的魯棒性。雖然該方法能夠保證跟蹤誤差滿意的動態性能與穩態精度,但是在線調整參數過多,算法的在線學習量有待進一步降低。文獻[12]為WV提出了一種固定收斂時間PPC方法,可以定量地設置跟蹤誤差的收斂時間,提高了PPC方法的實用性。進一步,文獻[6]將文獻[12]方法改進為有限時間小超調PPC,仿真結果表明,該方法可以保證WV速度跟蹤誤差與高度跟蹤誤差任意定量的預設性能。上述PPC方法的有效性雖已得到驗證,但忽略了由輸入受限導致的PPC脆弱性問題。所謂脆弱性問題,是指輸入受限將導致誤差短時間內顯著增加,當誤差增加幅度足夠大時,有可能導致誤差過分接近甚至到達PPC的約束包絡,進而導致控制奇異[5, 13-14]。考慮到WV飛行高度大,大氣密度降低導致氣動舵執行效率明顯下降,極易造成控制執行器飽和。因此,PPC的脆弱性缺陷已經成為制約WV飛行控制研究的瓶頸難題。此外,現有基于反演設計[11-13]的WV控制策略帶來了極其復雜的回饋遞推設計過程,并產生一系列的中間虛擬控制律,控制復雜度還有待進一步降低。
基于以上分析,本文提出輸入受限WV非脆弱PPC新方法,為WV的速度動態與高度動態分別設計具有再調整約束包絡的新型非脆弱PPC,彌補現有PPC方法的脆弱性缺陷。為了保證控制魯棒性,引入徑向基神經網絡(Radial Basis Function Neural Network, RBFNN)對WV歸一化的未知模態進行在線逼近,并避免復雜的反演設計過程,控制復雜度得到顯著降低。最后,通過數值仿真驗證所提方法的效果與優勢。
本文采用美國NASA代號為X-43的典型WV,Bolender與Parker等學者[3-4]為其建立了在國際上被廣泛采用的縱向運動模型:
(1)
(2)
(3)
(4)
(5)
(6)
(7)
式中:V∈R>0,h∈R>0,γ∈R,θ∈R,Q∈R為剛體狀態;η1∈R,η2∈R為彈性狀態;Φ∈R>0,δe∈R為控制輸入;κV∈R>0,κγ∈R>0,κQ∈R>0為常數;ΞV∈R,Ξγ∈R,ΞQ∈R為非線性連續可微函數[6, 15],即



WV的幾何外形與受力情況如圖1所示,模型參數的詳細定義如表1所示。由于WV的彈性狀態無法測量,因此僅采用其5個剛體狀態進行狀態反饋設計,并利用控制魯棒性對彈性狀態進行被動抑制。

圖1 WV幾何外形與受力示意圖

表1 參數定義
控制目標是:在假設ΞV,Ξγ,ΞQ為完全未知的情況下,通過為Φ,δe設計合適的受限控制律,使得速度V和高度h穩定跟蹤其參考指令Vd∈R>0,hd∈R>0,并且跟蹤誤差滿足期望的預設性能。這里,Vd∈R>0和hd∈R>0及其一階導數均有界。
為了便于控制器設計,通常將WV的運動模型在形式上分解為速度子系統(即式(1))與高度子系統(即式(2)~(5))[9-12]。然后,分別為兩個子系統設計基于神經逼近的非脆弱PPC。
假設速度控制輸入Φ受到如下飽和約束:

(8)

定義速度跟蹤誤差eV=V-Vd,并為eV設計如下改進預設性能:
-σV(t)-?V(t) (9) 式中: ?V(t)=bΦtanh(|xΦ|)。 其中,aV>1,σ0,VσV(0)∈R>0,σ0,V>σTs,V∈R>0,Ts,V∈R>0,bΦ∈R>0為待設計參數;xΦ∈R為補償系統的狀態。 注釋2:通過為Φr設計合適的反饋控制律使得eV始終位于約束包絡(即式(9))內,則為σV(t)∈R>0,?V(t)∈R≥0選取合適的設計參數,能夠保證eV收斂過程具備滿意的動態性能與穩態性能。σV(t)為傳統的有限時間收斂性能函數[12],可以確保eV在時間Ts,V內收斂到穩態。?V(t)為新設計的自適應調整項,能夠根據Φ的飽和情況自適應調整約束包絡的形狀,使得當執行器飽和時eV始終位于約束包絡之內,從而避免傳統PPC可能導致的控制奇異問題。 鑒于式(9)不便于控制器設計,定義轉換誤差: (10) 式中:φV(t)∈R。 對式(10)求導并代入式(1),可得 (11) 式中: rV=1/[2σV(t)+2?V(t)]×(1/{eV/[σV(t)+?V(t)]+1}-1/{eV/[σV(t)+?V(t)]-1})>0; 為了處理速度控制輸入飽和問題,設計補償系統: (12) 式中:aΦ∈R>0;δV∈R>0。 利用xΦ對φV(t)進行修正,得到修正誤差: ψV=φV(t)-xΦ (13) 式中:ψV∈R。對式(13)求導,代入式(11)與式(12)并利用ΔΦ=Φ-Φr,可得 (14) 對于未知函數ΞV,引入RBFNN對其逼近: (15) 將Φr設計為 (16) (17) 式中:λV∈R>0。 下面,分析速度子系統的穩定性。 (18) 定義Lyapunov函數: (19) 對式(19)求導并代入式(17)~(18),可得 (20) 考慮到 則有 (21) 定義緊集: 定義高度誤差eh=h-hd。為eh設計如下改進預設性能: -σh(t)-?h(t) (22) 式中: ?h(t)=bδetanh(|xδe, 1|+|xδe, 2|+|xδe, 3|)。 其中:ah>1,σ0, hσh(0)∈R>0,σ0, h>σTs, h∈R>0,Ts, h∈R>0,bδe∈R>0為設計參數;xδe, 1∈R,xδe, 2∈R,xδe, 3∈R為輔助系統的狀態。 定義轉換誤差: (23) 對式(23)求導并代入式(2),可得 (24) 式中: rh=1/[2σh(t)+2?h(t)]×(1/{eh/[σh(t)+?h(t)]+1}-1/{eh/[σh(t)+?h(t)]-1})>0; 將航跡角參考指令選為 (25) 式中:lh, 1∈R>0,lh, 2∈R>0為待設計參數。 式(3)~(5)為嚴格反饋形式,傳統方法是采用反演策略設計控制律。但是,反演控制的回饋遞推設計過程非常復雜,且存在微分項膨脹問題[11, 15]。為了避免繁雜的反演設計過程,將式(3)~(5)等價變換為[6, 16] (26) 式中:x1=γ∈R;x2∈R;x3∈R;Fh為未知的連續可微函數;κδ>?Fh/(2?δe)為常數。 注釋3:經過模型等價變換,式(3)~(5)的未知函數Ξγ與ΞQ被歸一化為一個總的未知函數Fh,這樣僅需要一個RBFNN對Fh進行逼近,降低了神經逼近計算量。 假設高度控制輸入δe受到如下約束: (27) 設計新型輔助系統對高度子系統的控制飽和度進行補償: (28) 式中:xδe, 1∈R,xδe, 2∈R,xδe, 3∈R為輔助系統的狀態;δh∈R>0,aδe, 1∈R>0,aδe, 2∈R>0,aδe, 3∈R>0為待設計參數。 定義跟蹤誤差: sγ=γ-γd=x1-γd (29) 利用輔助系統的狀態xδe, 1∈R, 對跟蹤誤差sγ進行修正: eγ=sγ-xδe, 1 (30) 定義誤差函數: (31) 式中:μh∈R>0。 對式(31)求導并代入式(26)、式(28)~(30),得 (32) 對于未知函數Fh,引入RBFNN對其逼近: (33) 將δe, r設計為 (34) (35) 式中:λh∈R>0。 下面,分析高度子系統的穩定性。 (36) 定義Lyapunov函數: (37) 對式(37)求導并代入式(35)~(36),可得 (38) 考慮到 則式(38)變為 (39) 定義緊集: 注釋4:傳統PPC[6-10]的約束包絡不具備再調整能力,當控制飽和導致足夠幅度的誤差波動時,極易導致控制奇異,表現出明顯的脆弱性缺陷。本文提出的改進約束包絡含有兩個再調整項?V(t)與?h(t),使得約束包絡能夠根據誤差波動情況自適應調整其形狀(增加上包絡,減小下包絡),從而避免了控制奇異問題,克服了傳統PPC的脆弱性缺陷。 為驗證所設計控制律、補償系統以及自適應律的效果及相對于現有方法[14, 17]的優勢,以式(1)~(7)作為被控對象,采用MATLAB/Simulink軟件進行數值對比仿真。仿真采用四階龍格-庫塔法進行解算,仿真步長為0.01 s。設計參數取值為:aV=2,σ0, V=5,σTs, V=0.5,Ts, V=5,bΦ=2.5,aΦ=1.5,δV=0.8,lV, 1=0.2,lV, 2=0.8,λV=0.05,ah=2,σ0, h=3,σTs, h=0.5,Ts, h=2,bδe=1 000,lh, 1=2,lh, 2=0.8,δh=0.8,aδe, 1=0.5,aδe, 2=1,aδe, 3=1,μh=7,lh=50,λh=0.05,κV=1.2,κδ=1.1。 仿真過程中,假定系統參數隨時間攝動±30%,并取典型變化規律為sin(0.1πt)。假定控制輸入受到如下約束:Φ∈[0.05, 0.85],δe∈[-18.5°, 18.5°]。分別在以下三種情景進行仿真。 情景1:采用所提方法進行仿真。仿真結果如圖2~6所示。圖2~3表明,所提方法能夠將速度跟蹤誤差與高度跟蹤誤差限定在預設的約束包絡內,速度跟蹤誤差與高度跟蹤誤差均滿足期望的動態性能與穩態性能。進一步,當控制輸入處于飽和狀態時(見圖4),速度跟蹤誤差與高度跟蹤誤差均有所增加(見圖2~3),所提PPC方法的約束包絡能夠準確感知跟蹤誤差的增加態勢并及時調整約束包絡的形狀(增加上包絡并減小下包絡),從而避免了控制奇異。圖5~6表明,神經網絡權值估計參數與轉換誤差均有界。由此可見,仿真結果證明了所提方法的有效性。 圖2 所提方法的速度跟蹤效果 圖3 所提方法的高度跟蹤效果 圖4 所提方法的控制輸入 圖5 所提方法的神經網絡取值估計參數 情景2:只考慮速度控制輸入飽和,并取Φ∈[0.05, 0.85];其他條件與情景1完全相同。采用文獻[14]的傳統PPC約束包絡,仿真結果如圖7~10所示。由仿真結果可見,速度執行器飽和導致速度跟蹤誤差增加(見圖7、圖9),由于文獻[14]的傳統PPC約束包絡沒有再調整功能,導致速度跟蹤誤差因為自身增加而到達了預設包絡(見圖7),速度子系統的轉換誤差急劇發散(見圖10),最終造成控制奇異,控制系統失效。從而證明了所提方法相對于文獻[14]方法的優越性。 圖6 所提方法的轉換誤差 圖7 文獻[14]方法的速度跟蹤效果 圖8 文獻[14]方法的高度跟蹤效果 圖9 文獻[14]方法的控制輸入 圖10 文獻[14]方法的轉換誤差 情景3:在不考慮輸入受限的情況,將本文所提方法與文獻[17]的傳統神經控制方法進行對比。仿真結果如圖11~12所示,兩種方法的穩態精度基本相當。由圖11可見,相對于文獻[17]方法,所提方法的速度誤差的超調量雖有所增加,但仍然滿足期望的預設性能。但是,在高度跟蹤方面,所提方法保證了高度跟蹤誤差更小的超調量(見圖12)。進一步,所提方法相對于文獻[17]方法 在算法計算量方面的優勢具體如表2所示。由表2可見,當兩種方法的仿真時間都設置為50 s時,文獻[17]方法需要大約44 s的時間才能完成仿真程序的運行,而本文方法完成程序運行只需要大約12 s的時間。 圖11 速度跟蹤誤差對比 圖12 高度跟蹤誤差對比 表2 仿真時間對比 針對WV輸入受限條件下的跟蹤控制問題,提出了非脆弱神經PPC新方法。將神經逼近與模型變換相結合,避免了傳統反演控制的回饋遞推設計過程,并降低了控制復雜度與在線學習量。為了處理控制輸入問題,設計了新型補償系統對控制輸入飽和度進行補償。利用補償系統的狀態對傳統PPC的約束包絡進行改進,進而為WV的速度跟蹤誤差與高度跟蹤誤差設計了新型非脆弱約束包絡。仿真結果表明,存在輸入受限條件下,所提方法仍能保證跟蹤誤差期望的預設性能,并能克服傳統PPC的脆弱性缺陷。鑒于在仿真初始階段存在較大的控制輸入,后續研究將在借鑒文獻[18-20]研究結果的基礎上,深入研究對數函數與控制輸入速率約束等因素對控制輸入初值的影響問題。










2.2 高度控制器設計
















3 數值仿真與分析












4 結 論