許紅羊,李宏君,凡永華,閆 杰
(1. 西北工業大學航天學院,西安 710072;2. 西安航天動力研究所,西安 710100)
遠程操控無人作戰飛行器(Remotely piloted vehicle,RPV)可以同時發揮飛行員戰場感知能力好、決策能力強的指揮優勢和無人機戰術實現靈活、持續作戰能力強且全壽命周期成本低的性能優勢,同時可以有效減少人員傷亡是未來空中作戰的主要發展方向[1-2]。遠程操控飛行器在實際作戰中,飛行員可以在有人機或地面控制站通過人-機界面顯示的飛行器狀態按照作戰任務實時對飛行器進行遠程駕駛[3-4]。由于RPV具有飛行包線范圍大、模型高度非線性以及參數不確定等特點,此外在實際工程應用中,對于遠程操控人員而言,其對RPV的操控效果不僅與RPV本身的氣動特性有關還與RPV飛行控制系統的響應特性和舵機等執行機構的非線性特性相關,因此,充分考慮遠程操控飛行器動力學和控制系統特性,建立合理的、精確的控制系統模型是開展RPV遠程操控系統設計的關鍵[5-6]。
目前,國內外學者針對RPV的遠程操控問題做了大量的研究工作,大部分研究是基于確定性模型的[7-9]。文獻[10]分析了遠程操控無人機較大的數據鏈路延遲對操作品質的影響,針對無人機遠程操控存在時滯的問題,提出了一種基于線性時不變模型的狀態預測方法,有效的減輕了飛行員的工作負荷提高了Cooper-Harper評級。然而,由于系統存在未建模動態和附加擾動,整體的性能未得到改善。文獻[11]同樣以確定性線性模型為基礎,采用基于模型的預測方法提出了三種遠程操控飛行器的狀態預測算法,顯然這些方法只適用于理想模型假設的條件下。文獻[12]在無人機遠程操控技術研究中考慮了噪聲的影響建立了無人機的線性離散模型。文獻[13]針對具有參數不確定性的系統,采用Lyapunov-Krasovskii方法設計了模型參考自適應控制器,有效的解決了系統存在輸入延遲的問題。以上的研究在遠程操控飛行器延遲預測和魯棒控制等方面均取得了很好的效果,但它們都假設模型已知或在建模過程中都沒有考慮到遠程操控飛行器飛行控制系統本身的響應特性和舵機等執行機構的非線性特性對RPV閉環系統的影響。
目前針對模型存在非線性、未建模動態和附加擾動等問題,智能控制算法得到了廣泛的應用[14-17]。徑向基函數(RBF)神經網絡由于具有良好的泛化能力,能在一個緊湊集和任意精度下逼近任何非線性函數,是解決具有未建模動態的非線性系統建模的有效途徑[18-19]。文獻[20-23]針對典型的非線性系統采用神經網絡方法有效的解決了模型的不確定性,并通過Lyapunov理論證明了系統的穩定性。
本文針對遠程操控飛行器氣動特性復雜、氣動-控制強相關,無法精確建模的問題,提出了一種自適應神經網絡狀態觀測器設計方法實現對遠程操控飛行器控制系統模型的在線辨識。考慮到遠程操控飛行器動力學和飛行器控制系統的不確定性,將飛行器的動力學環節與自動駕駛儀構成的閉環回路作為一個整體建立了遠程操控飛行器控制系統的非線性模型。針對模型中存在未建模動態的問題,采用神經網絡算法對非線性動力學模型進行在線辨識,并引入魯棒項對擾動進行抑制。設計自適應律對神經網絡的權值進行實時調整,保證了系統的穩定性,并基于Lyapunov理論證明了觀測器的估計誤差是最終一致有界的。仿真結果表明,所設計的觀測器能夠保證遠程操控飛行器在存在未建模動態和附加擾動的情況下具有良好的估計性能。
遠程操控飛行器縱向通道動力學模型如下:
(1)
式中:H,V,α,?和q分別表示飛行器的高度、速度、攻角、俯仰角和俯仰角速度,Vy和ny分別為法向速度和法向過載,Iyy為俯仰轉動慣量,m為質量,g為重力加速度,Myy為俯仰力矩,其符合定義為正的升降舵偏角產生負力矩,L和D分別為飛行器的升力和阻力。L,D和Myy的具體表達式如下:
(2)
(3)
式中:Ma為馬赫數,ρ0和H0是標準大氣密度以及相應的高度,1/Hs是大氣密度的衰減律。δe為升降舵偏角。
遠程操控飛行器在執行作戰任務時,控制站與飛行器通過數據鏈路進行遠程通信,飛行員根據人-機界面顯示的飛行器飛行參數,按照戰術任務形成操控指令。飛行器實時接收飛行員的操控指令,飛行器的飛行控制系統按照預定的控制算法生成舵機控制指令,舵機按照指令偏轉舵偏,進而控制飛行器按照飛行員的意圖飛行。因此對于遠程操控人員,在設計和操控RPV時不僅要考慮飛行器本身的氣動特性和動力學特性還應將飛行器的控制系統和執行機構一并考慮在內,應該將RPV的氣動特性和控制系統作為一個整體建立氣動-控制閉環模型。RPV遠程操控示意圖如圖1所示。
從圖1可以看出,遠程操控飛行器的飛行控制系統主要包括:RPV控制器、執行機構和RPV動力學三個部分。考慮到實際工程中執行作戰任務時,RPV控制器通常采用法向過載控制系統實現戰術機動,因此本文對采用法向過載控制器的RPV對象進行建模分析。其模型主要存在以下三個難點:1)控制系統的響應特性隨著飛行包線和作戰任務的不同具有很大的變化,很難用模型精確描述;2)執行機構舵機系統存在死區和舵機飽和等非線性約束,使模型存在非線性;3)RPV飛行器氣動特性復雜,戰術機動過程中通道間耦合較大,模型不確定性強。綜上所述,RPV飛行器法向過載控制系統從過載指令到過載響應間的動態模型具有非線性和不確定性的特點,考慮附加擾動的影響,確定如下模型形式:
(4)
注1. 本文的研究目標為:設計一種自適應神經網絡觀測器,在線辨識模型(4)中的未知非線性函數f(x)和g(x),對系統狀態進行估計,從而使得狀態估計誤差是最終一致有界的。
采用RBF網絡,可實現未知非線性函數λ(ξ)的逼近,RBF網絡算法為:
λ(ξ)=W*TΦ(ξ)+ε(ξ)
(5)
(6)

采用RBF神經網絡逼近未知函數λ,網絡輸入取ξi,則RBF網絡的輸出為:
(7)
針對式(4),可設計如下觀測器:
(8)
(9)
(10)
則可得出如下的輸出誤差傳遞函數方程:
(11)
式中:s表示微分算子d/dt,線性傳遞函數H(s)=CT(sI-A+ΓCT)-1b,且H(s)為嚴格正實。
引理1[18]. 如果系數矩陣A滿足Hurwitz條件,且有理函數H(s)=CT(sI-A)-1b是嚴格正實的,那么存在一個正定對稱矩陣P使得:
ATP+PA=-Q,Pb=C
(12)
式中:Q為正定對稱矩陣。
引理2[18]. 考慮如下形式的線性時不變系統:
(13)
式中:x(t)∈Rn,u(t)∈Rm,矩陣A∈Rn×n,B∈Rn×m,則由文獻[18]可得,對于式(13)中x(t)的任意解均滿足:
(14)
式中:k1隨著x0指數衰減到零,k2是一個正常數,其值取決于矩陣A的特征值。
在觀測器式(8)中,f(x)和g(x)均采用RBF神經網絡進行估計。由2.1小節可知,未知連續非線性函數可采用理想權值W*和足夠數量的基函數Φ(x)組成的神經網絡表示。即:
(15)
式中:x∈Qx?Rp為網絡的輸入向量,p是神經網絡輸入的維數,ε1(x)和ε2(x)是神經網絡的逼近誤差,ε1,N和ε2,N為逼近誤差的上界。

采用神經網絡逼近f(x)和g(x),表示為:
(16)
(17)
則式(17)可寫為
(18)
且wi(t)為有界的,即:
式中:β1,β2>0。
可設計如下的神經網絡觀測器:
(19)
式中:v1和v2為魯棒項。進一步可得估計誤差為:
(20)
由式(20)可得,輸出誤差的傳遞函數方程可表示為:
(21)
式中:H(s)為由(A-ΓCT,b,C)定義的已知傳遞函數,且極點均在復平面的左半平面內。進一步將式(21)表示為如下形式:
(22)

(23)

注3. 式(22)的每一項都需要經過L-1(s)濾波。這個誤差方程僅用作分析。
給出式(22)的狀態空間實現如下:
(24)

神經網絡觀測器的魯棒項由以下形式給出:
(25)
式中:D1≥β1σM;D2≥β2σMud;σM=σmax[L-1(s)];σmax[·]為最大奇異值。
設計神經網絡自適應律為:
(26)
RPV自適應神經網絡觀測器結構如圖2所示。

證. 考慮如下Lyapunov函數:
(27)
式中:P=PT>0,由于H(s)L(s)是嚴格正實,則存在P=PT>0使得
(28)
式中:Q=QT>0。對函數V求導,結合式(28)有:
(29)
考慮式(25)、式(26)有:
(30)
由于

則有:
(31)

(32)
或
(33)
整理式(20)為
(34)
式中:
w2+ε2)u+d+v1+v2。
(35)
進一步可得,式(34)的解為
(36)
取
Ξ(t,0)=exp((A-ΓCT)t),Ξ(t,τ)=exp((A-ΓCT)t-(A-ΓCT)τ),
則上述方程可改寫為:
(37)
由于
exp((A-ΓCT)t-(A-ΓCT)τ)=
exp(A(t-τ))exp(-ΓCT(t-τ))=
m0exp(-α(t-τ))
式中:m0=exp(A(t-τ)),α=ΓCT。則有,Ξ(t,τ)=m0exp(-α(t-τ));m0exp(-α(t-τ))是Ξ(t,τ)的上界,m0和α均為正常數。
根據引理2和式(34)可得:
(38)
式中:

定義c=w1+ε1+(w2+ε2)u+d+v1+v2,則:
(39)
由于:
(40)
同理可得
(41)
(42)
將式(42)代入式(38)中,可得
(43)

為了驗證本文提出的自適應RBF觀測器的有效性和魯棒性,基于前述的模型進行了數字仿真。仿真的初始條件為:飛行高度H0=8000 m,飛行速度V0=246 m/s,法向速度Vy0=0 m/s,攻角α0=0 rad,俯仰角?0=0 rad,俯仰角速度q0=0 rad/s,法向過載ny0=0。
文中以工程上常用的飛行器法向過載三回路自動駕駛儀為例,作為遠程操控飛行器研究對象,通過本文提出的方法對控制系統輸入輸出模型進行逼近,對系統狀態進行估計。仿真所用的RPV法向過載控制律如下:
(44)
式中:kq,kα和kny為控制系統的增益,分別取值為kq=-0.3738,kα=4.1729和kny=0.15確保控制系統具有良好的響應特性。


仿真中控制參數不變,首先在標稱大氣的情況下,采用本文提出的方法進行仿真校驗方法的有效性。此外,在有氣動偏差、舵機模型非線性和外界擾動的情況下進行仿真,校驗了該方法的魯棒性。
在標稱情況下進行仿真校驗,仿真結果如圖3~6所示。圖3給出了RPV法向過載控制系統的響應特性,從圖中可以看出法向過載響應曲線光滑,能夠快速跟蹤過載指令。圖4中的(a)~(c)分別為RPV法向過載控制系統輸出的法向過載、法向速度和高度的實際值和自適應神經網絡觀測器輸出的相應狀態的估計值。圖5為估計誤差。從圖4和圖5可以看出,在存在初始狀態偏差的情況下,法向過載估計值1.5 s快速收斂到實際值,法向速度和高度的收斂速度分別為0.8 s和0.2 s,且隨后的估計誤差收斂到零。圖6給出了神經網絡輸出的非線性函數f(x)和g(x)的逼近值。從圖中可以看出,逼近曲線光滑且收斂。
為了校驗本文所提出的觀測器的魯棒性,考慮在有氣動偏差、舵機模型死區和外界擾動的情況下進行仿真。引入+30%的氣動力矩偏差和+10%的氣動力偏差,舵機死區選為±0.2°,外界擾動d(t)=0.1cos(0.7t),仿真結果如圖7~10所示。
從圖7法向過載響應、圖8(a)法向過載狀態估計曲線和圖9(a)的估計誤差曲線可以看出,在存在氣動偏差、舵機死區和外界擾動的情況下,法向過載估計值能夠快速收斂至實際值,估計誤差基本為零,在法向過載指令過零時,由于舵機死區的影響,過載響應出現0.1 s保持不變的現象,過載估計值與過載實際值吻合較好,估計誤差小于0.01。從圖8(b)和圖9(b)可以看出法向速度估計誤差小于0.004 m/s,從圖8(c)和圖9(c)可以看出高度估計值快速收斂至實際值,在存在氣動偏差、舵機死區和外界擾動的情況下估計誤差仍然快速收斂至零。圖10給出了神經網絡輸出的非線性函數f(x)和g(x)的逼近值。從圖中可以看出,逼近曲線光滑且收斂。通過仿真校驗,證明了本文所提方法的有效性和魯棒性。
本文針對無人飛行器遠程操控系統設計時,無法精確建立遠程操控飛行器控制系統模型的問題,提出了一種基于自適應神經網絡的非線性模型逼近方法,實現了對遠程操控飛行器動力學和控制系統閉環特性的估計。將飛行器的動力學環節與自動駕駛儀構成的閉環回路作為一個整體建立了遠程操控飛行器控制系統的非線性模型。針對模型中存在未建模動態的問題,采用神經網絡算法對非線性動力學模型進行在線辨識,并引入魯棒項對附加擾動進行抑制。設計自適應律對神經網絡的權值進行實時調整,保證了系統的穩定性,并基于Lyapunov理論證明了觀測器的估計誤差是最終一致有界的。仿真表明所設計的非線性觀測器,可以保證系統在存在氣動偏差、舵機非線性和外界擾動的情況下對遠程操控飛行器狀態具有良好的估計性能。