平流層飛艇巡航姿態(tài)自適應(yīng)神經(jīng)網(wǎng)絡(luò)補(bǔ)償控制*

2009-12-12 05:23:13劉其睿

空間控制技術(shù)與應(yīng)用 2009年4期

劉其睿，李勇

（1.北京控制工程研究所，北京100190；2.空間智能控制技術(shù)國(guó)家級(jí)重點(diǎn)實(shí)驗(yàn)室，北京100190；3.中國(guó)空間技術(shù)研究院研究發(fā)展中心，北京100094）

劉其睿1，2，李勇3

研究了一種基于自適應(yīng)神經(jīng)網(wǎng)絡(luò)補(bǔ)償?shù)钠搅鲗语w艇前向速度與姿態(tài)控制系統(tǒng)設(shè)計(jì)方法.針對(duì)近似模型進(jìn)行常規(guī)線性動(dòng)態(tài)補(bǔ)償器設(shè)計(jì)，并引入自適應(yīng)徑向基函數(shù)（RBF，radial basis function）神經(jīng)網(wǎng)絡(luò)對(duì)模型誤差進(jìn)行補(bǔ)償.根據(jù)Lyapunov方法得到神經(jīng)網(wǎng)絡(luò)權(quán)值自適應(yīng)律，保證了閉環(huán)系統(tǒng)誤差信號(hào)一致最終有界.仿真結(jié)果表明對(duì)于兩類不同的飛艇模型，所設(shè)計(jì)的控制器在響應(yīng)性及對(duì)未知環(huán)境風(fēng)速作用的魯棒性方面均具有良好的效果.

平流層飛艇；巡航姿態(tài)；神經(jīng)網(wǎng)絡(luò)；自適應(yīng)

平流層飛艇是工作在平流層中下層（20～40 km）的可控浮空器，因其可作為執(zhí)行高空長(zhǎng)航時(shí)應(yīng)用任務(wù)的平臺(tái)，近年來(lái)成為了全球范圍的研究熱點(diǎn).實(shí)現(xiàn)平流層飛艇自主運(yùn)行的關(guān)鍵就是要解決其自主綜合控制問(wèn)題［1］，巡航控制問(wèn)題是其中的一個(gè)重要方面.

由于平流層飛艇動(dòng)力學(xué)模型具有非線性、多變量及參數(shù)慢時(shí)變等特點(diǎn)，經(jīng)典的線性控制理論難以解決其控制問(wèn)題，目前的研究文獻(xiàn)多集中于動(dòng)態(tài)逆、反步法、滑模控制等先進(jìn)控制方法領(lǐng)域［2］.文獻(xiàn)［3］將線性矩陣不等式（LMI，linear matrix inequality）方法應(yīng)用于飛艇的魯棒航向控制系統(tǒng)設(shè)計(jì)，所得到的控制器對(duì)于具有參數(shù)不確定性的飛艇模型有著良好的跟蹤性能.但控制律的狀態(tài)反饋形式要求狀態(tài)量精確已知，另一方面采用固定增益使得控制律具有較大的保守性.

2001年，Calise等人提出了一種基于反饋線性化和自適應(yīng)神經(jīng)網(wǎng)絡(luò)補(bǔ)償?shù)闹苯幼赃m應(yīng)輸出反饋控制方法［4］，其基本思路是利用徑向基函數(shù)（RBF）神經(jīng)網(wǎng)絡(luò)對(duì)非線性動(dòng)力學(xué)函數(shù)的逼近能力補(bǔ)償反饋線性化帶來(lái)的模型誤差，以提高常規(guī)線性控制器的魯棒性，根據(jù)Lyapunov方法設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)權(quán)值的自適應(yīng)律，從而保證閉環(huán)系統(tǒng)誤差信號(hào)一致最終有界.本文主要參考這一思路，對(duì)平流層飛艇的前向速度與姿態(tài)控制系統(tǒng)進(jìn)行了設(shè)計(jì).

1 平流層飛艇的數(shù)學(xué)描述

目前公開(kāi)發(fā)表的研究文獻(xiàn)中，歐陽(yáng)晉［5］等人給出了較為完整的飛艇參數(shù)數(shù)據(jù)，所建立的飛艇模型采用剛體假設(shè).本文所研究的飛艇模型以文獻(xiàn)［5］中所給出的模型為基礎(chǔ).假設(shè)飛艇具有對(duì)稱平面xoz，重心在對(duì)稱平面內(nèi)，慣量積 Ixy＝Ixz＝0.直接取推力 Tthrust和滾動(dòng)、俯仰、偏航力矩 Mroll、Mpitch、Myaw作為控制量.其六自由度動(dòng)力學(xué)和運(yùn)動(dòng)學(xué)方程描述如下：

其中式（1）也可寫(xiě)為如下形式：

在上述方程中，f1（·），f2（·）是矩陣形式的函數(shù).狀態(tài)向量x＝[ u v w p q r]T，代表飛艇在本體系的三個(gè)線速度分量和三個(gè)角速度分量；姿態(tài)角向量Θ＝[ φ θ ψ]T，代表飛艇本體系相對(duì)地面系的三個(gè)姿態(tài)角分量，詳細(xì)說(shuō)明參見(jiàn)參考文獻(xiàn)［5］.式（1）中的控制量u＝[ TthrustMrollMpitchMyaw]T.在式（3）中，Mm為質(zhì)量矩陣

式中，m為飛艇質(zhì)量，Ix，Iy，Iz，Ixz為飛艇繞 ox，oy，oz軸的轉(zhuǎn)動(dòng)慣量和繞 xoz平面的慣量積，mii（i＝1，2，…，6）為飛艇的流體附加質(zhì)量，xG，zG是飛艇質(zhì)心在ox，oz軸的坐標(biāo).式（3）右邊有流體慣性力項(xiàng) Df，空氣動(dòng)力項(xiàng)At，重力項(xiàng)G，浮力項(xiàng)B，其具體表達(dá)式見(jiàn)參考文獻(xiàn)［5］，此處不再贅述.式中的控制量 U＝[Tthrust0 0 MrollMpitchMyaw]T，僅在形式上與式（1）中的u有區(qū)別.f2（·）的形式如下：本文的設(shè)計(jì)目標(biāo)為設(shè)計(jì)控制量u，使得飛艇巡航速度矢量在存在參數(shù)不確定和未知風(fēng)速干擾條件下跟蹤期望的巡航速度指令，即使得前向速度u和巡航姿態(tài)角Θ分別跟蹤前向速度指令uc及姿態(tài)角指令

2 基于自適應(yīng)神經(jīng)網(wǎng)絡(luò)補(bǔ)償?shù)淖藨B(tài)控制器設(shè)計(jì)

2.1 基于自適應(yīng)神經(jīng)網(wǎng)絡(luò)補(bǔ)償?shù)目刂品椒?/h3>
對(duì)于一般的非線性單輸入單輸出（SISO，singleinput-single-output）系統(tǒng)
式中，x′是 n維狀態(tài)向量，u′，y′分別是系統(tǒng)輸入和輸出信號(hào).假設(shè)系統(tǒng)滿足輸出反饋線性化條件并具有相對(duì)階 r［6］，即
式中 hr?drh／d tr，且有?hi／?u′＝0，0≤i＜r及?hr／?u′≠0.引入變換
其中 Δ′＝Δ′（x′，u′）＝hr（x′，u′）－′，u′）可視為擾動(dòng)信號(hào).此時(shí)系統(tǒng)的實(shí)際控制輸入u′可直接求逆得到
假設(shè)系統(tǒng)輸出y′要求跟蹤已知的參考輸入y′c.偽控制信號(hào)v′選為如下形式：
圖1 基于自適應(yīng)神經(jīng)網(wǎng)絡(luò)補(bǔ)償?shù)目刂圃O(shè)計(jì)原理
線性動(dòng)態(tài)補(bǔ)償器是單輸入雙輸出系統(tǒng)
自適應(yīng)神經(jīng)網(wǎng)絡(luò)的輸出
式中ηci是每個(gè)神經(jīng)元的中心值.神經(jīng)網(wǎng)絡(luò)的輸入η′為
式中，
這里 n1≥n，d＞0.
神經(jīng)網(wǎng)絡(luò)權(quán)值自適應(yīng)律為
式中，F(xiàn)＞0，λw＞0是自適應(yīng)增益.φf(shuō)是 φ經(jīng)過(guò)低通濾波器 T－1（s）的輸出.T（s）是多項(xiàng)式，其設(shè)計(jì)與線性動(dòng)態(tài)補(bǔ)償器（10）有關(guān).多項(xiàng)式 Ddc（s），Ndc（s），Nad（s）以及 T（s）需要滿足一定的條件［4］.
文獻(xiàn)［4］的定理2采用 Lyapunov方法證明：在設(shè)計(jì)參數(shù)滿足一定的條件下，上述控制器設(shè)計(jì)能夠保證閉環(huán)系統(tǒng)的誤差信號(hào)一致最終有界（關(guān)于系統(tǒng)的解一致最終有界的定義見(jiàn)參考文獻(xiàn)［11］）.

2.2 姿態(tài)控制器設(shè)計(jì)

在本文的姿態(tài)控制器設(shè)計(jì)問(wèn)題中，以姿態(tài)角Θ作為輸出量，容易驗(yàn)證系統(tǒng)（1）～（2）滿足輸出反饋線性化條件，且系統(tǒng)相對(duì)階為2

但函數(shù)h2（·）的形式難以直接得到.考慮將式（3）中的 Mm分解為確定項(xiàng)和不確定項(xiàng) ΔMm，式（2）中的 f2分解為確定項(xiàng)和不確定項(xiàng) Δf2

注意到經(jīng)過(guò)以上式（17）～（19）的處理，將流體附加質(zhì)量、流體慣性力、空氣動(dòng)力等項(xiàng)歸納到不確定項(xiàng)中，使得只包含確定項(xiàng)的近似模型無(wú)需考慮流體附加質(zhì)量、空氣動(dòng)力系數(shù)等參數(shù)的具體數(shù)值.而通常這些參數(shù)需要數(shù)值估算或?qū)嶒?yàn)測(cè)定，難以得到精確值.在此基礎(chǔ)上，原系統(tǒng)模型（1）～（2）可改寫(xiě)為如下形式：

式中，Δu、Δv、Δw及 Δ′是近似模型與實(shí)際對(duì)象之間的偏差.根據(jù)反饋線性化的思想，引入輸入變換

系統(tǒng)模型（1）～（2）轉(zhuǎn)化為

顯然實(shí)際控制信號(hào) u可由式（23）及（24）逆計(jì)算得到.這樣原設(shè)計(jì)問(wèn)題就轉(zhuǎn)化為偽控制信號(hào) v1及 vΘ的設(shè)計(jì)問(wèn)題.

觀察式（25）及（26）兩組方程，式（25）是一階系統(tǒng)，其控制設(shè)計(jì)問(wèn)題較為簡(jiǎn)單，這里采用常規(guī)的線性動(dòng)態(tài)補(bǔ)償器設(shè)計(jì).式（26）是二階系統(tǒng)，且與式（25）相比屬于快動(dòng)態(tài)，其控制設(shè)計(jì)較為困難.將式（26）按照滾動(dòng)、俯仰、偏航通道分解為三個(gè)SISO子系統(tǒng)，在每個(gè)通道上的統(tǒng)一形式為

于是可以按照?qǐng)D1的標(biāo)準(zhǔn)模型將偽控制信號(hào)vs設(shè)計(jì)為如下形式：

式中，Θsc是Θc在 vs相應(yīng)通道上的分量，通過(guò)二階濾波器可以很容易的得到.vdc是線性動(dòng)態(tài)補(bǔ)償器的輸出，用于使式（27）在 Δ′s＝0時(shí)的近似模型穩(wěn)定.vad是自適應(yīng)神經(jīng)網(wǎng)絡(luò)的輸出，用于近似抵消 Δ′s.并按照上一節(jié)中的介紹依次進(jìn)行vdc及vad的設(shè)計(jì).

對(duì)于v1的設(shè)計(jì)則較為簡(jiǎn)單，可按經(jīng)典方法設(shè)計(jì)傳遞函數(shù)形式的動(dòng)態(tài)補(bǔ)償器如下：

根據(jù)文獻(xiàn)［4］的定理2，如上所述的控制器設(shè)計(jì)能夠保證閉環(huán)系統(tǒng)的誤差信號(hào)一致最終有界.

3 仿真結(jié)果

本文的仿真分別對(duì)兩類飛艇模型A和B進(jìn)行驗(yàn)證.飛艇模型A的參數(shù)如質(zhì)量、轉(zhuǎn)動(dòng)慣量、附加質(zhì)量和氣動(dòng)參數(shù)等數(shù)值引自參考文獻(xiàn)［5］及文獻(xiàn)［10］.考慮到飛艇模型A是在近海平面高度飛行的19 m小型驗(yàn)證艇，為驗(yàn)證本控制器設(shè)計(jì)對(duì)平流層飛艇的控制效果，在參考文獻(xiàn)［1］所給250 m大艇數(shù)據(jù)的基礎(chǔ)上計(jì)算得到飛艇模型B的參數(shù).為考察控制器的抗干擾能力，根據(jù)平流層風(fēng)速特性并不失一般性，在仿真中引入風(fēng)速模型為地面系X軸方向存在－10 m／s的恒定風(fēng)速，同時(shí)三軸均存在均方差為0.316 m／s的零均值高斯白噪聲隨機(jī)風(fēng)速.控制器設(shè)計(jì)參數(shù)如下.

滾動(dòng)、俯仰、偏航通道的線性動(dòng)態(tài)補(bǔ)償器統(tǒng)一設(shè)計(jì)為

為消除穩(wěn)態(tài)偏差，分別在每個(gè)通道增加了PI控制.

飛艇模型A在無(wú)風(fēng)和有風(fēng)兩種情況下的仿真見(jiàn)圖2和圖3.可見(jiàn)在速度與姿態(tài)控制系統(tǒng)的作用下，飛艇能夠迅速跟蹤參考指令，在無(wú)風(fēng)情況時(shí)響應(yīng)時(shí)間在10 s左右，穩(wěn)態(tài)偏差小，并且在存在未知風(fēng)速時(shí)仍能穩(wěn)定跟蹤，表現(xiàn)出良好的機(jī)動(dòng)性與魯棒性.飛艇模型B在有風(fēng)擾時(shí)的仿真見(jiàn)圖4.其控制效果要好于飛艇模型A.

圖2 無(wú)風(fēng)擾時(shí)的飛艇模型A速度與姿態(tài)跟蹤性能

圖3 有風(fēng)擾時(shí)的飛艇模型A速度與姿態(tài)跟蹤性能

圖4 有風(fēng)擾時(shí)的飛艇模型B速度與姿態(tài)跟蹤性能

4 結(jié) 論

本文應(yīng)用基于自適應(yīng)神經(jīng)網(wǎng)絡(luò)補(bǔ)償?shù)脑O(shè)計(jì)方法，對(duì)平流層飛艇的前向速度與姿態(tài)控制系統(tǒng)進(jìn)行了設(shè)計(jì).該控制器設(shè)計(jì)方案對(duì)模型參數(shù)信息僅有較少的要求.仿真結(jié)果表明，對(duì)于兩類不同的飛艇模型，本文所設(shè)計(jì)的控制器均具有良好的響應(yīng)性和對(duì)未知的環(huán)境風(fēng)速作用的魯棒性，控制器設(shè)計(jì)是有效的和可靠的.

［1］Mueller J B，Paluszek M A，Zhao Y Y.Development of an aerodynamic model and control law design for a high altitude airship［C］.AIAA 3rd“Unmanned Unlimited”Technical Conference，Workshop and Exhibit，Chicago，Sep 2004

［2］Paiva E C，Benjovengo F，Bueno S S，et al.Nonlinear control approaches for an autonomous unmanned robotic airship［C］.AIAA Aviation Technology，Integration and Operations Conference，Belfast，Northern Ireland，Sep 2007

［3］屈衛(wèi)東，羅昌行，歐陽(yáng)晉.無(wú)人飛艇的魯棒航向控制系統(tǒng)設(shè)計(jì)［J］.系統(tǒng)仿真學(xué)報(bào)，2004，16（11）：2575-2579

［4］Calise A J，Hovakimyan N，Idan M.Adaptive output feedback control of nonlinear systems using neural networks［J］.Automatica，2001，37（8）：1201-1211

［5］歐陽(yáng)晉.空中無(wú)人飛艇的建模與控制方法研究［D］.上海交通大學(xué)，2003

［6］Isidori A.Nonlinear control systems［M］.Berlin：Springer，1995

［7］Kim Y，Lewis F.High level feedback control with neural networks［M］.NJ：World Scientific，1998

［8］Ioannu P A，Sun J.Robust adaptive control［M］.Englewood Cliffs，NJ：Prentice-Hall，1996

［9］Sanner R，Slotine J.Gaussian networks for direct adaptive control［J］.IEEE Transactions on Neural Networks，1992，3（6）：837-864

［10］王曉亮，劉丹，單雪雄.飛艇最優(yōu)飛行軌跡研究［J］.力學(xué)季刊，2005，26（4）：555-561

［11］Khalil H K.Nonlinear systems［M］.3rd ed.Upper Saddle River，NJ：Prentice-Hall，2002

Adaptive Neural Network Compensation for Stratospheric Airship Attitude Control of Cruising Phase

LIU Qirui1，2，LI Yong3
（1.Beijing Institute of Control Engineering，Beijing 100190，China；2.National Laboratory of Space Intelligent Control，Beijing 100190，China；3.R＆D Center，China Academy of Space Technology，Beijing 100094，China）

By designing a speed and attitude control system based on the adaptive neural network compensation，this paper investigates the cruise tracking control problem for the stratospheric airship.An adaptive RBFNN（radial basis function neural network）is used to compensate modeling errors，which come from the approximate model applied to a regular linear controller design.The network weight adaptation law，derived from the Lyapunov stability analysis，guarantees that the tracking errors are ultimately bounded.Simulation results demonstrate the excellent performance and robustness of the controller，even if environmental winds with unknown information exist.

stratospheric airship；cruise tracking；neural network；adaptive control

V448

1674-1579（2009）04-0034-05

*中國(guó)空間技術(shù)研究院自主研發(fā)課題及國(guó)家自然科學(xué)基金（60804016）資助項(xiàng)目.

2009-03-10

劉其睿（1981—），男，山東人，碩士研究生，研究方向?yàn)楹教炱髦悄芸刂?（e-mail：raymann67＠163.com）.