韓少君 倪 昆 熊寸平 張慶振
1.北京航空航天大學,北京 100191 2.北京航天自動控制研究所, 北京 100854
基于復合抗飽和策略的火星飛機自適應控制
韓少君1倪 昆1熊寸平2張慶振1
1.北京航空航天大學,北京 100191 2.北京航天自動控制研究所, 北京 100854

目前,伴隨著火星探測的興起,火星飛機越來越受重視。目前對火星大氣研究不充分,火星飛機飛行環境特殊,存在強烈的不確定性和干擾。同時稀薄的火星大氣與受限的飛機尺寸限制了操縱的機構控制能力。為了解決這2個關鍵問題,提出了一種基于復合抗飽和策略的自適應控制器,將模型誤差、不確定性和干擾視為系統的“總和擾動”,利用擴張狀態觀測器觀測并加以補償。針對控制能力受限帶來的控制飽和,提出偽控制限制與基于誤差補償的擴張狀態觀測器抗飽和方案相結合的復合抗飽和策略。仿真結果表明,該控制方法能較好地完成指令跟蹤,并有效抵制不確定性和干擾影響,效果良好,有效改善了控制飽和帶來的響應遲滯等現象,使系統具有較強的抗飽和特性。 關鍵詞 火星飛機;擴張狀態觀測器;偽控制限制;復合抗飽和策略
近年來,對于火星飛機作為火星探測科學平臺的討論不斷。傳統軌道探測器屬于大尺度探測,探測范圍廣,但探測顆粒度較大;火星探測器探測顆粒度較小,但屬于小尺度探測,活動范圍小。火星飛機則屬于中尺度探測[1],具有比天基平臺軌道探測更高的分辨率及比火星表面探測器更大的活動范圍,還具有比其他科學平臺更高的操縱性。但是,火星飛機控制系統設計中面臨幾大突出問題:控制受限、強干擾和不確定性。
目前國內外對火星飛機控制問題有一些研究,主要采用H∞控制、復合非線性反饋控制的方法來設計火星飛機的控制系統[2-3],這些文獻中的控制器大都是基于理想情況設計的。實際上,由于火星表面大氣稀薄、環境復雜, 火星飛機巡航飛行時,飛行跨度過大,或遇到外界干擾使飛行器的狀態發生突變,執行機構容易飽和。當執行機構飽和后,飛行控制系統的控制性能將下降,甚至不穩定。對于自適應控制系統,執行器的長期飽和將帶來嚴重不利的影響。因此,為了保證控制系統的性能,本文引入偽控制限制(Pseudo-ControlHedging,PCH)[4]及基于誤差補償的擴張狀態觀測器(ExtendedStateObserver,ESO)抗飽和方案[5]這2種機理不同但互補的抗飽和方案形成復合抗飽和策略,將其與控制系統結合,形成具有強魯棒性與抗飽和特性的控制系統。
本文從火星飛機的縱向模型出發,考慮巡航飛行控制要求與參數不確定性,對模型進行反饋線性化處理,繼而搭建基于擴張狀態觀測器的自適應控制系統,并且加入了復合抗飽和策略。給出了火星飛機模型、控制系統的結構與相關的數值仿真結果,驗證了本文提出方法的有效性和優越性。
研究模型是火星飛機模型,由于火星大氣稀薄,
假定火星飛機橫縱向耦合較弱,建立縱向模型
(1)
其中,V,γ,h,α,q,β分別為速度、航跡傾斜角、高度、攻角、俯仰角速度和發動機節流閥;L,D,T,Myy分別為升力、阻力、推力和俯仰力矩,具體計算公式見文獻[2]。
為了研究火星飛機巡航飛行控制,氣動數據是在標稱巡航段擬合簡化而得,以文獻[2]的氣動數據為基準,加入拉偏項如下
(2)
火星環境數據及火星飛機模型數據獲取自文獻[6],加入拉偏項如下
(3)

2.1 輸入/輸出線性化
反饋線性化的基本思想是通過狀態反饋消去非線性系統中的非線性部分,使閉環動態成為一個線性系統。輸入/輸出線性化是反饋線性化的一種,目的是建立系統輸出與控制輸入之間的一個簡單而直接的關系。對于MIMO系統,每一個輸出對時間求足夠次數的微分,直至結果出現至少一個控制量為止,并記微分次數為ri。對于m維輸出向量的n階非線性系統,其相對階r定義為
(4)
若r=n,則該系統能完全反饋線性化,沒有零動態。在設計控制器時,不需要檢驗內動態是否穩定[7]。
對于巡航飛行控制,輸出是火星飛機的速度V和高度h,輸入為節流閥設置βc和升降舵偏角δe。對速度和高度分別連續求3次和4次微分,可以得到線性輸出動態,則相對階r為7。考察式(4),系統階數n為7。由于r=n,系統能完全反饋線性化,具體推導參見文獻[8],結果如下所示
(5)
2.2 控制器設計
式(5)寫成緊湊形式
(6)
其中,f=[fV,fh]T,u=[βc,δe]T。
u=B-1(v-f)
(7)

根據式(7)設計非線性動態逆控制器
(8)
其中,
(9)
(10)
式(9)和(10)對應Vd,V,hd,h的各階導數均由跟蹤微分器生成。
結合上述式子,可以得到閉環系統的誤差動態
(11)
式(11)對應的特征方程為
(12)
根據飛行任務要求,調整上述特征方程的系數至符合Hurwitz判據,能使速度、高度的誤差動態漸進穩定到0。
2.3 擴張狀態觀測器(ESO)設計
火星飛機飛行過程中呈現很強的非線性特性,難以用解析式描述,導致動態逆控制器的控制性能降低。為了對系統的不確定性進行補償,引入擴張狀態觀測器。ESO是自抗擾控制的核心,它能對系統的總擾動進行動態觀測并在控制器中進行自適應補償,且ESO的構建不依賴于生成擾動的具體數學模型,十分實用[9]。
在式(6)中加入火星飛機模型的不確定性及外界擾動,并將其等效至速度及高度通道,得
(13)
其中,[gV,gh]T為等效擾動,在此假定執行機構沒有飽和情況出現,存在執行器飽和的情況將在后面詳細介紹。

(14)
對式(14)系統設計二階ESO
(15)
其中,非線性函數
g(z)=fal(z,α,δ)
(16)
根據文獻[10]中“參數動態確定法”選取合適的α,δ,β01,β02,擴張狀態觀測器在保證自身漸近穩定性的同時,可以對等效擾動進行很好的估計,高度回路ESO的設計基本相同。
在對等效擾動[gV,gh]T進行了準確的估計之后,對2.2節中設計的動態逆控制器加入對擾動的抑制,可以實現對指令信號更好的跟蹤,控制律為
(17)

(18)
可以看出,只要ESO觀測結果準確,等效擾動就可以得到很好的補償,速度和高度得以準確地跟蹤指令信號。
3.1 偽控制限制

(19)
將偽控制補償信號引入參考模型中,改變參考模型的狀態更新,進一步影響參考模型輸出,從而將執行機構的飽和特性影響轉移到參考模型中[4]。
偽控制限制結構如圖1所示。

圖1 偽控制限制結構
對于速度的參考模型,由于控制器的輸入需要速度的3次微分,因此選擇4階的跟蹤微分器,微分方程如下:
u=Vc
(20)
(21)
(22)
其中,
(23)

該跟蹤微分器輸出y的前3個分量,用于計算跟蹤誤差,即:
(24)

vcmd_V=x4
(25)
同理,對于高度的參考模型,選擇5階的跟蹤微分器,微分方程及參考模型的輸出如下:
u=hc
(26)
(27)
(28)

該跟蹤微分器輸出y的前4個分量,用于計算跟蹤誤差,即
(29)

vcmd_h=x5
(30)
以速度通道為例,假設控制指令過大,執行機構飽和,則產生對應的偽控制補償信號:
vh_V>0
(31)

分析來自La Esperanza地區調查的數據。首先,參與超市供應鏈的概率被評估為社會經濟,農業,交易成本和組織變量的函數。這一分析結果表明,社會經濟和農業特點無統計顯著性差異。這一結果的原因可能是調查人口的同質化,主要包括條件相似的小規模農戶。然而,交易成本與生產低質量風險,運輸和分級問題這些因素有非常重要的相關性,構成了農民在超市供應鏈中的參與約束。相反,供應鏈中相對較高的價格和對買家的信任,對農民加入又有積極的作用。有關交易成本的結果與本研究分析框架中的理論預期是一致的。
綜上,偽控制限制抗飽和策略將執行機構輸入動態對自適應控制器的影響轉化為對參考模型的影響,從而避免擴張狀態觀測器受執行機構輸入飽和的影響而輸出錯誤的補償信號。因此,引入偽控制限制抗飽和策略能保證擴張狀態觀測器估計補償作用的正常運行,使自適應控制系統具有一定的抗飽和特性。
3.2 基于誤差補償的ESO抗飽和策略
執行機構飽和使控制器輸出與執行器輸出之間存在誤差,導致控制器狀態無法準確估計。ESO具有估計執行機構狀態的功能,因此,可以將控制器輸出與執行器輸出之間的誤差反饋回ESO,這樣ESO就可估計并補償執行機構飽和所帶來的誤差,實現抗飽和效果。同樣,飽和約束環節前后的信號一致,補償環節將不再發揮作用,系統轉換為一般的自適應控制系統。
這種基于誤差補償的ESO抗飽和機構如圖 2所示。

圖2 基于誤差補償的ESO抗飽和方案
圖2中,kc為可調節的誤差補償系數,增加kc可以使誤差得到更快的補償,但是會造成ESO的不穩定,因此kc需要調節至合適的值[5]。
以速度通道為例,擴張狀態觀測器經過抗飽和環節之后由式(15)成為
(32)
此時,由于控制飽和所造成的誤差可以借助ESO的估計能力得到估計和補償。
3.3 復合抗飽和策略與控制系統的結合
實際控制系統中,執行機構由于自身特性的限制,輸出值不能準確地跟蹤控制器輸出,導致系統動態性能變差,甚至崩潰。執行機構約束造成控制器輸出與執行器輸出之間存在誤差,抗飽和策略的實現正是基于這個誤差。
由3.1節可知,偽控制限制抗飽和策略將控制器輸出與執行器輸出之間的誤差稱為偽控制補償信號,通過輸入輸出線性化后的模型求解轉化為參考模型補償信號,將其引入參考模型生成環節中,通過減緩參考模型信號達到抗飽和的作用,從而保證擴張狀態觀測器的正常工作。
3.2節中基于誤差補償的擴張狀態觀測器抗飽和方案同樣是基于控制器輸出與執行器輸出之間誤差進行工作的。將該誤差引入ESO中,利用ESO自身的估計補償作用對其進行估計并補償。通過改變ESO輸出前饋補償量調節控制器輸出來達到抗飽和效果。
因此,偽控制限制與基于誤差補償的擴張狀態觀測器抗飽和方案同是基于控制器輸出與執行器輸出之間誤差進行工作,偽控制限制抗飽和策略通過調節參考模型信號保證擴張狀態觀測器的正常工作,擴張狀態觀測器通過對該誤差進行估計補償,調節執行器輸入達到抗飽和的效果。兩者相輔相成、協同運作,成為一種復合抗飽和策略,與控制系統結合可以有效提高系統的抗飽和性能。
完整的控制系統如圖3所示。
初始條件:標稱巡航段(V=150m/s,h=2500m)的配平狀態,如下所示:
V=150m/s,γ=0rad,α=0.0281rad,


圖3 復合抗飽和策略與控制系統結合
對于升降舵,傳遞函數為二階慣性環節(ξ=0.707,ωn=25),舵面偏轉角最大范圍為±20°,偏轉速率最大范圍為±60(°)/s。對于發動機節流閥,工作范圍為[0,1]。
仿真指令:Vd=220m/s,hd=2700m的階躍信號;ESO參數:α=0.5,δ=0.05,β01=100,β02=500;ESO誤差補償系數:kc_ βc=0.5,kc_δe= 0.9。
控制系統參數:λ1=0.8,λ2=1,


設定如下拉偏量:
無參數拉偏、加入擴張狀態觀測器、不加入抗飽和策略時,仿真結果如圖 4所示,由于執行機構的持續飽和,ESO輸出錯誤的補償信號,導致高度和速度回路全都發散,最終導致系統崩潰。
在以上仿真基礎上加入復合抗飽和策略,仿真結果如圖 5所示,高度和速度準確跟蹤參考模型輸出。

圖4 標稱情況無抗飽和策略仿真結果
控制量仿真曲線如圖 6所示,可以看出發動機節流閥在0~38s內一直處于幅值飽和狀態,而升降舵在0~3s內處于速率飽和狀態。擴張狀態觀測器結構中,由于飽和誤差存在產生誤差補償量,對應于控制量飽和時段,基于誤差補償的擴張狀態觀測器抗飽和策略一直工作到執行機構飽和結束,由于執行機構飽和情況不太嚴重,僅有這一種抗飽和策略在工作,偽控制限制抗飽和策略沒有產生作用,輸出為0。
在參數拉偏、加入復合抗飽和策略時,仿真結果如圖 7所示。由仿真結果可見,在執行機構飽和情況下,復合抗飽和策略同時作用,有效地消除執行機構飽和所帶來的誤差,高度和速度準確跟蹤參考模型輸出。
由圖8可見,執行機構飽和時,偽控制限制環節有輸出,從而影響參考模型的輸出,減弱執行機構飽和影響。同時,ESO中誤差補償環節也在作用,通過ESO的估計補償作用補償消除部分執行機構飽和所帶來的誤差,通過復合抗飽和策略的應用,最終使系統跟蹤誤差無靜差鎮定到0,使系統具有較強的抗飽和特性。

圖5 標稱情況應用復合抗飽和策略速度及高度跟蹤曲線


圖6 標稱情況應用復合抗飽和策略控制量曲線

圖7 拉偏情況應用復合抗飽和策略速度及高度跟蹤曲線


圖8 拉偏情況應用復合抗飽和策略控制量曲線
研究了火星飛機巡航飛行控制問題,針對參數不確定性和輸入飽和,設計了基于復合抗飽和策略的自適應控制器。利用擴張狀態觀測器良好的估計補償能力,在沒有或短時間的輸入飽和情況下,擴張狀態觀測器能很好地消除模型誤差,使系統的跟蹤誤差無靜差鎮定。同時,控制系統采用復合抗飽和策略,通過偽控制限制調節參考模型輸出以及通過ESO估計補償執行機構飽和帶來的誤差,避免長時間的輸入飽和導致系統崩潰,使系統能夠克服一定程度的輸入受限問題。仿真結果表明,所設計的基于復合抗飽和策略的自適應控制系統具有較強的穩定性、魯棒性和抗飽和特性。
[1]GuynnM,CroomM,SmithS,etal.EvolutionofaMarsAirplaneConceptfortheARESMarsScoutMission[C]//2ndAIAA"UnmannedUnlimited"Conf.andWorkshop&Exhibit. 2003: 6578.
[2]LiuY,PengK,LuY,etal.FlightControlLawUsingCompositeNonlinearFeedbackTechniqueforaMarsAirplane[J].JournalofGuidance,Control,andDynamics, 2016: 2199-2204.
[3]BhattacharyaR,ValasekJ,SinghB,etal.OnModelingandRobustControlofARES[C]//AIAAGuidance,NavigationandControlConferenceandExhibit. 2008: 7454.
[4] 軒慧娉, 賈曉洪, 馬建偉, 劉忠. 基于偽控制隔離器的導彈控制方法研究[J]. 彈箭與制導學報, 2010, 30(5): 17-19.(XuanHuiping,JiaXiaohong,MaJianwei,LiuZhong.AdaptiveControlUsingPseudoControlHedgingforMissileCompoundControlSystem[J].JournalofProjectiles,Rockets,MissilesandGuidance, 2010, 30(5): 17-19.)
[5] 周宏, 譚文. 線性自抗擾控制的抗飽和補償措施[J]. 控制理論與應用, 2014, 31(11):1457-1463.(ZhouHong,TanWen.Anti-windupSchemesforLinearActiveDisturbanceRejectionControl[J].ControlTheory&Applications, 2014, 31(11): 1457-1463.)
[6]HjartarsonA,PawY,ChakrabortyA.ModelingandControlDesignfortheARESAircraft,Model-basedAerospaceChallenge# 1[C]//AIAAGuidance,NavigationandControlConferenceandExhibit. 2008: 7452.
[7]IsidoriA.NonlinearControlSystems[M].SpringerScience&BusinessMedia, 2013.
[8] Xu H, Mirmirani M D, Ioannou P A. Adaptive Sliding Mode Control Design for a Hypersonic Flight Vehicle[J]. Journal of Guidance, Control, and Dynamics, 2004, 27(5): 829-838.
[9] Han J. From PID to Active Disturbance Rejection Control[J]. IEEE Transactions on Industrial Electronics, 2009, 56(3): 900-906.
[10] 康忠健, 陳學允. 非線性擴張狀態觀測器的一種設計方法[J]. 電機與控制學報, 2001, 5(3): 199-203.(Kang Zhongjian, Chen Xueyun. A Design Method of Nonlinear Extension State Observer [J]. Electric Machines and Control, 2001, 5(3): 199-203.)
[11] 韓京清, 王偉. 非線性跟蹤一微分器[J]. 系統科學與數學, 1994, 14(2): 177-183.(Han Jingqing, Wang Wei. Nonlinear Traclong-differeentiator[J]. Journal of Systems Science and Mathematical Sciences, 1994, 14(2): 177-183.)
Adaptive Control of Mars Aircraft Based on Compound Anti-Saturation Strategy
Han Shaojun1,Ni Kun1,Xiong Cunping2,Zhang Qingzhen1
1.Beijing University of Aeronautics and Astronautics, Beijing 100191, China 2. Beijing Aerospace Automatic Control Institute, Beijing 100854, China
Atpresent,withtherisingofMarsexploration, Marsaircraftisfocusedincreasingly.DuetothelackofatmosphericresearchonMarsandspecialflyingenvironmentoftheMarsaircraft,therearealsostronguncertaintyandinterference.ThecontrolofthecontrolmechanismisdeterminedbythethinMarsatmosphereandthelimitedsizeoftheaircraft.Inordertosolvethesetwokeyproblems,anadaptivecontrollerbasedoncompoundanti-saturationstrategyisproposed.Themodelerrors,uncertaintiesanddisturbancesareconsideredassumdisturbancesofthesystem,whichareobservedandcompensatedbyusingtheextendedstateobserver.Aimingatthecontrolsaturationcausedbythelimitationofcontrolability,acompoundanti-saturationstrategywhichiscombiningpseudo-controlhedgingwithanti-saturationschemebasedonextendedstateobserverisproposed.Thesimulationresultsshowthattheinstructioncanbetrackedandtheinfluenceofuncertaintyandinterferencecanberesistedeffectivelybyusingtheproposedcontrolmethod.Thecompoundanti-saturationstrategyhasgoodeffectandcanimprovetheresponsehysteresiscausedbythecontrolsaturation.Thus,thesystemhasastronganti-saturationcharacteristics.
Marsaircraft;Extendedstateobserver(ESO);Pseudo-controlhedging(PCH);Compoundanti-saturationstrategy
2017-03-06
韓少君(1993-),男,山西原平人,碩士,主要研究方向為導航、制導與控制;倪 昆(1991-),男,蘇州人,博士,主要研究方向為導航制導與控制;熊寸平(1979-),男,浙江長興人,碩士,主要研究方向為自動控制;張慶振(1976-),男,江蘇沛縣人,博士后,主要研究方向為導航、制導與控制。
TP273
A
1006-3242(2017)03-0040-09