趙令公,賀衛亮,趙志高,劉志君
1.中國航空研究院,北京 100012
2.北京航空航天大學,北京 100191
傘翼飛行器是一種柔性翼飛行器,成本低、應用面廣、安全性高、機動靈活,滿足未來航空發展的低成本及分布式新質裝備發展需求[1]。其主要包含傘翼、傘繩、載荷和控制系統等部分。沖壓的柔性傘翼在飛行過程中保持一定的剛度,為飛行器提供氣動力,傘繩連接傘翼和有效載荷;控制系統包含舵機、傳感器和控制計算機,控制計算機基于傳感器和舵機信息計算、輸出控制指令。控制系統是傘翼飛行器可控飛行的至關重要部分。但是由于受柔性傘翼和傘繩的影響,傘翼飛行器系統具有強非線性,因此,無法構建精確的動力學模型,也就無法通過基于模型的設計方法來設計其控制系統。本文采用基于數據驅動的控制器設計方法,擺脫了控制器設計過程中對精確動力學模型的依賴。
控制系統通過對稱或不對稱下拉傘翼左右后緣控制繩,實現傘翼飛行器縱向和橫側向控制[2],以完成對指定路徑的跟蹤和精確空投。傘翼飛行器具有普通降落傘減少著陸沖擊和可控飛行的能力,因此,近幾十年來一直被用來提高物資投放精度[3]。已有數十種精確空投系統被用來測試,以滿足不同的應用需求[4]。
作為柔性翼飛行器,傘翼飛行器與固定翼飛行器有較大的區別。傘翼飛行器的柔性傘翼部分在擾動時易發生結構變形,如突風及控制輸入,而這種變形會影響氣動力且在仿真中無法精確描述。另外,傘繩有時處于非張緊狀態,影響傘翼和載荷之間力的傳遞,導致系統不穩定。并且,在實際飛行過程中,傘翼飛行器的控制輸入由舵機來實現,舵機的響應時間會有變化,因此,控制器需要在飛行過程中實時進行調整。
上述多種因素導致傘翼飛行器的動力學仿真與實際情況有較大差距。柔性傘翼和松弛狀態下的傘繩引起傘翼飛行器系統模型的不準確,也使系統模型中的力學關系不準確。因此,基于模型建立的控制系統在本飛行器中與實際情況相差較大,且控制參數需要在每次飛行過程中進行自適應調節。
一些專家學者和研究機構致力于解決傘翼飛行器上述問題。Yakimenko 主持編寫了《精確空投系統:建模、動力學和控制》,詳細介紹傘翼飛行器各個方面的內容,如沖壓翼傘分析、著陸精度影響分析、動力學和控制分析[4]。Sun Qinglin和Sun Hao 采用改進型PⅠD 控制方法,通過線性擴展狀態觀測器的方式,增加傳統PⅠD控制器的魯棒性[5]。Carter等采用前饋方法提高PⅠD控制器的響應時間,并利用半物理仿真飛行試驗驗證了該控制器的可用性[6]。Tao Jin和Sun Qinglin使用主動抗干擾方法控制傘翼飛行器精確跟蹤預定軌跡,通過擾動測量方法避免了對動力學方程精度的要求,比較適用于傘翼飛行器這種強非線性系統[7-8]。
上述控制方法基本上都不依賴于精確的傘翼飛行器動力學模型,并且在每次仿真或飛行測試中,控制器都會隨之發生變化。因此,不基于模型的控制方法,可以解決強非線性系統的部分問題。對其他相關的非線性系統的研究也在進行中。采用自適應逆方案和狀態反饋控制的自適應擬陣列控制方法,對于不確定性擾動具有較好的魯棒性;采用自適應積分反步控制方案對直升機進行控制,通過對參數和模型不確定性的估計,提高參數不確定性和未建模動態情況下的系統魯棒性[9]。其他非線性系統的控制問題,如非線性開關系統[10-11]、基于信號的執行機構的非線性[12]、微生物燃料電池[13]、糖尿病患者的血糖[14]、魯棒容錯H∞控制[15]等也已經在研究中。
本文采用基于迭代反饋調參的無模型自適應控制方法設計傘翼飛行器的控制系統,利用輸入、輸出數據對控制器參數進行調參。ⅠFT-MFAC是傘翼飛行器的非線性問題的一種解決方案,利用ⅠFT 方法對MFAC 控制方法的兩個步長因子進行調參,并通過仿真驗證ⅠFT-MFAC 控制器的控制效果。首先,簡單介紹了傘翼飛行器動力學建模,該模型不參與控制器的設計,僅用于控制效果的驗證;其次,推導了ⅠFTMFAC控制方法的構建過程,并通過仿真驗證該方法對傘翼飛行器控制的有效性。仿真中共設置兩種軌跡和三種狀態,對ⅠFT-MFAC 控制器的控制效果與PⅠD 控制器、ADRC 控制器和MFAC 控制器進行對比。多個控制方法均可為傘翼飛行器的非線性問題提供解決方案,但是ⅠFT-MFAC控制器的控制輸入值較小,也就意味著較少的能量消耗。
傘翼飛行器六自由度動力學模型可以滿足其對預設軌跡的跟蹤效果的分析需求,因此,構建六自由度動力學模型,基本假設如下:(1) 傘翼飛行器作為一個剛性整體,傘翼和載荷艙之間不存在相對運動;(2) 傘翼在飛行過程中保持剛性,忽略結構變形引起的氣動力和力矩變化;(3) 傘翼飛行器系統沿展向對稱;(4)柔性傘翼的質心位于1/4弦線處;(5)忽略傘繩和吊帶的質量和氣動力;(6)平面大地假設。
在構建傘翼飛行器六自由度動力學模型時,需要用到三個基本坐標系:大地坐標系{i}、飛行器本體坐標系{b}和氣流坐標系{a}。
傘翼飛行器本體坐標系和大地坐標系之間的關系由三個歐拉角表示,即滾轉角φ、俯仰角θ和偏航角ψ。兩個坐標系之間的轉換由轉換矩陣表示

式中,cx和sx代表三角函數cosx和sinx,x指代歐拉角。
傘翼飛行器本體坐標系與氣流坐標系之間的關系由兩個角度決定,即迎角α和側滑角β

式中,[vx,vy,vz]是來流速度Va在本體坐標系{b}的投影,其值由公式可以計算獲得,其中[wx,wy,wz]為風速在大地坐標系下的表示,[u,v,w]為系統速度在本體坐標系下的表示。

傘翼飛行器本體坐標系與氣流坐標系之間的轉換公式如下

在傘翼飛行器完全充氣展開后,除后緣下拉的狀況下,傘翼可以被假設為具有一個固定的外形結構,因此,在推導傘翼飛行器六自由動力學公式時,可以假設傘翼飛行器為一個剛性整體。
根據牛頓第二定律和轉動定律可以得到傘翼飛行器系統的動力學公式如下。

式中,m為傘翼飛行器系統質量,F、M為系統所受合力和合力矩。合力包括主要重力、氣動力、推力和附加質量力,分別作用于大地坐標系、氣流坐標系和本體坐標系,將其轉換到本體坐標系中表示,其中,重力在本體坐標系中的表示為

氣動力在本體坐標系中的表示為

式中,Q和S分別為傘翼飛行器動壓和傘翼面積;CD,CY和CL為氣動力系數。
傘翼飛行器推力表示為

式中,Cδp為推力系數;δp為無量綱推力。
系統所受氣動力如下

式中,Cl、Cm和Cn為氣動力矩系數。
結合上述氣動力和氣動力矩公式,代入到動力學方程中,可得

式中,I為附加質量、附加質量力矩等,為簡化建模過程,在計算時,忽略不計。
飛行控制方法大體可以分為基于模型的控制方法和基于數據驅動的無模型控制方法,基于模型的控制方法適用于動力學特性明確的系統,對于復雜的非線性系統,無模型控制方法更為適用。無模型控制方法主要有PⅠD 控制、無模型自適應控制、迭代反饋整定和迭代學習控制等。
本文基于無模型自適應控制方法設計傘翼飛行器控制器,無模型自適應控制方法是侯忠生教授針對離散非線性系統于20 世紀90 年代提出的數據驅動控制算法[16]。該算法的有效性和可用性已經經過了嚴密的數學推導和相應的仿真驗證[17],并已經在多個領域得到驗證[18-22]。
Hjalmarsson 采用迭代反饋調參方法分析非線性系統[23],該方法也基于數據驅動,通過最小化復合控制判據來調諧參數。王衛紅等總結了迭代反饋調參的發展,并指出該方法的幾個特性[24]。ⅠFT-MFAC 在火箭發射過程中對三軸姿態控制的有效性也通過仿真得到了驗證[25]。Wu 和Li將MFAC和ⅠFT結合,并應用于充氣人造肌肉控制中[26]。
無模型自適應控制器的推導過程簡單描述如下。單輸入、單輸出的離散非線性系統可以表示為

與控制量的迭代公式的求解算法類似,對離散非線性系統偽偏導數的評價函數可以表示成

式中,τ>0也是權重因子,用來改變誤差量和偏導函數變化對偽偏導數評價函數的影響權重。
該評價函數對Ωk求偏導極值,并置左右兩端為0,整理后得到偽偏導數的迭代公式如下。

式中,Ω?k是估計偽偏導數,是通過輸入輸出量解算出來的非線性系統偏導數,與真實的偏導數存在誤差。
根據單輸入單輸出非線性系統的偽偏導數和控制量迭代公式,可以得出無模型自適應控制方法的控制方案為

式中,為了使算法具有更強的靈活性,且保證算法收斂性和穩定性,在控制方案中增加兩個步長因子β、κ∈[0,1]。
為了使該算法具有更強的適應性,估計偏導函數滿足以下重置算法:當|Ω?k|≤ε, |Δuk-1|≤ε或者sign(Ω?k)≠sign(Ω?1)時,Ω?k=Ω?1。其中,ε是一個充分小的正數。該重置算法可以使估計偏導函數具有更強的對時變參數的跟蹤能力。無模型自適應控制算法的流程如圖 1 所示,對于被控非線性系統,通過測量獲得系統的狀態,作為輸入傳輸給無模型自適應控制器,控制器結合上一步的偽偏導數和控制量,計算本次的偽偏導數,經過偽偏導數的重置算法,獲得最終的偽偏導數,并結合控制目標值計算本次的控制量輸出。控制量經過限幅器,輸入被控非線性系統中,控制系統做出響應,得到下一步的狀態值。

圖1 無模型自適應控制算法的流程Fig.1 Process flow diagram of the MFAC method
經過上述推導,已經得到了無模型自適應控制方法,在具體應用之前,其穩定性和魯棒性需要進一步進行分析,本文不做重點分析。
基于迭代反饋調參的無模型自適應控制方法是指在無模型自適應控制器的基礎上,利用迭代反饋調參方法,根據實時的控制效果和控制量輸出,對控制器的兩個步長因子進行調諧,達到更優的輸出和控制組合。
迭代反饋調參控制方法首先要構建控制系統的評價函數,然后,根據試驗數據求取該評價函數的最小值,并解算出需要調諧的參數[1]。下面對反饋迭代調參方法的一般構建過程進行簡要說明。
非線性系統表述如式(15)所示,系統輸出如式(27)所示

式中,Γ(θ)和Ξ(θ)是簡化運算符號。
將系統輸出對待調諧參數θ取微分,表達式變成如下所示

相應地,控制輸入函數對待調諧參數θ取微分,并利用簡化符號,可以簡化為式(33)和式(34)。

由式(36)、式(37)可以看出,辨識參數進行更新需要系統輸出量和控制量對待辨識參數的微分,因此設置一些試驗來獲取這些微分量的預估值[24]。
設定參考信號和控制輸入的初始值,并設計三次測試

評價函數的微分形式和海森陣可以由式(41)和式(42)得到,從而可以推導得到待辨識參數的迭代公式(38)。迭代反饋調參方法流程如圖2 所示,可以總結如下:(1)設置初始參數、初始參考信號和初始控制量;(2)設置初始迭代試驗,并將上述初始值代入試驗中,得到初始輸出;(3)計算評價函數對待辨識參數的微分值;(4)迭代計算待辨識參數;(5)根據迭代后的待辨識參數計算控制量;(6)將控制量代入非線性系統中,得到系統輸出;(7)重復第三步。
在無模型自適應控制算法中,有4 個參數可以進行調諧,其中兩個步長因子對控制器的影響較大,因此,在本文,對于模型自適應控制器的兩個步長因子進行反饋迭代調整。根據2.2節所表述的過程,基于迭代反饋調參的無模型自適應控制器設計為如下公式所示
綜上,基于迭代反饋調參方法的無模型自適應控制器的參數調諧流程如圖3所示。
至此,基于反饋迭代調參的無模型自適應控制器已經建立起來,由于其僅僅是對無模型自適應控制方法的參數進行調參,而且參數調整在限定范圍內,因此,其穩定性和魯棒性與無模型自適應控制方法一致。
利用傘翼飛行器六自由度動力學模型,設置兩種跟蹤軌跡、三種工作環境,分別是直線軌跡、折線軌跡和理想環境、突風環境及隨機擾動環境,驗證ⅠFT-MFAC控制器對傘翼飛行器的軌跡跟蹤控制效果。將PⅠD 控制器、ADRC 控制器和MFAC控制器設置為對照組。
3.1.1 直線軌跡
在基于迭代反饋調參的傘翼飛行器無模型自適應控制器的仿真中,直線軌跡的設置與MFAC 控制器的驗證過程一致,控制效果如圖4所示,由圖4中可以看出,4種控制器均能較好地控制傘翼飛行器跟蹤該直線軌跡。跟蹤過程中的距離誤差和控制輸入量如圖5所示,在4種控制器的作用下,距離誤差最終歸為0,峰值誤差小于10m,其中,ADRC控制器、MFAC 控制器和ⅠFT-MFAC 控制器的距離誤差平均值相近,略大于PⅠD控制器。MFAC控制器和ⅠFT-MFAC控制器的控制效果相近。

圖4 理想環境下直線軌跡跟蹤效果Fig.4 Straight-line trajectory under ideal conditions

圖5 理想環境下直線軌跡跟蹤距離誤差和控制量Fig.5 Distance error and control value of the straight-line trajectory under ideal conditions
4種控制器的控制量在大約15s后均變為0。MFAC控制器和ⅠFT-MFAC控制器的平均控制量小于PⅠD控制器和ADRC控制器,且超調量遠小于另兩種控制器,其控制量均方差為0.19、0.194、0.175和0.174(分別對應于PⅠD控制器、ADRC控制器、MFAC控制器和ⅠFT-MFAC控制器,如無特殊說明,順序下同)。因此,MFAC 控制器和ⅠFT-MFAC 控制器具有更小的控制量均方差和更平穩的控制效果。ⅠFTMFAC控制器兩個待調諧參數的變化隨著跟蹤距離誤差減小,控制量步長因子也隨之下降,偽偏導數的步長因子在控制量變化劇烈階段存在擾動,隨后保持在初始值附近,說明該初始值的選取比較靠近最優值。
3.1.2 折線軌跡
為了驗證傘翼飛行器在ⅠFT-MFAC控制器控制下的轉彎特性,本節設計了方形折線軌跡,傘翼飛行器在4種控制器作用下對該軌跡的跟蹤效果如圖6 所示。由圖6 中可以看出,傘翼飛行器在4種控制器的作用下,均能較好地跟蹤該軌跡,圖中放大部分為第二個轉彎點傘翼飛行器的軌跡跟蹤情況,可以看出,在該種情況下,PⅠD 控制器和ADRC控制器的軌跡跟蹤效果好于MFAC控制器和ⅠFT-MFAC控制器,具體跟蹤過程中的距離誤差如圖7 所示。將轉彎點的目標閾值設置為5m,以判斷傘翼飛行器是否到達預設目標點。由圖7 中可以看出,傘翼飛行器在每個轉折點都會出現距離誤差瞬間增大的情況,這是因為當判斷傘翼飛行器到達目標點后,其目標點切換到下一個,相應的距離誤差計算切換到下一條航線。傘翼飛行器在4種控制器作用下的距離誤差平均值分別為3.31m、3.64m、3.33m 和3.38m,ⅠFT-MFAC控制器的收斂速度更快,超調量更小。

圖6 理想環境下折線軌跡跟蹤過程Fig.6 Polyline trajectories under ideal conditions

圖7 理想環境下折線軌跡跟蹤距離誤差Fig.7 Distance error of the polyline trajectories under ideal conditions
基于4 種控制器的傘翼飛行器飛行控制系統在折線軌跡的控制量輸出如圖8所示。由圖8中可以明顯看出,在轉彎點時,MFAC控制器和ⅠFT-MFAC控制器的控制超調量遠小于另兩種控制器,且ⅠFT-MFAC 控制器更小一些。另外,4 種控制器輸出控制量的均值分別為11.1%、11.3%、9.6%和9.5%,相應的均方差為0.237、0.239、0.223和0.218,由此可見,ⅠFT-MFAC控制器具有更小的控制量和更平穩的控制效果。

圖8 理想環境下折線軌跡跟蹤過程控制量Fig.8 Control input values of the polyline trajectory under ideal conditions
在傘翼飛行器的實際飛行過程中,系統的測量數據會存在擾動,在本節中,針對隨機擾動存在的情況進行仿真,驗證傘翼飛行器在4種控制器的作用下對兩種軌跡的跟蹤效果,擾動值的設置與MFAC控制器的擾動環境設置一致。
3.2.1 直線軌跡
在隨機擾動環境中,4種控制器控制傘翼飛行器對直線軌跡的跟蹤情況如圖9 所示。與理想環境和突風環境相比,隨機擾動情況下的跟蹤效果不夠平滑。圖9 中就部分細節進行放大,以便于進一步觀測其跟蹤情況,4種控制器整體的跟蹤效果與另兩種情況類似。軌跡跟蹤誤差和控制量輸出分別如圖 10和圖11所示。由圖中可以看出,軌跡跟蹤誤差平均值和控制量平均值均近似,軌跡跟蹤誤差的平均值分別為2.17m、2.23m、2.40m和2.19m,控制量的均值分別為22.1%、30.8%、22.4%和22.3%,控制量均方差分別為0.19、0.228、0.182 和0.181。MFAC 控制器和ⅠFT-MFAC 控制器的控制量均方差最小。

圖9 隨機擾動環境下直線軌跡跟蹤過程Fig.9 Straight line trajectory under random disturbance conditions

圖10 隨機擾動環境下直線軌跡跟蹤距離誤差Fig.10 Distance error of the straight-line trajectory under random disturbance conditions

圖11 隨機擾動環境下直線軌跡跟蹤過程控制量變化Fig.11 Control input value of the straight-line trajectory under random disturbance conditions
3.2.2 折線軌跡
在隨機擾動情況下,4種控制器控制傘翼飛行器對折線軌跡的跟蹤情況如圖12所示,所有控制器均能取得較好的控制效果,第一個轉折點被放大,以便于觀看軌跡跟蹤細節。MFAC控制器和ⅠFT-MFAC控制器的超調量要小于另兩種控制器。4 種控制器的軌跡跟蹤誤差如圖13 所示,其平均值分別為4.23m、4.48m、3.84m和3.81m,MFAC控制器和ⅠFT-MFAC 控制器的距離誤差平均值小于另兩種控制器。從放大部分可以看出,MFAC 控制器和ⅠFT-MFAC 控制器到達第二個轉折點的時間較另兩種控制器提早約2s,這意味著傘翼飛行器在這兩種控制器控制下實際飛行路徑小于另兩種控制器,這與軌跡跟蹤過程的超調量一致,即具有較小的超調量,更小的時間消耗。

圖12 隨機擾動環境下折線軌跡跟蹤過程Fig.12 Polyline trajectory under random disturbance conditions

圖13 隨機擾動環境下折線軌跡跟蹤距離誤差Fig.13 Distance error of the polyline trajectory under random disturbance conditions
4 種控制器的控制量輸出值如圖14 所示,其平均值分別為26.5%、34.5%、25.5%和25.3%,相應的均方差為0.234、0.254、0.224 和0.223。在此仿真試驗中,MFAC 控制器和ⅠFT-MFAC 控制器比另兩種控制器取得了更小的控制量平均值和控制量均方差,控制效果相對更加平滑。

圖14 隨機擾動環境下折線軌跡跟蹤過程中控制量變化Fig. 14 Control input value of the polyline trajectory under random disturbance conditions
通過設計基于迭代反饋調參的傘翼飛行器無模型自適應控制系統,并經過理想環境和隨機擾動環境對該控制器的控制效果進行仿真驗證,可以看出,該控制器可以控制傘翼飛行器對直線軌跡和折線軌跡進行有效的跟蹤。與PⅠD控制器、ADRC 控制器和無模型自適應控制器的控制效果相比,ⅠFT-MFAC控制器在復雜環境下的控制效果更好,尤其是在隨機擾動環境下對折線軌跡的跟蹤效果。其軌跡跟蹤誤差更小,控制量的平均值和均方差更小。在仿真過程中,可以看到,無模型自適應控制器的兩個步長因子隨著誤差量和控制量的變化而發生變化,數值在穩定過程中逐漸減小,但是由于擾動環境的存在,控制量的步長因子一直保持在邊界值附近。因此,基于反饋迭代調參的傘翼飛行器無模型自適應控制器可以滿足對傘翼飛行器在復雜工況下的軌跡跟蹤任務需求。