王 佳 曾慶華
中山大學航空航天學院,廣州 510006
RLV再入段依靠氣動柵格舵減速,飛行速度變化劇烈、模型參數不確定和強非線性對RLV姿態控制系統提出了更高的要求。
增益調度法[1-2]采用PID控制設計各個特征點的控制參數,PID控制調節參數少,便于分析,在工程上得到廣泛應用;由于再入段氣動環境復雜,存在各種干擾,PID控制無法保證良好的姿態控制效果,甚至造成火箭失穩。自抗擾控制器(Active Disturbance Rejection Control,ADRC)由跟蹤微分器[3]、非線性誤差反饋和擴張狀態觀測器構成,其非線性結構彌補了PID控制器的不足[4],在航空航天領域取得了較多的研究成果。為解決導彈的模型不確定問題,文獻[5]研究了基于自抗擾觀測器頻帶特性的參數整定方法,提升了系統的抗干擾和跟蹤性能;文獻[6]研究了運載火箭經過大風區的減載控制問題,改進了自抗擾控制律來區分干擾構成,提高了增益的選擇范圍和控制效果。針對高超聲速飛行器再入過程的參數不確定問題,文獻[7]利用ADRC跟蹤阻力加速度剖面,在模型參數攝動時能夠保證較好的系統響應。擴張狀態觀測器對誤差的估計和補償效果直接影響控制系統的性能,而ADRC控制參數多,對火箭的姿態控制器也帶來了一定的困難。NLPID控制器[8]與ADRC相比不含擴張狀態觀測器,控制參數少且易于工程實現,控制性能優于PID控制器。文獻[9]研究了NLPID控制器在級聯控制系統的應用,驗證了NLPID和PID的6種級聯組合對系統的影響,這對火箭角度環和角速度環的級聯系統設計具有指導意義。文獻[10]設計了6個NLPID控制器用于六自由度無人機的位置和姿態控制,系統的穩態誤差和響應速度均優于PID控制器。
進入21世紀,人工智能的研究熱度越來越高,神經網絡、模糊控制、遺傳算法等在導彈控制系統已經取得了很多研究成果[11]。模糊控制對外界擾動和參數攝動的適應能力強[12],文獻[13]針對高超聲速飛行器氣動參數變化引起的不確定性問題,設計了模糊分數階PID控制器,分數階運算保證了系統的控制精度和穩定性,模糊控制增強了系統的魯棒性;考慮到某導彈飛行時存在干擾和參數攝動問題,文獻[14]基于變論域理論設計了變論域模糊PID駕駛儀,通過引入伸縮因子來實時改變輸入輸出論域,在干擾條件下,仿真表明該駕駛儀具有良好的抗干擾性能。考慮到導彈控制系統參考模型不精確和非線性時變的特點,文獻[15]利用模糊控制器的在線推理能力整定PID控制器參數,為了進一步提高系統性能,采用遺傳算法整定模糊控制參數集參數,結果表明,該控制器具有良好的魯棒性和實時性。但是遺傳算法優化需要設置合理的目標函數和種群規模才能獲得比較理想的尋參效果,參數整定時存在效率低和結果不穩定的缺陷。文獻[16]設計了模糊自適應姿態控制策略,為提高模糊推理的實時性,采用擴張狀態觀測器觀測角速率動態中的參數攝動和外界擾動,仿真表明,該策略能夠很好地跟蹤高超聲速飛行器的姿態角指令。
上述研究大多未考慮飛行振動和隨機風擾動問題,這些問題會對模糊PID控制的推理過程產生不利影響。本文采用新型跟蹤微分器,提高了NLPID控制器的抗干擾和濾波能力,使攻角誤差及其微分更加穩定;隨后總結了控制參數影響系統響應速度、超調量和穩態誤差的規律,根據系統實時反饋量調節控制參數,為進一步設計自適應控制器提供了基礎;為了提高火箭抑制動力學模型參數攝動和抗干擾能力,引入模糊控制并改進模糊規則以提高NLPID的自適應能力,根據系統反饋的攻角誤差量及其微分實時調整跟蹤微分器的速度因子和NLPID的增益參數。仿真結果表明:本文設計的模糊NLPID控制器能夠有效抑制參數攝動和外界干擾,提高模糊推理的可靠性。
為了簡化RLV數學模型,有如下假設:1)RLV為一剛體,質量不變;2)氣動外形對稱。將RLV模型解耦為3個通道,包括俯仰、偏航和滾轉通道,火箭無滾轉運動。姿態控制回路分別跟蹤制導回路產生的攻角和側滑角[17],基于上述條件,可得火箭再入段姿態運動模型:

(1)
式中:α,β,wz,wy,δz和δy分別為攻角、側滑角、俯仰角速度、偏航角速度、俯仰舵偏和偏航舵偏,Jz,Jy為轉動慣量,cα,cβ,cδz和cδy為氣動力對α,β,δz和δy的氣動系數,mα,mβ,mδz和mδy為氣動力矩對的α,β,δz和δy氣動系數,cx為氣動阻力系數,Sm為特征面積,q為動壓,v為火箭飛行速度,m為導彈質量,L為氣動弦長。
火箭姿態控制總體方案見圖1。火箭俯仰通道和偏航通道存在耦合,為便于姿態控制器的設計,需將兩通道進行解耦,分別設計出兩通道的控制器后,再進行耦合模型的仿真驗證。后文以俯仰通道的姿態控制器設計為中心展開。圖2給出了火箭縱向通道的控制系統框圖。

圖1 火箭姿態控制總體方案

圖2 俯仰通道姿態控制系統框圖
為了保證火箭跟蹤角速度和姿態角指令的快速性和平穩性,本文的角速度環和角度環均采用了NLPID控制器,角速度環NLPID控制器參數固定,姿態角環NLPID參數通過模糊控制實時改變。
圖3為模糊NLPID控制器結構圖,包括模糊控制器和NLPID控制器2部分,模糊控制器采集攻角跟蹤誤差及其微分,由知識庫和規則庫推理得到修正量kr和Δb1;修正量與NLPID原有控制量r和b1經過數學運算,計算得到舵偏控制量δz。模糊NLPID控制器的設計步驟為:1)先設計NLPID,與火箭姿態模型構成閉環,調節控制參數,總結控制參數和控制指標的關系;2)為提高控制器的抗干擾能力和魯棒性,設計改進模糊控制器,在線整定控制參數,得到模糊NLPID控制器。

圖3 模糊NLPID控制器結構圖
圖3的虛線框內部結構給出了NLPID控制器跟蹤目標指令的原理。其中,v表示需要跟蹤的目標信號,v1和v2表示過渡信號及其微分信號;e1和e2為誤差信號;u為系統輸入,y(k+1)和y(3)為系統輸出y(k)的跟蹤信號及其微分。
1)跟蹤微分器
將文獻[18]的跟蹤微分器引入NLPID控制器。系統輸出y(k)經過跟蹤微分器得到其跟蹤信號y1(k)和微分信號y2(k),為消除y2(k)的震顫,經過fal(·)函數濾波得到新的微分信號y3(k);將新的微分信號y3(k)向前預報λ1時間可得新的跟蹤信號y(k+1)。該跟蹤微分器可以減少微分信號的震顫,調節跟蹤信號的幅值和相位,其離散形式可表示為:
(2)
式中:T,h和r分別為積分步長、濾波因子和速度因子,函數fhan(·)、函數fal(·)和其他變量含義參考文獻[18]。
速度因子r對控制性能的影響:r越大,跟蹤速度越快,當r大于臨界值時,繼續增大r對系統影響微弱,r大于臨界值,系統易產生超調;r越小,跟蹤速度越慢,但是可以抑制系統的超調。通過參數整定,考慮系統的快速性和抑制超調能力,火箭縱向通道r的修正量取為[0.001,1]。
2)非線性誤差組合
非線性誤差組合的輸入為誤差信號e1和e2,輸出為誤差信號的非線性組合,比PID的線性誤差組合控制效果更佳。不同的非線性誤差組合方式與跟蹤微分器組合,可以構成NLPD、NLPI和NLPID等常見非線性PID結構。經仿真驗證,因NLPD缺少積分環節,使系統存在較大的靜態誤差,所以本文采用NLPID形式。
(3)
式中:u0為控制器的輸出,b0,b1和b2為控制參數,fal(·)函數定義參考文獻[8]。
控制參數b0,b1和b2對系統性能的影響:b0主要影響系統的穩態誤差,選擇合適的參數可以減小甚至消除系統的穩態誤差;b1主要影響系統的響應速度;b2加快了系統的調節速度,有助于減小超調和振蕩,提高了系統的動態特性。通過參數整定,得到b1的修正量為:[0,1],b0、b2為定值。
根據上文總結的r,b1對系統的影響,可得r,b1與系統實時誤差及其微分的對應關系,為模糊控制器的設計提供依據。
對火箭氣動系數拉偏和施加干擾時,系統可能會出現超調過大甚至發散,采用固定控制參數的NLPID控制器無法滿足火箭再入段環境復雜和抗干擾的需求,因此本文采用改進模糊控制器對NLPID的控制參數進行在線整定。
模糊控制器包括知識庫和規則庫,知識庫反映了輸入變量和輸出變量的隸屬度函數,再經過規則庫的推理得到修正量。常見知識庫建立系統誤差e及其微分ec的隸屬度函數,經過規則庫推理得到控制參數Kp,Ki和Kd。如圖4所示,模糊NLPID控制器的輸入變量為攻角誤差e及其微分ec,輸出變量為kr和Δb1。

圖4 模糊控制推理過程
1)知識庫
e和ec是模糊控制的輸入變量,kr和Δb1是模糊控制的輸出變量。它們的語言變量分別為E,EC,KR和B1;設定其論域為E:{-2,2},EC:{-4,4},KR:{0.001,1},B1:{0;1}。將{NB,NS,ZO,PS,PB}設置為輸入變量和輸出變量的模糊子集。
2)規則庫
根據前文速度因子r和增益b1對系統性能的影響規律,以及文獻[19]的參數整定規則,確定火箭縱向通道的模糊控制規則,見表1。

表1 Δb1的模糊規則表
速度因子r的規則庫比較簡單,為了提高姿態控制器的實時性,本文根據系統的當前狀態,采用s-function實現修正量kr的實時更新。
3)模糊控制器輸出計算
模糊推理得到的模糊量經過清晰化,可得到實際控制量,采用重心法計算得到模糊控制器的輸出Δb1,以模糊輸出量B1為例展示清晰化的計算過程:
(4)
式中:n表示B1的規則數目,Δb1為模糊控制器輸出量清晰化后的精確值;B1i為模糊控制量論域內的值;μv(B1i)為B1i對應的隸屬度值。
可得模糊NLPID控制器更新后的控制參數為:
b1(k+1)=Δb1+b1(k)
(5)
式中:b1(k)是模糊NLPID控制器k時刻的參數,b1(k+1)是經過模糊控制器輸出更新后的值。
以某火箭再入段氣動數據為例,取一特征點的飛行速度、飛行高度、馬赫數、大氣密度、質量進行仿真。仿真計算軟件環境:Win10 64 bit操作系統、MATLAB;硬件環境Intel Corei7-7700處理器、16.0 GB RAM。
為了驗證NLPID控制器的有效性,分別在不同條件下與PID進行仿真對比,評價指標為調節時間tr和超調量σ。為下文描述方便,將3種仿真條件表述為:條件1:無干擾;條件2 ∶0.8倍Cmz,1.2倍Jz;條件3 ∶1.2倍Cmz,0.8倍Jz。
保證條件1時NLPID控制器和PID控制器的tr和σ相同。保持控制參數不變,由圖5知,在條件1和3時,NLPID控制器的tr和σ分別為0.6s和0; PID控制器的tr和σ分別為0.8s和0。可見PID控制器在控制參數固定時,系統響應隨氣動系數偏差變化更大,而NLPID有著更好的穩定性。

圖5 PID和NLPID仿真
繼續給系統輸出的攻角疊加隨機噪聲,得到NLPID和PID控制器的攻角響應及其微分的曲線,如圖6和圖7所示。

圖6 疊加噪聲系統響應

圖7 疊加噪聲系統響應微分信號
由圖6和圖7可知,PID控制器由于噪聲干擾使攻角及其微分信號產生較大震顫,模糊控制的輸入為攻角誤差e及其微分ec,較大的震顫不利于系統的穩定;NLPID經過跟蹤微分器的濾波作用,大幅降低了震顫。
圖8為條件1下的NLPID仿真結果,增益不變時,速度因子r越小,抑制系統超調量的能力越強。利用此特性,可根據系統狀態適當調節速度因子r,達到調節系統超調量和快速性的目的。

圖8 不同速度因子r時NLPID仿真
由圖9和圖10知,在氣動參數攝動時,在模糊NLPID控制器作用下,系統需0.5s進入穩態,響應速度優于模糊PID控制器。

圖9 不同條件模糊PID仿真

圖10 不同條件模糊NLPID仿真
當存在風干擾,空氣流相對于導彈有附加的速度,形成附加的攻角因而產生附加的空氣動力和空氣動力矩。為了簡化模型并驗證控制器的性能,將隨機風干擾[20]對火箭的影響轉換成附加攻角,引入模型中進行風干擾仿真驗證。考慮到風干擾和RLV振動對系統的影響,附加攻角采用Simulink的Band-Limited White Noise模塊產生,最大值為0.2°。
圖11給出了存在隨機風干擾時的系統響應曲線,發現系統進入穩態后均存在小幅的波動,但在模糊PID作用下系統始終存在無法消除的穩態誤差。

圖11 隨機風干擾響應
圖12給出了速度因子r抑制超調的過程,根據系統當前的狀態實時改變速度因子r的值,達到降低超調量的目的。

圖12 速度因子r抑制超調
結合了NLPID控制器和模糊控制自適應調整的優勢,將所設計的改進模糊NLPID控制器應用于RLV再入段的姿態控制。仿真結果表明:該控制器能夠有效克服氣動系數偏差和環境干擾,系統能夠保證較好的魯棒性和自適應能力;與傳統的模糊PID相比具有更好的控制性能,展現了較好的工程應用前景。