呂晨,歐陽權,許文波,王志勝
(1.南京航空航天大學自動化學院,江蘇南京 210016;2.北京精密機電控制設備研究所航天伺服驅動與傳動技術實驗室,北京 100076)
空氣舵伺服系統是飛行器制導與控制系統的執行機構,通過帶動舵面擺動實現飛行器姿態控制。隨著數字處理器技術、永磁材料和電力電子器件的發展,采用永磁同步電機的機電伺服系統憑借其輕質高效、高可靠、易維護、易安裝等優點近年來在航空航天飛行器中得到了廣泛使用[1-2]。然而,機電伺服系統是一個非線性、多變量、強耦合系統,傳統的PID 控制存在魯棒性較差、控制器參數較為固定、參數整定困難、對系統參數變化和外界干擾敏感等缺點[3],難以應用于某些對動靜態性能要求較高的場合。加上飛機運行環境中存在多種未知的動態擾動,會造成引起性能波動,因此影響了伺服系統的性能,并且容易引起諧振,甚至導致系統的不穩定,從而嚴重影響飛行器的安全性。
目前,為了抑制干擾對機電伺服系統的影響,各個領域的專家學者提出了不同的抗干擾控制方法,如內模控制、輸出調節理論、隨機控制理論等。從抗干擾能力上區分,這些抗干擾控制方法可以分為以下兩類:干擾抑制方法和干擾抵消或補償方法。干擾抑制方法是利用干擾的性能指標對干擾進行抑制,如H∞控制、隨機控制理論[4]、滑模控制[5]等。干擾抵消或補償方法是基于一些特征信息對干擾進行重構,得到干擾估計值,然后利用這個估計值抵消干擾對系統的影響,如自抗擾控制[6-7]、內模控制[8-9]、輸出調節理論、基于干擾觀測器的控制理論[10-12]等。
與其他抗干擾控制方法相比,基于干擾觀測器的控制方法(Disturbance -Observer -Based -Control,DOBC)具有結構簡單、容易實現等優點。近年來,DOBC 在機器人系統[13]、硬盤驅動系統、伺服系統、航空航天等系統中得到廣泛應用。為此,本文作者提出了一種基于神經網絡干擾觀測器的空氣舵機伺服系統控制策略,運用神經網絡觀測器進行非線性干擾的在線估計,再進行PI 控制保證系統獲得期望的舵面跟蹤精度。文中的主要創新點如下:
(1)設計了基于神經網絡觀測器,能對空氣舵機電伺服系統的狀態和未知干擾進行精確估計。
(2)傳統伺服系統以電機轉角進行反饋控制,在舵面伺服系統中抗干擾效果較差;以觀測器中舵面角度估計值進行反饋控制抗干擾效果有明顯提升。
空氣舵機電伺服系統的主要任務是接收擺角指令,然后驅動舵面按照指定角度進行擺動。本文作者以空氣舵機電伺服系統為研究對象,它主要由機電作動器和搖臂組成,機電作動器是由永磁同步電機(Permanent Magnetic Synchronous Machine,PMSM)、齒輪箱和滾珠絲杠組成。結構模型圖1 所示,其中忽略了電機和舵軸的黏性阻尼。

圖1 空氣舵機電伺服系統動力學模型Fig.1 Dynamics model of air rudder electromechanical servo system
圖1 中:Jm、θm、ωm分別為電機轉動慣量(含減速器、滾珠絲杠)、電機角位移和電機機械角速度;Jl、θl、ωl分別為負載轉動慣量、負載角度、負載角速度;Te為同步旋轉坐標系下,id=0 時電機的電磁轉矩;KA、KB分別為機電作動器剛度和機電作動器安裝支承剛度;Ph為滾珠絲杠導程(含減速器);R為空氣舵搖臂長度;Tl為負載轉矩(含鉸鏈力矩、舵軸摩擦力矩、阻尼力矩及模型參數的不確定性產生的力矩等)。空氣舵機電伺服系統的數學模型為
進一步簡化表示,定義狀態向量x=[x1,x2,x3,x4]T?[θm,ωm,θl,ωl]T∈R4,輸 入u?iq∈R,測量輸出m?θm∈R,命令輸出y?θl∈R。基于式(1)可以將空氣舵機電伺服系統的動力學模型寫為以下狀態空間表達式:
w=-RTl/(JlPh),在模型中被視為未知轉矩擾動項。
從公式(2)可以看出,如欲使舵面的旋轉角位移y跟蹤其期望值yd=,而在實際的伺服系統中,測量傳感器通常設置在電機側或滾珠絲杠處,這意味著可以直接測量電動機的角位移θm而不是θl,因此y不能直接測量,必須使用m而不是y作為反饋量來實現對y的高性能控制。且未知轉矩擾動的存在給基于模型的機電伺服控制策略的設計帶來了困難。如何抑制伺服系統因擾動而產生的指令跟蹤誤差,是亟待解決的難題。
為了彌補上述難題,本文作者設計了一種基于干擾觀測器的機電伺服系統控制策略,如圖2 所示。首先,設計了全維神經網絡觀測器用于系統狀態估計,RBF 神經網絡用于模型不確定性w的在線估計。然后針對機電伺服系統,將x3的估計值替換傳統位置環中的x1,使得y成為其期望的yd。

圖2 控制器示意Fig.2 Controller schematic
為了估計舵面y=x3的旋轉角位移,基于模型(2),設計了一種基于神經網絡的觀測器,使用RBF神經網絡近似模型不確定擾動:
其中:∈R4是x的估計;L是設計的觀測器增益向量;而是w的估計,它是一個RBF 神經網絡,可以計算為
其中:W=[w1,w2,…,wn]T∈Rn是權重向量;n表示神經網絡節點的數量;S()=[s1(),…,sn()]T∈Rn表示激活函數向量,si()(1≤i≤n)滿足:
其中:η1和η2是設計的正常數。參考文獻[14],具有足夠數量的神經節點的RBF 神經網絡可以近似任何連續函數。根據RBF 神經網絡的逼近性質,不確定項w可以替換為
其中:W*是理想的常權重向量;ξ是近似誤差。由于在實踐中w是有界的,因此可以推導出理想常數權重W*是有界的,可以表示為如下:
其中:WM是一個正常數。
設=x-,=W*-W,由式(2)(6)(7)可以推導出:
式(9)中:ε是有界的,滿足和εM≥0。從式(2)中可以看出(C,A)是可觀測的,因為
是滿秩的。因此可以找到正定對稱矩陣P滿足:
其中:Q也是正定矩陣。選擇Lyapunov 函數為
V的導數可以計算為
通過完全平方可以得到:
根據式(10)(13),可以推導出以下不等式:
其中:λm(Q)表示Q的最小特征值。通過定義
由于有界,則a為正有界,b有界。因為-a是負的,顯然式(17)是穩定的。因此的有界性也可以得到保證[16]。
基于MATLAB/Simulink 仿真平臺,對所提出的基于干擾補償的空氣伺服系統控制策略進行了驗證,并與常規位置環電機轉角反饋控制策略進行了比較。由于實際伺服系統存在庫侖摩擦和黏滯摩擦,將摩擦也考慮加入仿真。空氣舵伺服系統的參數和控制參數如表1 所示。

表1 空氣舵機電伺服系統的參數Tab.1 Parameters of air rudder electromechanical servo system
在系統初始就存在常值擾動。以Tl=100 N·m 情況為例,對系統輸入0.5 rad 擺角信號指令,其舵面擺角估計效果如圖3 所示,系統響應曲線如圖4 所示。類似上述仿真步驟,當Tl=300、500 N·m 時,仿真結果如圖5—6 所示。常值擾動效果對比如表2所示。

表2 常值擾動效果對比Tab.2 Comparison of constant disturbance effects

圖3 常值擾動Tl=100 N·m 下的θl估計效果Fig.3 Estimated effect of θl at constant disturbance Tl=100 N·m

圖4 常值擾動Tl=100 N·m 下的系統響應Fig.4 System response at constant disturbance Tl=100 N·m

圖5 常值擾動Tl=300 N·m 下的系統響應Fig.5 System response at constant disturbance Tl=300 N·m

圖6 常值擾動Tl=500 N·m 下的系統響應Fig.6 System response at constant disturbance Tl=500 N·m
從仿真結果來看,當系統初始就存在不同常值干擾力矩,文中設計的干擾觀測器反饋控制相比傳統θm反饋控制,穩態誤差減少97%以上,動態過程更平滑,穩態精度較高。
對系統輸入0.5 rad 擺角信號指令,在1 s 時對系統施加干擾力矩Tl。以Tl=100 N·m 情況為例,對系統輸入0.5 rad 擺角信號指令,其舵面擺角估計效果如圖7 所示,系統響應曲線如圖8 所示。類似上述仿真步驟,當Tl=300、500 N·m 時,仿真結果如圖9—10 所示。階躍擾動效果對比如表3 所示。

表3 階躍擾動效果對比Tab.3 Comparison of step disturbance effects

圖7 階躍擾動Tl=100 N·m 下的θl估計效果Fig.7 Estimated effect of θl at step disturbance Tl=100 N·m

圖8 階躍擾動Tl=100 N·m 下的系統響應Fig.8 System response at step disturbance Tl=100 N·m

圖9 階躍擾動Tl=300 N·m 下的系統響應Fig.9 System response at step disturbance Tl=300 N·m

圖10 階躍擾動Tl=500 N·m 下的系統響應Fig.10 System response at step disturbance Tl=500 N·m
從仿真結果來看,當系統存在不同階躍干擾力矩,設計的干擾觀測器反饋控制相比傳統θm反饋控制,穩態誤差減少97%以上,穩態精度較高,抗擾動效果更好。
設計一種基于RBF 神經網絡的狀態觀測器,對空氣舵機電伺服系統外部擾動進行觀測補償。仿真結果表明:相比傳統方法,該方法可以在較短時間內完成外部干擾的高精度補償,控制精度更高。