胡濤, 申立群, 曹杰銘, 董偉鋒, 寧佳意
(哈爾濱工業大學 儀器科學與工程學院,黑龍江 哈爾濱 150001)
航天飛行器在運行過程中為了沿著預定軌道飛行,航天伺服機構需要接收制導系統的控制指令,通過閉環回路產生控制力矩,實時調整自身姿態[1]。航天飛行器通常通過推力矢量控制(thrust vector control,TVC)修正姿態,即通過伺服機構的作動器旋轉發動機尾部噴管,改變噴管在偏航軸或俯仰軸的擺角,產生橫向力和繞質心運動的控制力矩,來修正航天飛行器的運行軌跡和姿態[2]。
伺服機構在TVC系統發揮著控制姿態和方向變化的重要作用。早期為了保證可靠性,大多使用電動液壓伺服機構,但由于電動液壓執行器需要的大量精細零件以及較高清潔度等要求,其設計問題一直是航空航天領域的巨大挑戰[3-5]。隨著航空航天工業的發展,對為了獲得更高的航空品質和驅動性能,航空航天行業越來越多地采用電動伺服系統來取代傳統的電動液壓伺服系統[6-7]。如今電動伺服系統因為具有結構簡單、質量更輕、成本較低、控制穩定性高等優點,已成為TVC系統執行器主要研究趨勢。例如:熟知的Vega運載火箭的第二、三、四級TVC系統便采用的機電作動器[8]。
模糊控制是智能控制理論的重要組成部分[9-11],它不需要被控對象的精確數學模型,對于非線性高的被控對象有較好的控制效果,廣泛應用于工程機械和航空航天領域。文獻[12]將模糊控制理論和PID控制方法相結合,提出了適合伺服系統的模糊自整定PID控制算法,對縮短伺服系統的輸出響應時間及提高擾動穩定性都具有明顯的優勢,具有良好的工程應用前景。文獻[13]針對傳統PID控制器參數時變導致控制品質下降的問題,基于模糊控制原理設計了一種角度隨動系統的自適應模糊PID控制器,加快了系統的收斂速度,減少了超調量。文獻[14]通過引入前饋補償和模糊PID控制器,完成了舵機加載系統的設計和實現,系統輸出跟隨輸入能力增強,滯后減小。文獻[15]利用變論域的模糊控制方法,改進了運載火箭姿態的控制設計,對外部干擾具有良好的魯棒性,提高了控制精確度。因此,模糊控制對于具有慣性大、時變不確定性、非線性等特點的航天電動伺服系統具有良好的控制效果,在液壓、舵機伺服系統上獲得了較為成熟的應用[16-19]。但這些研究并沒有考慮分析伺服系統所受到的摩擦力矩、齒槽力矩擾動等非線性擾動因素,同時模糊規則的建立,很大程度上取決于人的主觀經驗,因此模糊控制的自適應性和自學習能力需要進一步提升。
本文以直驅式機電作動器的電動伺服機構為研究對象,并充分考慮了摩擦、電機齒槽力矩、時滯等內部非線性干擾對TVC系統造成的影響。對電動伺服機構和各擾動因素進行動力學分析,建立數學模型,并通過Simulink軟件搭建出仿真模型。 通過設計前饋控制器對非線性干擾進行補償,設計的模糊PID控制器提高了系統的響應速度。在模糊PID控制器的基礎上,引入BP神經網絡保證模糊控制在全輸入論域上都有良好的控制效果。同時改善電動伺服機構的動、靜態特性,使其達到TVC系統的指標要求,可以為航天電動伺服機構結構和控制器設計提供借鑒。
電動伺服系統由電源、控制器、機電作動器(electromechanical actuation,EMA)組成,直驅式機電作動器不含減速箱,可以直接將電機的旋轉運動轉化為螺母的直線往復運動,從而驅動活塞擺動噴管。同時也有利于在滾柱絲杠的螺桿中插入用于測量活塞位移的線性傳感器 (linear variable differential transformer,LVDT),保護LVDT免受外部沖擊,TVC系統結構如圖1所示。

圖1 TVC系統結構圖
直驅式機電作動器結構簡單、成本更低、故障發生的概率降低、可靠性更高。因此本文對直驅式電動伺服系統進行仿真建模,考慮系統非線性干擾,設計控制器改善電動伺服機構的動、靜態特性。
機電作動器的驅動電機使用低速高扭矩的永磁同步電機(permanent magnet synchronous motor,PMSM),其轉矩方程為
(1)
式中:TL為負載轉矩;Jm為轉子轉動慣量;Bm為電機阻尼系數;Te為電磁力矩;ωe為機械角速度。
永磁同步電機驅動力矩通過絲杠傳遞到活塞,力矩與絲杠的軸向載荷之間的關系為
(2)
式中:Te為PMSM電機傳遞到絲杠旋轉軸的扭矩;F為軸向載荷;p為絲杠導程;η為絲杠傳遞效率。
直驅式機電執行器沒有減速器,絲杠的螺桿中有檢測活塞位移的LVDT,EMA中電機的負載力矩為
(3)
式中:mp為活塞質量;Bp為絲杠粘滯阻尼系數;xp為執行器的行程,由滾柱絲杠導程和電機旋轉角度決定,即
(4)
將式(4)代入式(3)中得到機電執行器負載轉矩TL與電機旋轉角度的表達式為
(5)
由于噴管的轉動慣量是機電執行器的主要負載,噴管的負載轉矩TE可以由下式計算得到:
TE=RmFE。
(6)
式中:Rm為執行器力臂;FE為噴管負載產生的阻力,有
FE=keq(xp-xeq)。
(7)
式中xeq是等效剛體模型中作動器活塞的位移,將PMSM電機的負載轉矩方程由式(5)改為
(8)
1)摩擦力矩擾動。
摩擦力矩是系統低速和微位移運行時的主要干擾力矩,導致系統產生“爬行”和“死區”等現象,產生功率損耗、儀器設備損壞等不良影響, 并降低系統動、靜態性能。工程中,Stirbeck模型能夠較好地描述摩擦力與速度的關系,Stribeck模型[20]如下:
(9)
式中:庫侖摩擦力矩Fc=0.25 N·m、靜摩擦力矩Fs=0.5 N·m、粘性摩擦力矩系數Bv=0.5 N·m·s/rad、vs為Stribeck速度,vs和ξ為經驗參數。
2)齒槽力矩擾動。
齒槽轉矩擾動是由磁場在電機齒槽兩側分布不均勻導致的。本文采用的是16級48槽永磁同步電機,未采用轉子斜極法安裝時齒槽轉矩的峰峰值為0.44 N·m轉矩大小隨轉子角度呈正弦波動,波動周期為7.5°,呈現為3P次諧波干擾。齒槽力矩擾動的數學模型如下:
Fcog=0.44sin(48θ)。
(10)
式中:θ為電機的電磁角度;Fcog為電機齒槽轉矩。
3)時滯特性。
推力矢量控制系統是典型的數字、模擬信號混合控制系統,矢量控制器和機電作動器必然會引入時滯特性。時滯環節的存在,會降低系統的跟隨性能。通過工程的實際測量,由上述因素造成的系統時滯大小一般在4~6 ms之間。時滯環節的傳函為
Gτ(s)=e-τs。
(11)
其中時間常數τ為6 ms。
通過以上對TVC系統模型的建立以及考慮的各種非線性擾動因素,利用Simulink仿真實現,建立各擾動仿真模型,引入了非線性擾動的TVC系統仿真模型如圖2所示。

圖2 含非線性環節的完整TVC仿真模型
本文以直驅式機電伺服系統為研究對象,建立了TVC系統非線性模型。模型中永磁同步電機、滾柱絲杠、活塞和負載等組件的模型參數如表1所示,電動伺服系統的動態性能指標要求如表2所示。

表1 TVC系統標稱模型參數

表2 TVC系統動態性能指標
1)摩擦力矩補償。
前饋系統如圖3所示,為了研究在微位移、低速情況下摩擦力矩對整個TVC系統的影響,對位置環輸入幅值為1 V(10%行程)的階躍控制信號,得到如圖4(a)所示的階躍響應曲線。可以看出,當系統趨近穩定值即2.043 mm時,轉速在0附近跳變,摩擦力在正負最大摩擦力之間跳變,導致輸出在穩定值之間來回振蕩。

圖3 按擾動補償的前饋控制

圖4 摩擦力矩補償前后的階躍響應曲線
本文采用圖3所示的方式設計前饋控制器,將干擾信號通過校正原件處理后,利用一條單獨的通路引入控制系統補償擾動信號。其中:N(s)為可測量到的擾動,例如摩擦力矩干擾;G1(s)、G2(s)是包括反饋控制器的主控制回路前向通道的傳遞函數;G3(s)為前饋補償原件的傳遞函數。當前饋補償元件傳函為下式時:
(12)
理論情況下由干擾造成的誤差為0,E(s)=0,前饋補償完全補償干擾力矩所產生的不良影響。
為了得到主控制回路傳函G1(s),對TVC系統輸入10 V滿行程控制指令信號,并以轉速環控制信號作為輸入,干擾力矩輸入點作為輸出,將輸入輸出數據導入到MATLAB工作區間,通過系統分析工具擬合得到傳函G1(s)。傳函G3(s)的具體形式如下:
(13)
取摩擦力矩補償后TVC系統的位置環,在零時刻輸入幅值為1 V(10%行程)的階躍控制信號,TVC系統階躍響應曲線如圖4(b)所示。與圖4(a)相比,加入前饋補償雖然使系統上升時間略有增加,但仍能滿足動態特性要求,同時減少了超調量和穩態誤差,改善了穩態值附近摩擦力矩正負波動而導致的振蕩現象,提高了系統的動態性能和抗干擾能力。
2)齒槽力矩補償。
為了研究在微位移、低速情況下齒槽定位力矩對TVC系統的影響,在零時刻對系統位置環輸入幅值為0.1 V的1%行程位移階躍信號,仿真時間為3 s,仿真曲線如圖5(a)所示。可以看出,在0~0.06 s的時間內電機電磁轉矩較大,電機快速起步,齒槽轉矩對電機轉速和系統位移影響較小;0.06~2.2 s之間PID控制器對誤差信號的積分作用使得電磁轉矩足以克服齒槽轉矩的大小。但積分作用的滯后效果,讓系統存在3.3%的超調,在3 s時仍存在3%的穩態誤差,不滿足靜態性能指標。由此可見在微位移、低轉速的情況下齒槽轉矩會阻礙系統達到穩態值,大大增加了系統的調節時間,降低了系統的動態響應能力。
前饋補償后TVC系統1%行程階躍響應曲線如圖5(b)所示。與圖5(a)相比,前饋控制較好的補償了齒槽力矩干擾,解決了齒槽力矩在穩態值附近帶來的延時,使調節時間幾乎為0,同時減少了超調量和穩態誤差,極大改善了系統的動態性能。
本文將經驗推理和臨界比例度法結合使用,通過經驗推理法得到PID參數初始值,再通過臨界比例度法的公式進一步調節,以此對TVC系統的轉速環控制器參數進行設計。通過多次仿真實驗并微調后得到轉速環PID控制器的3個參數分別為:kp=5、ki=0.1、kd=0.1。本文所選用的永磁同步電機最大空載轉速為4 500 r/min,轉化弧度值為471 rad/s。為了觀測轉速環的動態性能,在零時刻對無負載的機電執行器輸入幅值為471 rad/s的階躍信號,EMA的轉速響應曲線如圖6所示。可知電機轉速上升時間為42.6 ms,在0.5 s時電機轉速達到了469.7 rad/s。轉速環沒有超調、穩態誤差幾乎為0,且上升時間快,具有較好的動態特性。

圖6 EMA轉速環響應曲線
1)模糊變量設計。
位置環模糊PID控制系統的結構圖如圖7所示。由圖可知,位置環的輸入信號即位移偏差信號e。本次位置環模糊PID控制器采用二維輸入、三維輸出的結構,即以位移偏差信號e和位移偏差變化率ec作為輸入,PID控制器的kp、ki、kd參數作為3個輸出,實現PID控制器參數的動態調整,提高系統的適應性和抗干擾能力。

圖7 位置環模糊PID控制系統結構圖
根據模糊論域設計方法確定輸入、輸出變量的模糊論域。各個變量取值情況如下:e論域為[-12,12]、ec的論域為[-12,12]、kp的論域為[10,65]、ki的論域為[2,12.5]、kd的論域為[0.001,0.066]。綜合考慮模糊控制的準確度和推理復雜度,將輸入輸出5個變量劃分為7個自然語言描述的子集,即正大(PB)、正中(PM)、正小(PS)、零(ZO)、負小(NS)、負中(NM)、負大(NB)。
2)量化因子及比例因子設計。
量化因子是將實際的位置環輸入映射到模糊輸入論域上,起到把連續的物理輸入量轉化到離散模糊子集的變論域效果。
比例因子將模糊輸出論域轉變到實際輸出論域中,起到離散模糊子集到連續物理輸出的變論域效果。比例因子越大系統的響應速度越快,但過大會增大超調量和調節時間,嚴重會導致系統發散。
根據經驗微調得到Ke=0.49。同理誤差變化率量化因子取相同值Kec=0.49, 各比例因子Kup=1.5、Kui=1.2、Kud=1.2。
3)模糊推理規則設計。
為了保證模糊控制器高靈敏度的同時,也具有較好的穩定性,在輸入輸出較大時,即模糊子集為正大(PB)和負大(NB),選用高斯形函數,保證在輸入輸出變化較大時,函數曲線較平緩,降低超調量,提高系統穩定性;在輸入輸出為中值區時,即模糊子集為正中(PM)到負中(NM)之間,選用三角形函數,確保系統輸入值變化較小時,有較高的靈敏度,提高系統的響應速度。
模糊控制器在不同e和ec輸入值的情況下,PID控制器參數具體的模糊子集取值如表3所示。

表3 模糊PID控制器kp/ki/kd推理規則表
模糊PID實現了PID控制器參數的動態調整,提高系統應對復雜情況的能力。但量化因子和比例因子都是固定值,當物理輸入值與模糊論域相差較大時會使得模糊化后的輸入不能完全映射到模糊論域上,導致控制靈敏度下降。本文利用BP前饋神經網絡來動態調整量化、比例因子值,增強系統適應能力。
1)控制器結構設計。
利用BP神經網絡較強的擬合能力,利用在不同位移指令下人為整定的量化因子和比例因子樣本進行訓練,將訓練好的BP網絡搭建到TVC仿真模型中,實現對模糊控制器參數的動態整定,含有BP神經網絡的模糊PID控制系統如圖8所示。

圖8 BP神經網絡模糊PID控制系統結構圖
2)量化因子及比例因子擬合。
BP神經網絡的學習樣本源于人為整定的數據,在設計的傳統模糊PID基礎上,通過Simulink仿真,輸入不同階躍位置指令,分析TVC系統性能指標,人為修正量化因子和比例因子值,使系統在完整指令信號域上都有較好的動態性能。
kp比例因子的BP網絡設定為三層,第一層輸入層有1個輸入節點,第二層隱藏層設置10個節點,第三層輸出層有1個輸出節點,訓練樣本集占70%,驗證集占15%,測試集占15%。3個斜率較大的波峰處,調小步長多次整定,kp的比例因子的訓練樣本個數為114,它的擬合結果如圖9所示。

圖9 kp比例因子擬合結果
模糊PID的kp模糊論域為[10,65],并非關于零點中心對稱,模糊推理規則決定的kp輸出值,也不隨輸入值線性變化。人為整定kp比例因子發現負向最大位移-20.43 mm處,kp=2.5時系統響應速度快;負向最大位移20.43 mm處,kp=1.5時系統響應速度快,兩者下降和上升時間都約為119 ms。指令位移輸入為0、-5、5 mm時,比例因子出現峰值,在峰值附近應該減小步長,增加樣本個數,提高BP網絡復雜度。從圖9看出,采用10個隱藏節點的BP網絡較好擬合了整定樣本,誤差較小。
同理,對量化因子及ki、kd比例因子也利用人為整定得樣本進行訓練。量化因子與ki、kd比例因子擬合曲線都近似正態分布,搭建的BP網絡學習能力強,較好擬合了給定樣本,擬合曲線誤差較小。
為了對比TVC系統分別在傳統PID、模糊PID以及神經網絡模糊PID控制器下的控制性能,從動態響應能力、跟隨性能、抗干擾能力、頻域響應能力以及對微位移的響應速度這5個方面進行仿真驗證和對比分析。其中轉速環PID控制器的3個參數分別為:kp=5、ki=0.1、kd=0.1,位置環控制器參數由模糊控制器進行動態調整,比例因子和量化因子由訓練好的10層BP神經網絡進行實時整定。
1)TVC系統的動態響應能力對比實驗。
為對比各控制器下TVC系統的動態響應能力,在零時刻、零初始位置分別輸入正負向最大行程20.43 mm的階躍位置指令信號,觀察位置環取不同控制器時TVC系統階躍響應曲線,如圖10(a)和圖10(b)所示。可以看出,傳統PID的控制效果正負向一致,即正向上升時間和負向下降時間都為166.11 ms,超調量為0.3%。模糊PID控制器因模糊規則及模糊輸出論域不對稱,正負向階躍響應不完全相同,正向上升時間為118.73 ms,超調量為0.6%;反向下降時間為144.76 ms,超調量為0.7%。模糊PID正負向響應速度皆比傳統PID快,存在小于1%的微小超調。模糊BP網絡PID的上升時間為117.76 ms,超調量為0.2%;反向下降時間為117.72 ms,超調量為0.1%。

圖10 TVC系統的動態響應能力對比實驗結果
2)TVC系統的跟隨性能對比實驗。
為考驗TVC系統的跟隨性能,在零時刻、零初始位置輸入頻率為1 Hz,幅度為20.43 mm的正弦指令信號,TVC系統響應曲線如圖11所示。仿真結果表明,模糊PID和模糊BP網絡神經PID在幅值和跟隨時間上皆優于傳統PID控制,加快了系統跟隨速度,改善了系統的跟隨性能。但兩者性能相似。

圖11 TVC系統的跟隨性能對比實驗結果
3)TVC系統的抗干擾能力對比實驗。
為考驗系統的抗干擾能力,在零時刻、零初始位置對不同控制器下TVC系統輸入幅值為0.204 3 mm的階躍位置指令,在系統穩定后,0.5 s時突加幅值為150 N·m,持續時間為0.25 s的階躍負載擾動,系統響應曲線如圖12所示。其中,模糊BP受負載擾動后幅值下降最少,負載消除后恢復時間最短。傳統PID控制下的系統幅值下降最大,恢復時間最長,模糊PID控制器居于兩者之間。綜上所述,模糊BP網絡PID控制器抗干擾能力最好,模糊PID居中,傳統PID最差。

圖12 TVC系統的抗干擾能力對比實驗結果
4)TVC系統的頻域響應對比實驗。
為檢驗采用模糊控制的TVC系統是否滿足頻域指標要求,使用典型幅值和頻率的正弦信號激勵TVC系統。TVC系統工作帶寬在10 Hz以內,在零時刻、零初始位置將幅值為1 V即10%行程2.043 mm,頻率在0.1~20 Hz的Chirp信號作為激勵,得到TVC系統的位移響應曲線和頻率響應曲線分別如圖13(a)和圖13(b)所示。圖13(a)表明,隨著Chirp信號頻率的增加,TVC系統響應幅值逐漸降低,模糊PID控制器正負向不對稱,正向響應速度快于負向,正向跟隨性能更好,負向幅值較低。模糊BP網絡PID根據輸入位移幅值動態調整量化、比例因子大小,正負向對稱,正向幅值與模糊PID近似,負向幅值高于模糊PID,動態響應更佳。圖13(b)中,當位移指令信號幅值為10%行程時,采用模糊PID控制的TVC系統擁有3.13 Hz帶寬,相頻特性曲線-90°對應頻率為8.82 Hz,系統帶寬要求仍有所欠缺。采用模糊BP網絡PID控制的TVC系統擁有4.25 Hz帶寬,相頻特性曲線-90°對應頻率為9.98 Hz。模糊控制器拓寬了帶寬,改善了系統頻率特性。BP神經網絡在傳統模糊控制基礎上進一步拓寬了帶寬,滿足了系統頻域指標要求。

圖13 TVC系統的頻域響應對比實驗結果
5)TVC系統對微位移的響應速度對比實驗。
液體發動機燃料晃動會使航天飛行器姿態發生輕微晃動,為了保證系統穩定性,航天電動伺服系統需要對微位移控制指令也要有較快的響應速度。在零時刻、零初始位置以幅值為0.1 V即1%行程0.204 3 mm,頻率在0.1~20 Hz的Chirp信號作為激勵,得到TVC系統的位移響應曲線和頻率響應曲線分別如圖14(a)和圖14(b)所示。圖14(a)可以看出,模糊BP網絡PID控制0.1%行程的正弦響應明顯優于傳統模糊控制。在時間為10 s,位置指令為20 Hz時,模糊BP幅值為0.194 3 mm,下降了4.9%,此時傳統模糊PID為0.127 2 mm,下降了37.7%。圖14(b)中,當位移指令信號幅值為1%行程時,采用模糊PID控制的TVC系統擁有4.25 Hz帶寬,相頻特性曲線-90°對應頻率為10 Hz,系統帶寬要求仍有所欠缺。采用模糊BP網絡PID控制的系統擁有4.32 Hz帶寬,相頻特性曲線-90°對應頻率為15.2 Hz。相比于傳統PID控制器,模糊控制器拓寬了帶寬,系統響應速度更快。傳統模糊和BP模糊均能滿足頻率特性要求,但采用BP模糊器的系統帶寬更寬,較好改善了系統頻率特性。
本文以使用直驅式機電作動器的電動伺服系統為研究對象,對其進行分析建模,并針對系統存在的問題設計控制方法,改善系統性能。對直驅式航天電動伺服系統的各組成環節,及在運行過程中存在的非線性干擾,搭建了Simulink仿真模型。以此非線性TVC系統仿真模型為基礎,針對系統存在的問題,通過前饋控制方法補償了非線性擾動,并設計PID、模糊PID和模糊BP神經網絡PID控制器。各控制器的仿真結果表明,模糊BP網絡控制器性能最好,傳統PID最差,模糊PID居中,模糊神經網絡控制器較好的提高了系統響應速度,增強了系統抗干擾能力,滿足了系統的動、靜態性能和頻域性能指標,改善了系統控制品質。