鄧偉偉,段朝陽,閆 亮
(中國空空導彈研究院,洛陽 471009)
隨著武器技術的進步和裝備的發展,現代戰爭中以第四代戰斗機及高超聲速巡航導彈為代表的高空、高速、高機動目標不斷涌現,對導彈的敏捷轉彎能力和末端精確打擊能力提出了更高的要求,導彈面臨嚴峻挑戰。為了彌補傳統氣動舵控制的不足,采用直/氣復合控制來提高導彈的響應特性,實現對目標的精確打擊。
針對導彈直/氣復合控制問題,國內外學者已經開展了大量研究工作[1-4],導彈直/氣復合控制系統是一個非線性、時變、多變量復雜控制系統,難以建立精確的數學模型,基于經典與現代控制理論設計的導彈直/氣復合控制系統依賴精確的數學模型,缺乏自學習和自適應能力。近年來,人工智能成為研究熱點,未來是智能化戰爭時代,各國為占領智能化軍事領域制高點,都在加快研究智能武器裝備[5],導彈直/氣復合控制系統智能控制也得到了相應的研究。神經網絡[6]、模糊控制[7-8]和遺傳算法[9]結合了定性決策和定量控制,將人的經驗與思維加入到導彈直/氣復合控制系統中,設計過程不依賴精確的數學模型,但是各類智能控制存在著不可避免的缺點。模糊控制表達人腦的推理能力,設計相當依賴專家或操作人員的經驗與知識,若缺乏這樣的經驗,很難獲得滿意的控制效果。神經網絡模擬人腦的組織結構,具有自學習能力,但實際類似于一個黑箱,缺少透明度,可解釋性較差,不能很好地表達人腦的推理功能。自適應神經模糊推理系統(Adaptive Neural-based Fuzzy Inference System,ANFIS)將二者有機地結合起來,通過神經網絡建立具有自學習能力的模糊控制系統,利用神經網絡的學習機制補償模糊控制系統原有的缺點,能夠得出比較科學合理的參數,從而提高整個系統對知識的學習和表達能力。
本文以末制導段空空導彈為研究對象,建立俯仰通道數學模型,設計2輸入2輸出的模糊控制器。采用自適應神經模糊推理系統,通過樣本數據學習,優化常規模糊控制。直接力裝置數學模型首先采用線性化模型進行設計,之后通過脈沖調寬調頻(Pulse Width Pulse Frequency,PWPF)調制器對線性化設計得到的直接力控制量進行調制,得到離散的開關指令。仿真結果表明,基于ANFIS的導彈直/氣復合控制系統能夠快速精確地跟蹤導彈加速度指令,提高系統的控制品質。
空空導彈直/氣復合控制采用姿控式,直接力裝置位于質心后,結構如圖1所示。
導彈俯仰通道上小擾動線性化動力學方程[10]為
(1)
俯仰通道狀態空間模型為
(2)
其中




氣動舵數學模型描述為如下二階系統
(3)
直接力裝置數學模型描述為如下一階系統
(4)
模糊控制是一種簡單地將某一空間的輸入映射到另一空間的輸出的規則[11]。模糊控制的人機對話能力強,方便將人的思考邏輯加入控制過程。模糊控制分為模糊化、模糊推理和解模糊3個過程,3個過程的完成基于知識庫。
知識庫包含了應用知識以及控制目標,由數據庫和規則庫構成。數據庫包括隸屬函數和尺度變化因子等,規則庫包括模糊語言構成的一系列控制規則。模糊化是將輸入指令的清晰量轉化為模糊量,以便于模糊推理。模糊推理是模糊控制的核心,基于模糊概念模擬人的推理能力,一般基于控制工程知識、操作人員實際操作過程等來模仿人的決策行為,通過相應的模糊控制規則,得到控制指令的模糊量。解模糊是將模糊推理得到的控制指令的模糊量轉化為實際控制的清晰量。模糊控制器結構如圖2所示。

圖2 模糊控制器結構
自適應神經模糊推理系統利用神經網絡的學習能力,通過對樣本數據的學習實現模糊控制的模糊化、模糊推理和解模糊3個過程,優化模糊控制的知識庫,建立具有自學習、自適應能力的模糊控制系統[12]。以2輸入(x1,x2)和1輸出(y)的系統為例,模糊if-then規則如下:
規則1:ifx1isA1andx2isB1thenf1=p1x1+q1x2+r1
規則2:ifx1isA2andx2isB2thenf2=p2x1+q2x2+r2
自適應神經模糊推理系統可以認為是T-S型模糊控制的神經網絡實現,該網絡是一個多層前饋網絡,結構如圖3所示。

圖3 自適應神經模糊推理系統結構
第一層:輸入變量模糊化,該層參數可變,每個節點是以節點函數表示的方形節點
O1,i=μAi(x1),i=1,2;O1,i=μB(i-2)(x2),i=3,4
(5)
其中,x1(或x2)為節點的輸入;O1,i為模糊集Ai(或Bi-2)的隸屬函數,隸屬函數的參數集為前提參數。
第二層:模糊集運算,輸入信號相乘,而將其乘積輸出為
O2,i=ωi=μAi(x1)μBi(x2),i=1,2
(6)
第三層:計算每條規則ωi與全部規則ω之和的比值為
(7)
第四層:計算每條規則輸出為
(8)
其中,{pi,qi,ri},i=1,2為結論參數。
第五層:計算所有輸入信號的總輸出為
(9)
自適應神經模糊推理系統根據樣本數據學習調整前提參數和結論參數,對于集上任意函數有無限的逼近能力,為復雜系統的控制提供了有效的工具。
PWPF調制器由一階慣性環節、施密特觸發器以及反饋回路組成,如圖4所示。

圖4 PWPF調制器
其中,Km為一階慣性環節放大系數,Tm為一階慣性環節時間常數;Uon和Uoff為施密特觸發器的開關閾值,Um為施密特觸發器的脈沖幅值。脈沖調制基于沖量等價原理,采用PWPF調制器可以將連續推力轉化為等效的常值脈沖推力。
結合純氣動舵控制采用的經典Raytheon三回路結構[13],針對導彈直/氣復合控制數學模型,直接力控制回路與氣動舵控制回路并行工作,建立導彈直/氣復合模糊控制系統,如圖5所示。

圖5 導彈直/氣復合模糊控制系統
加速度誤差信號ea和角速度誤差信號eω為模糊控制器的輸入;氣動舵控制信號δz和直接力控制信號δR為模糊控制器的輸出;彈體加速度ay和俯仰角速度ωz為反饋信號。

自適應神經模糊推理系統的輸入為加速度誤差與角速度誤差,輸出為直接力控制與氣動舵控制。采用離線學習模式,通過線性二次型調節器(Linear Quadratic Regulator, LQR)采集樣本數據,分為訓練、測試、檢核3個部分,對于裝入系統的樣本數據通過網格分割法,按照設定參數,依據模糊C-均值聚類方法建立模糊推理系統。依據模糊控制的設計經驗,設置模糊子集個數為7,選取三角形隸屬函數,輸出為線性函數。利用混合最小二乘估計的反向傳播算法,確定自適應神經模糊推理系統的前提參數和結論參數,確定與輸入輸出樣本數據相匹配的模糊控制知識庫,建立具有自適應能力的模糊推理系統。
選取導彈在高度12km,馬赫數3.0的特征點進行設計,其狀態方程矩陣為


執行機構參數ωδ=120,ξ=0.7,τ=0.02;穩態傳遞增益Kωss=0.00113;PWPF調制器參數選取為Km=5,Tm=0.1。
圖6~圖10所示為加速度10m/s2的仿真結果。可以看出,常規模糊控制相對于LQR超調量更小,控制用量更優,控制品質更高。當加速度指令變化時,基于經驗設計的常規模糊控制的知識庫需要更新,經驗不足時一般采用試湊法完成知識庫更新,設計過程復雜。圖11~圖14所示為加速度100m/s2的仿真結果??梢钥闯觯赃m應神經模糊推理系統控制品質優于常規模糊控制,常規模糊控制設計由于經驗不足,加速度指令跟蹤存在一定的穩態誤差與振蕩。圖15~圖17所示為直接力裝置采用PWPF調制器,驗證導彈直/氣復合控制系統的離散特性。加速度響應曲線上升段的波動是由于直接力裝置點火產生的瞬時推力造成的正常現象。仿真結果表明,基于ANFIS的導彈直/氣復合控制系統能夠快速精確地跟蹤導彈加速度指令。

圖6 加速度指令10m/s2時加速度響應

圖7 加速度指令10m/s2時俯仰角速度響應

圖8 加速度指令10m/s2時氣動舵偏用量

圖9 加速度指令10m/s2時直接力用量

圖10 直接力用量局部放大

圖11 加速度指令100m/s2時加速度響應

圖12 加速度指令100m/s2時俯仰角速度響應

圖13 加速度指令100m/s2時氣動舵偏用量

圖14 加速度指令100m/s2時直接力用量

圖15 采用PWPF調制器的加速度響應

圖16 采用PWPF調制器的直接力裝置開關指令

圖17 直接力裝置開關指令局部放大
本文針對空空導彈直/氣復合控制問題,基于ANFIS設計了導彈直/氣復合控制系統。常規模糊控制設計基于經驗,不依賴精確的數學模型,但是當系統工作狀態變化時,知識庫相應地需要更新,設計過程復雜,經驗不足時難以保證控制品質。本文通過引入神經網絡,建立了自適應神經模糊推理系統,通過樣本數據學習建立了模糊控制知識庫,優化了常規模糊控制。采用PWPF調制器對線性化設計得到的直接力控制量進行調制,得到離散的開關指令,驗證了導彈直/氣復合控制系統的離散特性。仿真結果表明,常規模糊控制的控制品質優于LQR,系統狀態發生變化時,基于ANFIS的導彈直/氣復合控制系統可以實現加速度指令的快速精確跟蹤,改善了空空導彈的響應特性。