黃民昌 蔣 政 張 南 褚衍超 胡 勇
上海航天控制技術研究所,上海 201109
舵機作為飛控系統的執行機構,其工作特性直接影響飛行控制的品質[1]。折疊舵(翼)以其結構簡單、占用空間小、便于貯存、運輸和發射等優點而廣泛應用于導彈彈翼以及舵機機構[2]。導彈折疊舵的關鍵指標包括展開時間、展開沖擊量級、可靠穩定性等。這些指標是導彈正常完成后續預定任務的前提,也對導彈傳動機構、彈體框架等薄弱部位提出了耐沖擊、高強度、高可靠的要求[3]。同時,以指標提升、持續學習為核心目標的航天智能控制系統也是今后的發展趨勢[4]。
為了解決折疊舵展開時結構的沖擊安全性問題,國內學者主要從以下兩方面進行了較為充分的研究:一是對折疊舵展開沖擊過程進行精細化分析,作為加強結構設計的指導與評估,如甄文強等對橫向折疊翼展開過程進行考慮空氣阻力和摩擦力矩的數學和動力學建模分析[5]。二是在結構設計上引入特殊設計方法,提高折疊舵本體抗沖擊強度。如祝隆偉、張玉翠、劉芳等學者分別研究了間隙與折疊翼面振動的關系,各自提出了通過控制間隙從而減小碰撞力的方法[6-8]。李玉亮等在折疊舵中引入了減震墊,給出了力函數參數的確定方法[9]。
目前折疊舵展開沖擊研究主要集中在抗沖擊結構強度和振動兩方面。而實際中卻往往忽略了兩方面重要問題,一方面,舵軸作為舵系統的傳動件,在巨大的舵面展開沖擊下,舵軸難以保持零位,如不進行適應性控制,容易激勵出彈體的彈性振動[10]。另一方面,基于環境交互時沖擊安全控制的思想,利用在短時間內舵軸旋轉方向自由度的力和位移,可達到化解部分舵軸彎曲應力與舵面沖擊應力的效果,避免傳動件間的硬碰硬沖擊。
因此,在舵面展開的瞬時過程中如何控制舵系統使得舵面的展開沖擊最小成為一個最優控制問題。在最優控制問題的解決方法中,啟發式策略以試探的方法,通過不斷迭代生成較優解,以逼近最優解,具有良好的通用性和穩定性,廣泛運用于仿生控制、人工智能、機器人等領域[11-14]。
本文針對舵面展開沖擊過程舵系統安全最優控制問題,在引入舵系統自由度的基礎上,分析折疊舵系統展開過程的動力學模型,建立了包含舵面展開運動耦合特性的控制系統模型。依據展開時間、最大舵軸彎矩、沖擊殘余動能三大指標作為約束條件,采用啟發式學習的方法對舵面展開沖擊過程中的舵系統優化控制進行迭代求解,經過仿真驗證,經過優化后的舵系統展開過程達到了減少彎矩應力、減小沖擊載荷的效果。
某橫向折疊舵分為2個部分,與舵軸固連的內舵,以及橫向折疊的外舵,外舵初始與內外舵轉軸折入一定角度,如圖1所示。導彈發射后,燃氣驅動外舵向外展開,在完全展開時刻鎖緊銷將內外舵鎖制在一起[15]。

圖1 某折疊舵結構示意圖
如圖2所示,針對舵展開原理建立固定坐標系OXYZ位于舵軸接口中心,δX、δY和δZ分別為沿各軸分量的單位基矢量,動坐標系pxyz與外舵固連,δx、δy和δz分別為沿各軸分量的單位基矢量,z軸與內外舵轉軸重合,y軸垂直于外舵面,動坐標系qx′y′z′與內舵固連,δx′、δy′和δz′分別為沿各軸分量的單位基矢量,x′軸與內舵舵軸轉軸重合,y′軸垂直于內舵面。令舵軸轉角為θ,外舵展開角度為φ。

圖2 折疊舵展開基本模型
矢量或張量在坐標系下的投影矩陣為沿該坐標系的各單位矢量或單位并矢量的對應分量組成的矩陣,本文中投影矩陣采用坐標原點加括號的上標來區分矢量或張量。設外舵以質心mc為原點的慣性張量為Jout_c,剛體平面上各點的法線必為該點的慣性主軸[16],張量Jout_c平行于pxyz各坐標軸的投影矩陣為:
(1)
式中:A,B,C分別為外舵以質心為原點的慣性張量分別在x,y,z軸方向上的分量。

(2)

(3)
式中:Rop為旋轉矩陣,
(4)
為了簡化問題,折疊舵展開時內外舵間隙和變形忽略不計,展開到位后內外舵看做一個整體。以下分為展開階段和沖擊階段對舵面展開進行分析。
展開階段,外舵在燃氣驅動下向外展開,內舵由于伺服系統在驅動力和燃氣驅動耦合力作用下運動。忽略內外舵轉軸與舵軸軸線的中心距,外舵的運動為繞動坐標系原點p的旋轉運動,其動能Tout為:
(5)
式中ωout為外舵轉動角速度矢量,其在慣性坐標系OXYZ下投影為:
(6)
類似地,對內舵動能Tin進行分析:
(7)
式中:ωin為內舵與舵軸的轉動角速度矢量,Jin_q為內舵相對于原點q的慣性張量,計算公式為:
(8)
(9)
(10)
式中: (xcin,0,zcin) 為內舵質心在qx′y′z′坐標系下坐標,min為內舵質量,Ain,Bin,Cin分別為內舵相對于內舵質心的慣性張量分別在x′,y′,z′軸方向上的分量,ωin在慣性坐標系OXYZ下投影為:
(11)
若忽略重力勢能的影響,列寫拉格朗日函數:
L=Tout+Tin
(12)
基于拉格朗日定理,建立舵系統動力學方程為:
(13)
式中:
m12=m21=myczcsinφ-mxczccosφ
Q1=τ·i·η,τ為舵機電機轉矩,i為電機到舵軸的減速比,η為傳動效率。
Q2=Q(t),Q(t)為舵面展開的驅動力矩。

由式(13),m12包含xc和zc,外舵質心位置到舵軸延長線以與折疊舵軸線交點的距離決定了展開力矩對舵軸偏轉扭矩的耦合程度。由于m12項和H1,H2項的存在。舵面展開動力學方程具有極強的時變性質和耦合性質。
舵面展開階段,舵軸處的彎矩和扭矩是舵面展開時期的主要沖擊部位。由動量矩定理,外舵的動量矩M是引起舵軸中心處產生的彎矩的唯一因素。列寫OXYZ坐標系下動量矩方程:
(14)

(15)
將動量矩投影于慣性坐標系OXYZ:
(16)
式中:Mx為沖擊產生的舵軸轉矩,由傳動機構彈性變形以及電機伺服控制產生的力矩來吸收。My和Mz為施加于舵軸軸承上的彎矩分量,是沖擊的薄弱位置,記其合力矩為:
(17)
沖擊階段,外舵與內舵產生激烈碰撞,同時鎖緊機構將內外舵鎖定在展開狀態,可視為內外舵產生了完全非彈性碰撞。此時由于舵面展開時燃氣做功積累的能量在短時間內來不及釋放,巨大沖量使舵軸,軸承甚至彈體產生彈性形變。通常情況下,艙體徑向剛度要比切向剛度大,因此切向是主要沖擊方向。沖擊階段在舵軸處引入了繞Z軸方向的旋轉自由度,設外舵轉軸與坐標原點O距離為d,如圖3所示。

圖3 展開到位沖擊階段折疊舵模型
碰撞前,外舵的旋轉角速度投影于慣性坐標系OXYZ為:
(18)
(19)
由于碰撞時間極短,忽略碰撞短時間內的動量變化,列寫OXYZ坐標系下動量守恒方程:
(20)
式中:Jall_o=Jout_o+Jin_o,為整個舵面相對于坐標原點O的慣性張量,其在慣性坐標系OXYZ下的投影為:
(21)
(22)
xcd=xc+d
(23)
內外舵展開到位后動坐標系pxyz平行于動坐標系qx′y′z′,因此有
(24)
(25)
式中:

建立舵面展開階段的控制模型,由式(13),可得系統逆動力學方程如下:
(26)
引入電機模型如下:
(27)
τ=KtI
(28)
式中:u為電機控制電壓,L為電機繞組電感,R為電機繞組內阻,τ為電機扭矩,I為繞組電流,i為電機到舵軸的減速比,Ke為電機反電勢系數,Kt為電機力矩常數。
定義系統狀態變量為:
(29)
由式(26)~ (28),可推導出系統狀態方程:
(30)
式(30)的控制模型為仿射非線性系統,直接對其進行最優求解較為困難,通過數值計算不斷逼近最優解是一條切實可行的途徑。
根據式(30)的控制模型,以下基于啟發式學習方法對控制輸入制定學習策略。首先,基于控制周期將控制輸入離散化,將控制時域劃分為T,2T,3T,…,nT,對應控制輸入:
u(kT)=uk,k=1,2,…,n
(31)
n為正整數,輸入有界|uk|≤umax,控制點之間輸入以樣條曲線過渡。設計舵面展開評價函數為:
J=(k1tf)n1+(k2Mbmax)n2+(k3Tafter)n3
(32)
評價函數包括3部分:1)舵面展開到位時間tf,舵面能在指標要求的時間內展開是優化的前提; 2)舵面展開過程的最大彎矩Mbmax;3)舵面展開到位沖擊后的內外舵共同運動的動能Tafter,以此表征沖擊后舵面殘余的能量。k1,k2和k3為線性權重參數,n1,n2和n3為指數權重參數。
基于式(32)的評價指標對式(30)的非線性系統進行終值時間不定的啟發式學習優化設計。訓練過程如圖4,首先以隨機初值輸入給定u(kT)。依次對每個輸入點進行上探索和下探索,探索步長Δu。對比上探索,下探索和原始狀態的評價函數,如果評價函數優化則更新最優的輸入序列u*。重復探索的過程,直至u*不變。接著縮小探索步長Δu,重復探索過程直到評價指標收斂速度足夠小,即認為對最優解進行了足夠精度的逼近。

圖4 啟發式學習流程圖
依據實物測量值,將各參數以及燃氣驅動力試驗實測數據代入系統狀態方程(30),建立實物折疊舵控制迭代模型。令式(32)的評價函數各分量參數為:k1=100s-1,k2=0.01(N·m)-1,k3=0.002J-1,n1=n2=n3=1。根據圖4的啟發式學習流程對樣本進行仿真迭代,直至參數穩定,獲得逼近最優解迭代結果。
圖5為經過訓練前后的輸入曲線對比,可見優化后的輸入曲線為一條復雜曲線。圖6為優化前后舵面展開角度曲線對比圖,優化前后舵偏角變化不大,保證了舵面展開快速性指標。圖9為彎矩曲線對比圖,圖中顯示經過優化后最大彎矩從89.87N·m降到了75.75N·m,沖擊后的動能從原來的397J降低至374J,沖擊后殘余動能為艙體沖擊的主要原因,因此舵面展開對艙體的沖擊減小了6%。

圖5 啟發式學習訓練前后輸入曲線

圖6 舵面展開曲線訓練前后對比圖

圖7 展開階段彎矩曲線訓練前后對比
結合圖5~7的分析, 0.008s前波動的輸入量控制了外舵展開速度不受影響的同時,盡可能在展開過程中耗散掉積累的能量。而在0.012s后的輸入反向,起到了抑制最后彎矩迅速增加的作用。
針對折疊舵展開沖擊大,過載高的情況,對展開過程中舵系統控制進行了優化,得出以下結論: 1)當外舵質心不在舵軸中心線上時,內外舵的展開具有強耦合的動力學特性;2)利用耦合特性,可以通過舵機伺服系統輸入對展開時間、彎矩、沖擊等因素進行優化控制; 3)利用啟發式學習法,對舵面展開進行迭代仿真,可以使舵面展開安全性能得到優化,仿真結果表明,經過優化的輸入可以使舵面在展開時間基本不變的條件下,舵軸的最大彎矩減小16%,碰撞后沖擊載荷減小6%。