顧乃建,武文華,2,郭杏林
(1. 大連理工大學工業裝備與結構分析國家重點實驗室,大連 116024; 2. 大連理工大學寧波研究院,寧波 315000)
在航天領域,準確地確定衛星與火箭連接結構的動態界面力,可對衛星搭載儀器設備的安全評估、定量化設計提供重要的依據[1-2]。要測定發射過程中星-箭連接部位動態載荷,最直接的測量方法是在衛星與運載火箭之間安裝力傳感器。但是,該方法會增加星-箭結構的質量,削弱界面處的連接剛度,改變星-箭耦合結構的整體力學特性[3],因此星-箭連接結構處動態界面力的直接測量往往不可行,只能采用間接界面力反演方法。現行的星-箭連接界面力反演方法主要是仿真分析結合遙測加速度方式計算界面載荷[4-5],但由于仿真分析難以準確模擬運載火箭與衛星之間的復雜飛行環境,導致界面力反演精度誤差仍較大。
目前,典型動載荷反演分析技術主要分為頻域法和時域法。頻域法是基于離散物理空間或者模態空間內的結構動力學方程,在頻域內根據系統的頻率響應函數與響應譜之間的關系來識別動態載荷的方法[6-9]。頻域法要求測量數據的樣本具有一定的長度,故通常適用于穩態或者平穩隨機動載荷識別,對瞬態沖擊或者非平穩隨機動載荷的識別有較大局限性。
與頻域法相比,時域法可直接考慮外部激勵與結構動力響應之間的關系,反演結果更為直觀,能更準確地識別各種類型的載荷[10-11]。經典時域法是基于杜哈梅積分在模態空間內構建響應與載荷之間的關系進行動態載荷反演。然而,時頻域法的穩定性主要受病態傳遞函數矩陣和測量噪聲的影響,帶來不適定問題。需要采用正則化方法解決不適定問題,常用的正則化方法有Tikhonov正則化方法[12]、奇異值分解方法[13]和截斷奇異值分解方法[14]等。Jacquelin等[15]對比了廣義奇異值分解方法、Tikhonov正則化方法和截斷奇異值分解方法,發現上述方法都有較快的收斂速度,但也存在著難以找到合適正則化參數的問題。另一方面,頻域法和時域法普遍使用的傳遞函數和卷積積分,一旦響應與載荷存在強非線性行為,系統界面力反演方法難以適用。目前,衛星等航天結構多采用性能優異的復合材料,衛星和運載火箭之間的特殊連接方式等都帶來了測點和界面力間的非線性動力學關系。因此,研究新的界面力反演分析技術十分重要。
近年來,人工神經網絡(Artificial neural network, ANN)逐漸發展,成為了解決非線性結構動載荷識別有效方法之一[16],尤其是在載荷反演中的應用潛力被廣泛關注[17]。通過數據訓練確定了神經網絡中的權重信息,可用于載荷等關鍵信息的在線實時反演[18]。現有研究中主要使用的ANN結構是多層感知機(Multilayer perceptron, MLP)[17]。MLP輸入數據是二維的(數據規模和特征),但實際動態載荷反演分析的模型輸入通常包括數據尺度、特征和時間的三維輸入數據,這使得ANN在非線性結構載荷反演問題中存在一定的局限性,往往無法取得高精度的反演結果[19]。針對ANN在非線性連接結構動載荷反演問題中的困境,基于深層神經網絡的深度學習模型用于動載荷反演得到了關注和重視[20]。其中,長短時記憶(Long short-term memory, LSTM)神經網絡為循環神經網絡(Recurrent neural network, RNN)體系結構之一,對時間序列有較強的處理能力[21-22]。LSTM通過增加隱藏層中單元之間的連接,輸入到隱藏層的數據不僅包括原始數據,還包括先前隱藏層單元的狀態。LSTM神經網絡可以存儲或遺忘輸入信息和隱藏單元沿時間方向的狀態,通過有監督的訓練構建輸入與輸出之間非線性的數據驅動模型,為星-箭連接界面載荷等時域響應反演提供較高應用潛力。
本文針對衛星發射過程中星-箭連接處動態界面力的準確快速反演問題,開展了以衛星上典型位置加速度數據為輸入,連接部位的動態界面力為輸出,發展并建立了基于LSTM神經網絡的星-箭連接部位界面力深度學習反演模型,取得了高精度的動態界面力反演結果。進而設計了某典型衛星結構的正弦掃頻和隨機振動實驗系統,測試了本文所建立LSTM界面力反演方法和模型的可行性。
如圖1所示,星-箭連接結構常布設于衛星主體結構下部,是連接衛星主體結構與運載火箭的接口。星-箭連接結構動力學性能的優劣直接影響衛星及星上高精度附件的性能,甚至關系到發射任務的成敗。基于衛星主體結構測點加速度響應反演界面載荷變化十分重要。

圖1 典型衛星及連接結構Fig.1 A typical satellite and its connection structure
典型衛星主體結構由蜂窩夾層板采用螺栓連接構成。蜂窩板和螺栓連接會造成結構在振動過程中產生非線性動力學特性[23-25],為衛星主體結構上的測點響應與連接界面力的動力學關系帶來復雜性。

(1)
式中:h(t-τ)為單元脈沖響應;f(τ)為τ時刻動態載荷的幅值;y(t)表示結構上測點處的響應。
由于衛星主體蜂窩結構和螺栓連接帶來的響應和載荷的非線性動力學關系。因此,利用上述的微分方程求解星-箭連接界面力的精度將難以控制。但從理論上仍可認為存在一個方程Φi,j可以描述測點的響應和連接界面力之間的非線性關系。
yj(t)=Φi,jfi(t),i,j=1,2,…,N
(2)
式中:Φi,j描述了作用在結構上i點的載荷fi(t)與結構上j點的動態響應yj(t)之間的非線性關系,其中在j點的動態響應yj(t)(如加速度)為易于結構直接測量量;N表示結構自由度。假設存在Φi,j的反函數ψi,j適用于下列情況:
(3)
式中:ψi,j表示衛星結構的j點響應與連接結構i點界面力的計算模型;ε為反演載荷與真實數據的允許誤差。如果能夠構建出描述測點響應與連接界面力之間的模型ψi,j,則可通過實測動態響應yj(t)作為輸入求解在i點處的界面力。因此,星-箭連接動態界面力反演的關鍵問題即是準確地構建出界面力反演模型ψi,j。但是,在實際分析過程中,從非線性結構的物理模型中直接推導出反函數ψi,j的表達式是非常困難的。長短時記憶(LSTM)神經網絡的提出為建立測點響應和界面力載荷之間的時間相關性提供了新思路。利用LSTM神經網絡替代界面力反演模型ψi,j,通過大規模監督訓練后神經網絡模型構建求解星-箭連接界面力反演模型。
LSTM神經網絡屬于循環神經網絡(RNN)體系結構,包括新輸入xt、輸出ht、輸入門it、忘記門ft和輸出門ot。其中引入輸入門、忘記門和輸出門的目的是為了控制每一步輸出的值,防止訓練過程中出現梯度消失或爆炸的問題。通過考慮先前信息和當前信息的時間相關性,解決了RNN在訓練過程中梯度消失或梯度爆炸的問題[26],典型的LSTM網絡循環體結構如圖2所示。

圖2 LSTM單元Fig.2 An LSTM unit
在星-箭界面力LSTM反演模型建立過程中,測點加速度響應X={x1,x2,…,xt,…,xT}為LSTM神經網絡的輸入,其中xt∈Rk表示第t個時間步實測響應的k維向量,k為測點個數,T為總時間步數。ht為LSTM輸出的測點響應與界面力之間非線性關系的時間序列,既是第t個時間步LSTM當前單元輸出向量,也是第t+1個時間步的輸入,ht∈Rm,m為LSTM隱藏層神經元數量。新輸入和每個門都會將前一次的輸出ht-1作為本次輸入的一部分,因此,輸入門it、忘記門ft和輸出門ot的輸入都是由[ht-1,xt]二元組構成。LSTM單元的正向傳播可以由式(4)~(9)表示:
ft=σ(Wf[ht-1,xt]+bf)
(4)
it=σ(Wi[ht-1,xt]+bi)
(5)
ot=σ(Wo[ht-1,xt]+bo)
(6)
(7)
(8)
ht=ot*tanhCt
(9)



圖3 單層LSTM順序體系結構Fig.3 Single-layer LSTM sequential architecture
圖4給出了基于LSTM神經網絡構建連接部位界面力反演模型的計算過程框架。該框架包括實驗數據采集、數據處理、模型訓練和模型性能評估等。具體計算步驟如下:
1) 實驗數據采集。建立實驗測試系統,通過振動臺施加動態激勵,獲得測點加速度響應X={x1,x2,…,xk}和連接部位界面力的時程數據y={y1,y2,…,yn}T。其中X∈Rn×k,y∈Rn×1,n為輸入數據樣本點個數。

(10)

3) LSTM神經網絡模型超參數設置。將實驗獲取的數據劃分為訓練集、驗證集。基于LSTM神經網絡建立星-箭連接界面力反演模型,以最小化單元輸出和實測界面力之間的差異為目標進行監督訓練。本文訓練過程中選擇調整的超參數包括:批次大小、初始學習率、最大時期數和隱藏層神經元數量。其中每層隱藏層神經元數量在50到250之間進行嘗試,批次大小調整范圍是1到256,初始學習率調整范圍是0.002到0.032,最大訓練迭代次數在500~1000范圍內進行調整。同時,訓練過程中引入正則化技術降低測量噪聲、測量儀器的局限性以及數字采樣相關的量化誤差等引起訓練過程中不穩定的問題,避免模型在訓練中的過擬合現象,提高對未知數據集的泛化能力[26-28]。
4) 界面力反演模型性能評估。將驗證數據集中的測點加速度響應輸入到構建的界面力反演模型中,計算得到星-箭連接部位的動態界面力時程。引入均方根誤差和相關性系數ρ用于定量評估界面力反演模型的性能。
(11)
(12)


圖4 星-箭連接界面力反演框架Fig.4 Framework of satellite-rocket interface force inversion method
利用振動臺建立了星-箭連接結構界面力實驗測試系統,實現火箭發射過程中連接部位的動態載荷輸入。為了避免實驗加裝傳感器過程對于結構的影響,在星-箭連接區域設計特制的高強度工裝,在連接傳感器后其結構強度和固有頻率遠大于衛星的相關動力學屬性,從而避免了傳感器存在對于界面力測量精度的影響,確保界面作用力與沒加裝傳感器的受力狀態基本一致。衛星實驗結構、力傳感器及與振動臺的連接方式如圖5所示。主體實驗結構為某衛星的1∶2縮比模型,其主體材料為鋁合金蜂窩板,星-箭連接結構為鋁合金材質。利用螺栓和環狀夾具將實驗結構與振動臺連接。下夾具使用8個M10螺栓與振動臺連接,上夾具采用9個M5螺栓與衛星進行連接。兩個夾具之間用3個三分力傳感器連接,用于測量振動過程中界面力載荷數據。力傳感器靈敏度為2 mV/N,量程為0~1000 N。
在衛星結構外壁板表面安裝6個加速度傳感器,工作頻率為20~9000 Hz,各加速度傳感器靈敏度參數見表1。利用振動臺分別施加橫向和豎向的掃頻和隨機振動激勵。其中掃頻實驗下限頻率為20 Hz,上限頻率為100 Hz,激勵大小為2g,g為重力加速度。隨機振動設置的功率譜密度見表2。

圖5 隨機振動實驗測試系統Fig.5 Random vibration experimental system

表1 加速度傳感器靈敏度系數Table 1 Sensitivity coefficients of accelerometers

表2 隨機振動功率譜密度Table 2 Power spectral density of random vibration
為了保障本文模型在實際衛星結構應用的可行性,在實驗過程中加速度傳感器安裝在衛星主體結構外壁板上。本次實驗采用單向加速度傳感器,傳感器的安裝方向與結構的振動方向一致。因此,橫向振動時,傳感器安裝在主體結構的側面;豎向振動時,加速度傳感器安裝在主體結構的上下表面。實驗過程中采樣頻率為5000 Hz,采樣時長為10 s。圖6和圖7分別展示了橫向隨機振動過程中1號力傳感器和各測點加速度傳感器采集的響應時程圖。

圖6 橫向隨機振動動態界面力時程數據Fig.6 Time series data of dynamic interface force of transverse random vibration

圖7 橫向隨機振動測點加速度響應時程數據Fig.7 Time series data of acceleration response of transverse random vibration measuring points
表3給出了1號力傳感器豎向界面力與各測點加速度響應的相關性分析結果。可以看出,界面力實測時程數據與測點加速度響應數據間的相關性系數均低于0.2,表明圖6~7中數據的線性相關性極低。

表3 界面力與各測點加速度的相關系數Table 3 Correlation coefficients between interface force and accelerations at each measurement points
本文選擇1號力傳感器的Z方向動態界面力與測點加速度響應建立反演關系模型。利用相同的方法可以構建其他位置的界面力與測點加速度響應的反演模型。界面力反演模型的數據樣本總量為50000,包括80%訓練數據和20%的驗證數據。模型輸入為6個加速度實測響應,輸出為1號力傳感器Z方向動態界面力。通過多次調整神經網絡模型結構和超參數,基于定量評估模型精度的結果,最終確定界面力反演模型的參數設置如下:3個LSTM隱藏層,其隱藏層神經元數量分別為200、100和100。選擇均方誤差作為損失函數,優化器選擇常用的Adam[29],當訓練過程中誤差不再下降時停止訓練,訓練最大輪數為600。初始學習率為0.016,最小批量大小為128。丟棄層設置在第2個LSTM隱藏層之后,其系數設置為0.2,模型中L2正則化系數為0.0001。圖8給出了界面力反演模型的訓練過程。可以看出,模型在訓練過程中代價函數和損失函數均快速收斂,說明該模型的參數設置較為合理。

圖8 模型訓練過程Fig.8 Training process of model
本文將基于LSTM神經網絡構建的界面力反演模型極限學習機(Extreme learning machine, ELM)和高斯過程回歸(Gaussian process regression, GPR)反演模型進行了對比。對于ELM模型的參數設置,本文采用單層前饋網絡,其隱藏層神經元數量設置為200。GPR模型的均值函數設置為常數,協方差函數選用二次有理函數核(Rational Quadratic kernel, RQ kernel)。圖9展示了使用不同反演模型識別的實驗結構在橫向正弦掃頻振動過程中連接部位的界面力時程圖。相比于ELM和GPR模型,基于LSTM神經網絡構建的界面力反演模型能更好地識別結構振動過程中的界面力時程。

圖9 不同模型的動態界面力反演結果Fig.9 Dynamic interface force inversion results of different models
表4給出了不同模型識別的界面力與實測數據的均方根誤差和相關性系數。基于ELM和GPR模型的界面力反演結果的均方根誤差分別是37.48和14.10,相關性系數分別為0.964和0.995。而本文提出的基于LSTM神經網絡的界面力反演模型識別的界面力反演結果均方根誤差和相關系數分別為8.01和0.998,兩項衡量指標均優于上述基于常規神經網絡和回歸模型的載荷反演方法。由于考慮了測點加速度響應與界面力之間的時間相關性,LSTM神經網絡可以更為準確地構建出二者之間的動力學非線性關系。

表4 LSTM與其它典型模型動界面力反演精度對比Table 4 Comparison of inversion accuracy on dynamic interface force between LSTM and traditional models
圖10給出了實驗結構橫向和豎向隨機振動過程中星-箭連接處界面力實測和反演的時程曲線。可以看出,基于LSTM神經網絡構建的界面力反演模型能夠準確識別實驗結構隨機振動過程中連接部位的界面力時程,在頻域和時域上均有較高的一致性。橫向和豎向隨機振動的界面力反演結果的均方根誤差R分別為3.977和1.319,相關性系數ρ分別為0.997和0.962(見表5)。此外,本文嘗試了使用ELM和GPR模型識別實驗結構在隨機振動過程中連接部位的界面力時程。實踐結果表明,基于傳統模型訓練過程難以收斂或訓練的界面力反演模型精度太大難以滿足實際應用。

圖10 隨機振動界面力反演結果Fig.10 Inversion results of random vibration interface force
本節進一步討論了隱藏層數量、初始學習率和隱藏層神經元數量對基于LSTM神經網絡的界面力反演模型泛化性能的影響。
改變LSTM隱藏層數量,對比分析了單層LSTM(A1)、2層LSTM(A2)、3層LSTM(A3)和4層LSTM(A4)對界面力反演模型泛化性能的影響,不同隱藏層數量的界面力反演模型識別結果與實測數據的均方根誤差R和相關性系數ρ見表6。結果對比可以發現,使用3層LSTM(A3)神經網絡訓練得到的界面力反演模型的泛化性能最好。除此之外,界面力反演模型的泛化性能并沒有隨著LSTM層數的增加而變得越來越好(A1~A4),這是由于較少的隱藏層無法學習到測點響應與界面力之間的非線性關系,而過多的隱藏層會導致模型在訓練過程中的過擬合。

表6 隱藏層數對界面力反演泛化性能的影響Table 6 Influence of different hidden layers on generalization performance of interface force inversion
圖11給出了不同模型結構的界面力反演結果與實測數據的誤差箱線圖。可以看出,LSTM隱藏層數量對構建的界面力反演模型的精度影響較大,3個LSTM隱藏層訓練的反演模型得到的界面力誤差分布優于其他模型結構。

圖11 不同隱藏層的界面力反演誤差分布Fig.11 Error distributions of interface force with different hidden layers
討論了初始學習率和LSTM隱藏層神經元數量等超參數對界面力反演模型精度和性能的影響。初始學習率和各個隱藏層神經元數量均以倍數的方式取值。初始學習率調整的范圍為0.002~0.032,神經元數量調整的范圍為50~250。不同參數訓練的界面力反演模型的計算精度見表7。可以看出,初始學習率和隱藏層神經元數量與動態界面力反演模型的精度密切相關。神經元數量以及初始學習率的改變均會降低界面力反演模型的泛化性能(B1~B7)。當初始學習率為0.016,隱藏層神經元數量為200/100/100時,模型的泛化性能最好(B2, B4~B7),界面力實測與反演的均方根誤差為9.68,相關性系數為0.989。初始學習率和隱藏層神經元數量過大或過小均造成動態界面力反演模型泛化性能下降。

表7 不同超參數對界面力反演模型泛化性能的影響Table 7 Influence of different hyperparameters on generalization performance of interface force inversion
圖12給出了不同超參數下,基于LSTM神經網絡構建的界面力反演模型識別的載荷數據誤差箱線圖。可以發現,不同超參數設置的界面力反演結果的誤差分布相差較大。選取合理的初始學習率和隱藏層神經元個數有助于提高界面力的反演精度。

圖12 不同超參數的模型界面力反演誤差分布Fig.12 Error distribution of interface force inversion for models with different hyperparameters
本文針對星-箭連接結構的動態界面力與衛星主體結構非線性程度高,且難以直接測量等難點,提出了一種基于LSTM神經網絡的動態界面力反演方法。通過監督訓練的方式直接從數據層面構建測點加速度響應和星-箭連接界面力之間的數據驅動模型,建立了基于LSTM神經網絡的界面力反演模型。進而設計并開展了衛星結構的正弦掃頻和隨機振動實驗,利用實驗數據驗證了所提出動載荷模型的預測精度。結果表明,相比于ELM和GPR模型,本文所提出的基于LSTM神經網絡星-箭連接結構界面力反演模型具有更高的計算精度。
進一步討論了LSTM界面力反演模型中隱藏層數量、初始學習率和隱藏層神經元個數對模型泛化性能和模型精度的影響。結果表明上述超參數均對界面力反演模型的精度有較大影響。研究超參數的優化設置是確保模型計算效率和計算精度的關鍵,是未來的研究方向之一。本文所發展的方法在將來可以進一步應用于衛星結構和運載工具的優化設計、減振隔振設計。