楊超,張開富
1.西北工業大學 機電學院,西安 710072
2.中國航空工業集團公司北京長城航空測控技術研究所,北京 101111
飛機機身筒段是構建飛機氣動外形的重要組成部分,具有尺寸大、形狀復雜、容易變形等特點,筒段中的蒙皮和長桁等零件都屬于易變形薄壁零件。飛機制造過程中,前機身、中機身和后機身通常是在不同的地方分別制造,最后運輸到一起進行機身對接裝配。運輸過程中,柔性薄壁機身筒段會在重力的作用下發生形變,機身部件的制造誤差、定位誤差和溫度變化以及零件剛度弱等因素的存在導致實際機身部件與理論模型有較大差距,過大的初始誤差增大了機身裝配的難度。因此在筒段裝配對接前,需要形狀控制工裝對飛機筒段進行形狀調整[1]。目前機身筒段形狀控制工藝受工人經驗差異的影響,導致機身形狀因人而異、質量穩定性差、返修率高和控形耗時長,因此迫切需要設計出自動化可調工裝進行弱剛性大部件的形狀控制。為避免自動化可調工裝控形過程中局部應力過大造成筒段損壞,控形過程中需要時刻關注筒段圓桁表面實時應力數據和應力變化趨勢,常規的應用有限元計算應力的時間代價較大,不能滿足控形過程中的應力監測實時性要求。應用電阻應變片傳感器可以對飛機筒段圓桁表面應力進行精確地監測,但只能對之前的時刻進行監測,不能對未來數據趨勢進行分析預測,因此如何快速準確地預測控形過程中筒段圓桁表面的應力顯得尤為重要,預測的效率和精度進而決定了控形過程應力優化的效率和準確性。
薄壁機身筒段在裝配前受制造、運輸、重力等因素影響,筒段呈現出不規則形狀,導致筒段在控形過程中,筒段圓桁的應力變化具有非線性變化特點,使用傳統方法難以計算出筒段準確應力??紤]到機身薄壁筒段控形過程應力具有時序相關性,采用一種基于雙向長短期記憶神經網絡的深度學習模型進行機身薄壁筒段控形過程中的應力預測,并搭建機身筒段試驗臺驗證應力預測方法的有效性。LSTM神經網絡是一種改進的循環神經網絡,由于LSTM神經網絡的激活函數是sigmoid函數與tanh函數相結合,所以避免了競爭模型循環神經網絡(Recurrent Neural Network, RNN)反向傳播求導時會出現梯度消失和梯度爆炸的情況,大大加快了模型收斂速度。
國內外學者在應力預測和LSTM神經網絡方面做了一些研究。唐成順[2]、袁泓磊[3]、Gulgec[4]等基于LSTM神經網絡分別建立了汽輪機轉子表面應力預測模型,甘蔗轉運車關節點應力預測模型,鋼制結構的振動、應力預測模型,并通過多次實驗驗證,驗證了應力預測模型的高效性和穩定性。Huang等[5]基于LSTM神經網絡模型預測油井性能,與傳統儲層數值模型相比,LSTM神經網絡模型在計算速度和精度方面有明顯的優勢。Ma等[6]提出一種基于LSTM神經網絡和混合優化算法的自適應修改方法,用于補償渦輪風扇發動機在健康狀態下的實驗數據和非線性分量級模型之間的初始誤差。Hajiaghayi和Vahedi[7]使用LSTM神經網絡模型進行代碼故障預測和模式提取,并利用貝葉斯優化算法優化網絡模型超參數,實驗表明,該方法優于決策樹和隨機森林等經典學習模型。標準LSTM神經網絡在學習長序列信息時,記憶細胞長度通常不能滿足需求,會出現梯度消失問題,BiLSTM神經網絡很好的解決了這個問題,國內外學者將BiLSTM神經網絡應用在多個領域。Zhang[8]基于BiLSTM神經網絡建立了航空發動機轉子多故障特征參數預測參數模型;Pan等[9]基于BiLSTM神經網絡檢測衛星遙測異常數據;車暢暢等[10]通過BiLSTM神經網絡預測性能退化趨勢;Bian等[11]基于BiLSTM神經網絡捕獲前向和反向電池時間信息。通過上述學者在BiLSTM神經網絡領域的研究實驗結果可以看出,基于BiLSTM神經網絡的預測模型在長序列信息記憶能力上有顯著提升。一些學者為了增強LSTM神經網絡的學習能力和預測能力,提出改進型LSTM神經網絡,并應用在各個領域。Liu等[12]采用LSTM-RNN模型預測燃料電池的剩余壽命;Que等[13]提出一種改進自編碼長短期記憶 (Auto-Encoder-Long Short-Term Memory Neural Networks, AE-LSTM) 神經網絡,用來預測飛機飛行過程中的異常數據;Li等[14]提出了卷積神經網絡和長短期記憶 (Convolutional Neural Network-Long Short-Term Memory,CNN-LSTM) 神經網絡混合網絡應力預測模型,預測橡膠拉伸變形過程中應激數據;Sun等[15]提出基于長短時記憶神經網絡和高斯過程回歸(Long Short-Term Memory Neural Networks-Gaussian Process Regression, LSTM-GPR)混合模型,可在不降低LSTM神經網絡模型預測精度的情況下,準確預測船舶運動姿態。Yao等[16]提出一種基于深度學習的模糊粗糙集和長短期記憶 (Fuzzy Rough Set-Long Short-Term Memory, FRS-LSTM) 神經網絡模型,采用模糊粗糙理論進行短期風速預測,實驗表明,預測精度高于傳統神經網絡。Du等[17]建立基于RNN和LSTM神經網絡的車輛速度預測模型,經實驗結果表明,在預測數據較長的情況下,LSTM神經網絡預測誤差更小,具有更好的性能。Ma等[18]使用縱向BiLSTM神經網絡建立刀具磨損預測模型,根據刀具切削力預測的磨損值誤差在8%以內。
對于本文需要計算的機身薄壁筒段應力,應用有限元計算的時間成本較高,應用傳統多層前饋神經網絡無法處理應力預測的時序序列問題,而RNN在處理時序序列問題時也因為序列數據過長而導致不易克服的梯度消失和梯度爆炸問題。因此為快速準確的計算和預測機身薄壁筒段應力,建立了基于BiLSTM神經網絡的機身筒段應力預測模型,并使用粒子群算法優化BiLSTM神經網絡超參數,提高預測模型訓練效率和選取更優的參數組合降低預測誤差。為驗證提出的解決方法的有效性,使用RNN和標準LSTM神經網絡進行對比試驗分析。
RNN和LSTM神經網絡都是依據之前時刻的時序信息來預測下一時刻的信息,不能結合未來時刻的信息,但是在一些問題中,當前時刻的信息輸出不僅與之前的狀態有關,還與未來的狀態有關,此時就需要將之前的時序信息和未來的時序信息都輸入到神經網絡中,本文提出雙向長短期記憶神經網絡用于飛機薄壁圓筒控形過程中更精準的應力預測。Cui[19]和Siami-Namini[20]等對LSTM神經網絡和BiLSTM神經網絡進行過詳細的比較,結果表明BiLSTM神經網絡在相應的時間系列任務中優于LSTM神經網絡。
BiLSTM神經網絡與標準LSTM神經網絡結構相同,BiLSTM神經網絡也是由基本的細胞狀態、輸入門、遺忘門和輸出門組成,BiLSTM神經網絡的基本原理是由一個向前的標準LSTM神經網絡和一個向后的標準LSTM神經網絡組成,標準LSTM神經網絡基本結構如圖1所示。
圖1 標準LSTM神經網絡結構Fig.1 Standard LSTM neural network structure
BiLSTM神經網絡結構由雙向循環神經網絡和標準LSTM神經網絡組成,BiLSTM神經網絡包含2個訓練方向的LSTM神經網絡,每層的網絡節點都包含完整的過去信息與未來信息,2個訓練方向最后都與輸出層相連。BiLSTM神經網絡結構如圖2所示。
圖2 BiLSTM神經網絡結構Fig.2 BiLSTM neural network structure
粒子群優化(Particle Swarm Optimization,PSO)算法是一種基于動物種群覓食的隨機優化技術,受鳥群和魚群覓食過程中的生物行為和群集行為的啟發,Kennedy和Eberhart[21]于1995年提出粒子群算法。將覓食中的每只鳥都看作空間中搜索的粒子,有自己的速度和位置特征。粒子在空間中的運動會結合自身判斷和群體共享信息,分別稱為局部搜索和全局搜索,粒子會結合全局搜索最佳位置和局部搜索最佳位置決定運動方式并指向目的地,并且會更新局部搜索最佳位置然后將其保存下來,最終實現從局部最優到全局最優的搜索過程。
BiLSTM神經網絡模型訓練過程中需要調節很多超參數,只有輸入和輸出參數可以直接確定,輸入是一個應力檢測點的歷史檢測數據,因此BiLSTM神經網絡模型的輸入層單元個數與輸入數據維度都是相同的,輸出維度與全連接層單元個數相同。其他參數包括隱藏層神經元數量、學習率、訓練迭代次數和滑窗大小都對機身筒段應力預測非常重要,但是無法直接計算出。若通過正交試驗法獲得最優組合超參數,將耗費大量的資源和時間,并且不能確保得到的超參數組合是最優解。因此本文使用粒子群算法優化雙向長短期記憶神經網絡超參數,提出基于PSO-BiLSTM神經網絡的機身筒段應力預測模型。
Greff等[22]的實驗表明對LSTM神經網絡模型影響最大的超參數是學習率,其次是最大迭代次數和隱藏層神經元數量,網絡深度對LSTM神經網絡模型的準確度影響最小,因此本文采用單層BiLSTM神經網絡模型。將學習率lr、最大時代ep、隱藏層神經元數量lb、輟學率dp這4個主要超參數和滑動窗口大小、培訓批次大小、學習率下降因子這3個次要超參數作為PSO算法的對象,基于PSO-BiLSTM神經網絡的機身筒段應力預測模型流程圖如圖3所示。具體步驟為
圖3 基于PSO-BiLSTM神經網絡的機身筒段應力預測模型流程圖Fig.3 Flow chart of stress prediction model of fuselage tube section based on PSO-BiLSTM neural network
步驟 1采集機身筒段控形過程中應力數據,構建應力預測數據集。
步驟 2對應力數據進行歸一化處理,采用離差標準化方法對應力數據進行線性變換,映射到[0,1]范圍內,提高應力預測精度和加快模型梯度下降求最優解的速度。
步驟 3將歸一化后的數據分為訓練集Train_x、Train_y和測試集Test_x、Test_y,再分別劃分為輸入數據和數據標簽。
步驟 4初始化粒子群,并以各粒子對應參數構建BiLSTM神經網絡模型,通過訓練數據進行模型訓練,將預測結果的均方根誤差(Root Mean Square Error, RMSE)作為各粒子的適應度值。
步驟 5將適應度值作為終止條件,若滿足終止條件,返回最優超參數取值,否則,返回步驟 4。
步驟 6粒子群優化算法根據BiLSTM神經網絡模型適應度更新粒子并確定粒子全局最優位置,構建PSO-BiLSTM神經網絡應力預測模型。
步驟 7將測試集輸入數據放入訓練好的預測模型中,將輸出數據與測試集測試結果Test_out進行比較,根據均方根誤差計算應力預測模型誤差。
為了客觀評價預測結果的準確性和有效性,選用RMSE、平均絕對誤差(Mean Absolute Error, MAE)和決定系數R2評估不同應力預測模型的準確性,其表達式分別為
式中:yi為應力真實值為應力預測值為應力真實值的平均值;m為應力預測次數。
應力預測模型基于python,實驗使用的計算機環境為:windows10,E-2286M處理器,12 G內存,Tesla T4顯卡(12 G顯存),tensrflow2.0。
為了測試預測模型的可行性和有效性,使用飛機機身筒段進行控形應力預測實驗。以某型號客機為原型,制造1∶4縮比模型,模型包括機身筒段主體和形狀控制工裝,如圖4和圖5所示。
圖4 某型客機機身筒段主體1∶4縮比模型Fig.4 A 1∶4 scaled model of main body of fuselage tube section for a certain type of passenger aircraft
圖5 形狀控制工裝Fig.5 Tooling for shape control
機身筒段由桁架和蒙皮組成,因為蒙皮厚度僅0.5 mm,所以蒙皮和圓桁受重力影響會發生一定的形變,筒段還會受到制造誤差和運輸振動的影響,導致機身筒段在裝配前可能出現不規則的變形,例如局部塌陷或左右不對稱。
為了克服筒段出現的不規則變形,在筒段對接一側安裝形狀控制工裝調節筒段形狀,如圖5所示,形狀控制工裝由框架和6個支撐模塊組成,支撐模塊對稱安裝在框架上,可徑向支撐圓桁達到控制筒段形狀的目的。圓桁上貼有6個電阻應變片,如圖藍色圓圈位置,用來監測控形過程中筒段應力變化,筒段中心設有可旋轉的位移檢測傳感器。旋轉1周采集12個預設標記點位置,通過擬合計算出筒段變形位置及變形量。
在室內溫度27 ℃的條件下,進行機身筒段形狀控制應力采集實驗,以0.5 mm/s的速度驅動步進電機移動,控制機身筒段形狀,以0.1 s為采樣間隔,采集電阻應變片數據和機身筒段形狀變化量。為了增強PSO-BiLSTM神經網絡應力預測模型的魯棒性,采集不同初始狀態下筒段控形的應力數據,對重力狀態下靜置的機身筒段進行人工干預,改變機身筒段形狀,模擬機身筒段受不可控因素出現不規則形狀的情況,然后采集不同變形情況下機身筒段形狀控制的應變變化數據。針對筒段上6個應力監測點,對其進行應變采集實驗,通過在筒段長桁上添加重物的形式對機身筒段做出8次形狀改變,以模擬機身筒段在重力和運輸振動影響下的不規則變形。然后分別采集8組應變變化數據,將其中7組作為訓練數據,1組作為測試數據進行應變預測實驗。圖6所示為6個應變監測點在8次形狀調整實驗中的應變監測數據。
圖6 機身筒段監測點應變監測數據Fig.6 Strain monitoring data at monitoring point of fuselage tube section
上述實驗數據中,出現應力下降和跌宕起伏的原因是機身筒段控形過程中,6個支撐點一起運動,且支撐速度和支撐距離并非線性的,1個監測點的應力可能受其他5個支撐點變化的影響。應用6個應力監測點數據集分別訓練6個應力預測模型,因為6個應力監測點應變變化相似,所以本文選擇應變變化較為復雜的監測點2和監測點4,用于展示模型訓練過程和預測準確度。監測點2和監測點4分別有3 200和3 400個歷史數據作為訓練數據,為了實現連續預測和克服樣本數據少而帶來的深度學習模型訓練不準確問題,采用滑動窗口處理方法處理樣本訓練數據,通過滑動窗口方法不但可以重復利用樣本訓練數據,提高控形過程中應力相鄰元素的相關性,還可以增加應力預測模型訓練的樣本數量,在應力預測過程中具有更強的魯棒性。因此,飛機機身應力預測問題變成一個回歸問題?;瑒哟翱谔幚矸椒〞颖緮祿貥嫗锽iLSTM神經網絡模型需要的三維輸入格式,更加適應時間序列模型的輸入。
以數據集中前7組數據作為訓練數據,最后1組數據作為測試數據,分別對4種應力預測模型進行訓練和測試。RNN、標準LSTM神經網絡和BiLSTM神經網絡在模型訓練過程中均需要手動調節模型超參數,確定最佳參數的方法是在保持其他參數不變的情況下,僅調整相關參數以獲得最佳預測性能。而PSO-BiLSTM神經網絡可以利用粒子群優化算法自動優化模型超參數,需要調節的超參數包括:學習率(0.001~0.1)、隱藏層神經元數量(30~200)、最大時代(50~500)、輟學率(0.2~0.5)、優化器(Adam)和學習率下降因子(0~0.6)。優化后的4個應力預測模型最佳超參數見表1和表2。
表1 4種應力預測模型超參數(監測點2)Table 1 Four kinds of stress prediction model hyperparameters at monitoring point 2
表2 4種應力預測模型超參數(監測點4)Table 2 Four kinds of stress prediction model hyperparameters at monitoring point 4
為了研究PSO-BiLSTM神經網絡模型在模型訓練階段的高效率和穩定性,將BiLSTM神經網絡模型和PSO-BiLSTM神經網絡模型訓練時的損失函數曲線進行分析對比,圖7和圖8分別為BiLSTM神經網絡模型和PSO-BiLSTM神經網絡模型訓練過程中的RMSE誤差收斂曲線。
圖7 監測點2模型訓練RMSE誤差收斂曲線Fig.7 Model training RMSE error convergence curve at monitoring point 2
圖8 監測點4模型訓練RMSE誤差收斂曲線Fig.8 Model training RMSE error convergence curve at monitoring point 4
由以上2個監測點的模型訓練誤差收斂時間可以看出,BiLSTM訓練50個時代后基本穩定,在120個時代后訓練停止,而PSO-BiLSTM只需要20個時代就基本達到穩定值,在80個時代后訓練停止,加入粒子群優化算法后訓練效率提升了50%,且在PSO-BiLSTM神經網絡中加入了提前退出迭代的算法,通過設置適應度函數變化容忍度,每次迭代完成后計算與上一次迭代的適應度函數之差,連續8次達到閾值即退出迭代,極大的節省了超參數調優工作量。并且PSOBiLSTM神經網絡模型的RMSE誤差比BiLSTM神經網絡模型的RMSE誤差更小,在監測點1的訓練過程中RMSE誤差達到0.0032,這表明粒子群優化算法可以在模型訓練迭代過程中獲得更優的參數來優化BiLSTM模型。結果表明,PSO-BiLSTM神經網絡模型的訓練效率更高且超參數調優能力更好。
為了驗證4種應力預測模型的實際預測效果,分別測試數據集第8組數據,PSO-BiLSTM神經網絡模型的超參數完全由粒子群優化算法得出最優解,其他3個模型的超參數為表1中最優組合解。應變預測性能分析如圖9和圖10所示。
圖9 監測點2應變預測性能分析Fig.9 Strain prediction performance analysis at monitoring point 2
圖10 監測點4應變預測性能分析Fig.10 Strain prediction performance analysis at monitoring point 4
在以上2個監測點的應力預測實驗中,4個應力預測模型均可以實現對應力變化趨勢的基本預測。應力預測性能比較:PSO-BiLSTM>BiLSTM>LSTM>RNN。RNN模型預測的數據曲線與真實曲線有較大偏差,在應力數據變化大的部分不能準確預測,例如監測點1中300~350 s的預測偏差達到了18,這是因為RNN模型沒有長期記憶細胞,當新的隱藏層數據輸入就會覆蓋原有數據信息,造成梯度爆炸損失預測,在長序列數據預測方面具有不可彌補的缺陷。標準LSTM神經網絡在RNN的基礎上增加了1路輸入和1路輸出,通過新增的長期記憶細胞可以保留更多的序列數據,預測準確度相比RNN模型有較大提升,但是標準LSTM神經網絡模型在面對應力變化較大的預測問題時,仍然存在明顯的預測結果滯后問題,這是因為序列式數據存在自相關性。標準LSTM神經網絡模型需要以序列式數據作為輸入,滑動窗口的應用讓輸入數據中當前時刻的值與其自身上一時刻的值具有一階自相關性,此缺陷不可避免,且滯后性導致的誤差會隨著時間的推移越來越大。多數情況下,BiLSTM神經網絡模型的預測結果與真實結果偏差較小,在正向預測和反向預測的疊加處理后,梯度消失問題和預測滯后問題都得到解決。在應力預測的前半部分,BiLSTM神經網絡模型和PSO-BiLSTM神經網絡模型的預測準確度都很高,與真實曲線基本擬合,隨著時間的推移,BiLSTM神經網絡模型的預測準確度略低于PSO-BiLSTM神經網絡模型,這是因為人為調節BiLSTM神經網絡模型超參數不能使模型發揮出最佳性能,經過粒子群優化算法調優的PSO-BiLSTM神經網絡模型不僅訓練速度快,在預測穩定性方面也有明顯提高。
為進一步驗證PSO-BiLSTM神經網絡模型的預測性能,表3和表4給出了4種預測模型在2個應力監測點的評價指標計算結果。PSOBiLSTM神經網絡模型的RMSE、MAE都低于其他預測模型,在決定系數R2評價標準中,該模型計算結果比其他預測模型更接近1,表明其預測性能優于其他模型。監測點2的評價指標計算結果中,PSO-BiLSTM神經網絡模型的RMSE比RNN模型低66%,比LSTM神經網絡模型低56.6%,比BiLSTM神經網絡模型低20%,其模型預測精度顯著提高,在PSO-BiLSTM神經網絡模型與BiLSTM神經網絡模型具有相同單元結構的情況下,PSO-BiLSTM神經網絡模型依靠粒子群優化算法優秀的超參數尋優能力顯著提高了預測精度。
表3 4種模型評價指標比較(監測點2)Table 3 Comparison of evaluation indicators of four kinds of model at monitoring point 2
表4 4種模型評價指標比較(監測點4)Table 4 Comparison of evaluation indicators of four kinds of model at monitoring point 4
1)使用滑動窗口提取應力數據相關信息,可以提高序列式數據相關性,使預測結果更加穩定。
2)應用RNN、LSTM神經網絡和BiLSTM神經網絡分別對數據集進行訓練和測試,實驗結果表明,BiLSTM神經網絡對于相關性強的長序列信息預測性能最好,可以較好地解決梯度消失問題和預測結果滯后問題。
3)將PSO算法與BiLSTM神經網絡相結合,使用PSO算法對BiLSTM神經網絡超參數進行迭代優化,解決了人為調參的不確定性并提高了工作效率,實驗結果表明,基于PSOBiLSTM神經網絡的應力預測模型可在飛機薄壁筒段控形過程中提供準確且快速的應力預測結果。