李 鵬, 丁 瀛, 黃培煒, 杜藝博
(華東交通大學機電與車輛工程學院,江西 南昌 330013)
航空發動機剩余壽命(remaining useful life,RUL)預測是航空發動機PΗM(prediction and health management)的核心技術,是連接飛機系統機載狀態監測、飛機設備故障診斷、地面運行規劃和維修保障的重要紐帶。
對于航空發動機PΗM系統中的設備退化建模和RUL預測,現有文獻大多集中在單個特征信號在單個運行條件下的分析。但隨著系統和設備結構的日趨復雜,再加上服役工況的惡劣多變,依賴單一類特征信號通常不足以準確描述設備的潛在退化機制,從而導致RUL預測結果的不準確。而另一方面,多個特征數據包含更為豐富的信息,采用多個特征監測數據用于發動機剩余壽命預測可以顯著提高發動機健康監測的效果[1]。但用于航空發動機PΗM系統的特征也并非越多越好,過量特征監測數據的處理將會導致算法的計算復雜性增加,并且冗余特征數據的引入將導致分析模型過擬合,反而降低模型的預測能力[2]。
因此,若對特征數據特征進行挑選,只挑選出于設備退化機制較相關的特征監測數據,利用這些合適特征監測數據進行融合并進行建模分析,將會提高RUL預測的精確度和魯棒性。
對于RUL預測中的特征數據的選擇問題,國內外學者也進行了大量的研究,Wang[3]等采用分析傳感器信噪比的方法對用于RUL預測的傳感器特征數據進行選擇,但只是考慮了單個特征信號噪聲的特點,未考慮到特征數據變化趨勢和不同類型特征數據間的相關性。Liu[4]等研究了集成數據融合方法以改進壽命預測的方法,并以模型擬合誤差、失效閾值方差為最小目標函數來確定融合系數。
王金杰[5]等將互信息作為特征貢獻度評價指標結合粒子群算法進行冗余特征剔除;Rao[6]等人采用梯度增強決策樹作為特征貢獻度評價方法,并利用人工蜂群算法進行特征優選。巫紅霞[7]等以Pearson相關系數對特征進行評估,再利用人工蟻群算法對評價后的特征子集進行特征優選。但以上方法都未直接建立不同特征選擇結果與發動機RUL預測效果的聯系,只評價了單一次特征選擇的預測結果,采用這樣的特征數據進行RUL預測時可能導致不合理的結果。并且隨著現代傳感器技術的發展,實際應用中采用越來越多的傳感器同時對一個設備進行狀態監測,從而出現了大量與設備的退化機理不相關或冗余的傳感器監測數據。
針對以上問題,研究提出了一種基于特征優選的航空發動機剩余壽命預測方法,首先,基于長短時記憶網絡建立監測數據預測模型,預測不同工況下發動機測試樣本的數據集。其次,基于特征融合與相似性匹配法,計算預測數據集剩余壽命值的均方根誤差,定義剩余壽命預測評價指標,并分別基于非劣分層遺傳算法(non-dominated sorting genetic algorithm II, NSGA-II)進行特征優選。最后,對基于特征優選的發動機剩余壽命預測效果進行驗證,以證明所提出方法的有效性。
研究以航空發動機為對象,基于NASA公布的航空渦輪發動機性能退化數據展開研究,研究中所采用的數據為C-PASS數據庫中的FD001數據集,包括訓練樣本集:100個不同工況下航空發動機的全壽命周期數據;測試樣本集:100個與訓練樣本集對應工況下的航空發動機部分退化數據;RUL真實值:包含測試樣本集100個不同工況下發動機的剩余壽命值,分別為測試樣本集中每個發動機最后時間周期的剩余壽命。上述訓練樣本集和測試樣本集中每組監測數據都包含了24個特征。
研究中以FD001數據集的前50個工況中的訓練樣本 T1-50和測試樣本 C1-50進行監測數據的預測和剩余壽命預測的特征優選,剩余50個工況中的訓練樣本 T51-100和測試樣本 C51-100用于特征優選結果的發動機剩余壽命預測效果驗證。
1)數據濾波。發動機的原始特征監測數據中伴隨著大量隨機噪聲,而且所有發動機存在一定的初始磨損。研究采用FIR數字濾波器對發動機的原始特征監測數據進行異常值和工作噪聲的去除。
2)數據去量綱。由于不同類型特征獲取的監測數據數量級和量綱都不同,因此采用歸一化的方法將數據濾波后的特征監測數據進行去量綱化,具體計算公式為:
式中: xi,j(t)——第i個工況中第j類特征在t時間周期時的原始特征監測數據;
min(xi,j)和——第j類特征在所有工
況下所有時間周期數據的最小值和最大值;
xi′,j(t)—— xi,j(t)經歸一化處理后的歸一化值。
對所有特征監測數據進行濾波和歸一化預處理,獲得處理后的訓練樣本集 xT1-50和測試樣本集 xC1-50。
為通過監測數據提取出航空發動機的性能退化內在趨勢,并以此預測未來一段時間內的性能退化趨勢,在設備故障失效前及時預警,需要通過預測模型獲取監測數據的時間序列預測結果,并充分利用時間序列信息進行RUL預測。常見的序列學習模型有遞歸神經網絡(recurrent neural network,RNN)、隱馬爾可夫模型(hidden Markov model,ΗMM)和前饋神經網絡等。其中,RNN網絡其內部循環結構允許信息從上一個網絡直接傳遞到下一個網絡,與序列型數據建模非常契合,在智能語音識別、圖像字幕、機器翻譯等領域得到廣泛應用。但由于梯度爆炸或梯度彌散現象的存在,導致RNN應用中“記憶能力”受限[8],通常只能學習到短時間步長的依賴關系。而LSTM網絡作為特殊的RNN網絡,通過引入了門限機制來控制信息的累積速度,使得其能夠學習長期的依賴信息[9],其結構如圖1所示。
圖1 LSTM網絡結構
一個LSTM網絡單位模塊主要包括長期狀態Ct和短期狀態ht,輸入門、遺忘門、輸出門門控機制來對進行信息調節[10]。通過遺忘舊信息,添加新信息和控制信息傳遞來實現LSTM網絡狀態更新,LSTM網絡計算t時刻輸入xt到輸出ht的實現公式為:
式中:σ——sigmoid函數;
i、f、O和C——輸入門、遺忘門、輸出門和單元狀態;
W——權值矩陣;
b——閾值矩陣;
tanh函數——激活函數;
LSTM監測數據預測模型結構圖如圖2所示。
圖2 LSTM單序列預測模型結構圖
LSTM監測數據預測模型利用特征全周期壽命監測數據中前mi個時間周期的監測數據值來預測第mi+1次時間周期時的特征監測數據y,故在訓練網絡模型時將第mi+1次時間周期點的xi的真實值y'作為模型的理想輸出。在完成所有LSTM監測數據預測模型訓練后,將對應的測試樣本集輸入網絡模型,進行測試樣本集后續l個時間周期的特征監測數據的預測。
特征優選的目標是獲取在特征數量盡可能少的情況保證對不同工況下的航空發動機的剩余壽命預測效果,研究據此設計雙目標優化函數f1和f2。
特征數量在本研究中指的是基于數據驅動進行航空發動機剩余壽命預測所采用的數據的特征總數量,有效地減少特征數量,不僅能選擇出包含信息量豐富、能有效反映航空發動機性能變化且冗余小的特征數據集,并且有利于提高RUL的數據處理速度,提升RUL預測的精準度和魯棒性。因此將特征數量設為優化目標函數I。
研究中特征的組合方式為二進制編碼,特征共24種,則特征的組合的向量可表示為S=[s1,s2,···,s24]T。向量中數字1的個數代表了選擇的特征數量。1代表選擇中該類特征數據,0代表不選擇該類特征數據。因此,優化目標函數I:特征數量fT1即為向量S中的非零元素個數:
在航空發動機剩余壽命預測過程中,對于相同的數據特征數量,基于不同的特征類型數據組成的特征數據進行的剩余壽命預測結果也大為不同。在某一組特征類型的組合中,如果其剩余壽命預測的預測結果與真實值越接近,即發動機所有工況下的預測剩余壽命與真實剩余壽命的誤差值越小,則剩余壽命預測的效果越好,將該誤差值定義為目標函數II。
2.2.1 基于特征融合的相似性匹配
研究采用一種基于特征融合的相似性匹配方法來確定預測數據集在對應工況下的發動機RUL預測結果,具體流程如圖3所示。
圖3 基于特征融合的相似性匹配流程
1)特征融合。為盡可能在特征融合過程中保留全周期壽命數據和預測數據集的退化特性,減少給后續的相似性匹配結果帶來的誤差,研究中采用最為簡單和有效的特征融合方法,即基于串聯的特征融合方法。對全周期壽命數據第t個時間周期起始、長度與預測數據集長度l相同的全周期壽命數據片段以及預測數據集進行串聯特征融合。
2)相似性匹配。采用Pearson相關系數來計算經過特征融合后的全周期壽命數據片段和預測數據集這兩個時間序列之間的相關程度,以此進行相似性匹配。Pearson相關系數的計算公式為:
其中,x和y在本研究中為待定的全周期壽命數據片段和預測數據集這兩個時間序列。
2.2.2 剩余壽命標定
在進行發動機RUL預測時,由于待測的測試樣本集,即待預測的系統性能狀態未知,在預測評估其RUL并生成其壽命標簽的過程中,通常采用分段標定的策略來實現[11]。定義RUL標定策略函數為 f (RUL),設定上邊界為U,則函數 f (RUL)可以表示為:
上邊界U值選取大小與航空發動機的退化性能密切相關,通常上邊界U的范圍在120~130之間。通過分段RUL的標定策略,將全周期壽命數據和預測數據集的剩余壽命標簽設置為分段的線性函數,當其RUL值超過125時統一修正為125。
2.2.3 獲取剩余壽命預測評價指標
在某一組特征類型的組合中,如果其剩余壽命預測的預測結果與真實值越接近,即發動機所有工況下的預測剩余壽命與真實剩余壽命的誤差值越小,則剩余壽命預測的效果越好。均方根誤差(root mean square error, RMSE)能夠反映出預測結果與真實值之間的偏差,所以將其作為評價目標函數I(f1)選擇的特征數據進行發動機剩余壽命預測效果的評價指標,即目標函數 II(f2)。
RULp——預測的剩余壽命值;
RULt——真實的剩余壽命值。
RMSE指的是所有工況下預測的剩余壽命與真實剩余壽命的均方根誤差值,得分越高,代表平均預測誤差越大。最終,確定剩余壽命預測中進行特征優選的兩個目標函數為:
NSGA-II是一種基于最優保存策略的隨機尋優算法[13],其本質是模擬自然中生物進化的過程,遵循物競天擇的原則,個體優勢基因將有更大機會傳遞下去,同時加入一定的變異概率,從而可以避免陷入局部最優解,找到全局最優解[14]。流程圖如圖4所示,具體步驟如下。
圖4 改進的非劣分層遺傳算法程序流程圖
步驟1:設定個體編碼方式。特征選擇方案采用A維列向量表示,中元素取值1(或0)表示是否選擇第i類特征。
步驟3:創建初始種群。隨機生成規模為n的初始種群:
式中:i——0時表示初始種群;
T——迭代終止次數;
j——種群中個體的編號。
步驟4:建立優選池。由公式(7)計算種群中所有個體的目標函數和目標函數的值,據此對所有個體進行非劣層級劃分,并采用輪盤賭從父代中挑選n個個體放入優選池。
步驟7:生成子代。將優選池、交叉種群和變異種群合并,并根據目標函數和目標函數的值對合并后的種群進行非劣層級劃分,將非劣層級最前和擁擠距離最大的n個個體放入子代。
步驟8:迭代終止條件
2)迭代次數達到10 000次,迭代結束。
將數據代入NAGA-II算法,特征數量閾值設定為14,經過優化后,獲得的特征優選結果如表1所示。由表1可知,特征優選結果中:
表1 采用NAGA-II優化獲得的特征優選結果
1)特征數量少的特征優選結果大都包含在特征數量多的特征優選結果里,說明優化后的特征優選結果具有一定可靠性。
2)在第一非劣層中,隨著特征數量從1增加到9,剩余壽命預測評價指標從41.85降低至33.38,以特征數量多的數據進行發動機RUL預測效果好于特征數量少的。
3)特征數量小于特征數量設計閾值14,而優選結果中的最大特征數量小于14,說明過多的特征數量并沒有使預測結果更接近真值,即部分冗余特征的數據加入導致了發動機RUL預測效果變得更差,證明了采用特征優選對發動機RUL預測的必要性。
將后50個工況中的訓練樣本 T51-100和測試樣本C51-100用于特征優選結果的發動機剩余壽命預測效果驗證。對于訓練樣本 T51-100和測試樣本C51-100,采用與前50個工況的訓練樣本 T1-50和測試樣本C1-50相同的數據處理方法和監測數據預測方法,利用2.4中獲得的特征優選結果,可以計算得到測試樣本剩余壽命預測效果如表2和圖5所示。
圖5 測試樣本C 51-100剩余壽命預測效果
表2 測試樣本C 51-100剩余壽命預測效果
由表2和圖5可以得知,測試樣本 C51-100的剩余壽命預測效果與特征優選結果相似:
1)以特征優選結果第一非劣層的特征組合進行剩余壽命預測和以第二非劣層的特征組合進行剩余壽命預測時,第一非劣層的f2值整體趨勢上小于第二非劣層的f2值,說明通過MOPSO算法獲得的最優特征組合(第一非劣層),相較于次優的特征組合(第二非劣層),能夠獲得更好的剩余壽命預測效果,證明論文所提的基于特征優選的航空發動機剩余壽命預測方法的正確性。
2)當特征數量為3時,測試樣本 C51-100以最優特征組合(第一非劣層)獲得的剩余壽命預測評價指標值反而小于以次優的特征組合(第二非劣層)獲得的值,以及當特征數量為3、4和6時,剩余壽命預測評價指標值不降反升,這是由于訓練樣本T51-100的50個工況和訓練樣本 T1-50的50個工況存在差異,導致進行特征優選時,優化會盡可能朝著對于訓練樣本 T1-50的50個工況剩余壽命預測效果更好的方向進行,使得對于訓練樣本的50個工況而言并非是最優的。
3)隨著特征數量的增加,測試樣本 C51-100的剩余壽命預測評價指標值整體呈現逐漸下降的趨勢。說明以訓練樣本 T1-50的50個工況數據進行特征優選的結果適用于另外完全不同的訓練樣本 T51-100的50個工況。
以第一非劣層中2、9個特征數量的特征優選結果進行RUL預測的結果以及第二非劣層中2個特征數量的特征優選結果進行RUL預測的結果如圖6所示。
圖6 不同特征優選結果下的剩余壽命預測效果
由圖6可知:對于進行特征優選的測試樣本C1-50的50個工況和進行剩余壽命預測的測試樣本C51-100的50個工況,都出現了相同的趨勢,以2個特征數量第一非劣層特征優選結果進行RUL預測的結果優于以2個特征數量第二非劣層特征優選結果進行RUL預測的結果,預測誤差均值從49.9降低至34.98;以9個特征數量第一非劣層特征優選結果進行RUL預測的結果優于同為第一非劣層中以2個特征數量第一非劣層特征優選結果進行RUL預測的結果,預測誤差均值從34.98降低至30.66,證明通過特征優選,可以有效提高航空發動機剩余壽命預測效果;第一非劣層中2個特征的的預測誤差均值相差8.47%,9個特征的的預測誤差均值相差15.07%,它們都小于16%,則可得到在第一非劣層不同特征數量下,的預測誤差均值相差都小于16%,證明了論文所提方法的魯棒性。
研究針對航空發動機剩余壽命預測中單一特征數據的剩余壽命預測方法數據利用率低及預測精度不高,而多特征數據的剩余壽命預測方法存在信息冗余及時間序列信息考慮不充分的問題,提出了一種基于特征優選的航空發動機剩余壽命預測方法,結果表明:
1)特征優選結果中:①特征數量少的特征優選結果大都包含在特征數量多的特征優選結果里,說明優化后的特征優選結果具有一定可靠性;②隨著特征數量從1增加到9,剩余壽命預測評價指標從41.85降低至33.38,以特征數量多的數據進行發動機RUL預測效果好于特征數量少的;③特征數量小于特征數量設計閾值14,說明部分冗余特征的數據加入導致了發動機RUL預測效果變得更差,證明了采用特征優選對發動機RUL預測的必要性。
2)以訓練工況樣本進行特征優選的結果適用于另外完全不同的測試工況樣本,預測誤差均值相差小于16%,證明了論文所提方法的正確性和魯棒性。