李天梅 司小勝 劉 翔 裴 洪
高速列車、航空航天裝備、導彈武器、風電裝備、工業機器人、石化裝備等現代裝備在功能不斷提升的同時,正逐漸趨于大型化、多元化和集成化,這類裝備多是由機械傳動系統、電磁驅動系統、運動控制系統、信息傳感系統等耦合組成的復雜系統,其服役過程受變環境、變載荷、變工況、大擾動和強沖擊等因素影響,整體及關鍵部件性能將發生不可避免的退化,一旦因設備性能退化造成最終失效,將會造成巨大的人員傷亡和財產損失.例如,2014 年8 月2 日發生在我國江蘇省昆山市的重大鋁粉塵爆炸事故,共造成97 人死亡、163 人受傷,直接經濟損失達到3.51 億元,事后調查表明: 除塵器維護不足而造成集塵桶銹蝕退化破損是主要技術原因.2017 年7 月發生在美國密西西比州的美國海軍陸戰隊KC-130 運輸機墜毀事件,造成機上16 名軍人全部遇難,該事故的調查結果表明發動機螺旋槳性能退化是造成飛機墜毀的主要原因.因此,若能在設備性能退化初期,尤其在尚未造成重大危害時,根據狀態監測信息,及時發現異?;蚨吭u價設備健康狀態并預測其剩余壽命(Remaining useful life,RUL),據此對設備實施健康管理,對于切實保障復雜設備的運行安全性、可靠性與經濟性具有重要意義.其中,剩余壽命預測是連接系統運行狀態信息感知與基于運行狀態實現個性化精準健康管理的紐帶和關鍵,在過去十余年得到了長足的發展,主要技術方法包括失效機理分析方法、數據驅動的方法、機理模型和數據混合驅動方法[1-8],如圖1 所示.基于失效機理分析的方法主要通過構建描述設備失效機理的數學模型,結合特定設備的經驗知識和缺陷增長方程實現設備的剩余壽命預測.由于實際工程設備本身的復雜性、任務與運行環境的多樣性,其健康狀態演化規律通常難以物理機理建模或者獲得失效機理模型的代價過高,導致失效機理方法及機理模型和數據混合驅動方法存在推廣應用難的問題.因此,數據驅動的剩余壽命預測技術已成為國際上可靠性工程和自動化技術領域的研究前沿,過去十余年中得到了長足發展,在航空航天、軍事、工業制造等領域具有極其重要的應用.

圖1 剩余壽命預測方法體系Fig.1 The methodology of remaining useful life prediction
伴隨著先進傳感技術的快速發展,工程設備健康狀態感知手段日益豐富,為設備運行監測大數據的獲取提供了更多的可能.因此,數據驅動的剩余壽命預測技術發展迎來了新的契機,針對大數據處理的隨機退化設備剩余壽命預測問題得到了大量學者的關注,相關技術蓬勃發展.在此背景下,本文的主要目的在于面向大數據背景下隨機退化設備剩余壽命預測的現實需求,通過分析當前剩余壽命預測技術的發展動態,旨在探究該領域亟待解決的關鍵問題和新的發展方向.為此,第1 節首先結合數據特點對大數據下剩余壽命預測的研究背景、主要方法及思路、核心問題等進行了概述.第2~ 5 節分別分析了機理模型與數據混合驅動的剩余壽命預測技術、基于機器學習的剩余壽命預測技術、統計數據驅動的剩余壽命預測技術以及機器學習和統計數據驅動相結合的剩余壽命預測技術的基本研究思想和發展動態,同時結合隨機退化設備監測大數據特點以及剩余壽命預測不確定性量化這一核心問題,深入剖析了當前研究存在的局限性和共性難題.第6節針對當前研究存在的局限性,提出了一種多源傳感監測大數據下數模聯動的隨機退化設備剩余壽命預測問題解決思路(簡稱為數模聯動,這里需要說明的是,“數”是指數據退化特征提取,“?!笔侵杆崛⊥嘶卣鲿r變演化過程隨機建模),通過構建優化目標函數實現數據特征提取與所提取特征時變演化過程隨機建模的 “聯動”,并通過航空發動機多源監測數據初步驗證了該思路的可行性和有效性.第7 節借鑒數模聯動思路,圍繞大數據背景下隨機退化設備剩余壽命預測不確定性量化這一核心問題,探討并提出了大數據背景下深度學習與隨機退化建模交互聯動、監測大數據與剩余壽命及其預測不確定性映射機制、非理想大數據下的剩余壽命預測等亟待解決的關鍵科學問題.第8 節總結全文.
近年來,隨著無線傳感、物聯網等技術快速興起與普及,各式傳感器猶如一張龐大的神經網絡密布在裝備內部,實時感知裝備的一舉一動,推動剩余壽命預測進入 “大數據” 時代.例如,軍事裝備在國家戰略安全中具有不可替代的特殊地位,其各子系統的安全可靠運行舉足輕重,必須依靠狀態監測、剩余壽命預測以及預測維護等理論與方法保駕護航.由于需要監測的軍事裝備群規模大、每個裝備需監測參量多、數據采樣頻率高、服役時間長,所以獲取了海量監測數據: 一個現代航空發動機,每10毫秒就能生成幾百個傳感器信息,每次飛行能產生TB 級的運行監測數據;現代化工業制造生產線安裝有數以萬計的各型傳感器來監測工業裝備的運行過程信息及產品質量信息,比如大型工業機器人制造商利用云平臺監控著百萬臺工業機器人,實時獲取機器人每個運動關節的轉速、角度、位置、溫度、振動等信號,每天需要對TB 級以上的數據進行處理.然而,這些監測大數據在為設備健康狀態感知及剩余壽命預測提供豐富信息的同時,由于設備工況多變、多源信號差異大、采樣策略形式多、信息之間相互耦合、數據價值密度低,導致數據質量參差不齊,狀態監測大數據呈現不同的統計特性.根據監測數據呈現的特點,圖2 給出了完整監測大數據和非完整監測大數據(具有碎片化、分段的、稀疏性等特征)的示例.

圖2 完整的、碎片化的、稀疏的監測大數據示例Fig.2 Examples of complete,fragment and sparse big data
這里完整監測大數據主要針對運行模式比較固定的隨機退化設備(如軸承、齒輪等),能夠實現不間斷連續監測,監測大數據涵蓋了設備從開始運行到失效比較完整的狀態數據,而非完整監測大數據主要針對受經濟條件及現實監測條件限制的隨機退化設備(如航空發動機、渦輪泵、配電電池等),對這類設備進行連續監測采樣是不現實的,只能間歇性地對其監測,得到的狀態監測大數據表現出一定的“碎片化、分段、稀疏”等特點.因此,當剩余壽命預測進入大數據時代,如何根據監測大數據呈現出的不同特點,充分分析利用豐富的監測大數據資源,從浩如煙海的數據中進行 “沙里淘金”,深度挖掘出反映設備健康狀態的信息并據此進行剩余壽命預測,是隨機退化設備剩余壽命預測領域亟需解決的關鍵問題.
數據驅動的剩余壽命預測方法基于設備運行監測數據,通過擬合設備性能變量演化規律并外推到失效閾值,或建立監測數據與失效時間的映射關系,以實現剩余壽命預測,為大數據背景下隨機退化設備剩余壽命預測提供了可行的技術思路.然而,剩余壽命指當前時刻到系統失效時刻的有效時間間隔,因此剩余壽命預測實際上是根據當前得到的監測信息,對系統將來失效事件的預測,其預測結果不可避免的具有不確定性.van Asselt 等[9]從哲學和認識論的角度討論了預測的不確定性處理問題,指出預測結果具有不確定性是學術界的共識,也是當今時代的特征.聯合攻擊機F-35 項目組研究人員Hess 等[10]和Smith 等11]、壽命預測領域代表性學者馬里蘭大學先進生命周期工程中心Pecht 教授等[1,12]、可靠性領域知名期刊Quality and Reliability Engineering International主編Brombacher 教授[13]通過各種事例強調了預測不確定性的量化是剩余壽命預測從理論到應用轉化的核心.美國國家航空航天局(National Aeronautics and Space Administration,NASA)預測與健康管理中心研究規劃中也將剩余壽命預測不確定性的管理列為了中心發展路線圖的重要研究內容(https://ti.arc.nasa.gov/tech/dash/groupspcoe/roadmap).由此可見,預測不確定性的量化是數據驅動隨機退化設備剩余壽命預測領域的一個核心問題,也是解決 “敢用、能用” 剩余壽命預測理論技術實現實際工程設備個性化精準健康管理、保障設備長周期安全可靠運行的關鍵所在.
隨著信息技術和傳感器技術的迅猛發展,數據驅動的剩余壽命預測技術由于適用范圍廣、容易實現、無需深入專業機理知識等優點,作為其中典型代表的機器學習方法和統計數據驅動方法已獲得了大量研究和蓬勃發展,得到了學術界和工業界的廣泛關注,相關技術已經在導彈武器、航空航天、風力發電、工業制造等領域產生了重要應用[14-16].盡管以機器學習方法和統計數據驅動方法為典型代表的數據驅動隨機退化設備剩余壽命預測已獲得了大量研究和蓬勃發展,但已有理論與方法在大數據背景下隨機退化設備剩余壽命預測及其預測不確定性量化這一核心問題上,仍然沒有系統有效的解決方法,主要體現在統計數據驅動方法處理大數據能力不足,而機器學習方法量化預測不確定性能力不足.因此,通過對大數據背景下剩余壽命預測研究發展脈絡的探究,深入剖析當前研究存在的瓶頸問題,對于促進隨機退化設備剩余壽命預測技術的發展具有重要意義.在第2~ 5 節,將針對當前大數據背景下剩余壽命預測典型解決思路的研究動態和存在的問題進行具體的分析.
基于機理模型的方法主要是依據失效機理構建描述設備退化過程的參數化數學模型,結合設備的設計試驗數據或經驗知識辨識數學模型參數,進而基于狀態監測數據更新機理模型參數實現設備的剩余壽命預測.典型的參數識別與更新方法包括: 卡爾曼濾波[17-19]、粒子濾波[20-21]和貝葉斯方法[22-23]等.常見的用于剩余壽命預測的機理模型包括: Paris模型、Forman 模型以及在其基礎上的各種改進和擴展模型,主要用以描述裂紋擴展和層裂增長[24-25].例如,Li 等[26-27]基于Paris 模型,建立了缺陷增長率與缺陷面積及材料常數的映射關系,以預測滾動軸承的剩余壽命;Li 等[28]提出了Paris 裂紋擴展模型,根據裂紋尺寸和動態載荷預測齒輪的剩余使用壽命;Liang 等[29]研究了基于Paris 模型的滾珠軸承剩余使用壽命自適應預測方法,即使在缺乏先驗信息且缺陷增長為時變的情況下,也能獲得可靠的預測結果.Oppenheimer 等[30]利用線彈性斷裂力學,對轉軸建立了基于Forman 裂紋擴展的壽命模型;針對層裂增長故障,Marble 等[31]開發了一種渦輪發動機軸承的層裂增長預測模型,能夠根據工況估計層裂增長軌跡和故障時間,并利用診斷反饋進行自調整,降低了預測不確定性;Choi 等[32]考慮了由于裂紋形成和磨粒磨損引起的層裂增長現象,提出了滾動接觸的層裂增長壽命模型.在充分理解失效機理并得到準確的模型估計參數后,基于機理模型的方法能夠實現對剩余使用壽命的精確預測.然而,以上現有基于機理模型的剩余壽命預測方法未能結合實際運行設備的實時監測數據,難以準確反映設備當前運行的實際狀態,特別是在設備運行環境、運行工況發生變化時,若不能利用實時監測數據對模型進行更新,將產生較大的預測偏差.
為了使得機理模型能夠更好地建模實際服役個體設備的性能演變過程,將設備實時運行監測數據與機理模型進行混合,將有助于實現剩余壽命預測準確性的提升.因此,機理模型與數據混合驅動的剩余壽命預測方法也得到了較多的關注和發展[4].最近該方面的研究包括Liao 等[33]、Wang 等[34]的論文,這些研究分別針對鋰電池系統和旋轉機械設備,提出了機理模型與數據混合驅動的剩余壽命預測方法.根據機理模型與數據混合驅動實現方式不同,可將這類混合驅動的剩余壽命預測方法分為兩大類: 1)基于監測數據構建機理模型所刻畫退化狀態的測量模型,運用卡爾曼濾波、粒子濾波等方法估計退化狀態和機理模型參數,然后通過機理模型預測設備的剩余壽命[12,35];2)首先分別基于數據和機理模型進行設備的剩余壽命預測,然后利用決策層融合方法實現集成基于數據和基于機理模型的剩余壽命預測[36-37].以上兩類機理模型與數據混合驅動實現剩余壽命預測的方式各具優勢: 第1 種方式能夠充分考慮退化狀態難以直接測量的實際,在考慮監測數據中測量噪聲的情況下,可實現隱含退化狀態的估計和機理模型參數的更新,使得最終的預測結果能夠更準確地反映設備當前的實際狀態;第2種方式實現過程相對簡單獨立,決策層融合的形式較為多樣,如平均法、權重平均、核回歸、證據組合等,能夠集成多種方法的優勢,有助于提升預測結果的魯棒性.
雖然基于機理模型的方法和機理模型與數據混合驅動方法得到了一定的發展,但其成功應用的基礎是可獲取精確可靠的機理模型.隨著當代設備逐步呈現復雜化、非線性化以及高維化等特征,其健康狀態演化規律通常難以精確機理建?;蛘攉@得失效機理模型的成本過高.現有研究中通過物理機理分析、理化分析、實驗分析等手段獲取的機理模型主要針對特定材料或對象,這一點也可以通過當前機理模型的種類相當匱乏反映出,由此在一定程度上限制了這類方法的廣泛應用.因此,在大數據背景下,通過挖掘數據中隱含的設備健康狀態信息,發展數據驅動的剩余壽命預測方法成為當前的主流和研究的焦點.
基于機器學習的設備剩余壽命預測主要思路是通過機器學習擬合性能變量演化規律并通過滾動外推到失效閾值以預測失效時間,或直接建立監測數據與失效時間的映射關系實現端到端的預測,基于此通過預測的失效時間減去當前運行時間得到剩余壽命的預測值.裴洪等[38]和Khan 等[39]分別綜述了機器學習方法和深度學習方法在剩余壽命預測與健康管理領域的研究應用現狀.為區別于以上綜述中介紹的工作,本文重點結合最新的研究進展和大數據下剩余壽命預測的現實需求,對基于機器學習的剩余壽命預測技術發展動態和存在的問題進行分析.根據機器學習網絡模型結構特點,這類方法主要分為基于淺層機器學習的方法和基于深度學習的方法.
基于淺層機器學習的剩余壽命預測方法中的典型代表為神經網絡、支持向量機等,具體發展動態分述如下.
1) 神經網絡
神經網絡是一種模擬人類中樞神經系統組織結構與信息處理機制的學習網絡,主要由輸入層、隱層和輸出層組成[40].神經網絡具有自學習、自組織、自適應以及強非線性映射擬合能力等優點[41-42],因而在設備剩余壽命預測領域受到了學者們的廣泛關注[43-45].早在2004 年,Gebraeel 等[46]就將單隱層前饋神經網絡用于機械設備振動信號建模,通過外推至失效閾值實現剩余壽命預測.Mahamad 等[47]通過改進前饋神經網絡訓練算法,將改進后的網絡用于旋轉機械的壽命預測.Lim 等[48]采用特征時序直方圖法從多源監測數據中提取了具有局部趨勢性的退化指標,然后將這些退化指標輸入到多層感知機中去預測航空發動機的剩余壽命.Drouillet 等[49]將單隱層前饋神經網絡用于高速銑刀剩余壽命預測.Ahmadzadeh[50]等使用多層感知機去預測研磨機剩余壽命.Zhang 等[51]基于小波包分解、快速傅里葉變換和反向傳播神經網絡構建了鼓風機剩余壽命預測模型.徐東輝[52]提出了多類神經網絡組合預測的方法,利用改進的Elman 神經網絡和非線性自回歸神經網絡兩個單項預測模型進行預測,并且借助于徑向基函數神經網絡對兩個單項模型的預測值進行非線性組合,實現了剩余壽命預測.楊洋[53]研究了一種基于自回歸移動平均和后向傳播神經網絡組合模型的鋰電池壽命預測方法,有效結合了兩者在短期預測方面與非線性擬合方面的優勢.在最新的研究中,Bektas 等[54]通過引入傳感器選擇、數據歸一化、特征提取等數據預處理技術,將預處理后的數據用于訓練神經網絡,提出了一種基于神經網絡和相似性的剩余壽命預測方法.Li 等[55]利用監測數據訓練了多個神經網絡,基于加權平均思想提出了一種基于集成網絡的剩余壽命預測方法.
2)支持向量機
支持向量機是由Cortes[56]和Vapnik[57]于1995 年首次提出的,在小樣本和高維數據機器學習領域受到廣泛關注,主要原理是首先通過非線性變換將多維輸入向量映射到高維特征空間,然后在高維特征空間中構造最優超平面來實現樣本分類或回歸.由于支持向量機能夠有效避免 “維數災難”問題,且具有較好的泛化能力,因而廣泛應用于設備的剩余壽命預測中[58-61].例如,Soualhi 等[62]利用Hilbert-Huang 變換構建了滾動軸承的敏感退化指標,然后將這些退化指標輸入到支持向量機中實現了旋轉軸承的剩余壽命預測;Sun 等[63]構建了貝葉斯最小二乘法支持向量機預測模型,并將其用于微波器件的剩余壽命預測;Nieto 等[64]將支持向量機應用到了航空發動機的剩余壽命預測中;Khelif 等[65]研究提出了一種不需要建立健康指標、故障狀態等直接基于支持向量回歸模型建立監測數據與設備壽命的擬合關系,進而實現了剩余壽命預測.Huang等[66]對基于支持向量機的剩余壽命預測方法研究現狀、應用領域及發展趨勢進行了系統地梳理和分析.
3)其他淺層模型
除了以上幾種常用的淺層模型外,一些其他機器學習模型也被應用到裝備的剩余壽命預測中,如極限學習機[67]、貝葉斯網絡[68]、隨機森林[69]、梯度提升決策樹[70]、基于案例的學習方法[71]、基于案例的推理方法[72]等.文獻[38]對基于淺層機器學習的剩余壽命預測方法進行了詳細綜述,本文不再贅述.
通過文獻總結分析可以發現,雖然淺層神經網絡訓練相對比較容易,基于淺層機器學習方法實現設備剩余壽命預測的研究具有較長的歷史,但這類方法中采用的網絡結構簡單、預測性能較多地依賴于專家先驗知識與信號處理技術,且難于量化剩余壽命預測結果的不確定性.此外,這類研究中較多的方法需借助人工經驗與知識預先提取監測數據中的關鍵信息并構建退化指標,因此退化指標的好壞將很大程度上決定淺層神經網絡的預測性能.在大數據時代,設備退化特征愈發表現出耦合性、不確定性、非完整性等特點,淺層機器學習算法自學習能力較弱,難以自動處理和分析海量監測數據.因此,大數據下剩余壽命預測的智能學習模型由 “淺”入 “深”、勢在必行.
深度學習作為一種大數據處理工具,旨在模擬大腦學習過程,構建深度模型,通過海量數據學習特征,刻畫數據豐富的內在信息,最終提升建模精度.深度學習自從2006 年在Science上首次提出便掀起了學術界和工業界的研究浪潮,如雨后春筍,以其強大的海量數據處理能力在諸多領域的大數據分析中方興未艾.經過了十余年的探索,深度學習當前已成功應用于許多工程領域,如圖像識別[73]、自然語言處理[74]、語音識別[75]、故障診斷[76]等,同時在剩余壽命預測領域也嶄露頭角.如圖1 所示,根據網絡結構的不同,這類方法主要包括: 基于深度自編碼器的方法、基于深度置信網絡的方法、基于卷積神經網絡的方法、基于循環神經網絡的方法以及多種網絡組合而成的混合網絡方法.無論基于哪種深度網絡結構形式,其基本思想都是采用現有深度學習模型建立性能測試數據與剩余壽命標簽或退化標簽之間的潛在關系.下面針對幾種典型的深度學習網絡,介紹其應用于剩余壽命預測時的研究動態并分析當前研究存在的問題.
1)深度自編碼網絡
深度自編碼網絡是由多個自編碼器或降噪自編碼器堆疊組成的深度神經網絡.基于深度自編碼網絡的剩余壽命預測通過提取出原始數據的深層次特征,然后通過邏輯回歸層或全連接層實現機械裝備的剩余壽命預測[77-80].由于自編碼器是以重構原始輸入為學習目標,因而其學習到的特征對數據有更本質的刻畫,有利于提高預測精度,且深度自編碼網絡能夠以無監督學習方式逐層對網絡參數進行預訓練,將訓練結果作為反向微調的初始值,確保了網絡參數的在線更新,在剩余壽命預測領域得到了廣泛的應用[81-85].例如,Xia 等[79]提出了一種基于深度自編碼網絡的兩階段剩余壽命預測方法,首先運用深度降噪自編碼器網絡對監測大數據進行階段劃分,然后訓練深度自編碼網絡得到每個階段的退化特征,最后通過回歸方法分析各階段特征實現剩余壽命預測.然而,深度自編碼網絡在處理力信號、振動信號、聲發射信號、光信號等高維原始監測數據時,其仍需要借助各類信號處理技術來提取設備的退化指標.
2)深度置信網絡
深度置信網絡主要是由多個受限波爾茲曼機堆疊與一個分類層或回歸層組合形成的深度網絡,通過逐層預訓練和反向精調策略解決深度模型普遍存在的訓練困難問題,不僅能實現數據從淺層到深層的特征表示與提取,而且能發現輸入數據的分布式特征,在深層特征提取方面獲得了廣泛的應用.例如,Jiao 等[86]提出了一種基于深度置信網絡的健康指標構建方法用于裝備的剩余壽命預測,該方法采用無監督學習的策略融合多個傳感器監測數據對裝備健康狀態進行評估,得到描述其退化程度的健康指標用于剩余壽命預測.需要注意的是,深度置信網絡在實際中的應用主要集中在深層次特征提取方面,單純利用深度置信網絡實現剩余壽命預測的研究還相當有限,需要與其他網絡混合進行才能進行剩余壽命預測.
3)卷積神經網絡
卷積神經網絡作為一類經典的前饋神經網絡,是由LeCun 等[87]首次提出并用于解決圖像處理問題的,主要由若干卷積層和池化層組成,既能輸入序列數據,也能處理網格化數據,在計算機視覺、語音識別等領域應用十分廣泛.針對設備性能監測大數據的特點,先后發展出了多種用于剩余壽命預測的卷積神經網絡,主要包括深度卷積神經網絡[88]、多層可分離卷積神經網絡[89]、多尺度卷積神經網絡[90]、聯合損失卷積神經網絡[91]等.Babu 等[92]首次將深度卷積神經網絡應用于剩余壽命預測領域,采用兩個卷積層和兩個池化層提取原始信號特征,同時結合多層感知器實現剩余壽命的預測.最近,Yang 等[93]提出了一種基于兩個卷積神經網絡的剩余壽命預測方法,其中一個是分類網絡用于監測性能退化的初始時刻,另一個是回歸網絡用于預測剩余壽命.相比于其他深度學習網絡,卷積神經網絡能夠更有效地處理力信號、振動信號、聲發射信號、光信號等高維原始數據,可實現從監測數據中自動提取退化特征信息,適合處理監測大數據且具有降噪的功能,同時其網絡參數量相對較少,訓練更加方便高效,因此易于構建更深的網絡結構.然而,隨機退化設備的監測數據蘊含的健康特征往往是時序相關的,而卷積神經網絡在應對大數據下時序特征提取能力不足,容易造成重要時序特征的丟失,這對于剩余壽命預測是不利的,因此卷積神經網絡在應用于剩余壽命預測時經常與其他深度網絡組合使用.
4)循環神經網絡
循環神經網絡作為一類包含前饋連接與內部反饋連接的前饋神經網絡,主要用于處理具有相互依賴特性的監測向量序列,由于其特殊的網絡結構,能夠保留隱含層上一時刻的狀態信息,目前已經在剩余壽命預測領域得到廣泛的關注,被應用于鋰電池系統[94]、風力發電設備[95]、航空發動機[96]等.為解決循環神經網絡通常存在 “記憶衰退”進而導致預測偏差較大這一問題,學者們對循環神經網絡模型進行了改進,提出了一種長短期記憶(Long short term memory,LSTM)模型,門結構作為LSTM 的獨特結構,能夠在最優條件下確定出所通過信息特征,在剩余壽命預測領域獲得了廣泛的應用[97-98].例如: 為解決運行和環境擾動引起的不確定性問題,Elsheikh 等[99]對LSTM 的結構分別進行了改進,提出了基于雙向LSTM 的剩余壽命預測方法.雖然循環神經網絡在隨機退化設備退化過程建模方面具有先天優勢,但當處理長期依賴型退化數據時,循環神經網絡在訓練過程中也經常面臨梯度消失或爆炸問題.同時,以上基于循環神經網絡的剩余壽命預測研究中都未考慮預測結果不確定性的量化問題,只能輸出一個剩余壽命的點估計,難以評估預測結果的置信度.
最近,針對剩余壽命預測不確定性量化問題,Zhang 等[100]在假定退化數據服從正態分布的前提下利用Monte Carlo 方法從退化數據中隨機采樣,通過改變LSTM 網絡輸入,在不同網絡輸入下得到不同的剩余壽命預測值,由此構造剩余壽命的數值分布,試圖量化預測不確定性.Huang 等[101]利用雙向LSTM 網絡預測剩余壽命輸出的均方根誤差構建剩余壽命預測的誤差帶,以區間的形式表示預測不確定性.Yu 等[102]對退化監測數據進行劃分、以退化量為標簽,建立了多個基于LSTM 網絡的退化量預測模型,然后通過滾動預測的思想將預測值作為模型輸入迭代預測至退化量超過失效預測的時刻,由此確定設備的剩余壽命預測值.進一步,為綜合多個LSTM 網絡預測值,引入Bayesian 模型平均方法,估計各個模型的后驗概率,由此可以確定最終的剩余壽命預測值和預測置信區間,有效提高了剩余壽命預測精度的同時以置信區間的形式表示了預測不確定性.以上思路在基于機器學習方法的剩余壽命預測不確定性量化方面做出了有益的嘗試,然而無論是改變輸入條件構建數值分布、基于均方根誤差構建誤差帶,還是構建多個預測模型通過Bayesian 模型平均構建置信區間,都更多地反映了網絡訓練的效果而不能全面反映設備性能退化固有的時變隨機性和動態特性.
5)混合深度網絡
基于混合深度網絡的方法可看作多個深度學習網絡以一定方式組合連接(如串聯、并聯等)用于彌補現有單一深度學習網絡的不足,目前主要的混合形式包括深度置信網絡+前饋神經網絡[103]、受限玻爾茲曼機+LSTM 網絡[104]、LSTM 網絡+卷積神經網絡[105]、LSTM 網絡+編碼-解碼模型[106]、循環神經網絡+自編碼器[107]、多損失編碼器+兩階段卷積神經網絡[108]等.這類方法主要通過繼承不同深度學習模型的優勢,進而期望實現取長補短、改善剩余壽命預測的效果.例如: Ren 等[109]提出了一種堆棧自編碼器與前饋神經網絡組合的軸承剩壽命預測方法,該方法能夠有效利用堆棧自編碼器在特征表示方面的優勢,同時將其引入至前饋神經網絡可有效避免訓練過程中的局部最優問題;Deutsch等[104]提出了一種融合深度置信網絡與前饋神經網絡的旋轉設備剩余壽命預測方法,這是基于深度置信網絡方法的改進和拓展,能夠有效結合深度置信網絡特征提取能力與前饋神經網絡的預測性能.雖然通過混合深度網絡進行剩余壽命預測有助于產生互補效應,但混合多種深度網絡將不可避免地導致剩余壽命預測模型的訓練復雜化,而且混合方式的選擇基本上是啟發式的,缺乏公認統一的形式.因此,發展剩余壽命預測相關性能要求牽引下的混合深度網絡構建方式以提高混合方式的可解釋性仍有待深入研究.
需要說明的是,基于深度學習的剩余壽命預測研究正在蓬勃發展,以上介紹到的文獻僅是冰山一角.通過對當前相關研究發展動態的分析不難發現,無論是傳統的基于淺層機器學習還是正在蓬勃發展的基于深度學習的剩余壽命預測研究,基本上都可以歸結到兩種思路,即基于退化量滾動預測和基于學習網絡建立監測數據與失效時間端到端的映射.雖然在以上兩種思路下的剩余壽命預測方法研究快速發展,且都屬于數據驅動的方法,但當前研究面對剩余壽命預測現實需求時主要存在以下有待解決的問題:
1)目前這些基于機器學習的剩余壽命預測研究,基本上都是將其他領域應用需求驅動下提出并發展起來的各種深度網絡直接應用,其網絡結構和參數均是確定性的,一般只能得到確定性的剩余壽命預測值,很難得到能夠量化剩余壽命預測不確定性的概率分布.正如第1 節所討論的,剩余壽命預測針對的是設備將來的失效事件,而設備性能退化在預測區間內受到環境、負載等多重隨機因素影響,導致剩余壽命預測結果不可避免地具有不確定性,因此剩余壽命預測不確定性的量化表征是該領域的一個核心問題.然而,目前基于機器學習的方法對這方面重視不夠,在預測不確定性量化能力上存在不足.無法量化預測不確定性也意味著無法量化預測結果帶來的風險,由此導致難以滿足以最小化運行風險或最小化費用為目標的健康管理相關決策(如維護決策、備件訂購等)對運行風險定量評估的應用需求[39].造成以上問題的根本原因在于所采用的學習網絡并不是針對剩余壽命預測的核心需求設計的,更多的是直接采用或借鑒其他任務需求下發展起來的學習網絡.因此,如何設計并發展面向剩余壽命預測及其不確定性量化需求的專用學習網絡,使得其能夠從監測數據中學習到反映預測不確定性的剩余壽命概率分布相關的信息,是克服現有研究發展瓶頸的根本途徑和有重要價值的研究方向.
2)現有研究中通過學習網絡建立監測數據與失效時間端到端映射以預測剩余壽命的思路,其成功實現的前提是能夠獲取充分的同類設備失效時間數據以制作訓練標簽.然而,在工程實際中,由于受到安全性與經濟性等因素的限制,設備運行至失效狀態是極其危險的,一般在失效前對設備進行替換.在該情況下,所能獲取的更多的是設備在服役過程中積累的大量狀態監測數據,關于設備失效時間的數據幾乎沒有,因而這類狀態監測大數據大多屬于非全壽命周期類型.盡管大數據背景下非全壽命周期數據包含了豐富的設備退化機制與壽命信息,但由于失效數據匱乏將導致現有基于機器學習的剩余壽命預測方法中所需的壽命標簽難以制作(即零壽命標簽問題),由此為構建監測數據與剩余壽命之間端到端的映射關系帶來了極大的挑戰.與此同時,基于退化量滾動預測的思路以退化量為標簽構建預測模型,能夠減少對壽命標簽數據的依賴,但在實現過程中將本身存在誤差的退化量預測值作為預測模型輸入進行滾動預測,容易造成預測誤差的累積,進而影響剩余壽命預測的準確性.此外,目前基于以上思路的剩余壽命預測研究主要針對完整監測數據,而對于圖2 所示的 “碎片化、分段的、稀疏的”非完整監測大數據與剩余壽命之間的映射關系鮮有研究.因此,零壽命標簽情形下如何通過非完整監測大數據構建隨機退化設備剩余壽命預測模型,發展剩余壽命預測研究的新范式仍有待解決.
3)如前所述,剩余壽命預測是銜接設備健康狀態感知與基于狀態感知信息實現設備的個性化精準健康管理的橋梁,因此剩余壽命預測方法的可解釋性對于將預測結果用于設備的健康管理(如預測維護、備件訂購等)至關重要.然而,現有基于機器學習的剩余壽命預測方法通過學習網絡建立監測數據與剩余壽命之間的映射關系,監測數據與剩余壽命之間的關系難以顯式表示,呈現 “黑箱” 特點,難以解釋設備退化失效機理.此外,當前的研究較多地關注了剩余壽命預測的準確性,但機器學習模型中超參數的選擇對預測結果的準確性和魯棒性具有重要影響,預測的效果對調參技巧和經驗有較大的依賴,而如何合理有效地選擇機器學習模型的超參數在機器學習領域本身就是一個極具挑戰性的問題.綜合以上兩個方面可見,發展具有可解釋性的基于機器學習的剩余壽命預測方法,將有助于打通當前這類方法從理論研究到推廣應用于設備健康管理的最后一公里.提高基于機器學習的剩余壽命預測方法的可解釋性的研究方向包括在學習網絡設計中考慮設備退化失效的機理知識、基于學習網絡從監測數據中提取退化特征時將特征的趨勢性或單調性作為約束條件考慮、將超參數的選擇問題轉化為提升預測效果的優化問題納入模型訓練過程等.
傳統統計數據驅動的剩余壽命預測方法通過對設備失效時間數據統計分析,構造壽命T的分布函數,由此設備在t時刻的剩余壽命即為T -t|T >t,z,其中z代表該類設備的事件數據集(主要指失效時間數據),然后通過分布擬合得到壽命T的概率分布,再通過上述條件隨機變量的關系實現剩余壽命預測[110].然而,隨著生產制造水平的不斷提升,設備的可靠性逐步提高,很難在短期內(即使是加速條件下)獲得足夠多的失效數據或對于昂貴的設備獲取成本過高,而且這類方法沒有用到設備運行過程中的監測數據,預測結果難以反映當前運行實際情況,由此導致難以實現個體服役設備的精準健康管理.
相比之下,隨著信息技術和傳感器技術的迅猛發展,通過設備性能退化變量的監測數據,建立描述設備性能演化過程的隨機模型,便可預測設備剩余壽命[111].這類方法以概率統計理論為基礎,在隨機模型框架下建模性能退化變量演變規律,以概率分布的形式給出剩余壽命分布的表達式,不僅能得到剩余壽命的點估計,而且能描述預測的不確定性(方差、置信區間等各種不確定性量化指標),這對維修、替換、后勤保障等的科學決策極為重要,因而已成為國內外研究的熱點.
基于隨機模型建模性能退化變量監測數據的關鍵是選擇合適的隨機模型,常用的隨機模型主要指各種隨機過程模型,包括Wiener 過程、Gamma過程、Markov 鏈、隱Markov 過程和逆高斯過程等[112-115].這類方法采用隨機過程描述性能退化變量的演變過程,通過監測數據實現模型參數的估計,基于此通過求解所建立的隨機退化過程首達失效閾值時間的概率分布實現剩余壽命預測,在剩余壽命預測不確定性量化方面具有天然優勢.從物理機制看,設備退化是其內部應力和外部環境綜合作用而引起的設備老化和性能衰變,與采樣時間和采樣頻率無關,亦即設備的退化過程應該滿足無限可分性.迄今,從數學上已證明滿足無限可分性的隨機過程模型只有Gamma 過程、逆高斯過程和Wiener 過程[116-117].因此,利用這三類隨機過程建立設備退化模型,在數學上和物理上均具有較強的可解釋性,受到了國內外研究者的廣泛關注[118-119].然而,前兩種隨機過程都是單調隨機過程,只能描述單調退化,例如磨損、疲勞裂紋增長等.在實際中,由于設備內部應力的吸收與釋放、使用強度、使用頻率、載荷大小、外界環境等的動態變化,性能退化變量的監測信號往往呈現非單調波動的特點,而Wiener 過程是由Brownian 運動驅動的一類擴散過程,其增量獨立且為高斯分布,適合刻畫非單調退化過程,在退化測量信號的建模上更具靈活性,因此廣泛應用于滾動軸承、液晶顯示器、激光器、慣性器件等的退化建模及剩余壽命預測.2018 年,Zhang 等[120]系統全面地總結了基于Wiener 過程的各種退化建模及剩余壽命預測方法最新研究進展情況.
目前,這類基于隨機過程的方法主要針對圖2所示的完整監測數據,且需要能夠從監測數據中提取具有一定趨勢特征的性能退化變量,以確定所采用隨機過程的參數化形式并基于監測數據實現隨機過程模型參數辨識,最終通過求解隨機過程首達失效閾值時間的概率分布達到預測剩余壽命的目的.根據建模過程中涉及的性能退化變量數目,主要分為單變量模型和多變量模型兩種情況.
單變量下隨機退化設備剩余壽命預測研究得到了廣泛關注和深入研究.Gebraeel 等[121]以軸承振動數據為背景,將設備退化數據演化過程描述為線性Wiener 過程,最早將Bayesian 更新策略用于剩余壽命分布的在線遞歸預測.Huang 等[122]通過采用時間尺度變換線性化技術研究了一類基于一般Wiener 隨機退化過程的剩余壽命預測問題,提出了漂移系數自適應更新方法;為處理本質非線性退化數據,Si 等[123]提出了一類一般非線性擴散過程模型描述退化數據,通過時間-空間變換,得到了剩余壽命分布的解析形式,并將所得結果應用于慣性平臺的漂移退化和2017-T4 鋁合金的疲勞裂紋增長.在文獻[123]基礎之上,出現了諸多的理論擴展及應用研究[124-125].最新出版的學術專著 [126] 對基于Wiener過程及其變形開展的單變量下隨機退化設備剩余壽命預測基礎理論和方法,從線性到非線性、從固定模式到切換模式進行了詳細的論述.
在工程實際中,設備存在運行工況、運行環境、運行負載多變等復雜運行模式,反映設備性能退化的變量往往不止一個且相互關聯,呈現多性能退化變量的特點,表征設備健康狀態的性能退化指標往往并不唯一.文獻[127]在Bayesian 框架下研究了多變量動態系統的可靠性估計問題,但將各個變量單獨建模,未考慮多退化變量之間相互耦合的實際.當前,對多變量耦合的情況主要有兩種思路.第1種是基于Copula 函數的方法.其中,Copula 函數是一種連接多維聯合分布與一維邊緣分布的特殊函數,基于此函數,多個相關退化量的聯合分布可以通過每個退化量的邊緣分布和Copula 函數融合為一個整體分布[128].Pan 等[129]、Peng等[130]、劉勝南等[131]、張建勛等[132]采用不同的隨機過程模型和Copula 函數研究了多元退化變量的建模問題,并用于剩余壽命預測.然而,基于Copula 函數的方法成功應用的關鍵在于Copula 函數的選擇,不同的退化數據常常適用于不同的Copula 函數,而且可供選擇的Copula 函數形式是非常有限的,選擇的過程有一定的主觀性,選擇結果也不唯一,因此這類方法難以對多個性能退化變量之間的相互作用關系進行合理的定量描述.第2 種是基于信息融合的方法.這種方法的主要思路是在進行退化建模之前,首先根據多維數據之間的關系,通過優化、加權、融合濾波等方式,將多維數據投影變換到一維數據上來,提取一個單變量復合性能指標,再應用已有針對單變量的方法對此一維數據進行建模和預測.例如,Liu 等先后提出了基于退化信號加權組合[133-134]、基于信號質量優化[135]、基于多源信息融合[136-137]的復合性能指標獲取方法,據此采用單變量退化建模方法實現剩余壽命預測.此類方法的優點在于融合后的性能指標可以采用傳統針對單變量的退化建模和剩余壽命預測方法.然而,在多維數據融合時其相互之間的關系一般難以界定,使得融合后的指標難以全面反映整個設備的退化,而且融合后的指標物理意義不明確,導致退化失效閾值的確定成為一個新的難題.
通過以上文獻分析可以看出,統計數據驅動方法以概率統計理論為基礎,利用隨機模型對監測數據進行建模,進而對剩余壽命進行推斷,可以得到剩余壽命的概率分布,在量化剩余壽命預測不確定性上具有天然優勢,且隨機模型參數與設備退化失效過程緊密相關使得模型可解釋性較強(如反映退化快慢的退化率參數、反映退化過程時變不確定性的擴散系數等),因此得到了可靠性領域學者的大力推崇,發展迅速.但需要注意到的是,無論是單變量下還是多變量下,這類方法主要針對圖2 所示的完整監測數據且需要能夠從監測數據中提取具有一定統計特征的退化趨勢數據以實現參數化的演變軌跡建模.然而,在大數據時代,通常采用傳感器網絡收集多物理源信號以全面反映設備狀態,由于多源信號差異大、采樣策略形式多,數據價值密度低,導致數據質量參差不齊,現有統計數據驅動的方法從大數據中提取退化特征信息如同大海撈針,處理如圖2 所示的 “碎片化、分段的、稀疏的”監測大數據更是難上加難,沒有良好統計特征的退化數據做輸入,這類方法必將迷失于浩瀚的數據海洋.此外,單變量下隨機退化設備剩余壽命預測研究試圖提取單一特征表征設備健康狀態全貌的思路,已與復雜運行條件下設備健康狀態需從多維度表征的需求不相適應,而現有多變量下隨機退化設備剩余壽命預測問題的研究基本都是試圖通過轉換為單變量情況再來處理,未充分考慮多性能退化變量相互耦合、相互影響的機制,多變量耦合導致的剩余壽命分布求解難題仍未能得到有效解決.因此,針對大數據環境下隨機退化設備的剩余壽命預測問題,發展新的理論和方法勢在必行.
通過第3 節和第4 節的文獻分析可以看出,以深度學習為代表的機器學習方法在監測大數據深層次特征自動提取、復雜結構數據擬合、非線性映射等方面具有強大的處理能力,但很難得到體現剩余壽命預測不確定性的概率分布,這與其強大的數據處理能力和學習能力還不相匹配.統計數據驅動的方法雖能得到剩余壽命的概率分布、在量化剩余壽命預測不確定性上具有天然優勢,但對具有多源信號差異大、采樣策略形式多、數據價值密度低、數據質量參差不齊等特點的監測大數據處理能力非常有限.因此,若能將機器學習方法與統計數據驅動方法相結合,有望綜合兩者的優勢、彌補各自局限性.最近,一些學者也開始了這方面的探索性研究.Deutsch 等[138]將深度置信網絡用于提取退化特征,然后用隨機退化模型表示特征的演變趨勢,利用粒子濾波算法實現模型更新,并得到了剩余壽命概率分布的數值形式.彭開香等[139]研究提出了一種基于深度置信網絡的無監督健康指標構建方法,并結合隱馬爾可夫模型對特征進行建模用于剩余壽命預測.進一步,該方法被改進為深度置信網絡與粒子濾波相結合的形式[140],可以實現剩余壽命概率分布的數值計算.最近,Hu 等[141]利用深度置信網絡的無監督學習特性構建性能退化指標,然后采用非線性擴散過程建模性能退化指標演變趨勢,從而得到了剩余壽命的概率分布.
這些研究在做出了有益嘗試的同時,還存在不容忽視的局限性: 1)以上方法中深度網絡用于特征提取而隨機模型用于建模特征實現剩余壽命的概率分布輸出,但在實現過程中特征提取和模型建立是孤立進行的,由此導致機器學習方法和統計數據驅動方法實際是簡單的組合關系,提取的深度退化特征能否適應并匹配所采用的隨機模型仍是問題,因為在特征提取過程中并沒有考慮提取后采用何種形式的模型對其建模表征;2)深度網絡通??梢詮谋O測大數據中提取深層次、多維度的退化特征,但以上方法通過指標篩選技術從多維度特征中選擇單個特征用于隨機退化建模,由此這類方法還存在第4節討論的所選單一特征難以表征設備健康狀態全貌、未考慮多變量耦合下剩余壽命分布求解等問題;3)通過深度網絡從大數據中提取的退化特征實際上是虛擬退化指標,物理意義不明確,由此導致這些退化指標所對應的失效閾值確定成為一個新的難題.
通過上述分析可見,若能綜合統計數據驅動方法在預測不確定性量化能力上的優勢與機器學習方法在大數據處理能力上的優勢,實現交互聯動、交叉融合、強強聯合,發展大數據環境下隨機退化設備剩余壽命預測新理論與新方法,有望為大數據時代設備剩余壽命預測與健康管理打造一把利器.然而,現有為數不多的綜合機器學習方法和統計數據驅動方法的剩余壽命預測研究中,基于監測數據的退化特征提取過程與所提取特征的隨機過程建模是孤立進行的,由此導致機器學習方法和統計數據驅動方法實際上是簡單的組合關系.此外,這些研究中提取退化特征的過程中主要關注了特征本身的特性(如單調性、趨勢性等),但如此提取的特征能否適應并匹配所采用的隨機過程模型并不能保證.因此,發展大數據下退化特征提取與隨機退化建模交互聯動的剩余壽命預測方法,將有助于形成大數據下剩余壽命預測研究的新模式.
根據第1 節大數據下剩余壽命預測問題面向的數據特點,可知如何有效融合隨機退化設備的多源傳感監測數據是實現這類設備剩余壽命精準預測的關鍵.針對多源傳感監測大數據融合下的剩余壽命預測問題,通過第4 節和第5 節的文獻介紹,可以發現Liu 等[133-137]在設備退化特征應當具有的單調性、趨勢性、失效時刻復合健康指標值方差最小等期望特性的要求下,通過構建適當的優化目標函數,提出了多傳感信號加權融合構建復合健康指標的方法,在此基礎上采用隨機系數回歸模型建模復合健康指標的演化軌跡以實現剩余壽命預測;彭開香等[139]將深度置信網絡應用于多源傳感監測數據融合構建退化特征,提取復合健康指標,然后通過隨機模型建模其演變過程實現剩余壽命預測.然而,以上研究均存在第5 節分析的將本身緊密相連的退化特征提取與隨機退化建模過程孤立進行而導致構建的退化特征和所采用的模型難以匹配的問題.因此,第5 節提出發展大數據下退化特征提取與隨機退化建模交互聯動的剩余壽命預測方法具有重要研究價值.
為了解決以上問題并佐證前面提出的通過交互聯動思想實現大數據下剩余壽命預測的可行性,本文以融合多源傳感監測數據的剩余壽命預測問題為例,提出一種針對完整監測大數據的隨機退化設備剩余壽命預測的新型解決思路,其基本思想是: 根據設備多源傳感監測數據,在數據層進行多源傳感器加權融合構建復合健康指標用于表征設備退化特征,然后采用隨機過程模型建模該復合健康指標時變演化趨勢,通過求解復合健康指標首達失效閾值的時間實現壽命預測,基于壽命預測值與設備實際壽命的偏差構建表征預測效果的優化目標函數,對多源傳感器融合系數和隨機退化建模中的參數進行反向優化調整,形成復合健康指標提取與隨機退化建模的反饋閉環,實現復合健康指標提取與隨機退化建模的交互聯動、交叉融合,達到復合健康指標與隨機模型自動匹配的目的,同時克服復合健康指標物理意義不明確進而導致其對應的失效閾值難以確定的問題.以上提出的新思路,簡稱為數模聯動,是指數據退化特征提取與所提取特征時變演化過程隨機建模的交互聯動、交叉融合,力求思路導向結果.主要實現方案及流程如圖3 所示.
通過圖3 可以看出,本文提出的數模聯動思路,通過形成復合健康指標提取過程與隨機退化建模過程的反饋閉環,使得復合健康指標提取與隨機退化建模交互聯動,這一思路與文獻[138-141]中退化特征提取與隨機退化建模過程孤立進行的思路顯著不同.此外,需要說明的是,圖3 所示的數模聯動方案與第2 節討論的機理模型與數據混合驅動的方案最大的不同在于其中的退化模型的來源.機理模型與數據混合驅動方案中的模型為設備退化失效的機理模型,但如前所述這類模型的獲取往往是困難的,而且機理模型的種類相當有限.相比之下,數模聯動方案中的模型指的是用于描述退化特征時變演化趨勢的隨機過程模型,在模型構建及選擇時可以融入退化失效的機理知識但又不完全受機理知識匱乏的束縛,而且根據第4 節的介紹可以看出剩余壽命預測領域對于隨機過程模型的研究高度重視,仍處于蓬勃發展階段,針對退化建模的各類隨機過程模型層出不窮,因此數模聯動方案應用于剩余壽命預測時更具靈活性,有助推廣應用于各類退化設備.

圖3 多源傳感器剩余壽命預測數模聯動解決方案與流程圖Fig.3 Idea and flowchart of data-model interactive remaining useful life prediction with multi-source sensors
下面針對多源傳感器監測下隨機退化設備剩余壽命預測問題,根據上述數模聯動原理,給出具體實現過程的一個示例,以說明其可行性和有效性.
令xi,j(t) 為第i(1≤i ≤N)個隨機退化設備第j(1≤j ≤S) 個傳感器在t(t ≥0)時刻采集到的性能退化監測數據,N為需要監測的隨機退化設備個數,假設對于同一個隨機退化設備共安裝有S個傳感器.根據多源傳感器數據,運用加權方法,融合多傳感器監測數據后的復合健康指標表示為

其中,wj表示第j個傳感器的融合系數,衡量了該傳感器在數據融合過程中所占比重.
假設第i(1≤i ≤N)個隨機退化設備對應監測時刻為ti={ti,0,ti,1,ti,2,···,ti,Ki},則復合健康指標對應的觀測數據為zi={zi,0,zi,1,zi,2,···,zi,Ki},其中,zi,k=Zi(ti,k),k=0,1,2,···,Ki,Ki為第i個隨機退化設備的監測數據個數.不失一般性,本文僅考慮隨機退化設備監測時間間隔為等間隔的情況,即 Δt=ti,k-ti,k-1.
為說明數模聯動的思路,這里以具有增長趨勢的退化特征為例,考慮線性Wiener 過程建模復合健康指標隨時間的演變過程,模型描述為

其中,zi,0為第i個設備在t0=0時刻的初始退化量,λi為漂移系數,反映了第i個設備的退化率,σi為第i個設備的擴散系數,刻畫退化過程的隨機不確定性,B(t)為反映退化過程時變隨機性的標準Brownian 運動.
基于以上建立的退化過程,通過首達時間的概念,設備的壽命可定義為

其中,v是融合多源傳感器的復合健康指標對應的失效閾值.
對于隨機退化過程(2)和首達時間壽命的定義(3),根據文獻[125]可知,壽命Yi服從逆高斯分布,其概率密度函數、數學期望和方差分別為

其中,

根據以上參數估計結果,第i(1≤i ≤N)個隨機退化設備壽命的預測值(點估計)可以表示為

其中,失效閾值v和融合系數wj仍然為待確定量,將由下述的數模聯動過程優化得到.
多源傳感器數據融合后構建的復合健康指標不具備實際的物理意義,且其構建過程和隨機過程建模及失效閾值的確定是孤立進行的,相互之間未形成聯動、融合機制,這是目前基于多源傳感器數據剩余壽命預測需重點解決的關鍵問題.為解決這一難題,本文基于前面圖3 所示的數模聯動思路,構建以最小化預測均方誤差為核心的優化目標函數,對多源數據融合系數和隨機退化建模中的失效閾值進行反向優化調整,形成融合多源數據復合健康指標構建與隨機退化建模的反饋閉環,達到復合健康指標構建與隨機退化過程模型自動匹配的目的.

對于式(11)的優化求解問題,對應地由式(10)給出的目標函數,現有較為成熟的各類優化方法均可應用.本文在案例驗證中將采用應用較為廣泛、具有較強靈活性的擬牛頓法進行多維搜索求解,具體通過MATLAB 中的 “fminunc”函數實現.通過上述優化求解過程,對多源數據融合系數和隨機退化建模中失效閾值進行迭代優化調整,實現退化特征提取與隨機退化建模的交互聯動、交叉融合,達到復合健康指標構建與隨機退化建模自動匹配的目的.基于以上數模聯動過程確定的復合健康指標融合系數和失效閾值,可以根據實際服役設備多源傳感器監測數據,構建其復合健康指標,然后采用隨機模型建模其演變過程,進而實現服役設備的剩余壽命預測.
為驗證上述數模聯動融合多源傳感器數據進行剩余壽命預測的思路,本文基于文獻[142]和文獻[143]提供的C-MAPSS 渦扇發動機退化數據集中的訓練數據集train_FD001 通過數模聯動過程確定復合健康指標融合系數和失效閾值,基于測試數據集test_FD001 驗證應用于個體服役設備剩余壽命預測時的效果,其中訓練數據集和測試數據集分別包括了100 個發動機的21 個傳感器監測數據,即N=100.
針對渦扇發動機退化數據集,可以發現部分傳感器的數據基本沒有變化,不具有時變的趨勢性特征,從數據趨勢建模的角度看這些傳感器數據的質量難以滿足可預測性要求.因此,在進行多源數據融合前一般先進行傳感器的選擇.為此,本文選取衡量退化數據趨勢性的皮爾遜相關系數作為表征數據質量的一個評價指標進行傳感器的篩選.具體地,令第i(1≤i ≤N) 個發動機對應監測時刻為ti={ti,0,ti,1,ti,2,···,ti,Ki},xi,j(t) 為第i(1≤i ≤N)個發動機的第j(1≤j ≤S) 個傳感器在t(t ≥0)時刻采集到的性能退化監測數據,Ki+1 為第i個發動機的監測數據個數,則第i個發動機的第j(1≤j ≤S)個傳感器監測數據對應的皮爾遜相關系數ri,j為

根據式(12),對train_FD001 數據集中每個發動機的各個傳感器數據對應的皮爾遜相關系數ri,j進行計算,然后取各個傳感器相關系數的平均值作為傳感器選擇的依據.本文根據計算的皮爾遜相關系數ri,j,選擇一致性較好且平均值較大的 2,3,4,7,11,12,15,17,20,21號傳感器數據,用于數模聯動的多源傳感數據融合復合健康指標構建,此時S=10.在此基礎上,本文對該訓練集中100 臺發動機的以上10 個傳感器監測數據做最大-最小歸一化處理和平滑去噪處理[144],然后應用本文提出的數模聯動方法,通過MATLAB 中的 “fminunc” 函數求解式(11),可以得到融合系數為{W*}={-0.0204,0.3 0 3 6 4,0.4451,-0.2238,0.0910,-0.1339,0.1283,0.1126,-0.0201,-0.1522},失效閾值為v*=0.7648.根據以上融合系數,可以利用train_FD001 數據集,融合該數據集中100 個發動機考慮 2,3,4,7,11,12,15,17,20,21 號傳感器數據的復合健康指標.然后,基于構建的復合健康指標和確定的失效閾值,利用如式(2)所示的線性Wiener 過程分別對測試數據集中100 個發動機的復合健康指標建模并預測剩余壽命,由此實現數模聯動的融合多源傳感器剩余壽命預測.
為了說明本文提出的數模聯動方案實現復合健康指標提取與隨機退化建模交互聯動后對于數據質量的改善情況及應用于剩余壽命預測時的效果,下面分兩個方面進行性能的對比.
1)數模聯動后數據質量改善效果
首先,基于皮爾遜相關系數對數模聯動優化后構建的復合健康指標與單一傳感器指標數據在趨勢性方面的效果進行對比.表1 給出了train_FD001數據集中100 個發動機的 2,3,4,7,11,12,15,17,20,21 號傳感器數據的平均皮爾遜相關系數值和數模聯動構建的復合健康指標的平均皮爾遜相關系數值.
由表1 中結果可以看出,數模聯動融合多源傳感監測得到的復合健康指標的皮爾遜相關系數平均值超過0.9,明顯高于單一傳感器對應的值,表明數模聯動構建的復合健康指標的時變趨勢性更好,在改善用于退化建模的復合健康指標數據的質量方面效果明顯.

表1 皮爾遜相關系數對比結果Table 1 Comparative results of Pearson correlation coefficients
進一步,考慮到數據集中的發動機具有相同的型號且都是設定在相同的工作條件下,因此用于退化建模的健康指標值在發動機失效時刻的分散程度應當盡可能小,以體現同類發動機在相同條件下質量的一致性.例如,文獻[133,137]中通過使復合健康指標在失效時刻取值的方差最小化來構建復合健康指標.鑒于此,本文將通過數模聯動構建的復合健康指標在發動機失效時刻取值的方差與以上研究中的結果和單一傳感器對應的結果進行對比,具體結果如表2 所示.

表2 失效時刻健康指標值的方差比較Table 2 Variance of health indices at failure time
根據表2 中的結果可知,本文數模聯動下構建的復合健康指標值在失效時刻對應的方差值遠小于單一傳感器和文獻[133,137]中構建的復合健康指標對應的方差值.值得一提的是,本文的數模聯動方法是以壽命預測的均方誤差最小為目標構建復合健康指標的,不同于已有文獻[133,137]中以復合健康指標在失效時刻取值方差最小化的出發點,但通過表2 的結果表明本文方法在改善失效時刻發動機復合健康指標數值的一致性方面也有較好的效果,這將為本文方法提升剩余壽命預測效果奠定基礎.
2)數模聯動剩余壽命預測效果對比
本節將數模聯動方法在剩余壽命預測的效果與基于單一傳感器數據的方法及前面文獻綜述中涉及的方法進行對比,以佐證基于多源監測大數據進行數模聯動剩余壽命預測的必要性和性能提升潛力.為此,本文采用針對該數據集的3 種剩余壽命預測領域常用的性能對比指標: 預測得分、準確性及均方誤差,其定義分別如下:
a) 預測得分(Score)

該指標值反映了剩余壽命預測誤差落在區間內的百分比,反映了預測的準確性,其值越大越好.
對于以上兩種評價指標,這里需要說明的是:在剩余壽命預測領域,C-MAPSS 航空發動機退化數據集已成為驗證剩余壽命預測方法的基準數據集,而該數據集最早用于IEEE PHM 2008 挑戰賽,挑戰賽主辦方為了評價各類預測方法在該數據集上的表現,給出了預測得分(13) 以及準確性指標(14)和(15).通過式(13)可以看出預測得分是非對稱的評價指標,且該指標值越小越好.采用非對稱指標的主要出發點在于: 考慮到提前預測(errori ≥0)產生的后果要小于滯后預測(errori <0)產生的后果,對于提前預測給予較小的懲罰而對于滯后預測給予更大的懲罰這是由于滯后的剩余壽命預測將使得設備運行失效而未能提前維護的風險更大,因此給予更大的指標值以示懲罰.在該指標中,-10 和13 這兩個數值就是用于反映這種非對稱性的,也是由IEEE PHM 2008 挑戰賽主辦方給出的.因此,預測誤差若能夠落在區間,則在一定程度上就能夠反映剩余壽命預測方法的準確性,這也就是準確性指標是統計預測誤差落在區間內的百分比的原因所在.在IEEE PHM 2008 挑戰賽后,預測得分和準確性指標被一直沿用于評價各種剩余壽命預測方法在C-MAPSS航空發動機退化數據集上的預測效果,-10 和13 這兩個數值也被領域內廣泛采納.因此,本文為了和現有的各類方法進行對比,也使用了這兩個指標.
c) 均方誤差(Mean squared error,MSE)

該指標值反映了預測誤差平方的平均值,其值越小越好.
基于以上預測性能指標,本文將提出的數模聯動剩余壽命預測方法與基于單一傳感器數據的方法及前面文獻綜述中涉及的一些典型的基于機器學習的方法和混合方法進行對比.具體地,用于對比的方法包括: 支持向量回歸方法[65]、基于案例的學習方法[71]、基于案例的推理方法[72]、多目標深度置信網絡集成方法[86]、卷積神經網絡[92]、循環神經網絡[96]、限玻爾茲曼機+LSTM 網絡[104]、基于長短時網絡的編碼-解碼器[106]、循環神經網絡+自編碼器[107]、基于多損失編碼器與卷積復合特征的兩階段深度學習方法[108]、深度置信網絡+后向傳播神經網絡+改進粒子濾波算法[140]、深度置信網絡+改進粒子濾波算法[140]以及基于線性Wiener 過程隨機建模單一傳感器監測數據的剩余壽命預測方法.表3 給出了各類方法在預測得分、準確性、均方誤差等性能指標上的對比結果.這里需要說明的是,為了更客觀地反映對比效果,表3 中采用了對比文獻中各類方法得到的預測得分、準確性及均方誤差的最好效果(眾所周知,機器學習類方法的預測結果對模型參數的設置具有較大依賴),其中 “—”表示對比文獻中沒有計算并給出這一指標值.
通過表3 中的結果可以發現,相比各類基于機器學習的剩余壽命預測方法、機器學習與統計數據驅動相結合的剩余壽命預測方法、基于線性Wiener 過程隨機建模單一傳感器監測數據的剩余壽命預測方法在該發動機數據集上的表現,本文提出的數模聯動多源傳感監測數據融合剩余壽命預測方法在預測得分、準確性、均方誤差等性能指標上均保持明顯的優勢.以上驗證結果表明,構建以最小化預測均方誤差為核心的優化目標函數,對多源數據融合系數和隨機退化建模中的失效閾值進行反向優化調整,形成多源傳感數據復合健康指標構建與隨機退化建模的反饋閉環,將很大程度上實現復合健康指標構建與隨機退化過程模型自動匹配的目標,進而提升剩余壽命預測性能,有助于思路導向結果.此外,表3 的對比結果反映出通過數模聯動實現退化特征提取與隨機退化建模交互聯動的思路在應用于剩余壽命預測時,預測性能好于典型的基于機器學習的方法,甚至也好于一些最新提出的基于深度學習的方法,進而顯示出數模聯動思路在大數據背景下剩余壽命預測中具有很好的應用潛力.這里需要說明的是,以上案例中所采用的隨機過程模型僅僅是最基本的線性Wiener 過程模型,從式(8)可以看出,由于該過程的獨立增量特性和馬氏性,漂移系數估計結果中僅僅利用了初始時刻和最后監測時刻的數據,忽視了中間演變過程的數據,勢必會影響建模及預測性能.因此,采用更為先進的模型參數估計方法(如Bayesian 方法、自適應濾波方法等)將有望進一步優化數模聯動下剩余壽命預測的效果.此外,實現數模聯動的關鍵在于構建反映預測性能的目標函數J(W,v),然而以上案例中J(W,v)僅僅考慮了剩余壽命預測的點估計,未考慮反映預測不確定性的剩余壽命預測的方差,因此通過預測誤差和表征預測不確定性的量構建以預測不確定性為核心的優化目標函數將是值得深入研究的問題.以上兩種思路將使得目標函數J(W,v)的復雜性顯著增加,因此進一步研究相應的優化求解技術也很有必要.

表3 剩余壽命預測性能比較Table 3 Comparative results in the performance of the remaining useful life prediction
綜上,數模聯動融合多源傳感器監測數據的發動機剩余壽命預測應用案例結果雖然初步驗證了本文提出的數模聯動思路的可行性和有效性,但發展先進實用的數模聯動剩余壽命預測技術,特別是如何將數模聯動的思路推廣用于解決大數據背景下隨機退化設備的剩余壽命預測問題,任重道遠.
大數據環境下隨機退化設備的剩余壽命智能預測是工程需求驅動的前沿研究方向,然而通過前面的文獻分析可以發現已有理論與方法在解決大數據下剩余壽命預測問題時捉襟見肘,主要表現為: 1)基于機器學習的剩余壽命預測在大數據深層次特征自動提取、復雜結構數據擬合、非線性映射等方面具有強大處理能力,但用于剩余壽命預測時難以得到其概率分布并量化預測不確定性;2)統計數據驅動方法以概率統計理論為基礎,在量化剩余壽命預測不確定性上具有天然的優勢,但更多處理的是完整監測數據且需要一定趨勢性的退化特征以實現參數化建模,在應對多源信號差異大、采樣策略形式多、數據價值密度低、數據質量參差不齊等特點的監測大數據,特別是 “碎片化、分段的、稀疏的”監測大數據時明顯力不從心;3)機器學習方法與統計數據驅動方法相結合的剩余壽命預測研究既能處理大數據又能得到剩余壽命的概率分布,但兩者未能實現交互聯動、交叉融合、自動匹配,存在特征提取與隨機建模孤立進行、退化特征失效閾值難確定、多維化深度特征下剩余壽命分布難求解等問題,與大數據下剩余壽命預測的需求還不相適應.
針對以上研究挑戰,第6 節以多源傳感監測大數據下剩余壽命預測問題為例,提出了一種數模聯動的完整監測數據下隨機退化設備剩余壽命預測問題解決思路,并通過航空發動機多源監測數據初步驗證了該思路的可行性和有效性.借鑒所提出的數模聯動思路,綜合考慮機器學習方法和統計數據驅動方法的優勢,緊緊扭住剩余壽命預測不確定性量化問題,大數據背景下隨機退化設備的剩余壽命預測主要存在以下亟待解決的關鍵科學問題.
針對以深度學習為代表的機器學習方法在監測大數據深層次特征自動提取、復雜結構數據擬合、非線性映射等方面具有強大的處理能力但很難得到體現剩余壽命預測不確定性的概率分布,而統計數據驅動的方法針對完整監測數據雖能得到剩余壽命的概率分布但對大數據處理能力非常有限的問題,可以借鑒第6 節針對多源傳感監測數據提出的數模聯動思路,發展深度學習與隨機退化過程建模交互聯動的剩余壽命預測技術,通過深度學習網絡提取大數據下設備退化特征,運用隨機過程模型對其表征并預測壽命,構建以最小化預測不確定性為核心的優化目標函數,實現深度網絡特征提取與隨機退化建模的交互聯動、交叉融合,達到深度特征提取與隨機退化模型自動匹配、失效閾值優化確定的目的.通過這一思路,使得深度退化特征的提取直接服務于隨機退化建模和剩余壽命預測,有助于保證思路導向最終的結果——提升剩余壽命預測性能.在此過程中,如何通過深度學習網絡從大數據中提取反映設備退化的復合特征指標、如何構建面向預測不確定性最小化的優化目標函數、如何利用目標函數反向優化調整網絡參數和模型參數形成復合特征指標提取與隨機退化建模的反饋閉環等都是需要解決的關鍵問題.
在工程實際中,設備受運行工況、環境、負載等復雜因素相互影響,表征設備健康狀態的性能退化特征往往并不唯一且相互關聯.現有多變量下隨機退化設備剩余壽命預測問題的研究基本都是試圖通過轉換為單變量情況再來處理,未充分考慮多性能退化變量相互耦合、相互影響的問題.因此,在深度學習與隨機退化建模交互聯動思路啟發下,通過深度學習網絡提取大數據中多維度深層次退化特征,構建多變量下的設備性能退化過程模型,研究多變量耦合下隨機模型參數估計及壽命分布求解問題,實現深度網絡特征提取與隨機退化建模的交互聯動,達到多維深度特征與隨機退化模型的自動匹配、失效閾值的優化確定,對于大數據下復雜退化設備的剩余壽命預測具有重要意義.在此過程中,如何通過深度學習網絡從大數據中提取反映設備退化的多維度深層次退化特征、如何考慮多維特征耦合關系的前提下建模其演變趨勢、如何求解多變量耦合下設備的剩余壽命分布等問題極具挑戰性,有待深入系統的研究.
數據是開展數據驅動剩余壽命預測研究的基礎,數據質量很大程度決定了剩余壽命預測的準確性和魯棒性.然而,隨機退化設備的監測大數據往往呈現非理想的狀態,具體表現為大而非平衡、局部缺失、不完備等特點,如圖2 所示的 “碎片化、分段的、稀疏的”非完整監測大數據.據統計公開發表的NASA 數據集中,正常工況的數據達95%,而異常極端環境數據只有5%[145],美國馬里蘭大學先進壽命周期中心(Center for advanced life cycle engineering,CALCE)公布的數據集中的情況與此類似[146].可見,實際設備的非理想監測大數據在工程中客觀存在,數據的非理想將導致基于這些數據建立的剩余壽命預測模型泛化能力不足,局限于某一特定條件.
針對非理想數據中的非平衡、局部缺失等數據,如果能利用先進的數據增強技術或能夠將其他工況、環境下的數據遷移到待研究的問題中,將有望改善數據質量從而提升剩余壽命預測的效果.例如,針對數據缺失問題,可以通過生成對抗網絡利用有限的數據訓練生成網絡和判別網絡以增強與擴充數據.當前生成對抗網絡在處理缺失數據的問題中應用較多,但這些研究更多地追求生成的數據與真實數據之間的接近程度,如果能夠應用前面提出的數模聯動的思想,在構建生成對抗網絡目標函數時考慮生成數據改善剩余壽命預測性能方面的效果,將數據擴充后剩余壽命預測效果改善情況用于指導數據生成,有望為缺失數據下剩余壽命預測問題的研究打開新的思路;針對不同工況下非平衡數據的問題,遷移學習技術將是有效的解決途徑,通過挖掘源域和目標域的數據共性,將不同工況下的數據可以轉換到特定工況下,以實現不同工況下非平衡數據的增強與擴充.類似地,如果在數據遷移實現數據擴充時能關注擴充后的數據在剩余壽命預測應用時的效果,將能夠更好地實現數據的擴充直接服務于最終剩余壽命預測應用的目標,避免兩者脫節導致數據與最終效果不匹配的問題.
此外,針對圖2 所示的具有數據價值密度低、數據質量參差不齊等特點的 “碎片化、分段的、稀疏的” 非完備監測大數據,以深度學習為代表的新一代機器學習方法,在大數據深層次特征提取、復雜結構數據擬合、非線性映射等方面具有強大的處理能力,為建立 “碎片化、分段的、稀疏的” 監測大數據與剩余壽命之間的映射關系提供了新的可能,但在建立映射關系的同時如何量化預測不確定性仍是當前面臨的主要挑戰.為此,針對非完整監測大數據,可考慮直接通過深度學習網絡建立 “碎片化、分段的、稀疏的” 非完整監測大數據與包含壽命信息的標簽信息及其預測不確定性的映射機制,在網絡構建過程中將網絡參數隨機化,表示為隨機變量,由此構建概率深度網絡,網路結構形式可以是卷積神經網絡、循環神經網絡、LSTM 等,然后運用Bayesian 方法估計網絡參數的后驗分布,使得網絡輸出具有隨機性以達到獲取概率分布的目標.最近,一些學者開始了這方面的有益嘗試[147-148],但這些僅有的研究中需要充分的壽命數據作為標簽數據,在實際工程中當面對截尾數據時,由于缺乏壽命信息,這類方法的適用性受到一定限制.因此,如何在壽命標簽信息匱乏條件下,通過概率深度網絡擬合監測數據趨勢并滾動預測,由此發展面向非完整監測大數據的剩余壽命預測方法仍有待突破.此外,在概率深度網絡中,由于參數的隨機變量化處理,導致網絡參數的Bayesian 估計涉及高維積分的求解問題,直接求解難度很大.因此,發展面向概率深度網絡參數Bayesian 估計的高效近似求解技術,對于攻克非完整監測大數據下剩余壽命預測難題具有重要意義,值得深入研究.
綜上,非理想數據的問題在大數據下隨機退化設備剩余壽命預測研究中普遍存在,本文針對幾類典型的非理想數據,探討了可能的研究思路,但需要說明的是,剩余壽命預測領域對這一問題的關注程度還不夠,目前針對性的處理方法還比較有限.可以預見的是,隨著大數據下隨機退化設備剩余壽命預測迫切需求的驅動和相關研究的深入,非理想大數據下的剩余壽命預測問題將逐漸成為新的研究熱點.
本文面向大數據背景下隨機退化設備剩余壽命預測的現實需求,深入分析了機理模型與數據混合驅動的剩余壽命預測技術、基于機器學習的剩余壽命預測技術、統計數據驅動的剩余壽命預測技術以及機器學習和統計數據驅動相結合的剩余壽命預測技術的基本研究思想和發展動態.在此基礎上,結合隨機退化設備監測大數據的特點以及剩余壽命預測不確定性量化問題,全面剖析了當前研究存在的局限性和共性難題.針對這些問題,本文以多源傳感監測大數據下剩余壽命預測問題為例,提出了一種大數據下數模聯動的隨機退化設備剩余壽命預測問題解決思路,通過構建以最小化壽命預測均方誤差為核心的優化目標函數,對多源數據融合系數和隨機退化建模中的失效閾值進行反向優化調整,達到復合健康指標構建與隨機退化過程模型自動匹配的目的,并通過航空發動機多源監測數據初步驗證了該思路的可行性和有效性.最后,借鑒數模聯動思路,本文提出了大數據背景下深度學習與隨機退化建模交互聯動、監測大數據與剩余壽命及其預測不確定性映射機制、非理想大數據下的剩余壽命預測等亟待解決的關鍵科學問題,并探討了解決思路.