李杰其 ,胡良兵
1.中國科學院 合肥物質科學研究院 等離子體物理研究所,合肥 230031
2.中國科學技術大學,合肥 230026
在工業中,設備維護是很重要的環節,直接影響到設備的運行時間和設備的工作效率。然而,設備剩余壽命需要被準確預測,故障需要被及時識別和處理,才能避免在生產過程中停機。根據文獻[1]所述,可將維護策略分為如下三類。
(1)故障維護:一種簡單的維護策略,設備發生故障時停止生產并更換零件。單一零件的突然失效會導致相關零件的故障率上升,增加生產成本。
(2)預防性維護:一種定期執行的維護策略,通過計劃時間表或生產經驗,以預測過程、設備故障。但是由于可能會采取不必要的維護措施,導致成本增加。
(3)預測性維護:使用預測工具對設備的剩余壽命進行預測,這種方法要求對機器狀態或運行過程進行持續監控,需要歷史數據處理(例如機器學習技術)、完整性因素分析(例如視覺方面、磨損、不同于原始顏色等)、統計推斷方法和工程方法的推理,所以這種方法可以預測設備早期的故障并提供解決方案。
每種維護方式各有特色,選擇故障維護策略會使得維護行為具有滯后性,設備發生風險性很高;選擇預防性維護策略,這種預見性維護的干預會導致設備的使用時間下降。高效的維護策略可以改善設備的狀況,降低設備故障率,降低維護成本,同時延長設備壽命。預測性維護是通過對設備狀態實施周期性監視、預測剩余壽命、評價設備狀況和產生相應邏輯的一套技術。傳統的預測性維護方法主要是基于物理模型,基本思想是基于物理性質的固定的物理公式去擬合設備、零部件的健康狀態或壽命。這種方法要求研究人員有很深的工程物理背景知識,通常采用復雜的物理公式,借助于過多的物理模型而忽略了數據本身的規律,預測準確度較低。
目前,伴隨著5G 技術的工業4.0 時代到來,工業系統可以采集大量的數據,包括工業生產線的運行過程、發生的事件和報警信息等。預測性維護系統可對設備數據進行系統分析和處理,建立和訓練預測模型,制定維護策略并及時調整,可以有效地降低維修成本、減少機器故障、減少維修停機、減少備件庫存、增加備件壽命、增加產量、提高操作員的安全性、提升維修驗證可靠性、提升整體利潤等。人工智能中的機器學習已經成為許多應用中開發智能預測算法的有力工具。
機器學習,通過自主學習大量數據中存在的規律,獲得新經驗和知識從而提高計算機智能,使得計算機擁有類似人類的決策能力。基于學習形式的不同通常可將機器學習算法分為監督學習、無監督學習以及強化學習三類。
(1)監督學習:給學習算法提供標記的數據和所需的輸出,對于每一個輸入,學習者都被提供了一個回應的目標。監督學習被用于解決分類和回歸的問題。常見的算法有:決策樹、人工神經網絡算法、支持向量機、樸素貝葉斯、隨機森林等。
(2)無監督學習:給學習算法提供的數據是未標記的,并且要求算法識別輸入數據中的模式,主要是建立一個模型,對輸入的數據進行解釋,并用于下次輸入。主要用于解決聚類和降維問題,常見的算法有:聚類算法、降維算法。
(3)強化學習:該算法與動態環境相互作用,把環境的反饋作為輸入,通過學習選擇能達到其目標的最優動作。強化學習這一方法背后的數學原理與監督、非監督學習略有差異。監督、非監督學習更多地應用了統計學,而強化學習更多地結合了離散數學、隨機過程這些數學方法[2]。常見的算法有:馬爾可夫決策過程等。
作為人工智能的核心,機器學習的主要功能是使得計算機模擬或實現人類的學習行為,通過獲取新的信息,不斷對模型進行訓練以提高模型的泛化能力[3]。由于機器學習具有強大的數據處理能力,該方法廣泛應用于數據挖掘、語音識別、計算機視覺、故障診斷與壽命預測等領域。基于機器學習的剩余壽命預測方法是預測性維護方法的一個重要分支,能夠較為準確地對剩余壽命進行預測,成為維護策略評估的重要指標。
建立用于預測性維護應用的機器學習模型包括以下幾個步驟:歷史數據選擇;數據預處理;模型選擇、模型訓練和模型驗證;模型維護[4]。歷史數據選擇,即收集和存儲設備運行過程中產生的數據集,以便為機器學習模型設計選擇有價值的數據,其目的是獲取與系統狀況相關的信息[5]。通過數據預處理步驟,對數據進行處理和分析收集的數據,可以使系統更好地解釋數據。數據預處理步驟包括數據轉換(標準化)、數據清理(缺失數據處理和異常值去除)和數據縮減(維度縮減和數量縮減),以保證數據能夠被機器學習模型有效地處理。模型的開發步驟包括:選擇模型、訓練模型、驗證模型。模型維護可以隨著時間的推移保持模型性能,因為工業生產可能會隨著時間的推移而發生變化,導致模型性能下降。
機器學習算法在壽命預測中應用最多是基于神經網絡、支持向量機、聚類算法和隨機森林,并在這些算法的基礎上靈活運用其他算法或模型進行優化改進,從而提高壽命預測的精度。
人工神經網絡是受生物神經元啟發的智能計算技術[6],是一種模仿動物神經網絡行為特征,進行分布式并行信息處理的算法數學模型。這種網絡依靠系統的復雜程度,通過調整內部大量節點之間相互連接的關系,從而達到處理信息的目的,具有自動學習和總結的能力。其主要包含輸入層、隱含層及輸出層,常用于解決分類、回歸等問題。人工神經網絡模型以原始測量數據或基于原始測量數據所提取的特征為輸入,通過一定的訓練算法不斷調整網絡的結構和參數,利用優化后的網絡在線預測設備的剩余壽命,并根據預測結果判斷設備的維護策略。
Biswal等人[7]采用人工神經網絡提出一種用于模擬風力渦輪機的模型,該模型能夠模擬風力渦輪機關鍵部件的故障工況,也可以用缺陷的部件替換健康的部件,從而收集健康和故障工況下的渦輪機的振動數據,再通過人工神經網絡模型預測,對設備健康狀態進行預測識并別決定維護策略,實驗結果準確性為92.6%。Gebraeel 等人[8]基于BP 神經網絡建立單個軸承和批量軸承的壽命預測模型,利用壽命周期內的振動監測信息,以一定權重融合各軸承指數回歸模型參數,同時進行參數在線更新,有效保證壽命預測的準確性。Bezazi等人[9]采用基于多層感知器的人工神經網絡對復合材料結構監測數據進行建模,通過極大似然估計和貝葉斯推理對神經網絡模型進行訓練,結果表明該模型具有較好的泛化能力。Wang 等人[10]提出一種極限學習機模型,避免隱含層神經元的數目選擇問題,實現了非平穩序列的在線預測。Kolokas等人[11]使用運行期間的過程傳感器數據,實時檢測某工業陽極生產設備的實時故障,并將人工神經網絡與其他機器學習進行了比較。Sheng等人[12]針對齒輪壽命預測問題,提出一種基于權值放大的長短時記憶神經網絡,并加入一種將隱含層的輸入權值和遞歸權值進行不同程度放大的注意機制,結果表明預測方法具有更高的精度。更多基于人工神經網絡的預測性維護研究的最新論文見表1。
基于人工神經網絡的預測性維護技術的主要優勢包括:訓練模型基于歷史數據,不需要專家知識決策;人工神經網絡的穩定性較強,數據的少量波動不會影響模型。
然而,人工神經網絡有一些缺點:訓練模型有概率獲得有悖于維護策略的結論;為獲得最合適的人工神經網絡模型,可能會花費很多時間;人工神經網絡是一種“黑箱”算法,無法對神經網絡模型輸出的預測結果進行解釋;人工神經網絡需要大量的數據集才能正確學習。
支持向量機是執行分類和回歸任務的另一種廣泛使用的機器學習方法,具有高精度[19]。它是一類按監督學習方式對數據進行二元分類的廣義線性分類器,其決策邊界是對學習樣本求解的最大邊距超平面,具有稀疏性和穩健性。支持向量機可以通過核方法進行非線性分類,是常見的核學習方法之一。支持向量機根據用途可分為支持向量回歸機SVR和支持向量分類機SVC。
Susto 等人[20]提出基于支持向量機的多類分類器,可以識別由于累積效應和違規使用而在機器上發生的故障。Nieto等人[21]提出一種基于混合粒子群優化算法和支持向量機算法的模型,用于預測航天器發動機的工況,解決了支持向量機訓練過程中超參數的優化問題,提高了設備工況預測精度。Maior等人[22]提出一種將經驗模態分解與支持向量機相結合的方法,可以實現退化數據分析和剩余壽命預測,結果表明該方法能夠改善電動機的剩余壽命預測性能。Mathew等人[23]使用改進回歸核的支持回歸向量的支持向量機來預測剩余壽命,通過一組模擬時間序列對算法進行測試,其結果表明所提出的支持向量回歸模型優于標準支持向量回歸模型。Song等人[24]采用支持向量機對電池容量進行預測,利用卡爾曼濾波對輸出信號進行優化,該方法減少了系統噪聲和測量不確定性因素的影響,實現了對電池剩余壽命的長期預測。Lasisi 等人[25]比較了支持向量機、隨機森林和三層貝葉斯概率模型來檢測鐵路軌道的缺陷。戴邵武等人[26]提出基于時域特征和支持向量機的滾動軸承退化趨勢預測方法,準確地預測了滾動軸承全壽命故障周期。王瀛洲等人[27]提出一種基于蟻獅優化和支持向量回歸的方法,利用蟻獅優化算法優化核參數,有效提高鋰離子電池剩余使用壽命預測的準確性和魯棒性。Liu等人[28]利用支持向量機建立了橡膠材料疲勞壽命預測模型,提出一種重力搜索算法來優化支持向量機的參數,提升了預測精度和預測效率。更多基于支持向量機的預測性維護研究的最新論文見表2。
支持向量機算法的優勢在于:學習過程簡單、訓練速度快;在預測性維護中可以解決設備工況識別問題,簡單分類問題處理較為精確;在參數優化方面可以結合先進的算法進行優化,提高分類準確率。
但支持向量機也存在一些問題:選擇合適的核函數較為困難;在進行大規模數據訓練時間時間較長;最終模型不容易理解和解釋;將實際應用與仿真模型相適應比較困難[34];無法解決多分類問題;理論上只能提供次優解。
聚類是一種無監督的學習算法,可以對大量未知標注的數據集,按數據的內在相似性將數據集劃分為多個類別,主要目的是找到數據集的聚類,以便彼此接近的樣本與同一個聚類相關聯,而彼此遠離的樣本與不同的聚類相關聯[29]。傳統的聚類算法可以分為五類:基于劃分的聚類、基于網格的聚類、基于層次的聚類、基于密度的聚類、基于模型的聚類。近年來產生了多種新的聚類算法:基于粒度的聚類算法、基于熵的聚類算法、不確定聚類算法、譜聚類算法、核聚類算法等[35]。

表1 人工神經網絡在預測性維護中的最新應用

表2 支持向量機在預測性維護中的最新應用
Durbhaka 等人[36]通過對振動信號使用聚類來分析風力渦輪機的工況,預測渦輪機的工況并對故障類型進行分類,通過對零部件的替換和校正,進而避免突然故障,通過加入CRA方法,使得聚類算法預測準確性達到93%。Eke等人[37]提出聚類算法可以用于自動提取變壓器絕緣油中溶解氣體數據中的簇,識別導致故障的每個集群的特征,使用聚類算法識別出四個聚類:高能電弧放電、油溫變化、生成氣體速率、油液循環周期,結果表明該模型可以較好預測設備工況。Mathew等人[38]比較多種機器學習(聚類算法、支持向量機等)來預測渦輪風扇發動機的故障,并給出各種方法的優缺點。Uhlmann等人[39]提出一種聚類算法來識別機床數據(平臺溫度、處理室中氧氣百分比和處理室壓力)的簇,識別數據中的四個聚類:操作條件、氣體保護系統的故障條件、壓力系統的故障條件以及使機床保持待機狀態的故障條件。Amruthnath等人[40]比較大量聚類算法,用于從排氣風扇的振動數據中進行故障預測,獲得較為準確的結果。張旺等人[41]提出了首先對雙通道信號分別進行Hilbert 包絡解調去除噪聲,對處理后的信號進行全矢融合提取主振矢,再采用聚類方法對主振矢信號進行分析,解決了軸承突發故障特征并不明顯的問題,其預測精度達到90.64%。李媛媛等人[42]提出采用模糊C均值算法,并以待測狀態隸屬于正常狀態的程度作為性能評判指標的方法,解決了轉盤軸承剩余壽命預測過程中的提取能夠反映轉盤軸承壽命狀態的特征向量和建立合理的預測模型問題,為轉盤軸承的故障診斷和剩余壽命預測的研究提供了一種新思路。更多基于聚類算法的預測性維護研究的最新論文見表3。
聚類算法可以通過新樣本再訓練來改變簇的中心,在處理大數據集上表現出良好的性能;聚類問題的研究趨勢將會向更快、更有理論保證的方向發展,隨著新的分析技術的發展,新的理論結果依然在不斷出現,有良好的發展前景[47]。
但其也存在一些問題:訓練數據中的噪聲會對最終結果造成重大影響;無法自動確定簇的數量;數據輸入順序對最終結果有影響;無法處理可分離非線性數據集;初始點選取會極大地影響聚類的結果。
隨機森林法最初是由Leo[48]提出的。隨機森林在以決策樹為基學習器構建bagging 集成的基礎上,進一步在決策樹的訓練過程中引入了隨機屬性選擇進行預測。它用隨機的方式建立一個森林,森林由許多決策樹組成,每一棵決策樹之間沒有關聯,利用多棵樹對樣本進行訓練并預測。當變量的數量大于樣本的數量時,隨機森林表現出良好的性能[49]。決策樹算法有ID3、C4.5、CRAT、SLIQ等。

表3 聚類算法在預測性維護中的最新應用
隨機森林被用于生成動態預測模型。Kusiak 等人[50]使用狀態數據和運行數據來設計隨機森林模型,為風力渦輪機工況監測提出了改進方案。Santos等人[51]提出隨機森林來預測鼠籠式感應電動機的定子繞組短路故障。Su等人[52]的研究提出一種硬盤故障檢測系統,用于實時預測故障硬盤和驅動器故障,其系統過程包括兩個階段:批量訓練,其中使用歷史數據生成和訓練隨機森林模型;實時預測,它使用從終端用戶設備收集的數據來進行預測。實時預測的準確性達到85%。Kulkarni等人[53]應用隨機森林模型來預測制冷和冷藏系統故障,其方法正確性能夠達到89%。Paolanti等人[54]提出一個利用來自各種傳感器、可編程邏輯控制器和通信協議的數據來預測設備工況的隨機森林模型,雖然決策樹可能會過度擬合,但在大多數情況下可以避免,因為決策樹可以處理隨機特征子集并從這些子集構建更小的樹[48-49,55]。更多基于隨機森林的預測性維護研究的最新論文見表4。
隨機森林的優勢在于:隨機森林是一類判別模型,支持分類問題、回歸問題和多分類問題;隨機森林結合其他算法,得到更優的預測結果,可以將新的理論引入隨機森林,結合不同的算法提升模型預測的性能[60];決策樹越多,可以提供越多的觀察結果作為預測的依據[38];在某些情況下,決策樹可以減少波動,增強隨機森林模型泛化能力[61]。
隨機森林方法也有缺點:少量的決策樹的分類能力有限,只有產生大量的決策樹才有可能得到有效的分類效果[60],與其他機器學習相比需要更多的計算時間;不能很好地處理非平衡數據,隨機選取的訓練集加劇了數據的非平衡性;對連續性變量的處理需要進行離散化,分析計算節點分裂標準花費大量時間;通過剪枝的方法避免決策樹的過擬合問題會提高算法的復雜性,性能提升有局限性[62]。
預測性維護是工業大數據和人工智能方向的一個重要的應用場景,針對設備的故障和失效問題,從被動的故障維護到主動的預測和綜合規劃管理,研究人員不斷提供新思路和新方法。
應用預測性維護的設備或系統,其產生的故障是由于漸進式的功能衰退超過臨界值導致的。對設備進行性能退化評估和剩余壽命預測具有很好的前景,其預測模型具有較高的準確率,是預測性維護策略決策的可靠依據。本文提出一種面向本地設備的預測性維護系統架構(如圖1所示),為后續研究提供思路。

圖1 面向本地設備的預測性維護系統框架
本系統架構主要是基于對設備運行時產生的大量歷史、實時數據進行收集、處理、分析、建模來實現的,對模型預測的設備剩余壽命進行分級,通過模擬仿真構造專家策略庫,根據分級對應的策略對設備進行維護,它所遵循的預測性運維流程主要包括以下步驟。
(1)數據獲取:通過模擬仿真和傳感器測量獲得目標設備或系統的全壽命數據。

表4 隨機森林在預測性維護中的最新應用
(2)數據處理:包括數據預處理和特征提取,對數據進行過濾和整理,識別數據中工況信息,剔除非重要變量,通過特征提取的方法得到衰退特征,供模型訓練使用。
(3)模型訓練:選擇適當機器學習模型,利用經處理后的全壽命數據進行訓練,獲得在不同工況下可以對設備或系統剩余壽命進行準確預測的模型。
(4)工況檢測:通過傳感器收集當前設備或系統數據,并通過模型提供的工況識別庫判斷設備或系統是否失效,并作出反饋。
(5)壽命預測:在設備或系統未失效情況下,用預測模型對其剩余壽命進行預測,并作出反饋。
(6)策略制定:根據系統故障預測的仿真,可以驗證維護和維修策略的可行性,并將論證結果導入專家策略庫中作為方案。
(7)策略執行:當系統失效時,根據工況識別庫的反饋信息進行故障診斷,決定設備或系統的維修策略;當系統未失效時,根據剩余壽命預測結果進行故障預測,決定設備或系統的維護和保養策略。
此外,根據實際情況還可以加入剩余壽命可視化、數據存儲再訓練、數據檢查等步驟。
由于預測性維護面向不同的目標設備時,選取的預測模型不唯一,故對模型選擇提出了比較高的要求。機器學習,包括人工神經網絡、支持向量機、聚類算法和隨機森林等,已經成功地應用于預測性維護應用中。隨著工業設備維護要求的不斷提高,預測模型也需要不斷發展出新的理論和方法來適應日趨復雜的生產環境。
(1)將新的理論引入機器學習算法。以隨機森林為例,由于隨機森林算法本身就是Bagging算法與Random Subaspace 算法結合而得到的新的算法,因此在隨機森林的基礎上再增加新的算法一直是許多專家學者研究的重點[60]。新算法與預測性維護技術進行正確結合,可以提升預測準確性。
(2)將新的數據預處理方法與機器學習算法結合。訓練數據集的質量決定了模型訓練的準確度,因此將數據進行有效數據處理之后進行模型訓練,將提高模型的質量。同時,機器學習模型訓練需要大量的訓練數據,而實際中獲得的小樣本數據的情況居多,因此如何利用機器學習算法對小樣本數據的設備進行壽命預測與故障診斷也是需要攻堅的一個難點[2]。
由于5G技術和工業4.0時代的到來,面對大規模生產的工業設備,通過工業物聯網將設備的工況數據上傳至服務器,生產廠家可以將獲得的大量設備數據進行分析處理、訓練建模、制定維護策略、實時更新、專家會診,進而優化服務。基于物聯網技術的預測性維護策略相比于面向本地設備的預測性維護策略不同,其效率更高、適配性更強、準確率更高。本文提出一種基于物聯網技術的預測性維護系統架構(如圖2所示),為后續研究提供思路。

圖2 基于物聯網技術的預測性維護系統框架
本系統架構主要是基于物聯網技術,通過對設備維護策略分別提供線上線下服務,現場收集設備數據和控制數據,經過現場決策系統判斷和反饋,并上傳數據至集團大數據平臺進行智能分析和數據挖掘,最新成果下載至現場決策系統并應用于之后的預測性維護策略。它所遵循的預測性運維流程主要包括以下步驟。
(1)信息感知:通過各類傳感器收集現場設備數據,由無線終端上傳至數據采集系統,同時上傳控制器等設備數據,經數據整理后進入現場決策系統。通過為設備開發傳感技術,提高數據數量和質量,當有更多高質量訓練數據可用時,預測性維護策略將更具可靠性[63]。
(2)現場決策:邊緣計算網關主要完成感知信息處理、在線診斷分析和實時反饋控制三個方面的工作[64]。感知信息處理和前文中數據處理相同,為設備狀態數據分析和挖掘提供數據基礎;在線診斷分析通過不同工況下的預測模型,對設備運行數據的實時分析和狀態的在線識別;實時反饋控制,根據狀態判斷結果,通過本地專家策略庫,自動生成相應控制邏輯。
(3)智能分析:現場設備數據、決策數據和維護結果等通過網絡上傳至設備生產集團的大數據平臺進行智能分析和數據挖掘,產生新的預測模型和維護策略,通過網絡下載至現場決策系統進行更新。智能分析系統還可根據數據反饋調整設備運行參數,以達到增加設備壽命、提升生產效率、提升生產安全性等目的。集團大數據平臺利用智能分析解決的問題和解決方案如表5所示。
物聯網技術為預測性維護策略提供了高效的解決方案,同時也提出了更高的要求,需要相關技術的不斷革新。目標系統越復雜,現場采集的信息越多,傳輸效率越低,而復雜的數據也考驗現場設備的計算力。5G技術的出現,為數據傳輸問題提供了解決方案,同時也為現場決策系統提升計算能力提供了更多選擇,但由于5G 技術與工業生產結合經驗較少,還需專家學者進一步研究。

表5 問題與解決方案
預測性維護技術作為工業生產領域的一個重要研究方向,近年來受到了越來越多的關注。鑒于機器學習領域不斷進行創新,本文系統地介紹了基于機器學習的預測性維護技術相關研究現狀,從機器學習算法入手,重點介紹了四種常見的算法,分析了面向特定設備的剩余壽命預測方法和特性,列舉了近些年來最新的研究成果和優勢,并從系統架構、預測模型和物聯網技術的角度對未來研究進行展望。隨著工業4.0 時代的到來,預測性維護技術將會為工業生產帶來革新,極大提高設備的安全性、提升保養效率、降低生產成本、提升生產效率。預測性維護技術在5G技術和人工智能技術的背景下,具有廣闊的應用前景和研究價值。