周云奕,蔡康健,張玉媛,郭新然,石 坤,向 峰
(中國特種設備檢測研究院,北京 100029)
石油化工是我國經濟的重要支柱產業,保證石油產業安全高效運轉是保障民生的關鍵任務之一。離心泵是石油運輸中的關鍵動設備,扮演著“心臟”的角色,一旦發生故障,輕則引起非計劃停機影響生產效率,帶來經濟損失;重則引起生產安全事故,給人民生命財產安全帶來威脅。因此,保障生產設備安全可靠運行是石化企業的核心工作之一。
隨著物聯網、人工智能、大數據等新技術的不斷發展,基于運行監控數據的設備早期故障診斷成為可能,有望進一步降低計劃外維修發生的概率,在設備狀態及運轉趨勢已知可控的前提下制定維修策略、調整生產計劃、調配維修所需資源,從而保證企業生產安全的同時提升企業生產效率。
設備全生命周期管理系統架構如圖1 所示。系統中的數據類型包括生產運行和記錄型業務數據兩大類。生產運行數據主要為設備的運行監控數據和工藝生產數據,來源包括設備本體、設備狀態在線監測系統、SCADA 系統(PLC/DCS系統)[1]、陰保系統等。記錄型業務數據包括設備設計、制造、采購、維修、保養、巡檢及相關知識庫資料等數據,來源于企業內部的ERP、OA、財務系統以及在本系統的信息化錄入模塊。結合數據處理技術與存儲設備將以上數據統一存儲至數據中心,用于實際應用中的數據分析與挖掘,支撐系統應用層的設備運行監控、設備故障診斷、設備缺陷庫建立、設備效能評估、設備剩余壽命預測、備品備件庫存統計以及供應商評估等應用,從而實現對設備管理數據價值的深度挖掘與利用。系統在用戶層以云端智能平臺與移動端為載體,集中匯總并集中展現設備全生命周期管理數據,實現智能化技術為企業管理賦能的目標。

圖1 設備全生命周期管理系統架構
離心泵是石油化工行業中的關鍵動設備,是油庫外輸、消防、換熱器水循環等環節必不可少的裝置,保證其安全運轉是油庫管理的基礎,一旦發生故障則會影響生產效率,甚至導致安全事故的發生。因此,保證油庫中機泵的正常平穩運轉至關重要。
目前,針對動設備的維護應用最為廣泛的理論是基于設備可靠性分析的維修(Reliability Centered Maintenance,RCM)。RCM 是建立在風險評價和可靠性分析基礎上的[2],應用系統化的技術方法對設備的失效模式及影響進行分析評估,確定設備失效的風險、造成失效的原因,識別設備固有或潛在的危險及其可能產生的后果,從而制定和優化降低風險的維修策略[3]。主要流程包括:(1)確定設備可能出現的故障問題,并分析故障問題出現后會給設備帶來的損害和影響;(2)通過邏輯判斷和科學有效的評估,針對故障造成的影響制定相應的控制措施;(3)由相關專業人員對實際的設備故障相關數據信息進行分析,并且建立數據模型,在保障設備功能性完整的基礎上對設備進行優化維修,從而盡可能地降低設備運行中由于故障而造成的損失。
預測性維修是以狀態為依據的維修。在設備運行時,對它的主要或重要部位進行定期或連續的狀態監測和故障診斷,判定設備所處的狀態,預測設備未來的狀態及發展趨勢。依據設備的狀態發展趨勢和可能的故障模式,預先制定預測性維修計劃,確定設備計劃維修時間、內容、方式、必需的技術及物資支持。預測性維修集設備狀態監測、故障診斷、故障(狀態)預測、維修決策支持和維修活動于一體,是一種新興的維修方式。
基于設備可靠性的預防性維修方案主要關注機械設備的性能退化規律,即設備P-F 曲線[4],如圖2 所示,P 點為潛在故障點,在此點設備出現故障趨勢,但仍未失效;F 點為功能故障點,設備出現功能性失效。有時P-F 間隔期很短,往往來不及采取預防性維修措施[5],所以預防性維修周期(依據平均故障間隔時間MTBF 確定)[4]需在潛在故障點之前。因此,設備的維修周期應根據設備的實際運行狀態進一步延長和優化,為維修提供充分的準備,優化備品備件庫存、優化人員調配方案、協調生產計劃乃至節約維修成本,從而提升企業運轉效能。

圖2 設備P-F 曲線
隨著設備在線檢測技術的不斷發展及成功應用,可考慮通過對設備的實時運行狀態進行監控及設備運行趨勢的預測,實現更加精準的預測性維修,進一步提升對設備正常運轉周期的預測精度,可較為準確地預測出設備的潛在故障點及功能故障點,以此實現在潛在故障點前調整生產計劃與維修安排,調配所需備品備件,避免欠維修,減少過維修,在P-F區間實現精準維修的目標。
張志彤:2013年,我國水旱災害頻繁。松花江、黑龍江發生流域性大洪水,有9個熱帶氣旋登陸,一些地區發生了較為嚴重的暴雨洪水和山洪地質災害,南方部分地區發生了嚴重高溫伏旱。全國汛情、旱情、災情主要有6個特點:
預測性維修的整體技術路線如圖3 所示。由設備全生命周期系統獲取到設備歷史與實時的運行數據和記錄型業務數據,基于以上原始數據,結合大數據分析以及專家經驗建立設備缺陷庫,梳理設備可能出現的所有缺陷對象、缺陷現象、缺陷機理、缺陷原因及治理策略。匯總以上所有數據用于設備的運行分析和運行監控、故障診斷[6]、可靠性分析、風險評估及效能分析,評估設備的剩余使用壽命并最終生成設備的預測性維修策略。同時,將以上設備運行分析模塊的中間或最終結果與設備維修過程中的實際結果比對后又會更新設備的相關業務記錄數據。需明確說明的是,技術路線中設備運行分析部分的各個功能模塊不完全獨立且不是并行關系,存在一定的耦合關系。

圖3 預測性維修技術路線
FMECA 即故障模式、影響及危害性分析,是通過分析產品所有可能的故障模式及其可能產生的影響,并按嚴重程度及發生概率予以分類的一種歸納分析方法,是RCM 中使用的主要方式,可支撐設備風險的評估。
2.3.1 泵的故障模式及原因分析
根據部件功能描述,確定該設備所有可能的功能故障模式;并根據設備的硬件組成,列舉最低層次上可能發生的硬件故障模式。找出每個故障模式產生的直接原因,以及外部因素構成的間接原因,如部件使用方式等人為操作因素。對部件進行故障原因分析,可幫助制定針對性的改進措施,從而降低故障發生的可能性。
結合某石油管道運輸公司場站調研情況,在實際生產過程中需要重點關注的離心泵故障類型包括:電機定子故障、軸承磨損、潤滑油/潤滑脂液位過低、電機和泵體不在一條直線等。離心泵泵體和電機現有的監測數據包含:泵體進出口兩端溫度、位移、電機溫度、定子三相溫度、電機電流、電機轉速、電機頻率等。
2.3.2 泵的故障模式危害性分析
故障模式危害性分析是分析設備故障造成的結果,包括:影響安全與環境的方式、影響生產和運行的方式、故障引起的物理損壞、要修復故障必須采取的措施(維修后果、故障后果、環境后果)。對每一種故障模式,一般用風險來描述其危害性。風險的兩個重要影響因素為失效頻率等級和失效所造成的后果。基于風險和后果的評價與分析,通過建立風險矩陣劃分失效模式的等級,關聯后續設備維修策略的制定與優化。
可靠性是指設備在一定時間內,不發生故障的概率。實現設備的可靠性分析重點在于發現并掌握設備性能劣化的趨勢,具體內容包括:對設備早期故障的感知、對設備故障類型的診斷、對設備運行趨勢的預測與設備剩余使用壽命的評估。核心研究內容為基于振動信號的設備早期故障診斷及設備的剩余使用壽命(Remaining Useful Life, RUL)預測。在基于設備振動信號進行分析時,前者關注故障特征信號的類型,后者則更關注故障信號的趨勢。
2.4.1 基于振動信號分析的離心泵故障診斷
傳統的基于統計的壽命分布模型往往僅關注設備的靜態或歷史數據,缺乏對設備實時運行數據的分析,且分布模型的選擇需要依靠人工經驗,參數求解過程較為復雜。在實際生產中,離心泵發生轉子不平衡或不對中、轉軸明顯彎曲、轉子的支撐部件聯接出現松動以及機械密封動靜件出現摩擦等故障都會伴隨設備振動異常現象的發生[7]。
隨著傳感器、物聯網、人工智能等技術的進步,可在以上新技術的基礎上,結合關鍵機泵的狀態在線監測與趨勢預測,實現對機泵尤其是軸承等核心部件[8]早期故障的檢測與診斷,提升設備可靠性分析的準確率,更能降低災難性損壞的可能性以及減少停機時間。設備的振動信號特征包括:(1)時域特征,例如均值(mean)、均方根(RMS)、方差、偏度、峰度等;(2)頻域特征,例如FFT 頻譜的幅度等;(3)時頻域特征,例如短時傅立葉變換(STFT)、維格納-維勒分布(WVD)、小波變換(WT)等的統計特性。
隨著機器學習理論研究的不斷進步,可在對設備振動信號進行特征提取的基礎上進行分類,實現對機泵故障類型的診斷,主流的算法包括:人工神經網絡、支持向量機、模糊分類器、決策樹等。支持向量機以其在小樣本數據分類上的優勢被用于解決振動信號的特征識別中的過擬合、收斂慢和局部最優解等問題。在設備故障診斷中可通過基于多尺度形態分析的形態模式譜對原始振動信號的形狀特征進行描述,再結合SVM 實現不同故障特征信號的分類與識別[9]。宋禮威等人[10]對離心泵轉子振動位移信號進行經驗模態分解,針對分解出的各層固有模態函數中的故障敏感分量進行分析,利用徑向基神經網絡對故障特征進行分類。Sugumaran 等[11]通過對滾動軸承振動信號進行統計分析,得到主要和次要參數,結合決策樹和距離評估算法從中提取并選擇用于故障分類的特征,針對故障信號存在的演變特點訓練模糊分類器,實現輸入特征和輸出類別之間的映射,完成軸承故障的診斷。王慶鋒等人[5]利用小波包分解技術對運行正常的振動數據進行特征矩陣抽取,然后基于動態核主成分分析得到該特征矩陣的特征子空間,在特征子空間內通過T2 統計分析求取設備健康指數T2 統計量,再基于Beta 分布自學習技術求取設備運行正常狀態的告警控制限,求得在線監測數據的健康指標,作為實際監控數據的告警控制限,以此探索不需要外部專家干預和人工分析即可準確獲取早期設備故障信息的方法。這對于信息物理系統環境下實現設備智能運維具有重要意義。
2.4.2 離心泵的剩余使用壽命預測
如前所述,以可靠性為中心的維修最終須得到設備的預防性維修周期,從而制定對應的維修計劃與策略。這與計算當前時間節點下設備的剩余使用壽命密切相關。實現以上數值預測的方法一般分為基于退化模型的方法和基于數據驅動的方法。
基于退化模型的方法常通過對設備歷史運行數據進行統計得到設備運行時間與故障率和可靠度的關系。常見的壽命分析模型包括威布爾分布、正態分布及指數分布等。大量實踐表明,因設備中某一零件失效引起設備故障的設備使用壽命服從三參數威布爾分布[2]。
基于數據驅動的方法無須依賴人工經驗,可通過挖掘生產中運行、工藝、巡檢、檢驗檢測、監測、環境等多維度數據,建立以數據為基礎的設備性能退化模型,挖掘其中與設備使用壽命預測相關的規律。當以振動信號為數據來源時,類似基于振動信號的故障診斷,不過前述問題為分類問題,而剩余壽命預測為回歸問題,更關注故障信號與設備使用壽命之間的聯系,實際預測值可作為設備性能退化的指示參數[12],也可直接為壽命的預測值[13],這與選擇的深度神經網絡特性有關。具體步驟包括設備運行數據的分解、特征的提取與選擇、健康指標建立及剩余使用壽命確定等。訓練模型可運用支持向量機(SVM)、卷積神經網絡(Convolutional Neural Network, CNN)[12]、循環神經網絡建立。
基于設備風險評估的結果,考慮針對風險等級較小、維修過程對生產影響較小且維修成本較低的設備及部件,采用預防性維修的策略進行定期維修,將周期性維修計劃制定入生產計劃中;對于風險等級較高、維修過程較復雜且對生產影響大、維修成本高的設備及部件,考慮結合其當前狀態及可靠性分析,采取預測性維修的方式,實現更加精準的維修,在保證生產安全的前提下提升生產效率。在實際工程應用中進一步結合企業生產及管理的要求,制定詳細且全面的設備維修策略。
物聯網、大數據、人工智能技術的發展為工業領域實現高效的設備管理提供技術支撐,有望通過多技術手段的融合,結合人工經驗與數據挖掘的雙重優勢,提升設備管理的效能和智能化水平,促進行業的安全高效發展。