何 偉,高 玲,崔振偉,江學文,郭月明,田 欣
(1.中國石油天然氣股份有限公司獨山子石化分公司,新疆克拉瑪依 833699;2.中國海洋石油集團有限公司,北京 100010;3.昆侖數智科技有限責任公司,北京 102206)
煉化企業機泵是指除列入大型機組管理范圍外的轉動設備,如泵、壓縮機、風機、汽輪機等,是本文的研究對象。
機泵智能系統監測機泵健康狀態,在提高機泵可靠性的前提下,實現庫存需求和維護成本的最優化。智能系統具備機器學習和預測分析能力,可幫助工程師實施預測性維護計劃。
GB/T 40571—2021《智能服務 預測性維護 通用要求》對預測性維護的定義是[1]:根據觀測到的狀況而決定的連續或間斷進行的維護,以監測、診斷或預測構筑物、系統或部件的條件指標。
預測性維護是通過對監測對象進行連續監測,分析判定監測對象所處的狀態和可能的故障模式,預測未來的發展趨勢,制定預測性維護計劃。預測性維護技術是目前工業領域研究的重點和熱點問題,也是工業智能化的具體內容之一,應用前景廣闊。
煉化企業機泵監測維修管理存在的問題有:
(1)監測系統分散建設,標準不一、互不兼容、數據難共享。
(2)系統“重數據、輕機理”,與工藝參數和故障機理關聯少,故障機理模型深度和廣度不夠、故障回溯和準確定位困難,故障處理治標不治本。
(3)歷史數據和故障數據分散在不同的監測系統,未能形成統一的機泵維護核心數據和專業模型。
(4)系統架構以C/S 為主,擴展性弱,應用體驗差,數據接入和處理能力低。
(5)大量監測數據依賴人工判斷,診斷準確率低,無法應用大數據等先進技術挖掘數據價值。
(6)機泵檢修模式仍以故障修、定期修為主,維護成本高、效率低。
機泵作為煉化企業通用的工業設備,實現智能運維是目前機泵設備智能化發展的方向。以智能化技術為支撐的機泵預測性維修,通過預測模型預測機泵故障發生的時間、位置以及故障程度,最優安排維修活動,可以大幅提高機泵維修效率,有效避免機泵運行過程中的非計劃停機,減少企業生產損失。
機泵預測性維護關鍵技術包括數據處理、智能報警、故障診斷、故障預測等。
2.1.1 異常信號識別技術
根據收集的大量傳感器異常數據(電氣干擾、導線晃動、傳感器松動、傳感器損壞等),通過設定的數據清洗業務規則,如時域波形呈直線、階梯狀、最大方差與最小方差比超過邊界值、單樣本有效值小于邊界值等,將當前采集的監測數據同異常信號規則庫進行基于機器學習算法的比對和判故,識別和剔除假信號,提高數據質量,避免誤報警(圖1)。

圖1 異常信號規則庫示意
2.1.2 數據預處理技術
2.1.2.1 重復數據清理
數據記錄中如果存在重復值,尤其是重復量大的情況下,直接影響對監測對象的狀態評估。機泵狀態監測數據不僅記錄了狀態值,同時也記錄了時間序列,采用逐個檢查時間點的方法,若存在重復的時間值則可以判定監測數據存在重復值,識別到重復值直接刪除處理。
2.1.2.2 缺失值處理
機泵監測數據記錄中若存在缺失值,意味著對應時間點的狀態信息丟失,引起狀態評估的結果少考慮了該段時間內的狀態。機泵狀態監測數據,記錄了狀態值及其對應時間。采用逐個檢查時間點的方法,若發現存在不連續的現象,則可以判定監測數據存在缺失值,也可根據監測數據采集密度判斷出缺失數據量。
缺失值數據處理采用三次樣條插值法處理。三次樣條插值方法如下:
假定有n+1 個數據點(x0,y0),(x1,y1),…,(xn,yn),以這些數據點為端點,則可劃分成n 個區間,每個區間的樣條曲線設為:
對于端點而言,Si(xi+1)=Si+1(xi+1),設mi=(xi)。
算法流程如下:
(1)計算步長,hi=xi+1-xi。
(2)選定邊界條件。m0=0、mn=0,將數據端點和選定的邊界條件帶入下述矩陣方程并求解:
(3)計算樣條曲線系數。
(4)通過上述步驟計算出參數后,代入樣條函數,并利用樣條函數計算的值代替缺失值。
缺失值處理示例:以指數函數為例,取t=[0.5,0.9](單位以秒計),示例函數x=expt2,并加上最大幅值為0.05 的隨機擾動,取中間0.12 的區間設置為缺失值(圖2 中的虛線部分)。通過三次樣條函數補充缺失值,最大絕對誤差是0.056 3(圖2)。

圖2 三次樣條插值效果示例
2.1.2.3 離群點清理
數據記錄中如果存在離群點,在特定情況下其代表監測對象的狀態相差甚遠。例如,溫度數據中的離群點,可能引發溫度誤報警,有無溫度報警所代表的機泵狀態差距很大(圖3)。

圖3 離散點圖
(1)采用K—均值聚類算法識別離群點。對于給定的樣本集,K—均值聚類算法是按照樣本之間的距離(即相似度)大小,將樣本集劃分為K 個簇(即類別),讓簇內的點盡量緊密的連在一起,而讓簇間的距離盡量的大,以此實現離群點識別。算法流程如下:①隨機取K 個初始中心點;②對于每個樣本點計算到這K 個中心點的距離,將樣本點歸到與之距離最小的那個中心點的簇,這樣每個樣本都有自己的簇;③對于每個簇,根據里面的所有樣本點重新計算得到一個新的中心點,如果中心點發生變化回到上一步,否則轉到下一步;④得出結果。按照上述流程被簇孤立出來的點,確定為離群點。
(2)離群點處理。采用滑動平均法處理離群點,消除離群點對健康狀態評估的影響。設n 個數據點x={x1,x2,…,xn},其中xk(k∈[1,n])是離群點,滑動平均法即用yk代替xk。
其中,m 是滑動點數,具體值視實際數據情況而定。
采用5 點滑動平均處理原始數據,處理后異常值將被平滑處理掉,處理后的效果如圖4 所示。

圖4 滑動平均處理效果
傳統的報警方式是將監測數據與設定的報警閾值進行比較,若超限則產生報警信息,報警信息用來反映機器內部產生的故障。智能報警技術以智能算法為基礎,包括閾值報警、差值報警、快變報警、慢變報警等內容。
(1)閾值報警。根據機泵應用經驗或參照國家標準確定報警閾值,在智能系統通過手動錄入方式配置相應參數。當監測數據反復穿越閾值邊界線時,系統通過報警策略算法對報警事件進行識別,篩選數據進行故障報警,防止針對同一報警事件進行重復報警。故障報警主要是對實時監測的振動數據進行數據處理,提取特征值,將特征值輸入智能算法模型進行統計學習,如果超限則在排除多種干擾因素后再判斷是否報警或更新統計模型,如果未超限則更新統計模型從而觸發新的一次學習。以某一個正常工況點為重心,劃分出機泵正常區域(綠色范圍)、預警區域(橙色范圍邊界)和報警區域(紅色范圍邊界),完成統計學習(圖5)。機泵長期運行過程中,智能系統通過對機泵在不同負荷、轉速下的振動參數進行統計學習,確定機泵在特定負荷、轉速下的正常工況范圍(圖6)。

圖5 機泵預警限報警限值智能統計學習

圖6 特定負荷下正常工況范圍

圖7 機理數據雙驅診斷模型
(2)差值報警。選擇n 個監測數據樣本,計算每個數據樣本的總振值,以及主頻值與總振值的差值,當選定的n 個監測數據樣本中有70%的樣本數量的差值超過設定的差值閾值,系統輸出差值報警信息。
(3)快變報警。振動監測單樣本數據的前5 階,1×、2×、3×、4×、5×振動幅值(振動分量的矢量和),與上次監測的振動樣本的前5 階振動幅值(與上同)的差值為跳變值,當跳變值超過設定限值,且跳變過程較快,按毫秒(ms)時間計量,跳變后狀態穩定在5 min 以上,系統將輸出快變報警信息。同時,系統會自動加密數據保存間隔,對快變報警事件進行高密度數據存儲。
(4)慢變報警。振動監測單樣本數據的前5 階,1×、2×、3×、4×、5×振動幅值(振動分量的矢量和),與上次監測的振動樣本的前5 階振動幅值(與上同)的差值為跳變值,當跳變值超過設定限值,但跳變過程緩慢,按分鐘(min)時間計量,跳變后狀態穩定在60 min 以上,系統將輸出慢變報警信息。
機泵報警輸出等級和狀態見表1。

表1 振動速度和振動加速度的5 級報警
2.3.1 基于機理規則的故障診斷
根據實際機泵結構和振動信號傳遞路徑,利用動力學原理,建立機泵轉子類典型故障、軸承典型故障、齒輪典型故障的動力學公式,結合Anasys、Adams 等多體動力學仿真軟件建立機泵典型故障的動力學模型,同時根據機泵結構振動信號傳遞路徑建立典型故障的激勵-響應系統模型,揭示出機泵典型故障的振動學機理,給出相關診斷規則,建立基于機理的診斷模型。
2.3.2 基于數據驅動的故障診斷
由于實際振動測試傳感器安裝位置的局限,難以測到故障源真實的振動信號,而所測的機體表面的振動響應信號存在一定程度的隨機性、不確定性、模糊性及耦合性,導致從機理模型上利用故障診斷規則實現的故障診斷存在一定誤差。為解決上述問題,提高機泵典型故障的診斷精度,開展基于數據驅動的故障診斷模型研究。
數據驅動是以概率與統計學為基礎,從數據出發,利用機器學習模型,主動學習數據內部潛在的規律與模式,建立數據—故障的數學映射模式,從而實現故障診斷。首先,針對機泵典型故障,分別從時域、頻域、時頻域提取原始振動信號的故障特征,建立高維故障特征集。然后利用核主成分分析算法,提取高維故障特征集的主成分。最后以神經網絡作為機器學習模型,建立基于數據驅動的故障診斷模型。
2.3.3 基于機理與數據融合的雙驅診斷技術
根據機泵的結構特點,研究各種典型故障的機理,基于故障機理研究特定故障的特征提取算法,建立診斷規則,同時通過故障仿真信號和故障模擬試驗,提取典型故障的高維度特征集,開發機器學習算法模型。
故障預測是指準確、精確地估計損壞的部件或子系統的剩余壽命,其對于機泵預測性維護至關重要。對于可能引起故障的相關部分的故障演變進行長期性估計,需要一些方法去描述和處理固有的不確定性。不確定性描述意味著能夠對由各種各樣原因所導致的各種形式的不確定性進行建模,而不確定性處理需要一些方法論和工具,當可以獲得更多數據時需要這些方法論和工具來不斷減小不確定性的界限。為得到精準的預測,需要有較好的故障演變概率模型以及足夠多的故障數據樣本,以幫助訓練、驗證、調整預測算法。
利用基于線性維納過程的機泵性能退化模型來預測當前評估對象的剩余壽命,利用樸素貝葉斯和EM(Expectation-Maximum,期望最大化)算法評估參數進行動態更新。
故障預測過程如下:
(1)基于退化特征值,建立線性維納過程預測模型。假設t為機泵運行時間程,為運行時間t 所對應的退化量,可建立如下維納過程模型:
其中,φ 為初始退化量,方便起見假設φ=0;θ 為漂移參數,表示機泵的退化速率。由于各樣本之間存在差異,假設θ~N(μ0,σ02);σ 為擴散參數,B(t)為標準布朗運動,σB(t)用于描述機泵性能在退化過程中存在的波動。
(2)利用貝葉斯準則更新漂移參數的條件密度函數和條件累計分布函數,得到模型中的待估計參數向量和對數似然函數,然后利用基于EM 算法給出待估計參數向量的極大似然估計的解析解。
記t1,t2,…,tk為某機泵的k 個監測時間點,X1∶k={x1,x2,…,xk}為k 個時間點對應的退化量值,其中xi=X(ti),i=1,2,…,k。機泵在tk時刻的剩余壽命模型為:
其中,w 表示失效閾值。
(3)依據退化特征模型和當前狀態,對監測對象進行動態壽命預測,可以實現機泵的全生命周期管理,保障機泵安全運行,提高機泵利用率。
運用物聯網、云計算、人工智能、大數據等新一代數字化技術,建設智能感知、智能分析、智能預警、全面協同、科學決策等方面的能力,是煉化企業數字化轉型發展的必然趨勢。實現機泵預測性維護的關鍵是解決機泵監測數據的智能化應用,數據處理、智能報警、故障診斷、故障預測4 個環節彼此獨立又相互聯系,構成了機泵預測性維護的核心技術。經過多年的研究和技術沉淀,上述關鍵技術在相關煉化企業獲得成功應用。