劉鵬濤
(國家管網集團 西部管道有限責任公司,甘肅 蘭州 730070)
壓縮機組作為天然氣管道系統的關鍵特種設備,通常由壓縮機本體、密封系統、潤滑系統以及輔助子系統組成[1],各個子系統之間相互協調與配合,通過壓縮機本體對氣體做功的形式提升燃氣的溫度和壓力,為燃氣的遠距離輸送提供了動力保障。在燃氣管道長輸的過程中,通常利用數據采集與監控系統[2](SCADA)實現壓縮機組監控參數的數據采集、信號調節以及報警等任務,為確保長輸管道安全運行和統一調度管理提供了保障。以國家管網集團西部天然氣管道為例,沿線各個場站的壓縮機組監控全部采用SCADA,實現遠程監視、控制、調度和管理各站的壓縮機組,提升了壓縮機組的透明度和可控性,大幅降低了事故維修成本,為西部天然氣管道的平穩運行提供了安全保障[3]。
然而,SCADA對于關鍵參數的報警只是基于當參數取值達到設定值才發出報警,當報警發生時需要值班人員立即采取措施,如果處理不及時或者處理不當引發機組緊急停機,嚴重影響生產安全。報警等級按重要程度分為低低報警、低報警、高報警和高高報警,其中低低報警和高高報警屬于停車值,低報和高報是預警值。在正常的生產運行過程中,需要值班人員實時查看和分析關鍵參數的歷史曲線,結合工作經驗、現場環境以及歷史參數值波動趨勢,人為推斷當前的參數取值是否將要達到報警值,確保機組的平穩運行。目前,國家管網集團處于數字化轉型的關鍵時期,以自動化代替手工、智能化驅動模式創新迫在眉睫,如何利用流程運行、AI算法和數據使這些關鍵點實現數字化、智能化轉型,成為急需突破的難點[4]。僅依據SCADA設定的報警值和歷史運行數據,以操作人員的工作經驗和專業素養來推斷機組的運行狀態,顯然不符合數字化轉型的策略。
近年來,隨著數字化、智能化技術普及,壓縮機組運行過程中大量的歷史數據逐漸被挖掘和利用,以神經網絡為代表的深度學習算法在圖像識別[5]、機器翻譯[6]、自然語言處理[7]等方面的成功應用,吸引了一大批研究學者投身于燃氣數據挖掘中[8-10]。2018年,Li等人[8]利用長短期記憶網絡(Long Short-Term Memory,LSTM)挖掘進氣溫度對排氣溫度的影響,利用規范變量分析將排氣溫度的變化作為評判壓縮機組的運行性能的依據。與之不同,Li等人[9]采用遺傳算法與反向傳播神經網絡訓練機組歷史出口壓力數據并對其預測,提出一種基于狀態參數學習的故障預測模型。雖然這些方法有效地預測了參數取值,但僅利用單個參數取值訓練模型使其結果作為故障預警的依據并不可靠[10];此外當數據分布的差異性較小時,依據遺傳算法進行特征提取會更加降低預警準確性[11]。為降低數據噪聲,提高預警準確度,Wang等人依據模糊C均值聚類去除壓縮機組運行數據中的特征混疊,采用RNN訓練壓縮機運行過程中的振動、壓力和溫度參數數據,預測機組參數取值,提出了一種融合多源信息的壓縮機故障預警模型[12]。Qiu等人利用隱馬爾可夫模型的隱態分析獲得機組監控參數隱含特征,通過深度置信網絡直接訓練隱含特征來預測參數取值,以此評估壓縮機組的運行狀態[13]。然而,SCADA是以秒為單位采集數據的[14],在較短的時間間隔內會產生大量的重復數據,當數據規模較大時,僅通過優化算法模型降低數據冗余取得的預警效果并不明顯[15]。此外,Tian等人考慮時間效應對機組參數取值的影響,通過設計時間特征提取策略,將參數在不同周期的表示特征重構為時間序列,提出了一種基于深度置信網絡的時空特征融合故障診斷方法(STF-DBN)[16]。雖然該方法提升了預警準確度,但是并沒有考慮不同子系統參數之間的隱含關聯。壓縮機組是由多個子系統組成的復雜集成運行系統,關鍵監控參數取值必然會受到多個子系統參數的影響[17],如機組出口溫度和壓力受外界環境、動力渦輪轉速、上游壓力和溫度、空冷系統等多種因素影響,當這些影響因素發生變化時,造成出口溫度的異常升高,進而影響壓縮機組的正常運行。
基于此,本文利用節點表示模型離散化機組監控參數取值,將參數的連續取值轉化為不同時間點對應的節點表示以此降低數據冗余。之后通過相關系數獲得各個時間點下關鍵參數節點的近鄰節點集,來量化關鍵節點與近鄰節點之間的隱含關聯。最后依據LSTM模型訓練時序近鄰節點集,實現關鍵參數節點的取值預測。針對關鍵參數的取值預警,一方面可以減輕現場值班人員的工作負擔并降低臨時預警恐慌度;另一方面通過制定合理的設置處理方案,大幅減少誤操作帶來的經濟損失,降低設備維修和處理成本,確保壓縮機組安全可靠運行。
針對壓縮機組不同子系統監控參數之間的時序相關性對關鍵參數取值的影響,同時為降低SCADA監控參數取值的數據冗余,本文提出了基于循環神經網絡壓縮機組性能預測模型,增強對機組參數的預警準確度,模型實現流程如圖1所示,首先將SCADA監測參數值離散化為節點表示,接著依據相關系數挖掘參數節點之間的隱含關聯,獲得關鍵參數的時序近鄰節點集,之后將時序近鄰節點集作為LSTM網絡的輸入,通過不斷地訓練網絡模型實現關鍵參數的取值預警。

圖1 基于循環神經網絡壓縮機組性能預測模型實現流程示意
SCADA以秒為單位獲取壓縮機組監控參數數據,同一個參數的取值在較短的時間間隔內幾乎相同,這些相同的數據大幅增加了計算量。研究表明,在大量的時序的SCADA數據中,以間隔5 min為基準取該段區間內數據的平均值,可以獲得單個監控參數精準的預測結果[18]。為了提升計算效率,通過這種轉化方式,本文將時序的SCADA數據轉化為離散節點表示;同時,考慮參數取值變化趨勢的差異性和預警監測的及時性,將1 h內獲得的12個區間離散值作為1組節點表示集合,由此給出了SCADA數據節點表示的定義描述。

經過轉化之后,得到了不同時間點下各個監控參數對應的離散節點表示Sm×n×12,通過對Sm×n×12進行近鄰節點集挖掘,可得到關鍵參數的時序近鄰節點集。
對關鍵參數的時序近鄰節點集挖掘是本文的核心,直接決定了模型預警的優劣程度。在SCADA數據集當中,并不是所有的監控參數對關鍵參數的取值具有影響,并且在不同的時間節點下各個參數的取值呈現不同的特征,為降低無效數據對關鍵參數預警取值的干擾,同時考慮時間效應對關鍵參數取值的影響,本文利用相關系數分析不同時間點內各個參數節點的取值趨勢,將與關鍵參數相關度較強的節點作為時序近鄰節點集。
1.2.1 相關系數
相關性分析作為一種統計方法,由于易理解、易擴展等優點常被用于定量描述節點之間的關聯程度[19],當相關性為正時,表明參數節點之間的取值趨勢相似;相反,取值趨勢相異。在SCADA數據集中,關鍵參數的取值并不只局限于其中一種關系。
(1)

依據相關系數,本文將與關鍵參數相關性較強的節點表示作為近鄰節點集。

1.2.2 時序近鄰節點集挖掘
機組參數監測值并不是一成不變的,而是隨時間變化。如進口壓力和溫度,受天然氣成分和質量,環境條件,中間站場壓縮機的轉速、啟停以及工作負荷等多種因素影響,在不同的時期呈現不同的變化。再如環境溫度,隸屬西北的作業區晝夜溫差較大,白天氣溫較高,而臨近夜晚氣溫緩慢下降,最大晝夜溫差可達30 ℃以上。考慮壓縮機組各個子系統之間的關聯性,關鍵參數近鄰節點集的元素組成并不固定。



圖2 單個LSTM的單元結構示意
遺忘門決定了節點表示信息有多少可以被遺忘,如式(2)所示:
(2)



(3)

(4)
選擇某壓氣站場3臺RR離心壓縮機組的SCADA運行監測數據作為實驗數據集來驗證算法模型的可行性,自投產以來,該壓氣站的單臺壓縮機組最大連續運行時間超過7×103h。為更好地訓練模型,收集了該壓氣站典型的多次出口溫度過高異常事件作為訓練數據集,事件的主要原因由動力渦輪轉速和上游進口溫度過高引起,次要原因包含潤滑系統、密封系統、外界環境溫度過高等因素。SCADA數據集主要包含影響出站溫度的m=36個壓縮機監控參數在n=2×103個時間點內的取值,其中出站溫度正常和異常的時間點分別為1 793個和207個。
由于發生事件的時間間隔或長或短,為了便于觀察與分析,給出了數據集中最近一次事件發生前后7.5 h內的壓縮機出口溫度、動力渦輪轉速、出口壓力和非驅動端振動取值變化,異常事件中壓縮機的參數取值如圖3所示,圖3中每個參數的取值是以間隔5 min為基準的監測平均值。事件中壓縮機的出口溫度已經超過了50 ℃,此時已發生出口溫度高報,需立即打開后空冷器,如果出口溫度超過60 ℃時會造成機組異常停機。


圖3 異常事件中壓縮機的參數取值示意
采用MAE(mean absolute error)和RMSE(root mean square error)作為評價指標[21]來驗證所提模型對出口溫度預警的準確性。

(5)

(6)
為驗證造成壓縮機出口溫度過高的主要影響因素,確定近鄰集合,壓縮機出口溫度與各個參數的相關系數見表1所列,給出了事件中壓縮機出口溫度與36個主要參數之間的相關系數。

表1 壓縮機出口溫度與各個參數的相關系數
從表1中可看出,動力渦輪轉速、壓縮機進口壓力和壓縮機非驅動端y振動速度值的關聯系數都大于0.6,表明具有較強的相關性,是影響出口溫度的直接原因,而剩余參數與壓縮機出口溫度的關聯系數都小于0.521,相關性較小,不作為近鄰節點的考慮范圍之內。
考慮時間效應對預測結果的影響,采用時間序列交叉驗證法[22]將時序近鄰節點集劃分為大小相等的5等分,進行四輪實驗,每輪實驗增加一等分作為訓練集訓練所提模型。SCADA訓練集與測試集見表2所列,列出了每一等分中正常運行類與異常類的時間點個數,來驗證所提模型對壓縮機出口溫度預警的準確性。

表2 SCADA訓練集與測試集
預測結果見表3所列,得到了每一輪最終的預測結果,前兩輪MAE和RMSE的取值較低,第三輪和第四輪MAE和RMSE取值相對較高,第四輪取得最高值。由于采用時間序列交叉驗證法,前兩輪訓練模型時接觸較少數據,可能還沒有充分學習到時間序列的隱含特征,MAE和RMSE的取值較高,預警的準確度較差。隨著實驗的進行,模型獲得更多數據進行訓練并逐漸學習到時間序列的結構特征,對出口溫度預警的準確性逐漸上升??傮w來看,所提模型對出口溫度預警的MAE和RMSE平均取值分別為1.83和2.27,較低的MAE和RMSE值表示模型的預測結果與實際監測值之間的差異相對較小,意味著所提模型在出口溫度預測方面具有較高準確性。

表3 預測結果
為更直觀顯示所提模型的預測結果,異常事件中壓縮機出口溫度預測值與真實值的對比如圖4所示。

圖4 壓縮機出口溫度真實值與預測值對比示意
從圖4可看出,所提模型能夠捕捉到出口溫度過高的異常事件,預測的取值趨勢和實際監測值一致,比較模型預測值與實際監測值之間的MAE和RMSE誤差,分別為0.88和0.92,較小的MAE和RMSE表明模型對出口溫度預測值更加接近實際監測值。由于考慮了不同時刻下影響出站溫度的主要因素,并將其作為近鄰節點集訓練所提模型,提高了出站溫度預警的準確性與泛化能力。
針對壓縮機組各子系統監控參數之間的關聯性對關鍵參數取值的影響,以及考慮監控參數取值的時序特征,提出了基于循環神經網絡壓縮機組性能預測模型。利用轉化模型離散化監測數據取值,降低了數據冗余和臟數據對模型的干擾,之后利用相關性分析獲得不同時間點內各個監控參數之間的相關度,接著依據時間效應對關鍵參數取值的影響,將相關性較大的參數作為關鍵參數節點的時序近鄰節點集,并將其作為循環神經網絡的訓練集來預測關鍵參數的取值,以此判斷機組運行狀態。通過分析機組關鍵參數的預測取值,可以事先了解和掌握機組的運行狀態,為后續調度提供可行的運行方案,進一步確保了機組的平穩運行。下一步,致力于將所提模型與基層站場實際相結合,通過研發預警系統實現管網數字化向智能化的轉型。