趙長軍
[摘 要]文章通過將油氣生產設備的故障數據、配套物聯網采集的故障期工況數據、設備維修保養記錄數據等進行多維組合,通過Hadoop大數據分析技術,對設備的故障率進行分析,生成全面的設備質量參考數據;并依據故障率分析結果與實時工況數據進行大數據模型比對分析,實現設備的實時故障預測。通過對輸入的多維數據進行整合,結合大數據技術在海量數據分析的優勢,實現了對油氣生產領域設備全方位的質量信息評估,并可據此采取針對性的質量改進與預防性措施,提升油氣生產的安全性和經營效益。
[關鍵詞]多維分析;故障預測;大數據;油氣生產設備
[DOI]10.13939/j.cnki.zgsc.2017.12.243
1 引 言
油氣生產行業所采用的各類數字化設備較多,隨著行業的競爭加劇,如何減少設備故障引起的停產時間,如何優化采購降低設備故障率,如何提前對故障做出預測以提前應對,是石油企業所亟須思考和解決的問題。
隨著工業自動化技術、物聯網技術、大數據技術在油氣生產行業的開始應用,為解決上述問題提供了全新的思路。運用大數據技術,可高速有效分析多維度的設備實時運行數據,并結合其他靜態和動態信息,對設備的故障進行分析和預測,分析結果為生產、經營和QHSE服務,實現技術手段和管理模式的革新,實現科學決策、卓越運營與安全生產,最終達到可持續的業務增長。例如茂名石化探索如何在不改變已知原料屬性下,實現在重整裝置上提高汽油收率最高和汽油辛烷值最高的生產目標。為解決這個問題,采用大數據分析技術,收集了重整裝置近三年的MES、HSE、實時數據庫、腐蝕數據、ITCC、機泵監測數據、氣象信息等數據,通過Hadoop建模,對重整原料歷史數據進行主成分聚類分析,形成了典型的原料操作樣本庫,并據此快速確定每種原料類別下的最優操作方案。技術人員對近4600個批次的石油原料進行了分析建模,組成了操作樣本庫。通過該方法計算優化工藝操作參數,可使汽油收率從89.88%提高到90.10%,是大數據在油氣生產行業應用的成功例子。
本文擬通過將油氣生產設備故障數據、配套物聯網采集的工況數據、維修保養記錄數據及工業自動化數據組合應用于設備故障大數據分析,實現對設備的綜合故障率分析與故障預測,從而為設備采購的最高性價比提供數據支撐,也為預防性維修維護提供決策支持,提升生產運行的安全性和企業經營效益。
2 大數據分析技術的運用
油氣生產行業設備數據數量大,并發處理要求較高,對數據存儲、處理、分析的巨大壓力,要解決海量數據處理的問題就需要引入大數據技術。
Hadoop是目前最流行和功能最強大的一個軟件計算平臺,可以很容易地開發和運行處理油氣生產過程中的海量數據的分析模型。其核心部分主要包括—HDFS(Hadoop Distributed File System)和基于MapReduce機制的并行算法實現。Hadoop提供的分布式文件系統HDFS是建立在大型集群上可靠存儲大數據集的文件系統,具有強容錯性、流式數據訪問與大數據集、硬件和操作系統的異構性的優勢。而MapReduce是一種簡化的分布式程序設計模型,用于處理和生成大量數據集。通過該模型,程序自動分布到一個由普通機器組成的超大機群上并發執行。MapReduce通過把對數據集的大規模操作分發給網絡上的每個節點來實現可靠性,每個節點會周期性地把完成的工作和狀態信息返回給主節點,實現大數據的并發處理。
Hadoop的上述優點尤其適合于油氣生產行業的海量數據分析應用。
3 設備故障率多維分析
設備故障率是評估設備性能優劣的一個重要指標。顧名思義,是設備故障運行與正常運行的比率。通過統計的方法可以計算特定個體、特定型號、特定類型或特定廠商的設備的故障信息,對設備時間質量進行評估和橫縱向對比。
在油氣生產中,設備的故障記錄信息是故障率分析的依據,但因為實際運行中各個井站、礦區的運行情況不同也影響了設備發生故障的情況,因此還需要引入配套物聯網采集的工況數據,以及日常的維修保養情況記錄數據,將這些信息進行進一步組合,在Hadoop大數據分析中建模挖掘,得出更精確的設備綜合故障率結果。
本文采用的多維故障率分析,基于3個大類的數據:
(1)設備故障信息:包括設備廠商信息、設備類型、設備型號、設備壽命、運行時間、故障類型、故障次數、故障時長、故障恢復時長等;
(2)物聯網采集的工況數據:油氣生產設備產量、流量、振動、位移,以及運行環境溫度、濕度、處理物質腐蝕性等;
(3)維修保養記錄數據:保養級別、保養時間、更換配件比、維修時間、維修級別等數據。
在Hadoop中,根據3類數據的權重、優先級,以及每個數據項的占比等,進行大數據分析建模。進而將各個維度的數據輸入到Hadoop的MapReduce框架中,在計算模型中進行分析計算,最后得到分析結果。多維分析過程如圖1所示。
如上表所示,基于大數據分析的油氣生產設備故障分析統計過程是從油氣生產中產生的多維數據(故障相關、設備相關、環境相關、操作相關)中獲取在任意時間間隔內的某項故障相關的統計結果。其統計數據源是多維數據按一定規則的組合,同時獲得相應的不同維度的統計結果。
下面以例子說明分析全過程。
向MapReduce庫輸入單個設備編號參數、時間區段參數,向Job Tracker提交統計任務,MapReduce庫將設備故障記錄庫中的數據分為m個分塊。Map Tracker讀取分塊中的設備故障記錄,作為map函數輸入,map函數按設備編號和時間區段參數,將該分塊內符合條件的設備故障記錄統計出來,結果保存在中間鍵值對中。Reduce Tracker讀取所有Map Tracker產生的中間鍵值對,將其歸并為一組統計記錄,從而得到單位時間內指定設備的故障率,或指定時間范圍內該設備故障次數變化趨勢等信息。
進一步,當輸入參數為設備型號、時間區段時,Map Tracker調用map函數,將分塊文件中的屬于該設備型號的所有設備列出,結果保存為中間鍵值對,作為下一級MapReduce過程的map函數輸入,在下一級的MapReduce過程中,再使用上例中的過程,過濾不同編號設備在指定時間段內的故障記錄并歸并出相關統計信息。整個過程如圖2所示。
多維分析數據來源正是應用上述MapReduce過程或多次MapReduce過程的迭代,得到最終分析結果。多維數據的故障率分析方法,解決了傳統單一數據對比未考慮實際運行環境、運行負荷、日常維護頻度等方面的因素,通過組合計算達到分析結果更全面完整的目的,為設備管理、設備采購、巡檢維修等日常管理工作提供更準確的決策輔助。
4 設備故障預測分析
獲得設備綜合故障率結果后,可進一步實現設備的故障預測。對于井口裝置、閥門等控制設備的常規維護手段多為定期檢修或故障后維修,存在“過修”和“失修”現象,造成生產設備損耗和停產減產風險。通過設備的故障預測預警,在設備正常運轉條件下,能夠分析出潛在故障及原因、實現預知性維修,將能有效減少維修成本、降低非計劃停工風險。
對設備的故障預測預警,通過現場數據采集→數據傳輸→HDFS的數據存儲→對運行狀態與故障模型進行并行計算大數據分析→設備的故障預測幾個步驟實現,如圖3所示。
通過現場的各類傳感器,將重點設備的關鍵參數進行實時采集和傳輸,通過RTU或者DCS等設備,傳輸到Hadoop的HDFS分布式文件系統中,按照流文件格式進行存儲。
設計MapReduce的設備故障預測模型,將幾個采集上來的維度數據進行并行計算分析,分析算法可以Java程序方式實現基本的Map函數和Reduce函數。
(1)MapReduce庫先把預測算法程序的輸入文件劃分為M份(M為用戶定義),每一份通常有16MB到64MB;然后使用fork將用戶進程拷貝到集群內其他機器上。
(2)被分配了Map作業的Task Tracker,開始讀取對應分片的輸入數據,包括此重點設備的振動、位移、溫度等各個維度的數據。
(3)接著進行Reduce作業。
(4)當所有的Map和Reduce作業都完成了,MapReduce函數調用返回預測模型程序的代碼。
通過以上方式,實時獲取設備的振動、溫度、壓力、流量等數據,同時將數據輸入到Hadoop故障預測模型進行實時分析比對,一旦比對類似,則可預測故障的近似發生時間,從而合理安排預防性維護,從而保證了設備維護更有針對性。
5 結 論
本文通過將與油氣生產設備故障相關的工況數據、故障數據、維修保養等操作數據,作為多維數據源進行組合,輸入到Hadoop大數據分析模型中,利用Hadoop的并行處理優勢解決油氣生產設備運行環境復雜、實時數據量大、影響因素眾多的故障分析難點,為設備的優化采購提供依據;同時將故障分析結果進一步導入到故障預測中,也為預防性維修維護提供決策參考,提升油氣生產運行安全和綜合運營效益。
參考文獻:
[1]趙慶周,李勇,田世明.基于智能配電網大數據分析的狀態監測與故障處理方法[J].電網技術,2016(3):774-780.
[2]檀朝東,陳見成,劉志海.大數據挖掘技術在石油工程的應用前景展望[J].中國石油和化工,2015(1):49-51.
[3]李金諾.淺談石油行業大數據的發展趨勢[J].價值工程,2013(29):172-174.
[4]張春生,郭長杰,尹兆濤.大數據分析在油氣行業的應用研究[J].微型電腦應用,2016,32(7):64-67.
[5]劉剛.Hadoop應用開發技術詳解[M].北京:機械工業出版社,2014.