閻紅巧 田 琨 冒亞明 樊志強 余 飛
(中國石油集團安全環保技術研究院有限公司)
油氣田集輸管道主要包括采油、注水及注汽井等的井場工藝管道、井口、計量站、聯合站之間的原油輸送管道[1]。據統計,中石油油氣田地面各類管道總長度為30萬公里,隨著油氣田開發時間延長, 部分油區采出液的物性發生了較大變化,采出液含水量不斷升高, 腐蝕條件不斷惡化,導致地面集輸管網腐蝕加劇,泄漏風險形勢嚴峻[2]。
經過多年積累,國內外在管道腐蝕監測研究與應用方面有了一定的技術進步,主要的研究方向為:一是基于直接腐蝕評價ICDA、ECDA的腐蝕監測技術研究與應用[3],這種評價方法較為成熟,但因集輸管道腐蝕的復雜性而難于開展內檢,故存在一定的瓶頸[4];二是基于監測技術的腐蝕預警技術,如腐蝕掛片、電阻探針、線性極化探針及FSM等監測技術, 這些技術在管道腐蝕預警方面取得了一定應用效果[5,6]。 但總體來看,就國內陸上油田的實際情況而言,盡管腐蝕控制方面的相關研究與技術應用已開展多年,但在管道腐蝕預警方面仍面臨巨大挑戰[7]。 大數據是網絡與信息技術發展至今所催生的一項革命性的理念和技術,創新安全環保監督管理需要借助于大數據這一技術利器。 筆者基于管道完整性管理的全生命周期管理數據,挖掘管道腐蝕規律,提出基于大數據的管道腐蝕預警策略,實現管道腐蝕管理關口前移的目的。
大數據技術帶動了思維模式的轉變,具體表現為:
a. 由因果關系向關聯關系轉變。傳統思維模式是基于因果關系的,在因果關系中,原因和結果都會被明確定義,且通常由業務專家基于具體的業務場景,結合專業理論知識確定原因自變量和結果因變量。 而大數據思維模式的關鍵是發現數據之間的關聯關系,因果關系僅是一種特定的關聯關系。
b. 由“為什么”向“是什么”的轉變。傳統的思維是首先思考“為什么”,并且在思考的基礎上建立基于因果關系的數據模型。 然而,大數據思維則是直接從數據中挖掘變量之間的數據關系,在得到關系后再解釋數學關系的物理含義。 例如經過大數據分析, 美國Target超市的蛋撻銷量與颶風用品間有強關聯關系, 因此當颶風來臨之際,Target超市將蛋撻和颶風用品一起打包出購,但是蛋撻和颶風產品之間為什么強關聯至今無法被解釋,但是這一關系的確能為超市提高銷售業績。
c. 由“專家經驗”向“數據驅動”的轉變。傳統的工業領域依賴于專家經驗,盡管專家經驗數據有科學理論作為支撐, 但是專家經驗主觀性強,缺乏客觀性,例如管道完整性管理中的肯特打分法。 而大數據思維則化數為據,充分發揮數據量化、客觀的特點,為領導制定決策提供依據和支持。
Q/SY 1180—2009《管道完整性管理規范》規定了管道在規劃、設計、施工和竣工階段,為了滿足管道運營期完整性管理需要應收集的數據內容與格式, 這些數據主要包括基礎地理數據、管道專業數據、 管道運行數據和管道檢維修數據,詳述如下:
a. 基礎地理數據至少包含行政區劃、 公路、鐵路、水系、居民地、等高線及數字高程模型等基礎信息。 此外,針對不同人口密度地區,應收集高后果區和環境敏感區的建筑物、人口及河流等數據信息,這些數據是管道風險評價的重要依據。
b. 管道專業數據包括管道區域等級、 套管、封堵物、防腐層、等高線、控制點、穿跨越、陰保電纜、裂紋、排流裝置、彎頭、地表高程、高后果區、收發球筒、閥、焊縫、管道材料、管道直徑及厚度等數據。
c. 管道運行數據主要包括管道運行壓力、溫度、流量、輸送介質及陰極保護點位等數據。
d. 管道檢維修數據主要包括管道泄漏位置、泄漏量和泄漏原因,對于配有腐蝕掛片、電阻探針等管道腐蝕監測裝置的管道,還應記錄其腐蝕速度數據、緩蝕劑加注數據等信息[8]。
以上數據貫穿管道的全生命周期,是開展基于大數據的管道腐蝕預警應用的基礎。
基于大數據的油氣管道腐蝕預警策略的架構如圖1所示,具體步驟有:
a. 收集歸納油氣管道腐蝕泄漏數據;
b. 對收集的大量數據進行預處理,如缺失值和偏差值處理[9],從而保證數據分析結果的可靠性和準確性;
c. 基于隨機森林模型、樸素貝葉斯網絡模型及FP-growth算法等挖掘管道腐蝕影響因素頻繁組合模式;
d. 選擇時間窗口長度,將固定時間長度內的管道數據看作一個數據流,通過數據流與管道腐蝕影響因素組合模式之間的關聯關系構建管道腐蝕預警模型;
e. 當數據流與管道腐蝕影響因素組合模式存在一定關聯關系時給出管道腐蝕預警模型。

圖1 基于大數據的油氣管道腐蝕預警策略架構簡圖
油氣管道腐蝕分為外腐蝕和內腐蝕,不同的腐蝕類型下管道的腐蝕影響因素各異。 管道本體的基礎數據、管道材質數據及焊縫等是影響管道內外腐蝕的共有因素。 管道外腐蝕主要影響因素包括土壤濕度、pH值、微生物、陰極保護裝置及防腐層等[10];管道的內腐蝕主要影響因素包括管道輸送介質的pH值、水分、微生物、運行溫度、運行壓力及緩蝕劑等[11]。 依據管道腐蝕機理,對油氣管道腐蝕影響因素進行分類歸納總結并基于分類建立管道腐蝕影響因素數據集。
實際生產運行過程中管道腐蝕泄漏是由多個影響因素組合誘發的,影響因素組合模型更為復雜, 管道腐蝕影響因素組合的數據緯度高,數據量大, 難以通過簡單的數據統計分析手段獲取。 根據管道腐蝕影響因素的分布規律, 利用Apriori關聯規則、 樸素貝葉斯分類等大數據分析算法挖掘管道腐蝕影響因素的頻繁項集組合(圖2),從得到的組合模式中進一步提取易引發管道泄漏的關鍵影響因素組合模式。

圖2 管道腐蝕影響因素頻繁項集挖掘原理示意圖
在大部分數據流的應用分析中,用戶往往關心最近的數據,因此基于基礎地理數據、管道專業數據、管道運行數據和管道檢維修數據構建管道生產運行數據流,數據流是一系列連續而有序的
依據油氣管道的基礎地理數據、管道專業數據、管道運行數據和管道檢維修數據,提出了基于大數據的油氣管道腐蝕預警策略,目前尚處于理論研究階段,歷史數據的完整性和數據質量在一定程度上制約著創新應用研究的進程。
傳統的管道腐蝕預警方法大部分是基于管道缺陷和管道腐蝕速度的直接檢測或間接檢測技術,側重于對管道腐蝕結果的測量,而基于大數據的管道腐蝕預警策略則依據管道腐蝕影響因素和腐蝕速度之間的量化關聯關系推斷管道腐蝕演變規律,后者考慮的因素更全面,對提高管道腐蝕預警的準確率有重要意義。
目前國內鮮有利用大數據算法構建基于滑動窗口的油氣管道腐蝕預警模型的研究,該模型構建方法具有典型的創新思維,為基于油氣管道腐蝕預警模型的研究提供了方法指導,對于提升油氣管道腐蝕泄漏防控水平具有重要意義。