齊秋平,文必龍,吳 婷
(東北石油大學 計算機與信息技術學院,黑龍江 大慶 163318)
時序數據是指按照時間的秩序,以一定的時間間隔排列的一系列數據的集合[1]。近年來,隨著大數據的迅速發展,對時間序列的分析經歷了從頻域到時域、單變量到多變量、線性到非線性、局部到系統的漸進過程;同時也是逐步提高模型擬合精度、增強模型的預測能力和改善可操作性的過程。為了減少異常點對時間序列分析結果的干擾,就需要對異常點進行檢測并處理。數據異常檢測能實現數據質量提升與潛在信息挖掘[2],異常數據的挖掘主要使用偏差檢測,包括聚類法、序列異常法、最近鄰居法、多位數據分析法等[3-5]。通過對時序數據應用主成分分析法進行特征壓縮從而去除數據的噪聲[6],對數據進行異常檢測,可以從大量的數據中挖掘出不滿足數據一般行為或模式的數據,而儲油罐液位數據反映的一些異常信息比常規模式更有價值,它能夠幫助人們掌握時間序列中蘊含的規律,為人們提供有力的決策支持。
針對液位數據的異常檢測主要分為以下四個方面:
1. 學習時序數據過去的行為特征;
2. 計算出相似的行為模式,預測未來過程中的可能狀態或表現;
3. 根據限制條件進行異常活動檢測;
4. 通過對異常數據的特征分析進行模式識別,判別出異常類型。
針對以上方面,提出了一套基于儲罐液位數據進行異常檢測的系統,該系統可根據油田歷史數據找出其內在規律,并根據過去的某些行為特征做出相似模式的預測,最后找出其中的異常波動并對這些波動進行分類和標識,可防止儲油罐過滿溢出、儀器故障、拉油車拉油時間不規范、偷油漏油等情況的發生。
儲罐液位隨時間的變化趨勢如下圖1所示。

圖1 儲罐液位散點圖Fig.1 Storage tank level scatter chart
針對液位曲線的走勢,本文的模型研究主要從以下四個方面展開:
(1)數據分析:在石油集輸過程中會產生大量油罐液位實時監測數據,對這些數據分析過程中發現數據反復呈現某些規律,抽取出潛在的、有價值的知識(模型或規則)[7],如液位在某時間段內上下波動、液位上升時斜率會有所變化、拉油車拉油過程中液位會均勻下降等等。通過對數據的綜合處理發現,數據整體具有一定的變化趨勢和數據周期,而油田上對于這些行為模式的認識及分析并不全面。
(2)數據預測:在對海量液位數據潛在價值的挖掘中,綜合考慮溫度、壓力、流量、負荷等因素的變化對液位未來動態變化的影響,充分利用歷史數據的規律對未來數據進行一定的預測分析和總結。
(3)異常檢測:在數據的分析處理中,通常會出現一些數據的異常波動,而這些波動在生產上通常會有一定的現實意義,目前油田上的數據體系太過繁雜,并未對這些異常的數據波動做出分類和標識,相應的,對于相關的數據誤差和體系缺陷并沒有給出規范性約束。
(4)模式識別:通過對數據的異常檢測只能夠篩選出異常的數據,并不能夠判別出是哪一類別的異常情況,為了提高異常數據的實際意義,須將異常數據進行模式識別判斷出異常數據的實際意義,從而提高異常數據的實用價值。
隨著計算機技術的發展,人們引入了鉆井監控軟件。目前國內外有許多針對特定專業如鉆井的實時數據采集的系統,對智能預警和優化方面有較多的研究。
在石油數據實時分析方面,李云峰等人提出一個新型的鉆井異常狀態實時監測與智能決策系統模型,該模型將鉆井工程信息管理,鉆井參數實時采集和智能化決策支持技術集成為一體,解決了鉆井異常狀態實時監測的問題[8]。由劉琦開發的鉆井監控系統提供了鉆井、電機和發電機實時數據可使技術人員和工程人員對現場施工數據及時瀏覽與分析,實時監控,及時指導和處理鉆井現場的問題[9]。史鵬濤等人對智能完井技術的深入研究也解決了采集、傳輸及分析井眼生產數據、油藏數據和全井生產鏈數據能力,以遠程控制方式改善對油藏動態和生產動態的監控的問題[10]。從上世紀90年代,國外就開始研究智能完井技術,Baker Hughes、Schlumberger、ABB和 Roxar等幾家公司都開發了進行井下監控的智能完井技術,并得到了大面積的推廣應用[11]。
在時序數據預測未來趨勢方面,修妍提出了基于改進相空間加權局域法的混沌時序預測[12],吳江等人提出了一種基于云模型的數據預測算法[13],郭建明設計并實現一個安全優化鉆井實時監控智能計算機系統,實現了安全優化鉆井知識整合.系統可用于鉆井設計、施工、完鉆總結階段的鉆井異常問題的檢測、識別、預測、診斷、預防和處理,實現安全優化鉆井的目標[14]。閆學峰等人設計了油井生產實時分析優化專家系統 PES,該系統具備了油井生產數據實時采集、數據管理、生產動態預測、實時工程分析、故障診斷、遠程計量、系統效率及損耗分析、生產參數實時優化設計、措施方案發布、智能控制等功能[15]。陳銳等人設計了鉆井風險實時監測與診斷系統,主要是通過對鉆井工程數據和隨鉆測量數據進行實時處理分析,結合多參數融合算法技術對井下鉆井風險進行實時監測和診斷分析,很好地監測與診斷鉆井風險[16]。
在油田時序數據分析系統方面,國外先進的石油公司都已經建立了強大的決策支持系統和協同工作環境,將分布在世界各地的研究機構、管理部門和施工現場連接起來,利用強大的數據庫和先進的軟件對各種技術決策提供者有力支撐,有效降低了施工風險。國內石油行業,尤其是鉆井行業盡管開展了相關研究,但尚未建立完整的自主產權的決策支持系統和相應的決策工作模式[17]。
綜上,油田上大多數平臺或系統均是單方面分析數據,對于時序數據的異常檢測方面并沒有統一的模式,因此,本文以儲罐液位數據為例,提出了一套對油田儲罐液位數據進行異常檢測的系統。
根據儲罐液位異常檢測系統需求,主要分為特征提取、異常檢測、模式識別(異常分類)、預測分析四個部分,系統總體架構圖如下圖2所示。
系統設計以簡便操作、精確分析、準確預測為原則,突破傳統單一的數據可視化方式,把異常檢測和異常模式識別作為重點突破問題,能夠更好地監測數據中的異常情況。數據分析結果、異常檢測功能進行軟件實現,提供可視化操作平臺。儲罐液位異常檢測平臺主要功能如圖3所示。
本系統主要分為以下模塊:
1. 數據選擇模塊
儲罐液位數據會實時錄入到數據庫中,通過前端與后臺的交互,對數據進行選擇并錄入到R語言軟件中進行處理,實現數據庫中的數據表可視化,以便用戶進行選擇。
2. 算法匹配模塊
不同的油井的數據流變化趨勢有所不同,將預處理后的數據進行圖形可視化,從算法庫中選擇合適的算法進行匹配分析,通過算法評價體系自動匹配最優算法,對各參數和油井產量之間進行多種分析,判定各參數同油井產量的關聯性程度,定性、定量地給出影響油井生產動態的各種因素對油井產量影響的大小,從而挖掘出蘊含在數據內部的關系模式。

圖2 系統總體架構圖Fig. 2 System overall architecture chart

圖3 功能結構圖Fig.3 Functional structure diagram
3. 異常檢測模塊
數據異常檢測,本文采用SPC算法中的控制圖對波動點進行篩選,找出數據的異常波動并將其歸類,建立樣本庫,通過模式識別技術對不同類的數據進行特征構建與特征提取,并通過機器學習的手段實現異常自動歸類的目的。
4. 預測分析模塊
石油數據龐大繁多,對于預測的結果要求很高,采用 ARIMA模型對時間序列進行預測取得了可觀的效果,并能夠顯示波動范圍的可控區間,能夠很好地對數據進行觀測以便及時采取預防措施。
通過以上幾個模塊解決現實生活中油田生產成本高,生產效益低的問題,在歷史數據的基礎上更好的決策異常范圍并做出預測,很好地檢測出異常數值并進行預報。在研究過程中通過對數據的了解及分析還可以對運營模式給予一定的優化建議,降低生產成本更好地提高生產效益。
數據架構圖如圖4所示,其中:
● 數據庫用來從油田液位數據庫或其它數據源中抽取數據到平臺中,并建立分析數據集。

圖4 數據架構圖Fig.4 Data structure diagram
● 算法庫主要是提供由實驗案例得出適合的算法與當前要進行異常檢測的數據進行自動匹配的功能。
● 組件庫提供歷史數據的描述存儲以及算法的分析與解釋功能,執行異常檢測算法生成分析結果,評價結果。
● 圖形庫完成數據的可視化,并能夠對異常結果進行標識。
總體技術上,本項目采用模型驅動 MDA的技術架構。通過元模型,把同類的模型管理起來,如油田不同工序的時序數據、各種通過實驗的算法模型等,通過數據映射技術,實現不同模型之間的關聯,從而達到同一系統可推廣到分析不同工序數據的目的。
本文針對液位數據進行了分析,設計了一套儲罐液位異常檢測的模型,優化了油田大多數平臺單方面分析數據的缺陷,利用液位數據的時序性對其進行挖掘分析并給出了一套通用的分析框架,以便于將其推廣到油田中其他工序如鉆井、測井、錄井、井下作業等工程的異常檢測。
[1] Brockwell P J. Introduction to time series and forecasting,volume 1. Taylor & Francis, 2002.
[2] 龍瀅, 裘曉峰. 基于滑動窗口的單傳感器數據異常檢測[J].軟件, 2014, 35(12): 49-57
[3] 楊金偉. 基于距離和信息熵的不確定異常點檢測研究[D].云南大學, 2011.
[4] 劉良旭, 樂嘉錦, 喬少杰, 宋加濤. 基于軌跡點局部異常度的異常點檢測算法[J]. 計算機學報, 2011, (10): 1966-1975.
[5] 劉丹丹, 陳啟軍, 森一之. 線性回歸模型的多離群點檢測方法及節能應用[J]. 信息與控制, 2013, (06): 765-771.
[6] 張樂玫, 羅濤. 室內定位特征選擇算法研究[J]. 軟件,2015, 36(1): 38-46
[7] 馮文霞, 王廣安. 數據挖掘在服務成本預測方面的應用研究(SDCF-DM)[J]. 軟件, 2013, 34(4): 46-48
[8] 葛利. 基于過程神經網絡的時序數據挖掘研究[D]. 哈爾濱工程大學, 2012.
[9] 劉琦. 鉆井監控系統的設計與研究[D]. 電子科技大學,2011.
[10] 史鵬濤, 陳俊斌, 陳鵬剛. 智能完井新技術的研究及應用[C]//石油鉆井院所長會議. 2008.
[11] 阮臣良, 朱和明, 馮麗瑩. 國外智能完井技術介紹[J]. 石油機械, 2011, (03): 82-84.
[12] 修妍. 基于改進相空間加權局域法的混沌時序預測[J]. 軟件, 2013, 34(4): 34-37
[13] 吳江, 孫劍偉. 一種基于云模型的數據預測算法[J]. 軟件,2015, 36(12): 212-215
[14] 郭建明. 安全優化鉆井實時監控智能系統模型及應用[J].西南石油大學學報(自然科學版), 2008, (06): 153-156+217.
[15] 閆學峰, 檀朝東, 吳曉東, 張杰. 油井生產實時分析優化專家系統PES的研發及應用[J]. 中國石油和化工, 2009,(11): 55-58.
[16] 陳銳, 李黔, 尹虎, 袁本福. 鉆井風險實時監測與診斷系統設計及應用[J]. 斷塊油氣田, 2013, (01): 115-117.
[17] 楊傳書, 肖波, 肖莉, 等. 鉆井決策支持系統總體架構設計[C]//度鉆井技術研討會暨石油鉆井院所長會議.2011.