李 鑫 耿玉廣 楊小平 黃少偉 張文靜 周正奇(.華北油田公司采油工程研究院,河北任丘 0655;.華北油田公司第一采油廠,河北任丘 0655)
以噸液百米舉升耗電量為目標的大數據分析應用
李鑫1耿玉廣1楊小平1黃少偉1張文靜1周正奇2
(1.華北油田公司采油工程研究院,河北任丘062552;2.華北油田公司第一采油廠,河北任丘062552)
應用大數據挖掘技術可實現將采油工程海量數據轉化為可用于指導油田生產的意見。由于影響噸液百米舉升耗電量指標的因素眾多,對于何種因素是影響區塊或單井噸液百米舉升耗電量指標的主要因素并不十分明確,這就需要利用大數據挖掘技術來剖析各種因素對噸液百米舉升耗電量的影響。以噸液百米舉升耗電量為目標,建立了相應的數學分析模型,基于油田生產數據庫的海量數據,開發了數據挖掘軟件,挖掘出影響阿爾油田機采井噸液百米舉升耗電量的數十個關聯因素,定量化泵效、沉沒度等指標范圍,并預測了噸液百米舉升耗電量指標的未來的變化趨勢,提出了措施調整建議。編制的采油工程大數據軟件是實現大數據管理、數據挖掘、結果呈現的載體,包括系統管理、數據預處理、功能模塊、功能應用、圖形報表展示、分析模型、進程可視等功能,為用戶提供了實用的數據挖掘工具平臺。
智慧油田;大數據;耗電量;數據挖掘;算法模型
當前,大數據挖掘技術與石油工程領域還沒有做到充分結合,應用也并不廣泛。有部分學者將數據挖掘技術應用到石油工程領域,如G. Zangl[1]通過建立數據挖掘模型,進一步保證了油田各項數據的質量,實現了對油井或整個生產系統的監視,對提高油氣田產量具有重要意義。隨著華北油田勘探開發工作的不斷深入和數字油田建設的快速發展,在油氣生產過程中積累了海量數據,為應用大數據挖掘技術提供了堅實的基礎。采用數據挖掘算法和技術能夠充分利用多專業的大數據,挖掘出蘊含在海量數據中不易發現的規律,在此基礎上綜合考慮多種因素變化,預測這些因素對未來生產動態的影響。以噸液百米舉升耗電量為挖掘目標,進行大數據分析研究,挖掘各種影響因素與噸液百米舉升耗電量之間的內在隱蔽規律,綜合考慮多種因素對未來抽油機井系統效率、噸液百米舉升耗電量的影響,準確采取降低噸液百米舉升耗電量的措施手段。
油氣田領域的應用數據庫獨立而分散,結構化數據和非結構化數據并存,為了使這些數據產生效益,將大量的實際數據作為樣本點,通過相應的數學分析方法對這些樣本點進行分析,得到其中的變化規律和各個樣本參數間的關聯性[2]。
數據挖掘又稱為數據庫中的知識發現,是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含其中的、不為人們所知的、但又有潛在應用價值的信息和知識的過程[3]。
1.1總體設計
通過建立主題數據庫,從相關數據庫中獲取所需數據,并配置包括灰色關聯、因素分析、聚類分析等多種數據挖掘算法,形成數據挖掘平臺,對大量多維、多源數據進行關聯分析與預測工作,并以圖表、報表等形式進行成果展現,形成基于噸液百米舉升耗電量指標的大數據挖掘系統應用。如圖1所示。

圖1 數據挖掘軟件平臺系統總體設計
1.2數據準備
噸液百米舉升耗電量指原油在開采過程中把1 t液體從地下提升100 m所消耗的電能。
單井噸液百米舉升耗電量計算公式[4]

式中,X為單井噸液百米舉升耗電量,kW·h/(100 m·t);W為單井日耗電量,kW·h;Q為單井日產液量,t;H為有效揚程,m。
在油田生產中涉及噸液百米舉升耗電量指標的因素很多,已知的有:產液量、含水率、井液黏度、井口回壓、套壓、沉沒度、沖程、沖次,泵徑、油管直徑、泵掛深度、桿柱組合,抽油機井系統效率(井下效率、地面效率)、泵效,電機輸入功率、電機功率、電機負載率、抽油機平衡率等。未知的有:環境溫度、調參時機、洗井次數、清蠟周期、增注量等。而產液量、電機功率其數值與噸液百米舉升耗電量沒有直接的線性關系[5],所以需要通過統計、分析找出其相關性。
1.3挖掘算法
在數據倉庫的基礎上,采用了灰色關聯方法、因素分析法和聚類分析法等多種數據挖掘算法建立挖掘模型,對大量多維、多源數據進行關聯分析與預測工作[6]。
1.3.1灰色關聯方法任何隨機過程都是一定范圍、一定時區變化的灰色量,其隨機過程為灰色過程。對于抽油機井噸液百米舉升耗電量,各影響因素不是確定值,而是一個變化范圍。灰色理論分析方法是一種動態發展態勢的量化描述和比較方法[7]。亦即“灰色關聯度”,作為衡量因素間關聯程度的一種方法。
設母序列為{X0,(k)},子序列為{Xi,(k)},其中k=1,2,…,N;i =1,2,…,m。N為時間序列長度,m為影響因素個數。
由于系統中各因素的物理意義不同,導致數據的量綱也不一定相同,因此在進行灰色關聯度分析時,一般都要進行無量綱化的數據處理。
極大值法——無量綱化數據處理

則關聯系數,當t = k時

其中

式中,?ymin、?ymax為各個時刻絕對值差的最小值與最大值;ρ為分辨系數[0~1],通常取0.5。
關聯度

通過對噸液百米舉升耗電量的影響因素進行灰色關聯分析,生產決策者可掌握影響噸液百米舉升耗電量指標的最重要的影響因素排名,并根據影響程度排名有的放矢地采取相應措施,降低噸油百米舉升耗電量,提高抽油機井生產管理水平。
1.3.2因素分析法因素分析法又稱連鎖置換法或連鎖替代法,是通過逐個替換因素,確定相互聯系的因素對分析指標變動影響程度的一種方法[8]。實時分析機采井各部分工作狀態的參數大小,建立指標評價標準,應用模糊隸屬函數標準化方法把指標進行歸一化,對各個指標進行評價。
越大越優型

越小越優型

適中型

式中, OFMij為第i個因素的第j個客觀指標的隸屬度,亦為標準化計量值;OFij為第i個因素的第j個客觀指標的計量值;OFijmax為第i個因素的第j個客觀指標的最大可能值;OFijmin為第i個因素的第j個客觀指標的最小可能值; OFbe為第i個因素的第j個客觀指標的最優值。
單因素分析指標級別分為好(0.75~1.0)、較好(0.5~0.75)、一般(0.25~0.5)和差(0~0.25)。通過影響因素分析法可對影響噸液百米舉升耗電量指標的幾個因素進行評價,并與其評價標準進行比對,就可得到各影響因素的評價級別,進而分析得到導致噸液百米舉升耗電量指標低的具體原因,對抽油機井工作參數進行調整,進一步提高抽油機的系統效率,降低噸液百米舉升耗電量指標。
1.3.3聚類分析法根據事物的特征對其進行聚類或分類,以期發現規律和典型模式。這類技術是數據挖掘技術的最重要技術之一[9]。聚類分析是歸納的,不需要事先確定分類的準則來分析數據對象,不考慮已知的類標記,聚類目標就是通過聚類算法產生這種標記。
通過研究噸液百米舉升耗電量所在區塊的分布,能夠很好地根據噸液百米舉升耗電量指標對多口抽油機井進行分類,發現高耗能井的規律,從而研究各類噸液百米舉升耗電量指標特征,并根據現場實際情況做出客觀評價。
1.4系統平臺
軟件平臺是實現數據挖掘、結果呈現的載體,包括分析系統、功能模塊、分析模型、功能應用、進程可視、結果展示等功能,滿足用戶選用適合的挖掘算法、定制曲線圖表等,數據挖掘軟件平臺構成見圖2。

圖2 數據挖掘軟件平臺構成示意圖
采用阿爾、岔河集油田近400萬條油井實時生產數據,結合抽油機井基礎數據、示功圖計量和系統效率分析數據以及當地同期氣溫數據,建立了針對噸液百米舉升耗電量挖掘任務的主題數據庫,并利用配置的各種基礎、專業和高級挖掘算法對其進行數據挖掘工作,從中發現和總結影響噸液百米舉升耗電量指標的相關規律,提出了更加有針對性的降低噸液百米舉升耗電量指標的措施。
2.1基礎挖掘實例
通過對不同數據以曲線圖、柱狀圖、散點圖、餅圖和泡狀圖等形式進行直接展示,可以對某一個參數進行連續顯示,從中找出數據的變化規律,實現單口油井生產數據分析;也可以通過井與井間的數據對比,發現井間的差異,實現油井間的對比。以XX井在一年半的時間里噸液百米舉升耗電量的變化為例,可以發現噸液百米舉升耗電量隨時間是在不斷變化的,從中反映管理水平;結合井位圖直觀地展示一個區塊內多口油井的噸液百米舉升耗電量,其中圖形越大,表明耗電量越高。
2.2專業挖掘實例
通過分析環境溫度與噸液百米舉升耗電量關系,可以發現,環境對噸液百米舉升耗電量有一定影響,氣溫高,噸液百米舉升耗電量低;氣溫低,噸液百米舉升耗電量高。通過分析某區塊某一時間內全部油井的耗電量情況,可以看出大部分井都在合理區,也有部分井處在潛力區,通過采取適當措施可以降低耗電量;部分井可能數據有問題需要落實,這就為下一步在哪些井上采取措施提供了方向。
2.3高級挖掘實例
隨機選擇Ax井的16個與噸液百米舉升耗電量可能有關的因素,采用灰色關聯度分析方法,得到相關度及排序,見表1。從表1可以看出,Ax井沉沒度、泵效、有效功率、泵功率和日產液對噸液百米舉升耗電量的影響最大。該井泵效(23.62%)和日產液量較低(3.4 t/d),且處于下降趨勢,建議該井通過調整抽汲參數提高泵效和產液量,進而可降低噸液百米舉升耗電量。

表1 Ax井噸液百米舉升耗電量的影響因素排序
選取A井區某一天的所有井數據,對與噸液百米舉升耗電量關聯度較高的沉沒度和系統效率2個因素為研究對象,先聚類歸納后再進行平均處理得到關系曲線。圖3顯示隨沉沒度增加,噸液百米舉升耗電量先逐漸減少然后增加,而系統效率隨著沉沒度的增大先增大后減少。因此,A井區合理沉沒度區間應控制在400~650 m之間。

圖3 A井區沉沒度、系統效率與噸液百米舉升耗電量聚類分析
(1)通過對噸液百米舉升耗電量大數據分析方法的研究應用,為在油田各工程領域應用大數據分析技術提供了很好的借鑒作用。
(2)以噸液百米舉升耗電量為分析目標,結合基礎、專業及高級挖掘算法庫開展的大數據分析研究工作,為油田工程技術研究提供了一套新的數據分析方法。
(3)大數據挖掘就是通過“回頭看”,把前期大量的生產數據,經過分析、對比,找出產生問題的原因,提出解決的辦法,達到優化生產運行參數、節能降耗的目的。
[1]ZANGL G, OBERWINKLER C P, Schlumberger. SPE annual technical conference and exhibition[R] . Houston, Texas, 26-29 September 2004.
[2]劉國民,孟祥菊,李亞,等.數據挖掘技術在油田上的應用[J].內蒙古石油化工,2009(16):92-96.
[3]王宏威.油田數據挖掘技術的研究與應用[D].黑龍江大慶:大慶石油學院,2005-02.
[4]DB21/1740—2009,原油(氣)液生產噸液百米用電限額與計算方法[S].
[5]姜海濤.單井電量計量在節能對標方面的應用[J].油氣田地面工程,2013,23(9):100.
[6]檀朝東,岳晶晶,吳麗烽,等.數據挖掘技術在油藏挖掘軟件中的應用[J].中國石油和化工,2010(10):66-67.
[7]胡永宏,賀思輝.綜合評價方法[M].北京:科學出版社,2000:129-140.
[8]龔攀,劉金蘭,張婷婷.基于因素分析法的石油企業利潤影響因素分析[J]. 價值工程,2011(35):131-132.
[9]呂安民,林宗堅,李成名.數據挖掘和知識發現的技術方法[J].測繪科學,2000,25(4):37-38.
(修改稿收到日期2015-06-26)
〔編輯景暖〕
Big data analysis and application targeted at power consumption by lifting one ton of liquid to 100 m
LI Xin1, GENG Yuguang1, YANG Xiaoping1, HUANG Shaowei1, ZHANG Wenjing1, ZHOU Zhengqi2
(1. Research Institute of Oil Production Engineering, Huabei Oilfield Company, Renqiu 062552, China; 2. No.1 Oil Production Plant, Huabei Oilfield Company, Renqiu 062552, China)
The use of big data mining technology can transform the mass data of oil production engineering into ideas of guiding oilfield production. There are numerous factors which affect the power consumption indicators for lifting one ton of liquid to 100 m, so it is not quite clear which is the main factor that affect the power consumption indicators for lifting. This will need the big data mining technology to analyze the effect of various factors on power consumption indicators for lifting. With the goal of power consumption for lifting, a relevant mathematic analytic model was built, and data mining software was developed based on the mass data of oilfield production database, and tens of related factors were mined which affected the power consumption for lifting in artificially lifted wells of Al Oilfield. The target scope of pump efficiency and submergence was quantified. The future trend of power consumption indicators for lifting was predicted, and suggestions for related measures and adjustment were come up with. The developed big data software of oil production engineering was a carrier which realized big data management, data mining and result presentation, including functions like system management, data preprocessing, functional modules, function application, display of graphic report, analytic model, and progress visualization, providing a practical data mining tool platform for our customers.
intelligent oilfield; big data; power consumption; data mining; arithmetic model
TE355.5;TE19
A
1000 – 7393( 2015 ) 04 – 0076 – 04
10.13639/j.odpt.2015.04.020
華北油田公司中長期重大科研項目“智慧油田研究與實踐——油氣田自動化生產指揮系統及采油工程云系統研建”(編號:2013-HB-Z1010)。
李鑫,1962年生。1984年畢業于華北石油職工大學油田自動化專業,從事油田自動化技術研究與應用工作,高級工程師。電話:0317-2727695。E-mail:cyy_lixin@petrochina.com.cn。
引用格式:李鑫,耿玉廣,楊小平,等.以噸液百米舉升耗電量為目標的大數據分析應用[J].石油鉆采工藝,2015,37(4):76-79.