梅永貴 駱裕明 王景悅 薛占新 石延霞 張 斌
(1.中國石油華北油田公司,河北 062550;2.中國石油華北油田公司山西煤層氣勘探開發分公司,山西 046000;3.中國石油天然氣集團有限公司煤層氣開采先導試驗基地,河北 062550)
在煤層氣開發中,抽油機作為主要排采設備其整體效率直接影響開發成本。煤層氣井生產屬于降壓排采,各排采階段產水量變化較大,若不及時調整排采設備,經常會出現“大馬拉小車”的情況。另外一些排采井產水量大,存在著泵徑過小、抽油機機型不匹配等問題,均會導致系統效率過低,降液困難。據統計,國內油田抽油機平均系統效率為27.6%,而沁水盆地南部煤層氣主要區塊的抽油機井平均系統效率僅為0.6%~7.4%,遠遠不能達到抽油機節能要求25%的標準,能量利用率低的現狀亟待改善。
對于抽油機能耗分析,國內外學者從理論計算和經驗數據兩個方面開展了大量研究。理論計算方法主要是從能量的角度精確模擬計算系統的各節點損耗,而經驗分析法則是根據電流、功圖、泵效等指標或其組合判斷能耗在節點的轉換率。這兩類方法應用于煤層氣抽油機井能耗分析時,存在以下問題:(1)煤層氣不同排采階段,抽油機懸點載荷數值波動大,相應的節點能耗是動態變化的,節點指標參數分析取值存在困難;(2)機采井受到多方面因素影響,精確的模型對參數要求較高,求解一般較為復雜,理論計算法的及時性和實用性較差;(3)經驗分析法依賴于分析人員對平衡率、泵效、電機的平衡度等指標數據的認識程度,對于大量單井機采系統無法快速實現能耗評價。
本文基于數據挖掘與大數據分析,創新構建一套多維尺度機采系統優化模型,應用K-means聚類分析獲得不同能耗偏向性的獨立樣本群,明確節能措施方向,給抽油機系統節能降耗提供新的技術思路。
機采系統能耗主要考慮因素是電機、抽油機匹配度、抽油機生產參數與載荷的匹配度、抽油機工況(抽油機“五率”)、皮帶和盤根松緊度等。地下管柱因素主要包括管柱的偏磨、泵的漏失率、供液不足、氣體影響等影響。采用9個能耗關聯性較高、容易獲取的指標進行替代分析:載荷利用率、沉沒度、流壓、產液量、泵排量系數、噸液百米單耗、沖次、平衡度、電機功率利用率。這些指標與可反映的節點或設備因素的對應關系如表1所示。

表1 能耗指標與影響因素對應關系
提取與抽油機能耗相關的各類生產參數,建立①~⑤大數據分析模型,優化抽油機系統能耗分析傳統算法,如圖1所示:
① 提取與單耗相關性高的9個生產指標參數;
② 利用SPSS軟件建模進行參數主成分分析,降低其耦合性;
③ 利用K-means聚類分析,依據數據特性劃分單井類型;
④ 依據不同類型單井做偏向性分析,確定高能耗節點;
⑤ 依據高能耗節點,制定對應的優化措施。

圖1 大數據優化模型示意圖
上述9個指標從不同方面反映了抽油機的節點能耗情況,但是數據維度多、耦合性較強,如何從指標數據中分析出節點能耗特征,這實際是個多參數的優化問題。下面以沁水盆地南煤層氣田的504口抽油機井生產動態數據為例,通過數據挖掘提取單井的能耗特征。
實際生產中對于具體損失多少能耗的定量計算要求不高,都屬于定性判斷。指標之間并不獨立,耦合性較強,這里對數據進行主成分分析提取獨立變量,實現數據降維。首先對上述的9個指標數據進行主成分分析,表2所示為利用SPSS軟件建模計算結果。最終提取了特征值大于1的3個主成分,依據轉換系數(表3)將9個指標轉化成3個主成分。

表2 SPSS主成分分析結果

表3 SPSS主成分分析各參數占比
雖然主成分分析簡化了指標,降低了耦合性,但對主成分數據結果很難發掘其實際意義,將主成分指標數據投影到多維空間中后,如圖2所示,無法感官區分和發現樣本的特征。需要通過聚類分析得到不同能耗特征的分類。

圖2 能耗指標主成分數據多維空間顯示
對于多指標分類,如何確定最佳分類的個數,目前仍沒有明確唯一的方法來解決這個問題。理想的分類方案需要最大限度地使類別間距離最大,同時類內成員距離最小。本文采用的是基于Euclidean距離模型的K-means聚類算法進行分析。
這里從實用性的角度結合類間距和類的穩定性幾個方面來考慮,根據排采井生產經驗我們需要的分類數在3~5范圍內,即方案A:分為3類,方案B:分為4類,方案C:分為5類。采用枚舉法,分別計算在一定數據增量的情況下原樣本分類是否發生變化來衡量各自分類的穩定性,最為穩定的分類方案即為滿足要求程度最高的方案。本文采用交叉驗證法(Cross Validation)來比較3種分類方案的聚類結果。使用504條樣本記錄的50%的樣本聚類計算得出分類后,分別使用30%、40%、50%(152條、203條、252條)作為增量形成3個樣本總體分別進行聚類計算,相應的結果如表4所示。從穩定性角度考慮,方案A的類別最為穩定,分類較為合理。

表4 聚類分析評價表
取劃分3類為參數進行K-means聚類計算,主成分樣本及聚類中心結果如圖3,圖中使用3種不同顏色標注不同分類,可以看出三個類別的樣本主成分數據基本上是沿著某個方向的延伸,可以解釋為同一類別具有相同特征值的表現。

圖3 k-means聚類結果

圖4 Ⅱ類能耗井(左)及Ⅲ類能耗井(右)偏向性分析結果
依據上述聚類分析得到的3個類別內分別進行多維尺度偏向性分析,在某一類別內評價各單井,明確能耗特征偏向:
Ⅰ類井一般某些特征較明顯,直接分析較為容易,同時井數較少,也無法進行偏向性分析。
Ⅱ類井(圖4a)的百米噸液耗電量與電動機功率利用率和泵的排量系數相關性較大,而受其他因素影響較小。
Ⅲ類井(圖4b)的百米噸液量與抽油機井的平衡度相關性大,另外電動機功率利用率與載荷利用率關系較為密切。
依據上述指標特征的偏向性分析,依據不同的分類展開不同側重點的優化維護工作。相應地從單井水量與設備的匹配度、設備的狀態、工作制度三個方面對系統進行優化,具體優化策略及措施如表5。

表5 不同類型能耗單井優化策略
Ⅰ類能耗井:通過經驗法分析,2口井存在管柱漏失的問題,經過作業施工,更換破損油管,指標恢復正常。
Ⅱ類能耗井:在煤層氣田井中存在大量供液不足的單井,主要采用間抽、調整泵徑和沖程沖次等方法減少了抽油機的運行時間,從而降低單位能耗。依托井上自動化系統,目前沁水盆地南的單井可實現大面積智能排采控制。針對422口井的抽油機工作制度重點篩查,經過論證對115口單井實行了間抽,下調213口單井的沖次。
Ⅲ類能耗井:對80口單井抽油機工況進行檢查,進行了調整平衡、盤根盒等井上日常維護,有效降低了單耗。
(1)針對煤層氣抽油機井,研究了百米噸液單耗與相關生產指標的分布關系,依此對單耗影響因素進行了指標提取,利用指標的大數據特征對大量單井進行能耗特征評估,是降低煤層氣井能耗動態分析成本的有效途徑,彌補了理論計算法的不足。
(2)對于多因子、高耦合的能耗相關指標,首次提出綜合運用主成分分析結合K-means聚類分析、多維尺度偏向性分析等數據挖掘技術進行分析,可降低經驗分析法的工作強度,有利于提高氣田智慧化控制水平。
(3)從大數據特征發現,影響沁南煤層氣抽油機井高單耗的主要因素為水量不穩定及低載荷,常規抽采設備要想實現油田高效運行水平的難度較大,因而急需尋找適合這種特點的新型節能排采設備。