王丹群, 李治平*, 毛得雷
(1.中國地質大學(北京)能源學院, 北京 100083; 2.中聯煤層氣國家工程研究中心有限責任公司, 北京 100095)
水平井分段壓裂技術的廣泛應用使得致密氣藏快速地進入了工業化開采階段,對于壓裂后產能預測的難點主要來源于兩方面:一是由于壓裂后產能的影響因素眾多,如包括流體性質以及儲層巖石性質的地質因素、包括完井方式或工作制度等開發因素、壓裂后裂縫的滲透率、裂縫長度等裂縫因素以及壓裂過程中的人為因素,都讓預測的無阻流量和影響因素之前呈現出復雜的非線性關系。二是由于壓裂產能預測的模型傳統方法大多為解析解法、半解析解法和數值解法,由于所探討模型多做大量理想化假設,導致預測產能的結果誤差很大。
早在1988年,Joshi[1]率先提出了水平井產能公式的計算方法,也成為后續研究學者產能模型演變的基礎公式。中國研究學者郎兆新等[2]在綜合Joshi[1]和Mukherjee等[3]的研究的基礎之上提出了基于嚴格高等滲流理論求解出水平井壓裂的產能公式。隨后寧正福等[4]、韓樹剛等[5]、位云生等[6]、黃亮等[7]、楊兆中等[8]研究學者都對致密氣藏水平井分段壓裂井產能的模型進行了推導和修正,但應用方法并不僅僅局限于一種,多利用位勢理論和疊加原理。基于郎兆新等[2]的物理模型假設思想,寧正福等[4]對壓裂水平井的產能預測公式進行了重新修正,在產能公式的求解和推導過程中應用了位勢理論、疊加原理和矩陣方程數值分析求解方法。韓樹剛等[5]的研究基于動量定理和流體力學理論,將水平井產能公式當中壓力等值運用真實氣體狀態方程和壓力函數替代為氣體表示,建立氣藏壓裂后水平井地層滲流特征和水平井筒管流耦合的產能計算模型。位云生等[6]建立以單壓裂段為單元的物理模型,運用單壓裂段壓降疊加分析方法和單壓裂段產量遞減分析方法,并且將氣藏滲流和變流量井筒流動聯系起來,建立了多段壓裂水平井從地層到井底全過程流動的產能預測方程組是位等人所提出的創新點。2017年黃亮等[7]提出的模型分別對地層段、裂縫段、射孔孔眼段和井筒段的壓降進行耦合,建立了考慮氣體從地層滲流至水平井筒內全過程壓降分析的低滲致密氣藏壓裂水平井產能預測新模型,并且考慮到了人工裂縫的應力敏感性,給裂縫滲透率增加了裂縫滲透率敏感系數,增加產能模型的準確性。
近年來對于致密氣藏壓裂水平井的產能模型的探究并未停止,2019年楊兆中等[8]對致密氣藏水平井分段壓裂后產能的計算模型進行了更創新的分析方法,建立利用高滲透帶代表水平井分段多簇壓裂后的裂縫的物理模型,根據等效滲流理論、位勢理論、疊加原理,對高滲透帶進行微元計算,建立致密氣藏分段壓裂水平井非穩態產能計算模型,并利用數值模擬分析高滲透帶以及裂縫特征對壓裂后水平井產能的影響,實例驗證模型準確性高。但對于利用數學方法建立模型而言,理想化的假設、模型求解過程當中簡化的計算方法,這些都導致產能模型最后的計算結果誤差較大。
近年來,神經網絡方法作為最具有預測性的一種模型廣泛應用于油氣田領域。利用神經網絡模型等機器學習的方法可以將復雜的地質施工工程和人工操作因素作為變量類型,不考慮實際的地質構造和物理模型過程,讓產能計算更加方便。將機器學習方法融合進氣井產能預測取得了顯著的成果,如許敏等[9]、葉雙江等[10]、王黎等[11]、莊華等[12];當然,神經網絡不僅應用于產能預測,楊志浩等[13]、于聰靈等[14]、李鑫羽等[15]利用神經網絡進行地質勘探方面或壓裂選段的預測為油氣田領域的發展注入嶄新力量。其中,Sheikhoushaghi[16]、Zhou[17]、Li等[18]都利用了神經網絡模型對不同地區不同油氣藏的產能或油氣藏性能進行了預測。Zhou等[17]基于貝葉斯神經網絡對致密氣砂巖滲透率進行預測,但模型中僅選取巖心孔隙度、常規測井因素作為輸入項,主要數據輸入項選取較少且沒有比較;Sheikhoushaghi等[16]比較了幾種神經網絡模型的性能,最后選取了粗糙神經網絡模型進行伊朗油田產量預測,模型準確率良好;Li等[18]利用基于時間序列的神經網絡模型進行煤層氣產量的預測;Peng等[19]利用深度卷積生成對抗網絡(deep convolution generation adversarial network,DCGAN)進行裂縫網絡形態的模擬從而預測致密油氣多級壓裂水平井儲層的壓力分布。
但目前對于上述研究內容存在兩方面不足:一是在進行神經網絡模型選擇輸入層節點因素時,選用產能模型多為二項式等簡單產能模型,考慮因素有限導致模型準確率降低;二是模型考慮多為直井、水平井,對于壓裂水平井工程因素,例如裂縫數、裂縫滲透率等考慮不足,對于致密氣壓裂水平井的神經網絡模型產能預測研究較為匱乏。現基于致密氣藏分段壓裂水平井的產能模型選取影響因素,根據灰色關聯可視化方法的不同取值選取不同主要因素作為網絡模型的輸入層節點,建立神經網絡模型,對模型進行訓練使其可以預測待壓裂井產能。
Joshi等[1]提出簡化三維滲流模型為二維滲流模型的想法,基于此思想,探究水平井產能模型的研究學者多利用上述簡化思想進行產能物理模型的假設和建立。楊兆中等[8]考慮利用復雜滲透縫網來表示在射孔段部分周圍引起的復雜裂縫形態(如圖1所示)。

圖1 壓裂水平井物理模型示意圖Fig.1 Schematic diagram of physical model of fractured horizontal well
雙重介質模型所涉及的兩個滲流過程,做如下的等效,分別為:所形成的高滲透帶當中基質流向水平井筒和高滲透帶中縫網流向水平井筒兩個過程。借鑒楊兆中等[8]模型,整合影響致密氣藏分段壓裂水平井產能因素,如表1所示。

表1 分段多簇壓裂水平井產能影響因素Table 1 Factors affecting productivity of multi-cluster fractured horizontal wells
灰色關聯多因素分析方法主要應用于求解尋找各個因素之間的主要聯系關系,輸入各個因素序列的樣本數據,根據計算過程計算灰色關聯度描述因素序列之間關系的緊密強度以及次序。灰色關聯度數值越大求取樣本數據數值序列與輸出主序列關聯性越大;反之則越小。
(1)主系列。
X1=[x1(1),x1(2),…,x1(n)]
(1)
(2)相關因素的確定。
X2=[x2(1),x2(1),…,x2(n)]
(2)
X3=[x3(1),x3(2),…,x3(n)]
(3)
?
Xs=[xs(1),xs(2),…,xs(n)]
(4)
?
Xm=[xm(1),xm(2),…,xm(n)]
(5)
(1)初像值。

s=0,1,…,m
(6)
(2)計算序列的絕對數值。
Δs(k)=|x′1(k)-x′s(k)|
(7)
Δs=[Δs(1),Δs(2),…,Δs(n)],
s=1,2,…,m
(8)
(3)最大值M和最小值m的計算。
M=maxsmaxkΔs(k)
(9)
m=minsminkΔs(k)
(10)
(11)
(12)
通過Python編程實現灰色關聯法結果可視化,如圖2所示,可視化圖形每一塊為計算灰色關聯值,與每一項元素一一對應,每一列代表選擇序列。

圖2 灰色關聯可視化分析舉例Fig.2 Example of grey correlation visual analysis
通過選取不同灰色關聯值因素,選取所需要的神經網絡模型輸入層。數據分析方法眾多,灰色關聯分析法的主要優勢是:一是對于樣本數據數量和分布都沒有具體強制性的規定;二是計算的過程更為簡潔輕便,類似于定性分析。灰色關聯分析法的優勢適合于致密氣藏壓裂水平井產能影響因素的主要影響因素的確定,影響因素的數量眾多,樣本繁雜,影響因素之間呈現復雜的非線性關系,利用灰色關聯分析法不需要對樣本數據進行要求和處理,可以更加簡便地計算出主要影響因素。
神經元之間的交互連接組成人工神經網絡的基本機構,典型的基本神經元網絡結構示意圖如圖3所示。其中結構中各個部分各司其職,輸入層主要負責接收外界傳遞來的信息;輸出層作為輸出系統處理后結構的輸出部分;隱含層位置位于輸入層和輸出層之間,作用也最為重要,主要負責處理輸入層傳遞進來的外界信息。

圖3 典型神經元模型示意圖Fig.3 Schematic diagram of typical neuron model
擬用經典重要的前向網絡模型當中的反向傳播(back propagation,BP)神經網絡模型進行建立產能預測模型。BP神經網絡模型的兩個重要原理為正向數據傳輸和誤差反饋矯正,如圖4所示。
在圖4的正向轉播過程中,其他神經元傳遞到本神經元的信息輸入量進入神經元結構從輸入量部分,通過連接權值以及神經元閾值的加和計算,輸出得到計算量,傳遞給隱藏層當中;隱藏層的神經元經歷重復的上述計算得到的變量傳遞給下一層——輸出層;至此前向傳遞階段大部分完成。接收到傳遞信號的輸入層會把期望輸出值與計算傳遞的輸出值進行比較,計算出誤差后將得到誤差反向傳遞給輸入層,進行輸出層的權值和閾值的不斷調整,再次進行循環計算。在循環計算的過程之中,計算誤差值小于模型建立設定的期望誤差后,循環計算結束輸出結果,以上就是誤差反轉矯正的過程。

圖4 BP神經網絡模型網絡結構圖Fig.4 Network structure diagram of BP neural network model
對于BP神經網絡模型的設計,一般從神經網絡模型的組成部分的開始,即網絡層數、每一層當中的神經元個數、激活函數、學習速率等。本部分就從以上幾個方面來進行BP神經網絡模型的設計,便于對產能預測模型進行構建。
對于所建立的致密氣藏分段壓裂水平井的產能預測模型,建立三層網絡結構,即可解決復雜問題又可避免網絡復雜化的問題出現。
對于設定隱含層神經元的個數,研究學者也進行了探究。一般來說,確定三層神經網絡當中隱含層的神經元個數有如下幾種經驗公式。
(13)
式(13)中:K為輸出層節點數;n為輸入層的節點數;n1為隱含層的節點數。
n1=p-1
(14)
式(14)中:p為輸入層的節點數。
n1=log2n
(15)
(16)
式(16)中:m為輸出層節點數;a為1~10的一個常數。
n1=(0.43mn+2.54m+0.77n+0.35+
(17)
輸入層節點與隱含層節點數設置直接影響神經網絡模型預測值的準確性,為此選擇不同隱含層節點設置訓練查看誤差曲線方法,并與上述計算公式對比確定節點數設置,
BP神經網絡模型的學習效率的選取一般為0.01~0.8, 神經網絡模型系統的不穩定會由于設定了過大的學習速率導致;但小于適合值和正常值的學習速率會導致神經網絡模型在計算時收斂速度過慢,計算速率大幅度降低、訓練模型的時間增長。
選取合適期望誤差值的方法為:同時對其他因素相同而設定的期望誤差值不同的神經網絡模型進行訓練,以此來選取合適的期望誤差,產能預測神經網絡模型的期望誤差值設定為0.001,效果最好。
選15口井數據作為測試組實例,如表2所示,對所有分段壓裂水平井影響因素進行灰色關聯可視化分析,利用Python語言實現計算結果,如圖5所示。

表2 測試組各井參數數據表Table 2 Parameter data of each well in the test group
編寫程序并代入實際數據得到灰色關聯分析計算結果,如圖6所示,方格數據代表影響因素序列(表2中除了“無阻流量”外的18列數據)與主序列(表2無阻流量序列)關聯數值得到影響因素關聯緊密性。
神經網絡模型準確性和運行速度等性能好壞與輸入層節點與隱含層節點設置有直接關系,分別以灰色關聯數值0.7、0.72、0.74作為選擇主要影響因素的標準,對比3種不同輸入層節點的神經網絡訓練精度得到最佳模型配比選擇。
利用Python語言實現神經網絡建立,灰色關聯數值為0.7時,輸入層節點為18個;為0.72時,輸入層節點為12個;為0.74時,輸入層節點為7個。隱含層節點設置3、6、10個,以對比得到誤差最小的訓練模型進行預測,模型學習效率0.04,迭代步數設置為5 000步完成模型訓練,查看誤差曲線確定最佳訓練模型,結果如圖7~圖9所示。其中set0、set1、set2表示隱含層節點為3、6、10的模型。

圖8 界限值0.72誤差曲線圖Fig.8 Error curve of limit value 0.72

圖9 界限值0.74誤差曲線圖Fig.9 Error curve of limit value 0.74
結果顯示,輸入層節點越少,誤差曲線降落越快,訓練模型穩定越快;比較3種輸入模型穩定誤差值,選取灰色關聯值0.72為界限,輸入層為12個節點時模型穩定時誤差最小。
由圖7~圖9可知,set1、set2模型誤差曲線下降速度最快,故取模型12-7-1、12-8-1、12-9-1再次訓練確定最佳訓練模型隱含層節點數,結果如圖10所示。

圖10 隱含層訓練模型對比圖Fig.10 Comparison of hidden layer training models
隱含層節點設置為7時可以得到誤差曲線下降速度快、誤差小的訓練模型,選用神經網絡模型設計隱含層節點公式計算得隱含層節點數為7時也可以印證結果,訓練模型選取完成進行待壓裂井的實際預測。
選取訓練模型輸入節點12個、隱含層節點7個、輸出層節點1個結構進行實例分段壓裂水平井產能預測。選取實際井4口進行壓裂預測,待壓裂井實際數據如表3所示。輸入至訓練好的模型進行產能預測,得到預測值以及誤差如表4所示。

表3 分段壓裂水平井預測組數據Table 3 Prediction group data of staged fracturing horizontal wells

表4 產能預測誤差表Table 4 Productivity prediction error
(1)對于致密氣藏的分段壓裂井產能模型采用高滲透帶的物理模型進行產能模型的建立更加簡便高效。
(2)灰色關聯可視化分析法可以幫助我們篩選對產能主要影響因素,通過不同灰色關聯值取值確定最佳訓練模型的結構為12-7-1,雖然設置輸入層個數越少訓練速度越快但也會造成訓練誤差較大。利用實際礦場數據對建立產能模型進行學習和訓練,誤差效果圖顯示,模型數據訓練良好,模型精確度較高。
(3)利用訓練好的神經網絡產能預測模型對壓裂井產能進行實際預測,預測結果顯示預測值與真實值誤差較小。神經網絡模型可以用來解決致密氣藏分段壓裂井產能預測問題,對于影響因素與無阻流量之間的復雜非線性問題,神經網絡模型顯示出良好的性能,可以用于礦場的實際預測,對接下來礦場的實際生產工作制度有一定的理論指導意義。