楊建雷,張津紅
(1.承德石油高等專科學校 石油工程系,河北 承德 067000;2.大港油田公司 采油工藝研究院,天津 300280)
油田注水開發中調剖(驅)施工的效果預測,一直是行業內亟待解決的難題,現階段缺乏系列行之有效的精確預測方法。目前常規的預測方法有專家經驗法、數值模擬預測及基于統計學習理論的潛力預測法等[1]。這些方法無不局限于資料的完整性及受過度依賴專家經驗等因素地制約??紤]到影響調驅措施效果原因的復雜性,無法用常規的多元回歸解決各影響因素與措施效果之間的定量關系。尋求影響調剖效果的各種因素及其影響規律,進而找到各種主要變量之間的關系,從而利用這種關系進行調剖效果預測。SVM技術是20世紀90年代初Vapnik等人根據統計學習理論提出的一種新的機器學習方法[2,3],它以結構風險最小化原則為理論基礎,通過適當地選擇函數子集及該子集中的判別函數,使學習機器的實際風險達到最小,保證了通過有限訓練樣本得到的小誤差分類器,降低獨立測試集的測試誤差。
利用已調剖(驅)井的資料評價出其相應的效果,對這些井的動靜態資料、工藝參數和相應的調剖(驅)效果,建立其水井調剖效果預測的樣本集,再利用這些樣本建立起措施效果的預測模型,即可利用該模型預測不同地質特征、不同開發狀況和工藝條件下的調剖效果。在模型建立前,首先要對影響調剖(驅)效果的主要因素進行評價分析,在評價分析的基礎上,選取合適的樣本集,訓練SVM模型。
影響調剖(驅)效果的因素較多,模型根據指標的重要性及獲取的難易程度,選取以下參數作為模型訓練的評價指標:
壓力指數(PI):根據注水井井口壓降曲線求得,單位MPa。調前注水井井口壓力指數越低,井組調剖效果越好。
調前注入壓力(P):指調驅前注水井的平均注入壓力值,單位MPa。水流優勢通道形成后,導致相同注入量下,注水壓力降低,一般調前注水壓力低的井調剖效果較好。
調前平均注入量(Qin):調驅前注水井的平均日注水量,單位m3/d。一般調前注水量越大,井組調剖效果總體上越好。
調前含水率(fw):調剖前油井平均含水率,單位%。調剖(驅)使油水井之間水流優勢通道的形成,往往伴隨著含水率的突升,一般含水率較高的井組,調驅必要性較大。
調劑注入量(Q):指施工治理過程中調剖藥劑的注入量,單位m3,通常堵劑用量越大,對大孔道封堵越好,總體調剖效果越好。
無因次增油量:無因次量,是考慮到不同調剖井對應油井數目不同、對應油井產量基數不一樣而采用的一項評價指標,是衡量調剖效果的主要指標。
以調剖歷史數據作為訓練集(xi,yi)(i=1,2,3,…,n),xi∈Rn,yi∈R,通過一個非線性映射φ將樣本數據從樣本空間映射到高維特征空間進行線性回歸,從而求解出一個包含多種因素影響的調剖調驅效果預測函數。
為了消除輸入變量之間由于量綱和數值大小的差異而造成的影響,避免模型計算時出現病態,將模擬數據標準化到[0,1]區間,然后將標準化后的數據作為模型的輸入值。其標準化公式為:
x′i=(xi-minxi)/(maxxi-minxi)
(1)
在最優回歸函數中采用適當的核函數k(xi,yi)代替高維空間中的向量內積φ(xi)φ(x)就可以實現φ非線性變換后的線性擬合,得到最優回歸函數為:
(2)

提供正則化的因子qk的Fourier展開,在函數逼近問題上,體現了隨著k值的增加,展開項對擬合精度提高作用的衰退,其相應的核函數為:

(3)
參考人工神經網絡注水井調剖效果預測方法[4],對大港油田調剖調驅井歷史數據進行了收集、篩選,得到了歷史數據樣本。由于歷史數據樣本集中的數據與模型中有所差異,在此根據數據樣本重新制定了BP神經網絡的輸入因素和輸出因素。其中,輸入因素包括調驅輪次(T,次)、施工起始壓力(Ps,MPa)、施工結束壓力(Pe,MPa)、實際排量(Q,m3/d)、調驅前日注入量(Q注,m3/d)、調驅前套壓(Pt,MPa)及對應受益油井數。輸出因素則包括有效期(T有效,天)、有效期內純增油(ΔQo,m3)、有效期內純降水(ΔQw,m3)。
選取2014~2016年作為樣本集,對2017年的調剖(驅)井進行效果預測,其中y實際效果,x預測效果,預測結果如圖1,圖2,圖3所示。



由預測結果來看,預測值與實際值的關系雖然分布于y=x兩側,但并不趨向于y=x,增油預測的吻合率僅為30%左右,降水的吻合率僅為20%左右,有效期的吻合率僅為20%左右,綜合吻合率僅為23%左右。
對數據樣本進行進一步分析發現,不同類型的調驅體系,輸入量相似,輸出量卻差異很大,致使某些神經元失效。通過對樣本數據進行篩選,選取2014~2016年交聯聚合物體系為數據樣本集,對選取2017交聯聚合物體系調剖(驅)井進行預測,其預測結果如圖4,圖5,圖6所示。
從結果看來,增油的吻合率約為50%,降水的吻合率約為45%,有效期的吻合率約為25%,綜合吻合率在40%左右。雖然結果仍然很差,但進行了分類后的樣本比歷史總樣本預測效果更趨近于y=x,說明了神經網絡的設計與設計者、數據樣本有很大的關系。






同樣選取2014~2016年作為樣本集,選用本文中1建立的模型,使用Libsvm工具箱對樣本集進行擬合,結果如圖7,圖8,圖9所示。
通過結果可以看出,增油的吻合率在90%左右,降水的吻合率在94%左右,有效期的吻合率在90%左右,綜合吻合率在91%左右,預測結果與實際結果分布于y=x兩側,并且趨向于y=x,預測結果明顯優于神經網格。
1)SVM是基于結構風險最小化(SRM)原則,可以保證學習機器具有良好的泛化能力。2)運用SVM對數據分類同時進行數據回歸,預測目標采用的樣本均篩選自樣本集,且主要針對小樣本情況。3)運用LibSvm技術可提高調剖(驅)潛力預測的精確度,指導油田方案的制定與措施的實施,提高油田的經濟效益。