馮中申(遼河油田興隆臺采油廠,遼寧 盤錦 124010)
用于動液面軟測量的經驗模態分解和高斯過程回歸建模方法
馮中申(遼河油田興隆臺采油廠,遼寧 盤錦 124010)
動液面的軟測量預測模型一直存在著預測精度不高、泛化能力差的缺點,針對上述問題本文提出基于經驗模態分解和高斯過程回歸相結合的算法對動液面進行預測,以提高模型的預測精度,滿足實際的生產要求。
動液面;經驗模態分解;高斯過程回歸
動液面參數是油田生產指導的重要依據,傳統的人工測量容易受到各種因素的影響,存在著實時性差、誤差大的缺陷,而現有的動液面軟測量模型又達不到較高的預測精度。本文提出基于經驗模態分解[1]和高斯過程回歸相結合的算法對動液面進行預測,以此改善模型的預測性能,提高預測精度。
軟測量建模過程中,對于主導變量而言,輔助變量的選取是否合理直接關系到建模質量,影響模型的預測性能。在實際生產中,相關的可測變量有很多,如何選取輔助變量變得尤為重要。根據相關機理分析與先驗知識得出:

其中,Ld為動液面深度;Pt是井口套壓;Qr代表日產液量;泵效η;Δv為建模的動態項。所以,輔助變量選取為泵效、套壓和日產液量。
在油田的現場開采過程中,由于其復雜的生產環境影響,使得輔助變量的數據監測傳感器在采集數據時難免受到噪聲干擾。噪聲對于建模數據的影響直接關系到建模質量,所以本文提出采用經驗模態分解(EMD)的方法對數據進行去噪處理。經驗模態分解過程如下:

其中,x(t)為待分解信號;c1(t),c2(t),...,cn(t)為一系列的本征模態函數(IMF),頻率由低到高排列;r(t)為殘差信號。由于先分解出來的IMF高頻數據為噪聲信號或者異常數據,所以,刪除高頻的IMF成分并將其他段的IMF數據進行重新整合作為輔助變量數據。
高斯過程回歸[2]是一種熱門的機器學習方法,相對于神經網絡、支持向量機在處理高維數據和非線性復雜問題的應用上有明顯的適用性;建模的參數比較少并且有優化簡單的優勢,所以本文選取高斯過程回歸進行軟測量建模。選用徑向基函數作為模型的協方差函數,使用極大似然法對超參數θ=[w1,w2,…wm,v1,v0]進行調整。選用的徑向基函數如下:

式中,v0是噪聲方差(服從高斯分布);wd是模型的測度參數;v1是局部相關性程度;δij為算子Kronecker算子。
以某油田J18-32油井的實際產生數據作為實驗數據對本文提出的方法進行驗證分析。對同一口井采集350組數據,200組數據作為訓練數據,150組數據作為測試數據。對傳感器采集的輔助變量數據進行EMD處理,消除噪聲干擾。為了驗證EMD算法對輔助變量去噪處理的有效性,對經過去噪處理的輔助變量數據和未經過處理的輔助變量數據分別進行軟測量建模,對比分析實驗結果。建模方法采用高斯過程回歸,模型對應的協方差函數如式(1)所示,對于模型中的超參數θ=[w1,w2,…wm,v1,v0],w1~wm的初值均設置為1,v1和v0分別取2和0.01,假設認為每個輔助變量對主導變量的貢獻是相同的,利用極大似然法對輸入的超參數最優值進行尋優。仿真的結果圖如下:

圖1 不同方法的仿真結果圖
計算圖中兩種方法對應預測結果的均方根誤差(RMSE)和平均絕對誤差(MAE)。輔助變量經過EMD處理的建模方法對應的誤差值分別為16.569、28.653;輔助變量未經過EMD處理的建模方法對應的誤差值分別為21.843、35.964。通過誤差對比分析可知,輔助變量經過EMD處理后的預測結果誤差明顯小于輔助變量未經過去噪處理的預測結果誤差,由此可說明EMD算法對于輔助變量去噪處理的有效性,可以提高模型的預測精度。
本文針對油田生產數據采集過程中存在的噪聲干擾,以及軟測量建模方法的選取對模型預測性能的影響問題進行了研究。提出經驗模態分解(EMD)的方法對輔助變量數據進行去噪處理,以及更適用于復雜的非線性問題和高維數據的高斯過程回歸進行軟測量建模,對動液面結果進行預測。通過對實際生產數據進行仿真分析,證明了本方法的有效性,確實能夠有效提升模型的預測精度。
[1]J Huang N E,Shen Z,Long S R,et al.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-sta?tionary time series analysis[J].Proc.Rsoc.Lond.,1998,454:56-78
[2]Wang Huazhong(王華忠).Gaussian process and its appli?cation to soft-sensor modeling[J].Journal of Chemical Industry and Engineering(China)(化工學報),2007,58(11):2839-2845.