申洪源,馬 亮,張雅楠,陳 冰,趙世睿,張海峰
(1.南方石油勘探開發有限責任公司,海口 570216;2.北京中油瑞飛信息技術有限責任公司,北京 102206;
3.清華大學 深圳研究生院 海洋科學與技術學部,廣東 深圳 518055)

圖1 雙差壓文丘里測量裝置Fig.1 Double differential pressure venturimeasuring device
目前伴隨人工智能和物聯網技術的快速發展,在油氣生產行業,新興的在線多相流計量技術已被英國石油(BP)等國際能源巨頭列舉為“決定未來油氣工業成功的五大關鍵技術”之一,是能源物聯網行業中關鍵的一環。
在線油氣水多相流流量測量是油氣行業流量交接、油藏分析、優化作業等工作中亟需的技術[1]。然而由于油氣水物性參數多樣,流動過程復雜,測量手段各異,目前難以用單一測量裝置和數學模型進行各相流量的準確描述,這也是嚴重制約油氣生產流量實時測量技術發展的瓶頸問題。因此,采用多傳感器協同和多測量模型融合的方式進行測量,已成為目前國內外多家公司和學者研究的熱點。如美國AGAR 公司、挪威FRAMO 公司和ROXAR 公司以及中國海默公司多采用文丘里和射線的方式進行多相流流量的測量[2]。但是,由于射線方式成本較高、有輻射,且受到相關法規限定,適用范圍有限,在實際應用過程中受到一定的限制。新一代的多相流檢測方法則多采用如電容(ECT)、電阻(ERT)、微波等非放射方式來代替傳統放射性測量方式,從而降低設備生產成本和提高設備安全性能[3]。如文獻[4]采用了電導環陣列和內錐式差壓傳感器相結合,并結合了卡爾曼集中式融合估計方法進行總流量的測量。文獻[5]采用文丘里和電容成像系統進行油水兩相流量識別。對于油田多相流模型構建,眾多有關文獻報道中展示:早期文丘里差壓測量的基礎模型是均相流模型和分相流模型等傳統模型,這些傳統測量模型受測量條件影響較大,大部分是通過實驗獲得修正系數,對于復雜的流場環境缺乏普適性。近年來隨著機器學習等人工智能技術的快速發展,采用機器學習算法代替傳統的數學統計方法來進行模型構建的方式在多相流領域也在慢慢興起,2010 年Meribout 等人采用文丘里、電容-電導、超聲流量計進行油氣水三相的測量,并采用BP 神經網絡進行多相流量的識別[6]。2011 年Xu 采用了基于SVM(支持向量機)的機器學習方法對長喉文丘里壓降信號進行學習來構建濕氣流量測量模型[7]。目前采用機器學習的算法在多相流領域已經取得了一定的效果。
鑒于上述情況,本文創新性的開展基于文丘里和微波等多傳感器協同測量方式,通過開展油氣水不同分相含率范圍內的多相流動過程測量實驗研究,在充分的實驗數據基礎上,研究采用基于支持向量回歸(SVR)的機器學習算法,自主學習文丘里和微波測量信號特征與多相流量間的關聯規則,建立油氣水多相流氣相、液相流量和含水率的機器學習模型,為進一步滿足石油工業對油氣水多相流計量精度和適應性日益增長的要求,提供一種新的技術支持。
1.1.1 雙差壓文丘里流量測量
文丘里差壓式流量計包括“收縮段”“喉道”和“擴散段”三部分。其技術原理為:基于連續性方程和伯努利方程,流體在經過文丘里“收縮段”時流體會產生局部壓縮,流速增加,靜壓力降低,從而在收縮段前后形成一定的壓力差。經過“喉道”時流體則會與管壁產生摩擦作用后會形成壓力損失。流量越大,經過文丘里“收縮段”“喉道”所產生的差壓就越大。因此,可以根據差壓信號的變化來獲得流體流量變化。通過實驗近一步發現,文丘里傳感器在“收縮段”和“喉道”差壓信號對流體中含有的氣體和液體比例不同,所變現出來的信號也不盡相同。因此,可以通過分別安裝在“收縮段”和“喉道”的差壓傳感器獲得兩組差壓信號來求得氣相流量和液相流量[7]。
1.1.2 基于微波的含水率測量
原油含水率同樣是石油工業中的一個重要測量參數,微波的波長被規定在1mm ~1m 之間,其頻率范圍相當于300GHz ~300MHz。不同波長的電磁波具有不同的能量,電磁輻射的能量與波長成反比。而微波測量技術則可以在一定微波頻率下,通過測量微波信號通過油水混合物中油相和水相時,微波信號幅值和相位發生的變化來測量混合物中含水率(wlr)[8,9]。根據油(介電常數:2-4)水(介電常數:80)介電常數差別,對微波信號的吸收不同等特點,通過測得透過油水混合物后的微波信號幅值和相位變化來獲得油水混合物的含水率。
支持向量機(Support Vector Machine,SVM)于1995年由Vapnik 提出,它是在統計學理論的基礎之上發展起來的一種新的學習方法。SVM 主要應用到兩類問題的研究,一是分類問題,即:支持向量分類(Support Vector Classification,SVC);另一類是回歸(Regression)問題,即:支持向量回歸(Support Vector Regression,SVR)。
SVR 的回歸分析的基本思想可表示為設原有空間訓練樣本:

利用函數Φ(·) 變換將l 個訓練樣本映射到高維特征空間,并在此空間中應用回歸函數:

擬合原有空間中的數據樣本(xi, yi),其中,w 是高維空間中的向量,Φ(·)是該高維空間中的函數向量,b 為該高維空間中的標量。支持向量機的基本理論及其求解過程可以描述為,根據結構風險最小化準則定義目標函數:

等式(3)中的ξi,ξi*為間隔松弛因子,其可保證目標函數在約束條件下一定會有解。ε 為不敏感損失因子,表示可允許范圍的訓練損失,對給定的ε,目標損失函數可以定義為:

目標函數(2)中,C>0,稱之為懲罰因子,其作用是控制超出誤差范圍ε 的樣本數據的懲罰程度,同時目標函數的Hessian 矩陣正定,是一個凸函數。因此,可以通過采用對偶理論求解凸二次規劃問題進而獲得目標函數的最優解。
建立Lagrange 函數:

其中,α,α*,η,η*≥0 為Lagrange 乘子,在核函數滿足Mercer 條件下,其Lagrange 函數也為凸函數,其求取的局部最優解則為全局最優解。并根據Kuhn-Tucker 定理可將原空間內的輸入樣本和輸出樣本回歸形式在高維空間內表示:

其中:

等式(6)中,非線性函數Φ(·)的引入可以將低維空間中的樣本數據映射到高維空間,通過在高維空間進行數據樣本的線性回歸,從而實現樣本數據在原始空間中的非線性回歸效果。同時,也可以通過定義核函數(Kernel Function)K(xi, xj)=(φ(xi)·φ(xj))來簡化非線性逼近,此方法主要原理為通過核函數將函數的求解過程直接在輸入空間中計算,從而繞過特征空間,避免計算非線性映射Φ(·)。核函數的引入可以將等式(6)轉化為:

其中,m 為支持向量的個數,支持向量的個數由(αiαi*)決定,只有非零的(αi-αi*)對計算權值w 才有貢獻,支持向量的定義也是由此而得來的。
常見的核函數如下所示[10]:
1)線性核函數。
2)多項式核函數。
3)高斯基徑向基(RBF)核函數。
本文模型構多相流量計測量樣本信息為:采用文丘里和微波組合方式進行試驗數據測量,測量信號包括管道運行壓力、流體溫度、文丘里前壓差(收縮段)、文丘里后差壓(喉道)、微波幅值、微波相位共計6 種觀測信號,樣本標簽為氣相流量、液相流量和含水率3 種流量參數。測量過程中,由于數據獲取過程為連續動態計量,分離罐標定裝置和三相流量計間管道內存流體和分離罐分離速度等原因,會導致標定結果存在系統誤差。為了消除系統誤差,設定每組樣本數據采集時長為5mins,傳感器采集頻率為10Hz。油氣水三相(油:0m3/h ~5m3/h,氣:0m3/h ~100m3/h(標況),水:0m3/h ~5m3/h)流動過程測量實驗,累計獲得500 組實驗數據。
文丘里和微波測量樣本自身存在干擾和缺失信息,需要進行樣本預處理和特征提取。首先,對采集信號進行均值濾波處理、異常數據剔除和缺失數據補齊等數據預處理工作,獲取預處理后每個數據樣本結構為300×6 的數據矩陣。之后,對預處理后的樣本數據分別在時域和頻域范圍內進行特征參數提取,包括前差壓時域均值、方差、頻域峰值、峰值頻率,以及管道壓力、后差壓、溫度、微波幅值、微波相位等均值,總計9 組特征參數。
對上述特征數據進行歸一化處理,并將采集樣本順序隨機打亂后構建模型的訓練和測試樣本。其中,設定90%數據用于模型的訓練,剩余10%用于對訓練模型性能進行測試評價。模型訓練過程中,對影響模型性能的3 種核函數采用窮舉法分別進行測試,同時對于每種核函數,采用交叉驗證和網絡搜索法尋找最優SVR 模型參數。
本文采用總流量誤差(SPE)、平均絕對比例誤差(MAPE)、平均絕對誤差(MAE)和支持向量數量(N)4個評價指標,對不同核函數下SVR 模型建立的性能進行分析評價。

圖2 氣相流量測試結果Fig.2 Gas flow test results

圖4 含水率測試結果Fig.4 Water content test results
本文采用SVR 算法和網格搜索法分別對氣相流量(Qg)、液相流量(Ql)和液相含水率(wlr)3 個關鍵參數測量模型進行訓練和測試,對于不同核函數下的SVR 模型測試結果和相對誤差分別在圖2 ~圖4 中給出。其中,圖2、圖3 給出氣相和液相流量測試結果的相對誤差。鑒于含水率為計算油相流量和水相流量過程中的過程量(單位為百分比)。因此,圖4 給出含水率測量結果的絕對誤差。

圖3 液相流量測試結果Fig.3 Liquid flow test results

表1 測量評價結果Table 1 Measurement evaluation results
對采用linear、poly、rbf 三種核函數構建的多相流氣相、液相流量和含水率的SVR 回歸模型的性能進行評價,評價結果如表1 所示。
累計誤差(SPE)、平均絕對比例誤差(MAPE)和平均絕對誤差(MAE)等參數,均可以從多個方面反映測量值與真實值之間差異程度,對于上述三種評價指標,其值越小說明預測模型描述實驗數據越具有更好的精確度。對表3 的4 種評價指標可以確定:
1)對于氣相流量,本文通過采用rbf 核函數構建的回歸模型可以實現氣相流量長時間50 個樣本共計250mins 的累計測量,流量的相對誤差為-6.01%。5mins 的瞬時流量平均相對誤差為9.54%,絕對誤差為4.87Nm3/h(標況流量);2)對于液相流量的測量測試結果,基于rbf 核函數的SVR 模型累計液相流量相對誤差為-1.13%,5mins 的瞬時測量平均誤差為3.68%,絕對誤差為0.15m3/h;3)含水率測試的5mins 的瞬時測量平均誤差為9.82%,絕對誤差為6.98%;4)對比氣相和液相的測試結果,可以看出基于文丘里的壓差測量方式的流量計,對流體質量特征測量更為準確。因此,液相流量測量效果更好;5)氣相、液相流量和含水率的測試結果表明,本文構建的基于多傳感器和SVR 算法的多相流測量模型滿足油田對氣相、液相流量和含水率測量誤差<10%的油氣生產計量要求;6)從表中可以看出用rbf 核函數構建的svr 模型在支持向量數量上同樣小于linear 和poly 兩種核函數。因此,也證明了rbf 核函數構建的模型測試泛化效果更優。
針對油氣生產過程中油氣水在線實時測量技術的實際需求,本文提出了一種基于多傳感器和SVR 算法的油田油氣水多相流量量化檢測方法。通過采用雙差壓文丘里和微波協同測量的方式進行在線實時流動參數測量,并提出了一種基于SVR 的機器學習的人工智能算法,利用多傳感器間互補信息進行氣相、液相流量和含水率量化檢測模型的構建和測試,對影響SVR 模型性能的核函數等關鍵參數進行分析,分析結果表明,采用rbf 核函數的SVR 構建的多相流測量模型可實現5mins 瞬時氣相流量相對誤差為9.54%,液相流量相對誤差為3.68%,含水率絕對誤差為6.98%的測量精度,達到了工業油氣生產過程中多相流產量的計量要求,為油氣生產過程中油氣水在線實時測量提供了一項新的技術方法。