金龍 曾德智 孟可雨 肖國清 譚四周 張昇
1.油氣藏及地質(zhì)開發(fā)工程國家重點(diǎn)實(shí)驗(yàn)室·西南石油大學(xué) 2.中海石油(中國)中國有限公司深圳分公司3.中國石油天然氣股份有限公司東北銷售分公司
腐蝕失效一直以來是油氣行業(yè)亟需解決的難題之一[1-2],腐蝕造成的管道、井筒、套管等油氣裝備損壞現(xiàn)象嚴(yán)重影響油氣田的生產(chǎn)安全[3-5]。在大數(shù)據(jù)分析與人工智能快速發(fā)展的今天,大數(shù)據(jù)驅(qū)動的人工智能方法開始在腐蝕科學(xué)領(lǐng)域得以運(yùn)用。從非線性系統(tǒng)角度來看,腐蝕速率受多種因素共同影響,影響因素之間存在信息疊加與相互耦合,造成傳統(tǒng)預(yù)測模型不準(zhǔn)。目前,引入以神經(jīng)網(wǎng)絡(luò)為代表的人工智能方法對腐蝕速率進(jìn)行預(yù)測取得了良好的效果。粒子群優(yōu)化支持向量機(jī)、粒子群優(yōu)化廣義回歸神經(jīng)網(wǎng)絡(luò)、主成分分析支持向量機(jī)、隨機(jī)森林、集成式學(xué)習(xí)等一批方法在腐蝕預(yù)測方面都得到了廣泛的應(yīng)用[6-11]。此外還包括多種方法的聯(lián)合運(yùn)用,例如S. B. Peng等[12]提出了一種混合智能算法來預(yù)測多相流管道的腐蝕速率,該模型結(jié)合了支持向量回歸、主成分分析和混沌粒子群算法,并利用該模型對管道多相流腐蝕速率進(jìn)行預(yù)測,取得了良好的效果;田源等[13]將半經(jīng)驗(yàn)腐蝕速率預(yù)測模型與BP神經(jīng)網(wǎng)絡(luò)結(jié)合開發(fā)了含硫氣田集輸管道預(yù)測軟件,軟件預(yù)測結(jié)果與腐蝕掛片數(shù)據(jù)吻合度較好。
從前人研究成果來看,研究重點(diǎn)為提高預(yù)測精度和減低預(yù)測耗時等方面。筆者在大數(shù)據(jù)腐蝕預(yù)測研究中發(fā)現(xiàn),最小二乘支持向量機(jī)(LSSVM)作為支持向量機(jī)算法的提升版,屬于學(xué)習(xí)效率高,泛化性能強(qiáng),結(jié)構(gòu)性能穩(wěn)健的預(yù)測模型,其在腐蝕預(yù)測方面鮮有文獻(xiàn)報(bào)道。本研究將LSSVM模型與群智能優(yōu)化算法—灰狼優(yōu)化(GWO)算法相結(jié)合,形成GWO-LSSVM預(yù)測模型,旨在探索開發(fā)一種新型高效率、高精度的多元非線性腐蝕速率預(yù)測模型。將該模型應(yīng)用于海洋油氣管道的外腐蝕速率預(yù)測中,是對大數(shù)據(jù)腐蝕預(yù)測方法的探索與豐富,具有一定的重要意義與應(yīng)用價值。
海水內(nèi)部溶質(zhì)種類較多,屬于天然電解質(zhì),為電化學(xué)腐蝕創(chuàng)造了天然有利條件,容易造成海洋油氣裝備的腐蝕失效。圖1為某海洋管道受海水腐蝕破壞的宏觀與微觀形貌[14]。海水中影響金屬腐蝕的因素主要包括海水溫度、氧溶解量、鹽含量、pH值、氧化還原電位、管道材質(zhì)、海水流速[15-16]。

海水溫度在不同緯度、不同季節(jié)與不同海洋深度下均有不同的變化。溫度升高會加快海水腐蝕金屬的速率,但是溫度升高又會降低海水的氧溶解量,而氧溶解量又決定了吸氧腐蝕進(jìn)行的快慢。其陰極反應(yīng)方程式如式(1)所示。
O2+2H2O+4e-→4OH-
(1)
同時,鹽含量也會影響海水導(dǎo)電率和氧含量。鹽含量增加會使得海水電導(dǎo)率增加,但是會導(dǎo)致海水氧溶解量降低。因此,鹽含量對海水腐蝕的作用機(jī)理較為復(fù)雜。海水的pH值相對穩(wěn)定,一般為7.2~8.6,呈現(xiàn)出中性或弱堿性,與前面3個影響因素相比,pH值主要影響海水中的含鐵鹽水垢沉積過程,其對腐蝕的影響作用相對較弱。海水作為一種腐蝕性電解質(zhì),其內(nèi)部存在諸多氧化劑與還原劑,故用氧化還原電位表示海水氧化還原程度的強(qiáng)弱。由于不同材料的耐蝕性不同,因此,也應(yīng)當(dāng)考慮材料對腐蝕速率的影響。海水流速也會影響腐蝕過程的傳質(zhì)作用,同時流速還會影響海水含氧量的變化,因此,海水腐蝕影響因素還需考慮流速。圖2為本實(shí)驗(yàn)構(gòu)建的海底管道腐蝕速率預(yù)測指標(biāo)體系。

1995年,C. Cortes[17]在研究有限小樣本推測大樣本的算法模型時,從VC維與結(jié)構(gòu)風(fēng)險(xiǎn)最小原則出發(fā),提出一種通用有效機(jī)器學(xué)習(xí)模型-支持向量機(jī)(support vector machine,SVM)模型。該模型具有出色的學(xué)習(xí)能力以及強(qiáng)大的泛化性能,尤其擅長對小樣本數(shù)據(jù)的機(jī)器學(xué)習(xí)。LSSVM模型是對傳統(tǒng)支持向量機(jī)的簡化改進(jìn)[18-19],改變了問題的求解類型,將二次規(guī)劃不等式求解轉(zhuǎn)化為等式求解,進(jìn)而提升了算法的求解效率。
LSSVM模型的數(shù)學(xué)表述為:假設(shè)存在一組樣本D={(xi,yi)|i=1,2,…,N}作為訓(xùn)練集,其中xi作為輸入值,yi作為輸出值。則對于任意的非線性回歸問題,LSSVM模型可以進(jìn)行如式(2)的表示。
y(x)=ωTφ(xi)+b+ei
(2)
式中:ω為權(quán)重向量;φ(xi)為非線性映射函數(shù);b為偏置值;ei為擬合誤差,是訓(xùn)練集樣本的實(shí)際輸出值與預(yù)測輸出值之間的誤差。
式(2)中,ω與b可以通過結(jié)構(gòu)風(fēng)險(xiǎn)最小原則獲取,表達(dá)式如下:
(3)
式(2)的約束函數(shù)表達(dá)式可以寫成如下形式:
yi=ωTφ(xi)+b+ei,i=1,2,3,…,N
(4)
如果在式(3)中引Lagrange乘子L,其表達(dá)式如式(5)所示。
(5)
式中:αi為拉格朗日乘子;γ為懲罰因子,用于平衡yi與訓(xùn)練誤差。
根據(jù)KKT(Karush-Kuhn-Tucker)優(yōu)化條件,利用式(5)可分別獲取ω、b、e和α的極大似然估計(jì),如式(6)所示。
(6)
則LSSVM多元非線性回歸方程如式(7)所示,該方程為多維空間中的曲線。
(7)
式中:K(x,xi)為核函數(shù);x為訓(xùn)練集樣本的輸入向量;α,b為式(5)的求解結(jié)果。
核函數(shù)K(x,xi)的選取有多種函數(shù),本研究選取穩(wěn)健性較強(qiáng)的RBF函數(shù)作為核函數(shù),其表達(dá)式如式(8)所示。
(8)
式中:σ為核參數(shù)。
懲罰因子γ與核參數(shù)σ為影響LSSVM模型精度的主要參數(shù),也是構(gòu)建高精度LSSVM機(jī)器學(xué)習(xí)預(yù)測模型的關(guān)鍵。因此,需要從全局最優(yōu)的角度出發(fā)選取γ與σ,而全局最優(yōu)則需要依靠智能優(yōu)化算法來實(shí)現(xiàn)。
灰狼優(yōu)化算法與粒子群優(yōu)化算法(particle swarm optimization,PSO)均為生物種群仿真算法,算法的原理有所不同。有關(guān)粒子群優(yōu)化最小二乘支持向量機(jī)的PSO-LSSVM模型的計(jì)算流程參見文獻(xiàn)[20-22]。2014年,Mirjalili等學(xué)者從灰狼種群捕食行為中提出一種新型生物種群啟發(fā)式算法稱為灰狼優(yōu)化算法(GWO)。與其他生物種群啟發(fā)式算法不同,該算法的核心是抽象模擬灰狼種群捕食規(guī)律,GWO算法的原理如圖3所示。在圖3的種群社會等級金字塔中,α狼位于金字塔的頂端,α狼的主要任務(wù)是負(fù)責(zé)覓食和領(lǐng)導(dǎo)其他灰狼。β狼位于種群等級金字塔的第二層,其任務(wù)主要是協(xié)助α狼管理狼群,并將其他灰狼個體信息反饋給狼α。δ狼位于種群等級金字塔的第三層,其任務(wù)主要是執(zhí)行α狼與β狼的決定。W狼位于種群等級金字塔的最底層,其任務(wù)是負(fù)責(zé)實(shí)際獵物捕捉。灰狼優(yōu)化算法尋找待解決問題的全局最優(yōu)問題時,α狼領(lǐng)導(dǎo)其他灰狼進(jìn)行搜尋,狼群在α狼領(lǐng)導(dǎo)下采用包圍、跟蹤、攻擊等方式捕食獵物。

圖3的GWO算法原理圖表明在K維搜索空間中,產(chǎn)生一組由N只狼組成的狼群,狼群會包圍住獵物。在此過程中,獵物與狼群之間的距離函數(shù)關(guān)系如式(9)所示。
(9)
與其他生物種群啟發(fā)式算法相同,灰狼也必須采用隨機(jī)搜索的方式逐步逼近全局最優(yōu)解,在灰狼優(yōu)化算法中,狼只的隨機(jī)搜索控制函數(shù)如式(10)所示。
(10)

α狼、β狼、δ狼在算法中表現(xiàn)為每次迭代中所保留的3個暫時擁有全局優(yōu)解的灰狼,賦予其對狼群的領(lǐng)導(dǎo)能力,其他灰狼會根據(jù)α狼、β狼和δ狼的召喚更新自身的位置,但是每一次迭代更新都會產(chǎn)生新的α狼、β狼和δ狼,如此往復(fù)迭代直到最底層W灰狼抵達(dá)全局最優(yōu)位置。狼群召喚更新位置過程的數(shù)學(xué)表達(dá)式如式(11)所示。
(11)

由于懲罰因子γ與核參數(shù)σ2是影響LSSVM模型預(yù)測精度的關(guān)鍵參數(shù),將懲罰因子γ與核參數(shù)σ2視為獵物,應(yīng)用GWO算法對目標(biāo)函數(shù)LSSVM的核函數(shù)的γ與σ2進(jìn)行全局尋優(yōu),GWO-LSSVM模型計(jì)算流程如圖4所示。

為了評價模型的預(yù)測精度,引入MAE、RMSE、MSE和R24個預(yù)測誤差評估函數(shù)對預(yù)測模型精度進(jìn)行綜合評估。MAE反映預(yù)測值的真實(shí)誤差,RMSE用于反映預(yù)測值和真實(shí)值之間的偏離程度,MSE反映真實(shí)值與預(yù)測值之間的差異,MAE、RMSE和MSE越接近零,表示預(yù)測精度越高[17],R2衡量的是預(yù)測值與真實(shí)值之間的擬合程度,其值越接近1,表示擬合程度越好,4個預(yù)測誤差評估函數(shù)表達(dá)式如式(12)所示。
(12)

數(shù)據(jù)源引文獻(xiàn)[15]中海水掛片實(shí)驗(yàn)的50組數(shù)據(jù),腐蝕速率采用陽極電流密度表示。文獻(xiàn)[15]利用灰色關(guān)聯(lián)分析法對指標(biāo)進(jìn)行了降維,同時將管材與海水流速設(shè)為獨(dú)立值,即不受其他指標(biāo)影響,單獨(dú)統(tǒng)一賦值,經(jīng)過該處理方式后指標(biāo)降為五維。從50組數(shù)據(jù)中隨機(jī)選出10組數(shù)據(jù)作為測試集樣本,剩余的40組數(shù)據(jù)作為訓(xùn)練集樣本供預(yù)測模型學(xué)習(xí)。訓(xùn)練集樣本見表1,測試集樣本見表2。由于海洋油氣管道外腐蝕影響指標(biāo)的量綱與數(shù)值不同,為了提高預(yù)測算法精度和消除不同量綱數(shù)據(jù)對算法精度的影響,數(shù)據(jù)集經(jīng)過無量綱與歸一化處理,處理公式如式(13)所示。
(13)
式中:x為變量的具體數(shù)值;xmin和xmax分別為該組變量中的最小值與最大值。

表1 訓(xùn)練集樣本數(shù)據(jù)序號溫度/℃氧溶解量/(mg·L-1)鹽含量/(103 mg·L-1)pH值氧化還原電位/mV腐蝕電流密度/(μA·cm-2)125.906.7130.105.1037816.40229.356.0929.006.3040016.90327.906.1831.507.0036315.57424.007.9530.208.1032413.65527.323.2129.318.2028112.91627.876.5531.687.2035614.06…………………3724.316.4240.677.882508.753824.116.3841.007.982288.993917.457.4834.088.1013517.054021.958.2834.647.9511317.34

表2 測試集樣本數(shù)據(jù)序號溫度/℃氧溶解量/(mg·L-1)鹽含量/(103 mg·L-1)pH值氧化還原電位/mV腐蝕電流密度/(μA·cm-2)128.005.0531.409.2024013.34229.376.8230.126.2041417.11328.756.8032.228.0034011.43424.607.5224.427.5721011.83525.576.7032.198.0932511.87628.726.8032.218.0032513.33724.607.5224.427.5721010.74830.707.1531.746.5040115.00925.556.6731.008.0932012.491027.194.9133.507.9927515.48
此處將對比分析粒子群優(yōu)化最小二乘支持向量機(jī)PSO-LSSVM、灰狼優(yōu)化最小二乘支持向量機(jī)GWO-LSSVM、傳統(tǒng)最小二乘支持向量機(jī)LSSVM這3種模型的預(yù)測結(jié)果。PSO速度更新系數(shù)c1取1.5,c2取1.7,種群規(guī)模為20,迭代次數(shù)為100,個體和速度的取值區(qū)間分別為[1,1 00 0]和[0.001,100]。經(jīng)過PSO后的最小二乘支持向量機(jī)核函數(shù)σ為1.435,懲罰因子γ為1.808 9。GWO對LSSVM的核函數(shù)σ、懲罰因子γ的尋優(yōu)范圍分別為[0.001,500]與[0.001,100],搜索狼群單位數(shù)量為20,迭代步數(shù)為50次。經(jīng)過GWO尋優(yōu)迭代后的最小二乘支持向量機(jī)核函數(shù)σ為7.465、懲罰因子γ為0.288 3。兩種算法均在相同的16核工作站上完成,分別用時5.6 s和3.5 s。



圖5是3種預(yù)測模型的預(yù)測結(jié)果。由圖5(b)可看出:傳統(tǒng)LSSVM的相對誤差波動較大,其最大相對誤差達(dá)到1.64%,高于PASO-LSSVM與GWO-LSSVM的預(yù)測結(jié)果。PSO-LSSVM預(yù)測結(jié)果的最大相對誤差為0.44%,GWO-LSSVM預(yù)測結(jié)果的最大相對誤差為0.16%;GWO-LSSVM算法誤差波動小,算法穩(wěn)健。同時,利用預(yù)測結(jié)果計(jì)算3種模型的MAE、MSE和RMES,可以看出GWO-LSSVM的MAE、MSE和RMES最小,最接近于零,分析結(jié)果見圖6。圖7是真實(shí)值與預(yù)測值的線性回歸擬合分析。由圖7可以看出,GWO-LSSVM的決定系數(shù)R2為0.997 8,與1最接近,擬合程度最好。綜合來看,GWO-LSSVM的預(yù)測精度高于PSO-LSSVM及LSSVM,且計(jì)算時間也相對較短。
(1) 從系統(tǒng)工程出發(fā),根據(jù)海底管道的腐蝕機(jī)理,篩選出包括海水溫度、氧溶解量、鹽含量、pH值、氧化還原電位、管道材質(zhì)、海水流速7個因素作為海底管道腐蝕預(yù)測因子,構(gòu)建了海底管道外腐蝕預(yù)測指標(biāo)體系。
(2) 引入灰狼優(yōu)化算法對最小二乘支持向量機(jī)進(jìn)行參數(shù)尋優(yōu),形成GWO-LSSVM預(yù)測模型,與傳統(tǒng)最小二乘支持向量機(jī)、粒子群優(yōu)化最小二乘支持向量機(jī)相比,GWO-LSSVM預(yù)測模型的誤差波動最小,算法穩(wěn)健性和預(yù)測精度更高。