駱正山,秦越,張新生,畢傲睿
(西安建筑科技大學 管理學院,西安 710055)
在役海底油氣管線通常處于復雜惡劣的海洋環境中,管段經常會遭受嚴重腐蝕,從而造成管段結構破壞與經濟損失[1]。對于陸上管道,可通過各種檢測方法了解管道的腐蝕狀況,但對海洋環境中管道的檢測相對困難,利用機器學習算法預測管道腐蝕速率是一種較為理想的方法[2-3]。因此,研究海底管道的腐蝕機理和規律,建立準確、有效的預測模型具有十分重要的現實意義。
目前,國內學者對海底油氣管道的腐蝕行為進行了大量研究。駱正山等[4]建立了海底油氣管道腐蝕速率預測的Frechet 分布模型,該模型只預測了油氣管道的腐蝕深度和管道壽命,未表明預測誤差。同時,駱正山等[5]建立了基于誤差補償的GM-RBF 海底輸油管道腐蝕速率的預測模型,該研究將GM 模型用于預測腐蝕速率,但模型預測誤差較大。王慶鋒[6]等基于GM(1,1)模型建立了無偏灰色GM(1,1)模型,構建的無偏灰色馬爾可夫鏈組合模型可對管線腐蝕剩余壽命進行預測。但傳統單維灰色模型分析法以時間序列為軸線,未能表明其他環境因素的相互聯系及其對響應變量的具體影響。鄧志安等[7]建立了GRA-FNN模型,對海洋管線腐蝕速率進行了預測,但灰色關聯分析中的各指標均需人為確定,主觀性強。李響等[8]構建了遺傳算法SVM 模型,對海洋環境腐蝕速率進行了預測,解決了BP 神經網絡等智能算法需要大量訓練樣本的問題,但SVM 參數選取較為復雜,收斂速度不夠快。以上的研究均存在諸如影響因素考慮欠全面、算法迭代速度較慢和預測精度不夠高等問題。
鑒于此,本文提出了一種將套索回歸(LASSO)、鯨魚優化算法(WOA)和最小二乘支持向量機(LSSVM)有機結合的海底管道腐蝕預測新方法。采用LASSO 回歸,約簡樣本指標,提取主要變量,并使用WOA 對LSSVM 的核函數寬度和懲罰因子兩個參數進行了優化,建立了LASSO-WOA-LSSVM 的海底管道腐蝕速率預測模型,以海洋掛片實驗數據為例進行實證研究,通過指標和對比,對模型性能進行驗證和分析。
影響海底管道腐蝕速率的因素眾多,其主要影響因素為以下五項:海水溫度[9]、溶解氧含量[10]、鹽度[11]、pH 值[12]和氧化還原電位[13]。
在建立腐蝕回歸模型時,若將某些對因變量影響較小的影響因子選入模型,會降低模型的預測精確度[14]。故在腐蝕失效預測前,應先對海洋管線的各腐蝕因素進行分析,篩選出關鍵因素。
LASSO(Least Absolute Shrinkage and Selection Operator)即最小絕對值壓縮選擇算法[15-17],是Tishirani 提出的一種非負干擾激勵的變量選擇方法。該方法通過構造懲罰函數來壓縮變量系數,使壓縮后某些絕對值較小的系數直接變為零,這些變量將被刪除,從而同時達到降維與參數選擇的目的。
假設給定數據集(X,Y),X是自變量向量,Xi(i=1,2, …,n),Y是因變量向量,Yi(i=1, 2, …,n),系數向量為β(β1,β2, …,βm)。令β=(β1,β2, …,βm)T,則LASSO 的估計量為:


式中,Xi是第i組自變量,Yi是對應于Xi的因變量的值,Xi經標準化后得到Xij,βj是回歸系數,n為組數,t為非負調整參數。λ是正則化參數,λ越小,懲罰項的力度越小,模型保留變量越多;λ越大,懲罰項的力度越大,模型保留變量越少。
最小二乘支持向量機(LSSVM)[18-19]是一種基于傳統 SVM 算法的改進算法,在對偶空間中,LSSVM 通過用等式代替不等式約束,并將線性最小二乘準則應用于損失函數優化,實現了凸二次規劃問題向線性方程組問題的求解轉變,提高了收斂速度[20]。LSSVM 的實現過程如下:
(1)給定訓練集D={(xi,yi)|i=1, 2, …,n},xi∈Rn是第i個輸入樣本,yi∈{-1,+1}是輸出變量組。

(2)在高維空間中構造回歸函數:ω為可調權向量,φ(x)是非線性核映射函數,b為偏差參數。
(3)根據結構風險最小準則,最優ω和b可經下述函數最小化得到:

其中,C是平衡訓練誤差與模型適應度的正則化參數,ξi是隨機誤差。
(4)為解決LSSVM 的優化問題,構造如下拉格朗日函數:

此處的αi是Lagrange 乘子。根據KKT(Karush-Kuhn-Tucker)條件,分別求解L(ω,b,ξ,α)對ω、b、ξ、α的偏微分,可得:

(5)消除ω和ξi,并以矩陣形式表達:

(6)最后,在求解優化問題后,得到函數估計的線性模型:

鯨魚優化算法(WOA)是澳大利亞學者Seyedali Mirjalili 于2016 年提出的一種新的元啟發式算法[21-24]。在發現獵物后,座頭鯨先潛入獵物的底部,然后沿著圓圈形路徑形成獨特的氣泡,如圖1 所示。與此同時,座頭鯨從上游到達海面,通過氣泡將獵物圍在較小的范圍內吞食。WOA 的工作分為以下三個部分:收縮包圍、氣泡網狩獵和搜索獵物。

圖1 座頭鯨螺旋氣泡攻擊捕獵行為示意Fig.1 Spiral bubble attack hunting behavior of humpback whales
在收縮包圍階段,座頭鯨首先會對獵物進行環繞式包圍,該過程可用以下方程描述:

式中,t為迭代的次數,X*(t)為當前鯨魚的最優位置向量,X(t)為當前鯨魚的位置向量,X(t+1)代表迭代后下一次的目標位置向量,A、C為系數向量,定義如式(12)、(13)。

式中,r是區間[0,1]內的隨機向量,a值由2 線性減小至0。
其次是開發階段,該過程實現了收縮包圍機制和螺旋更新位置機制,其數學模型如下:(1)收縮包圍機制,在該過程中,A是在[a,–a]之間的某隨機數,其值隨迭代過程由2 減小至0。(2)螺旋更新位置機制,在該機制中,座頭鯨以螺旋狀運動方式接近獵物,該過程的模擬方程如式(14)所示。

式中,D′=|X*(t)–X(t)|,代表鯨魚與當前最優位置間的距離,常數b表征螺旋線的形狀,l是一個在[–1,1]中的隨機數。
座頭鯨在進行捕獵時,按照50%的概率實施以上兩種捕食策略,其過程如下式所示:

其中,p代表[0,1]之間的隨機變量,a值會隨著鯨魚靠近獵物而減小。若|A|<1,鯨魚將進攻獵物;若|A|>1,鯨魚將會放棄獵物并重新進行搜尋。
最后是探索階段。設定隨機值|A|≥1,該階段的數學模型如下:

其中,Xrand是所在種群中的隨機代理位置向量。
在LSSVM 模型中,模型預測性能受懲罰因子C和核函數寬度σ兩個參數的影響較大,故本文采用WOA 對參數進行優化,以提高模型的回歸性能。具體過程描述如下。
首先對樣本集進行歸一化,并設定初始參數,即對運行過程中4 個參數的初值進行設置,分別是鯨魚種群規模、最大迭代次數Tmax、鯨魚種群位置的上限與下限。其次,對種群位置進行初始化,定義適應度函數,即將預測值與實際值的均方差作為適應度函數,并對個體適應度進行計算,選擇出當前最優適應度個體,設置該個體的位置為當前最優。若t 圖2 腐蝕預測流程Fig.2 Flow chart of corrosion prediction 為了驗證WOA-LSSVM 模型的預測效果,本文選擇以下三項指標對模型性能進行分析,即均方根誤差(Root Mean Square Error, RMSE)、平均絕對百分誤差(Mean Absolute Percentage Error, MAPE)和決定系數(Coefficient of Determination,R2)。計算公式如下: 其中,n是樣本總量,iy為測試樣本的預測值,yi為真實值。決定系數R2介于0 到1 之間,且越接近1,模型擬合度越高,性能越優良。 表1 提供了在不同海水環境參數下50 組海洋掛片腐蝕速率的數據[25],以電流密度(1 μA/cm2)為單位來表征腐蝕速率,鋼材腐蝕情況見圖3。 圖3 鋼材腐蝕形貌圖Fig.3 Corrosion morphology of steel 表1 海洋掛片腐蝕數據Tab.1 Test data of marine corrosion 首先通過交叉驗證法確定LASSO 回歸模型的懲罰力度,由圖4 可知,經交叉驗證得到的正則化參數λ為0.297 15。圖5 為在λ為不同取值下各變量懲罰函數值的變化情況及篩選結果。由圖5 可知,當λ為0.297 15 時,有兩個變量的懲罰函數值收斂為0,故將這兩個變量剔除,篩選后,得到海洋管線腐蝕速率的影響變量為溫度、溶解氧含量和pH 值。 圖4 交叉驗證過程Fig.4 Cross validation process 圖5 LASSO 擬合的系數軌跡Fig.5 Coefficient trajectories fitted by LASSO 將經篩選后的數據分為兩組,選取其中42 組作為WOA-LSSVM 的訓練集,其余8 組為檢測集,模型在訓練中的迭代進化過程如圖6 所示。經迭代尋優后的最優參數Cbest=619.2068,σ2best=14.8045,并將兩參數代入到LSSVM 中進行預測。 圖6 WOA-LSSVM 迭代過程Fig.6 Iteration process of WOA-LSSVM 圖7 預測結果對比圖Fig.7 Comparison of prediction results 為檢驗WOA-LSSVM 模型的預測精度,選用FOA-LSSVM 和LSSVM 兩個模型與之進行對比,結果如圖7 所示,相對誤差對比結果見圖8 和表2。由圖7 可以看出,相較于LSSVM 和FOA-LSSVM 兩個模型,WOA-LSSVM 的預測值與真實值的差距較小,擬合效果更佳。結合圖8 和表2 的分析可知,除第7、8 兩組數據外,WOA-LSSVM 的預測相對誤差均小于其余兩個模型。且就相對誤差的平均值來看,LSSVM、FOA-LSSVM、WOA-LSSVM 的平均相對誤差分別為8.01%、6.28%、2.23%,WOA-LSSVM 的平均相對誤差值明顯低于另外兩者,亦可證明該模型的預測精度最高。 為進一步評價模型的預測性能,采用前文所述的三個統計學指標對模型進行評價,其分析結果見表3。從均方根誤差(RMSE)這個指標來看,WOA-LSSVM分別比FOA-LSSVM 和LSSVM 減少了0.6107 和0.8939;從平均絕對百分誤差(MAPE)這個指標來看,WOA-LSSVM 又分別比兩者降低了 4.06%和5.79%。而 WOA-LSSVM 的決定系數R2達到了0.9708,遠高于兩個對照模型,說明模型的擬合度較高,預測效果更好。 圖8 相對誤差對比圖Fig.8 Comparison of relative errors 表2 預測相對誤差結果分析Tab.2 Analysis of relative error results 表3 模型預測性能指標對比Tab.3 Comparison of model performance indicators 由于海洋環境復雜多變,影響管道腐蝕速率的因素較多,且某些指標難以測量和定量化,故在實際研究中無法將海洋掛片數據的所有影響指標納入分析。未來可根據綜合指標的管線腐蝕數據進行分析預測,進一步提高海洋管線外腐蝕速率預測的精確性和科學性。 1)采用LASSO 回歸算法,確定海底管道腐蝕速率的主要影響指標,降低了LSSVM 輸入變量的維度。作為傳統支持向量機的改良,使用最小二乘支持向量機避免了二次規劃問題的求解,提高了收斂速度,節約了運算成本。 2)使用WOA 對LSSVM 的懲罰因子C和核函數寬度σ2兩個參數進行優化,將預測的平均相對誤差降低至2.23%,提高了迭代速度和預測精度,證明了模型具有較高的可靠性和良好的預測性能,也為深海油氣集輸系統平臺等結構的安全風險預警與防范提供了較為可靠的數據和理論支持。
2.3 模型驗證指標

3 實例應用
3.1 數據準備


3.2 LASSO 變量選擇


3.3 結果分析與模型對比





4 結論