蓋小剛,許佳偉,楊 亮,張 馳,郝思佳
(中海石油氣電集團(tuán)有限責(zé)任公司,北京 100028)
隨著我國能源需求的不斷增長,液化天然氣(LNG)作為一種清潔、高效的能源供應(yīng)方式,其在能源領(lǐng)域的應(yīng)用日益廣泛。然而,由于LNG接收站均在沿海地區(qū),所以管道的腐蝕問題已成為影響其安全運行的關(guān)鍵因素。LNG接收站腐蝕管道剩余壽命的預(yù)測對于管道運行安全、經(jīng)濟(jì)性和維護(hù)決策具有重要意義。LNG接收站腐蝕管道剩余壽命精度預(yù)測的研究,首先需要對管道的腐蝕機(jī)理進(jìn)行深入探討。LNG接收站管道腐蝕主要受環(huán)境、管道材料、施工質(zhì)量等多種因素影響。此外,還需關(guān)注LNG接收站管道腐蝕控制技術(shù)以及剩余壽命評價方法等方面的發(fā)展。
在檢測技術(shù)方面,國外研究提出了一種綜合運用多種方法綜合檢測的技術(shù)方案,極大改善了缺陷檢出率。此外,針對管道的腐蝕狀況,提出了外防腐層安全狀況等級評定標(biāo)準(zhǔn),為管道剩余壽命預(yù)測提供了理論依據(jù)。在腐蝕控制技術(shù)方面,管道腐蝕控制技術(shù)規(guī)程宣貫教材總結(jié)了燃?xì)廨斉涔艿栏g控制的實踐經(jīng)驗,為管道剩余壽命預(yù)測提供了技術(shù)支持。在剩余壽命預(yù)測方法方面,近年來,許多學(xué)者致力于探索適用于LNG接收站管道的剩余壽命預(yù)測方法。這些方法包括基于數(shù)值模擬、灰色關(guān)聯(lián)分析、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等方法。這些研究成果為提高LNG接收站管道剩余壽命預(yù)測的精度提供了理論依據(jù)??傊?,LNG接收站腐蝕管道剩余壽命精度預(yù)測研究需綜合考慮管道腐蝕機(jī)理、腐蝕控制技術(shù)及剩余壽命評價方法等多方面因素。通過深入研究這些因素,有望為我國LNG接收站的安全運行和管道剩余壽命預(yù)測提供有力支持
隨機(jī)森林(Random Forest,簡稱RF)是一種集成學(xué)習(xí)(Ensemble Learning)算法,它主要由多個決策樹(Decision Tree)組成。每個決策樹都是獨立的,并且每個決策樹的訓(xùn)練數(shù)據(jù)集都是通過隨機(jī)采樣得到的[1]。這種方法可以避免決策樹過擬合現(xiàn)象,從而提高整體模型的泛化能力。
由于多種因素都會對管道的腐蝕壽命產(chǎn)生一定的影響,所以需要研究各種因素對其影響的程度。采用隨機(jī)森林方法評估各影響因子對管道剩余壽命的影響,克服了傳統(tǒng)方法推廣性能差的缺點。隨機(jī)森林是一個由多個決策樹組成的分類器,它的基本思想就是用再抽樣的方式從訓(xùn)練集中隨機(jī)選擇一個樣本,然后對每一個樣本構(gòu)建一個二元遞推分類樹。每一個自助抽樣只有37%的原始資料,被稱作袋外數(shù)據(jù),用來作為隨機(jī)森林的試驗樣本;最后,將K個訓(xùn)練樣本作為分類器,構(gòu)建隨機(jī)森林,通過對聚類結(jié)果的表決來判斷試驗樣本的分類效果,并用離包數(shù)據(jù)的錯誤率對分類準(zhǔn)確率進(jìn)行度量。利用MDG(均值基尼指數(shù)降值法),計算各變量對基尼指數(shù)各點的異質(zhì)性的影響,用較高的均值表示該變量的重要性。
這里,MDA表示平均準(zhǔn)確率下降;n表示樹的個數(shù);err00B表示超出袋外數(shù)據(jù)誤差;t表示結(jié)點數(shù);其中,p(k/t)為目標(biāo)變量在節(jié)點t內(nèi)為第k個變量的可能性。按(2)式求出每種樹木的GI值,求出各樹種的平均MDG值。
管道腐蝕問題在我國的工業(yè)領(lǐng)域中十分常見,它不僅會對管道系統(tǒng)的正常運行造成影響,而且還會帶來安全隱患。針對這一問題,研究人員嘗試采用各種方法進(jìn)行預(yù)測,其中多變量線性回歸方法是一種常見的手段。不過因為管道腐蝕是非線性的,因此不能用線性回歸方法對其進(jìn)行預(yù)測分析。
Elman神經(jīng)網(wǎng)絡(luò)作為一種具有非線性、高維等特性的神經(jīng)網(wǎng)絡(luò)模型,它在非線性系統(tǒng)建模和預(yù)測方面具有顯著優(yōu)勢。與傳統(tǒng)的多變量線性回歸方法相比,Elman神經(jīng)網(wǎng)絡(luò)具有以下特點:①非線性能力。Elman神經(jīng)網(wǎng)絡(luò)能夠?qū)W習(xí)和表示非線性關(guān)系,這使得它在處理具有非線性特性的問題時具有優(yōu)越性[2]。通過學(xué)習(xí)非線性關(guān)系,Elman神經(jīng)網(wǎng)絡(luò)可以更好地捕捉管道腐蝕與發(fā)展趨勢之間的復(fù)雜聯(lián)系,從而提高預(yù)測的準(zhǔn)確性;②高維處理。Elman神經(jīng)網(wǎng)絡(luò)能夠處理高維數(shù)據(jù),這使得它在處理包含多個影響因素的復(fù)雜問題時具有優(yōu)勢。在管道腐蝕問題中,可能存在多個因素共同影響腐蝕的發(fā)展,Elman神經(jīng)網(wǎng)絡(luò)能夠同時考慮這些因素,從而提高預(yù)測的準(zhǔn)確性;③自適應(yīng)學(xué)習(xí)。Elman神經(jīng)網(wǎng)絡(luò)具有自適應(yīng)學(xué)習(xí)的能力,能夠根據(jù)輸入數(shù)據(jù)自動調(diào)整網(wǎng)絡(luò)參數(shù),從而使其更適合解決特定問題。這使得Elman神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的泛化能力,可以在不同領(lǐng)域和場景中應(yīng)用。綜上,Elman神經(jīng)網(wǎng)絡(luò)在非線性系統(tǒng)建模和預(yù)測方面具有顯著優(yōu)勢,將其應(yīng)用于管道腐蝕問題的預(yù)測具有較高的準(zhǔn)確性和可靠性。通過構(gòu)建Elman神經(jīng)網(wǎng)絡(luò)模型,可以有效地預(yù)測管道腐蝕的發(fā)展趨勢,從而為工業(yè)領(lǐng)域提供有力支持,提高管道系統(tǒng)的安全運行水平[3]。本項目擬采用非線性活化函數(shù)表征管道剩余壽命的隱含層,采用非線性活化函數(shù)表征管道的動態(tài)信息處理,并以此為輸入,通過四層神經(jīng)網(wǎng)絡(luò)對各因子進(jìn)行量化計算,得到管道剩余使用壽命的預(yù)測結(jié)果。

圖1 Elman 神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)
在Elman 神經(jīng)網(wǎng)絡(luò)模型中,U(k)為網(wǎng)絡(luò)的隱含層,q(k)、qc(k)、h(k)為輸出層;ωi為承接層與隱含層、輸入層與隱含層、隱含層與輸出層的連接權(quán);bi分別為隱式層與輸出級的門限;其中,g是隱式層與輸出層網(wǎng)絡(luò)輸出的線性權(quán)重之和,即隱式層神經(jīng)元的輸出與隱含層的輸出之間的線性權(quán)重之和;f表示隱含層神經(jīng)元的傳輸函數(shù)。Elman 局部遞歸神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)模型如式(1)—(3)所示:
式中:g(*)-隱含層神經(jīng)元傳遞函數(shù),常采用Sigmoid 函數(shù);f(*)-輸出神經(jīng)元的激勵函數(shù)Elman神經(jīng)網(wǎng)絡(luò)采用梯度下降算法對權(quán)重和偏置進(jìn)行調(diào)整,以使誤差平方和最小。梯度下降算法的核心思想是不斷調(diào)整權(quán)重和偏置,使得誤差函數(shù)的梯度(即偏導(dǎo)數(shù))趨近于0,表達(dá)式如式(4)所示:
式中:hc(k)-目標(biāo)輸出值。在實際應(yīng)用中,為了提高Elman神經(jīng)網(wǎng)絡(luò)的性能,通常需要對學(xué)習(xí)過程進(jìn)行多次迭代。通過不斷調(diào)整權(quán)重和偏置,使誤差平方和逐漸減小,直至達(dá)到預(yù)設(shè)的學(xué)習(xí)目標(biāo)。通過調(diào)整權(quán)重、偏置以及激勵函數(shù)和隱含層神經(jīng)元傳遞函數(shù),Elman神經(jīng)網(wǎng)絡(luò)能夠?qū)W習(xí)到管道腐蝕與發(fā)展趨勢之間的非線性關(guān)系,從而實現(xiàn)對腐蝕速度的準(zhǔn)確預(yù)測。在實際應(yīng)用中,可以根據(jù)實際情況選擇不同的參數(shù)和算法,以提高Elman神經(jīng)網(wǎng)絡(luò)的性能。
采用隨機(jī)森林方法對 Elman參數(shù)進(jìn)行選取[4],從而改善了神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力和推廣能力。針對人工神經(jīng)網(wǎng)絡(luò)對權(quán)值、門限等因素的敏感性,提出了一種基于啟發(fā)式演化算法的優(yōu)化參數(shù)選取方法。
思維進(jìn)化算法(MEA)是一種新的演化算法,它利用相位收斂性與異化作用,有效地克服了遺傳算法中雜交與變異操作存在的雙重性問題。該方法的基本思路是:在求解空間中隨機(jī)產(chǎn)生多個個體,獲得分?jǐn)?shù)最大的勝者和暫時的勝者;以產(chǎn)生的個體為中心,產(chǎn)生一系列新的優(yōu)勢子群及暫態(tài)子群;在此基礎(chǔ)上,本項目擬采用收斂操作優(yōu)化子群內(nèi)的個體,并利用異化操作實現(xiàn)子群間的競爭,實現(xiàn)勝者子群與暫態(tài)子群中個體的替代、拋棄與釋放,進(jìn)而獲得全局競爭程度,進(jìn)而計算全局競爭程度。在此基礎(chǔ)上,實現(xiàn)了群體中個體的替代、丟棄、釋放等操作,以求獲得全局最優(yōu)個體的得分。其系統(tǒng)結(jié)構(gòu)如圖2所示。

圖2 思維進(jìn)化算法系統(tǒng)結(jié)構(gòu)圖
經(jīng)過實驗和對比,最后得出了在13個隱層節(jié)點數(shù)的情況下,訓(xùn)練錯誤率最小的結(jié)論。Elman神經(jīng)網(wǎng)絡(luò)權(quán)值參數(shù)修正采取基于梯度下降的改進(jìn)算法,該算法在優(yōu)化過程中引入了一個新的權(quán)值,該方法不僅對算法的收斂能力有很大的影響,而且在求解過程中易出現(xiàn)局部極值。具體過程描述如下:
首先,將樣本集合歸一化,設(shè)定初始參數(shù),采用演化思想的方法,使用群體母函數(shù)產(chǎn)生原始群體和子代群體,并將其劃分為兩個集合。在此基礎(chǔ)上,提出了一種新的改進(jìn)算法,該算法將所有的連通權(quán)集成到同一矢量上,以求出最佳的定位矢量。其中,用遺傳算法求出每個個體的極值點,以此作為神經(jīng)網(wǎng)絡(luò)對性能指數(shù)函數(shù)的近似值,并用啟發(fā)式的演化算法進(jìn)行反復(fù)求解,直至達(dá)到全局最優(yōu);在此基礎(chǔ)上,設(shè)計一種基于遺傳算法的遺傳算法,并對其進(jìn)行局部最優(yōu)編碼,當(dāng)誤差大于給定值時,將其反饋給出最優(yōu)個體,進(jìn)而獲得對應(yīng)的神經(jīng)網(wǎng)絡(luò)權(quán)重及閾值。最后,利用該方法對該模型進(jìn)行了改進(jìn),并對其進(jìn)行了驗證,流程圖如圖 3所示。
為了驗證 MEA-Elma n模型的預(yù)測效果,選取均方誤差(mean squareerror,MSE)和決定系數(shù)(Coeff icient of determination,R2)進(jìn)行分析。即:
式中:y-實際值;預(yù)測值;n-為樣本總數(shù);f-為預(yù)測值;實際值的平均值。決定系數(shù)R2介于0~1之間,且越接近1,模型擬合度愈高,性能愈優(yōu)良。
以某LNG接收站管段為例,對管段的腐蝕狀況進(jìn)行全面檢測,本次采用了掛片實驗方法。掛片實驗是一種常用的腐蝕檢測手段,通過觀察金屬材料在特定環(huán)境下的腐蝕程度,以評估管道的健康狀況。在該實驗中,研究人員沿著管段沿線均勻布設(shè)了200個監(jiān)測點,以確保對整個管段進(jìn)行全面覆蓋。在實驗過程中,研究人員將特定時間內(nèi)(例如100 d)的腐蝕數(shù)據(jù)進(jìn)行收集。經(jīng)過數(shù)據(jù)預(yù)處理和篩選,最終得到了900組具有代表性的腐蝕數(shù)據(jù)。這些數(shù)據(jù)涵蓋了管段沿線各個監(jiān)測點的腐蝕情況,為后續(xù)分析和建模提供了豐富且有價值的樣本。然而,為了進(jìn)一步提高模型的預(yù)測精度和泛化能力,研究人員還需要對原始數(shù)據(jù)進(jìn)行進(jìn)一步篩選和處理。在這個過程中,他們可以采用數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等方法,找出具有典型特征的數(shù)據(jù)子集。通過這種方式,可以降低模型的過擬合風(fēng)險,提高其在實際應(yīng)用中的泛化能力[5]。最終,研究人員從900組數(shù)據(jù)中選取了202組具有代表性的數(shù)據(jù)。這些數(shù)據(jù)既包括了管段沿線各個監(jiān)測點的腐蝕情況,也涵蓋了不同時間跨度和環(huán)境條件下的腐蝕特征。通過使用這些典型數(shù)據(jù),研究人員可以構(gòu)建更加精確和可靠的Elman神經(jīng)網(wǎng)絡(luò)模型,以預(yù)測管道的腐蝕發(fā)展趨勢。部分?jǐn)?shù)據(jù)見表1。

表1 管道腐蝕原始數(shù)據(jù)
針對不同因素之間的差異,提出了一種基于premnnmx函數(shù)的方法,來消除尺度效應(yīng)的影響。通過隨機(jī)森林算法將樣本數(shù)據(jù)10種腐蝕單因素變量納入隨機(jī)森林模型得到各變量重要性由高到低排序;根據(jù)重要性評分排序得到的結(jié)論,從評分最高的單個變量進(jìn)行逐步隨機(jī)森林。分析結(jié)果如圖4所示。當(dāng)變量數(shù)為8時估算誤差率最低,因此,選取電阻率、環(huán)境pH、鹽度、含水率、氧含量、H2S含量、注入水體pH等8個因子作為神經(jīng)網(wǎng)絡(luò)的輸入?yún)?shù)。

圖4 變量重要性排序圖
為了驗證RF-MEA-Elman模型的性能,研究人員將篩選后的數(shù)據(jù)分為訓(xùn)練集和檢測集。其中,186組數(shù)據(jù)作為MEA-Elman模型的訓(xùn)練集,剩余的20組數(shù)據(jù)作為檢測集。研究人員通過不斷迭代優(yōu)化,揭示了模型在訓(xùn)練過程中的進(jìn)化歷程,如圖5所示。為了評估RF-MEA-Elman模型的預(yù)測準(zhǔn)確性,研究者選取了MEA-Elman和Elman兩個模型作為對比[5]。思維進(jìn)化迭代過程如圖6展示的那樣。在迭代過程中,研究人員不斷調(diào)整模型參數(shù),以期達(dá)到更高的預(yù)測精度。通過圖5,我們可以觀察到模型的精度隨著迭代的進(jìn)行而逐步提高。了更直觀地評估RF-MEA-Elman模型的性能,研究人員選擇了MEA-Elman和Elman兩個模型進(jìn)行對比。通過對比三種模型的預(yù)測結(jié)果,可以清楚地看出RF-MEA-Elman模型在預(yù)測精度方面的優(yōu)勢[6]。圖6展示了思維進(jìn)化迭代過程,從中我們可以看到模型在迭代過程中的逐步優(yōu)化。通過對比預(yù)測結(jié)果及相對誤差,研究人員可以直觀地評估RFMEA-Elman模型的性能。如圖7、8和表2所示,RFMEA-Elman模型在預(yù)測精度、準(zhǔn)確性和穩(wěn)定性方面均表現(xiàn)出顯著優(yōu)勢。RF-MEA-Elman模型在迭代優(yōu)化過程中具有較高的預(yù)測精度,可以有效地應(yīng)用于管道腐蝕預(yù)測。與MEA-Elman和Elman模型相比,RFMEA-Elman模型在預(yù)測性能方面具有明顯優(yōu)勢,為管道管理部門提供了有力支持。通過應(yīng)用RF-MEAElman模型,可以提高管道的安全運行水平和維護(hù)效率,降低管道腐蝕帶來的風(fēng)險[7]。

圖5 逐步隨機(jī)森林分析結(jié)果

圖6 思維進(jìn)化算法迭代變化過程

圖7 模型預(yù)測結(jié)果的比較
如圖6所示,經(jīng)過30個迭代后,該方法的誤差很快降至0.05以下,表明該方法有很好的推廣性能和穩(wěn)定性。如圖7所示,RF-MEA-Elman預(yù)測值與真實值之間的差異較小,且與單個 Elman模型及MEAElman模型的擬合結(jié)果吻合較好,說明 RF法剔除了冗余變量,采用演化思想對神經(jīng)網(wǎng)絡(luò)權(quán)重及門限進(jìn)行了優(yōu)化,得到了準(zhǔn)確、快速的神經(jīng)網(wǎng)絡(luò)模型。從圖8和圖2中可以看出,RF-MEA-Elman方法的相對預(yù)報誤差比其他兩種模式都要小,而所建立的模型大部分誤差在4%之內(nèi)。為了更好地評估該模式的預(yù)報效能,我們使用前一節(jié)介紹的兩種統(tǒng)計方法來評估該模式,并將其結(jié)果顯示在表3中。

表3 模型預(yù)測性能指標(biāo)對比

圖8 相對誤差對比圖
進(jìn)一步的分析顯示,在誤差指標(biāo)(MSE)方面,最小的只有0.86,判決系數(shù)R2高達(dá)0.98,比兩個對照模型都要高得多,并且都非常逼近1,這表明演化算法可以很好地對 Elman神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化。研究結(jié)果表明,本文提出的方法預(yù)報準(zhǔn)確率高,泛化能力強(qiáng),可以為管線腐蝕評價提供一定的理論依據(jù)。
針對腐蝕管道影響因素復(fù)雜與傳統(tǒng)方法預(yù)測效果差等問題,構(gòu)建含腐蝕管線的RF-MEA-Elman剩余壽命預(yù)測模型,并對其進(jìn)行驗證。結(jié)果如下:
1)利用隨機(jī)森林方法,有效地提取出了腐蝕過程中的主導(dǎo)因子,減弱了數(shù)據(jù)冗余性對預(yù)測結(jié)果的影響。
2)利用演化算法對神經(jīng)網(wǎng)絡(luò)的權(quán)重門限進(jìn)行優(yōu)化,以克服因參數(shù)隨機(jī)性而導(dǎo)致的學(xué)習(xí)效率下降,從而達(dá)到快速、準(zhǔn)確、節(jié)省計算量的目的[7]。
3)將本模型用于管線的剩余壽命預(yù)測,結(jié)果表明RF-MEA-Elman模型在推廣能力、穩(wěn)定性和精度上都有很大的改善,具有較好的推廣價值。通過本項目的實施,將進(jìn)一步完善含腐蝕管線剩余壽命的研究方法,為我國LNG接收站的安全運行和維護(hù)工作提供理論支撐。