劉 潔 谷劍英
(中水北方勘測設計研究有限責任公司,天津 300222)
水利工程常涉及長距離引調水問題,需要埋設地下輸水管線以供后期使用。土壤中富含氧、水分、溶鹽和微生物等,輸水管線長期埋置于地下會發(fā)生腐蝕破壞[1]。材料腐蝕是材料受環(huán)境介質的化學、電化學和物理作用產生的損壞或者破壞現(xiàn)象,常發(fā)生于工程建筑、日常生活中。這不僅會造成材料損耗、工程成本增加,還可能導致重大事故發(fā)生。腐蝕防護事關國家安全、經濟發(fā)展、民生民利、生態(tài)環(huán)境等多個方面[2]。腐蝕防護安全問題關系重大,建立、完善和發(fā)展土壤腐蝕防護體系具有重要的戰(zhàn)略意義、科學意義和現(xiàn)實意義[1,2]。
土壤對鋼結構的腐蝕主要分為4類,依次為酸類腐蝕、細菌腐蝕、原電池腐蝕和雜散電流腐蝕[3]。為加強輸水管線的防護,減少土壤對鋼結構的腐蝕破壞,需要對土壤進行腐蝕性測試,以綜合評價其腐蝕能力,因地制宜做好管線防護工作。常規(guī)測試參數有5個,依次為土壤電阻率、氧化還原電位、pH值、質量損失、極化電流密度[4]。科學高效地評價土壤腐蝕能力具有重要的實際意義[5]。在以往的研究中,土壤的理化性質常作為判斷土壤腐蝕性的標準。但單項指標評價法片面、不具有代表性和說服力,綜合指標評價法雖綜合性強、能較為全面地作出評價,但數據多、耗時久、操作難度大[6]。土壤的影響因素多且復雜,其腐蝕性評價具有模糊性、隨機性和不確定性的特點。故而,引用機器學習模型理論,將多元統(tǒng)計評價方法應用于土壤腐蝕的分析與評價工作中[7]。機器模型成本低、周期短、尺度廣、計算效率高,而多元統(tǒng)計評價方法能綜合處理多個變量并根據結果做出評價,融合其優(yōu)勢并應用于土壤腐蝕性評價領域,將是一項重大突破[6,7]。
本文采用因子分析和熵權法,構建土壤腐蝕性評價模型,評價土壤對鋼結構的腐蝕情況。經數據集訓練和測試證明該模型可行、有效,經多個應用實例驗證其結果與該模型評價結果一致,證明了該評價方法對土壤腐蝕性評價的有效性。
因子分析法是以原始變量的相關性為出發(fā)點,利用降維思想,通過探尋原始變量矩陣的內部關系,將多變量簡化為少數因子,進而分析其內在關聯(lián)[8,9]。其基本思想是:按照相關度的不同將原始變量進行分類,類別內部變量的相關性和變量聯(lián)系呈正相關關系,即:類別之間的變量相關度高,則聯(lián)系緊密;類別之間的變量相關度低,則聯(lián)系稀疏[10,11]。
土壤腐蝕性的因子分析法一般步驟[12,13]為:
(1)確定變量和搜集資料,構建m×n的矩陣,m為樣本數量,n為原始變量數(常規(guī)測試中n=5);
(2)通過標準化式(2)~式(4),對原始數據進行預處理,以消除各變量因量綱和數值差異對計算產生的影響:
其中,xij為原始數據,zij為標準化數據;
(3)因子分析要求變量具有連續(xù)性和相關性,故在分析數據之前,需要對數據進行KMO檢驗和Bartiett球度檢驗。
通過計算KMO值,可知樣本是否適合采用因子分析法進行評價。當KMO<0.5時,說明該樣本不適合采用因子分析法進行綜合評價;當0.5
Bartiett球度檢驗值若小于顯著性水平,說明變量間有相關性,可以進行因子分析。
具體計算公式如下:
(4)計算相關系數矩陣,如式(6)所示:
其中,i=j時,rij=1;i≠j時,rij= rji;
(5)求解相關系數矩陣特征值和特征向量,并計算貢獻率,如式(7)所示:
設R的特征值依次為λ1,λ2,…,λn,且規(guī)定λ1≥λ2…λn≥0,則λi/(λ1+λ2+…+λn)是第i主成分的貢獻。方差貢獻率指的是第i因子對所有原始變量的信息提取程度。累積方差貢獻率是提取出的所有因子對原始變量總共提取的信息量,即(λ1+λ2+…+λi)/(λ1+λ2+…+ λn);
(6)確定公因子個數。提取幾個因子可根據以下幾點來確定:
1)初始特征值大于1的因子個數;
2)累積方差解釋率達到一定水平(一般為60%)的因子個數;
3)碎石圖中處于陡峭斜率所對應的因子個數;
(7)對因子載荷矩陣進行旋轉處理
采取最常用的最大方差法進行旋轉。旋轉處理后的因子載荷矩陣能對各原始變量更好地進行分類。旋轉次數可以自己規(guī)定,也可以通過SPSS軟件進行確定;
(8)計算因子得分
將公共因子當作分析變量,計算其因子得分。
在信息論中,熵是對不確定性的一種度量。不確定性越大,熵就越大,包含的信息量越大;不確定性越小,熵就越小,包含的信息量就越小。利用熵權決策法來計算各評價指標的權重,即是利用評價指標的有效信息量來計算,有效信息量越大,權重就越大[14]。根據熵的特性,可以通過計算熵值來判斷一個事件的隨機性以及無序程度,也可以用熵值來判斷某個指標的離散程度,指標的離散程度越大,該指標對綜合評價的影響(權重越大)。比如樣本數據在某指標下取值都相等,則該指標對總體評價的影響為0,權值為0。熵權法是一種客觀賦權法,因為它僅依賴于數據本身的離散性。
(1)數據標準化處理,如式(8)所示:
(2)計算因子所占比例,如式(9)所示:
(3)計算各因子權重,如式(10)所示:
其中,dj是第j項指標的信息效用值。
其中,ej是第j項因子的熵值。
(4)計算綜合得分,式(13)所示:
收集不同地區(qū)土壤腐蝕性參數數據,總計樣本數m為100,原始變量數n為5(包括土壤pH值、氧化還原電位、土壤電阻率、極化電流密度和質量損失)。
首先將不同量綱的訓練數據集通過標準化公式進行標準化處理消除數據自身對結果的不利影響。分析樣本變量數據間的相關關系是進行因子分析的先行條件,若變量間的相關關系較差,則無法分析出公共因子。在SPSSPro軟件中,變量相關關系由KMO檢驗和Bartiett球度檢驗進行評價。KMO檢驗用于分析原始變量數據間的簡單相關性和偏相關性的大小關系,Bartiett球度檢驗用于檢驗變量數據是否符合多元正態(tài)分布。
由表1可知,KMO統(tǒng)計量為0.619,Bartiett球度檢驗的概率值小于0.05(顯著性水平),說明所分析的5個變量之間是存在相關性,符合因子分析的前提條件,可以進行因子分析。

表1 KMO檢驗和Bartlett檢驗
由表2可知,前兩個因子的初始特征值均大于1,且累積方差解釋率為大于60%,說明這兩個因子能夠基本反映土壤對鋼結構的腐蝕情況。結合碎石圖(如圖1所示)中處于陡峭斜率所對應的因子個數,可以確定選取前兩個因子進行分析。

圖1 碎石圖

表2 方差分析
為了賦予因子載荷實際意義,采取最大方差法進行因子旋轉,旋轉后因子載荷系數如表3所示。因子旋轉前后,累計方差解釋率并未變化,但是各因子解釋原有變量的方差進行了重新分配,其方差解釋率發(fā)生了變化。由表3可知,第1因子在質量損失上有較大的載荷,體現(xiàn)出導電性質。第2因子在氧化還原電位上有較大的載荷,體現(xiàn)出電化學性質。

表3 旋轉后因子載荷系數
表4說明各個成分的所包含的因子得分系數(主成分載荷),用于計算出成分得分,得出主成分公式。計算得到各樣品對鋼結構腐蝕能力的兩個因子得分,最后根據各因子解釋率得到最終的綜合得分。得分情況如圖2所示。

圖2 主因子得分情況

表4 成分矩陣
第一個公共因子與質量損失、視電阻率和電阻率有較大相關性,它代表了土壤的物理性質,反映土壤介質的導電能力。第二個公共因子與氧化還原電位和pH值有較大相關性,它代表了土壤的電化學性質。
將通過因子分析法得到的兩個主因子帶入式(8)~式(12),計算出第1因子、第2因子的權重分別為 33.986%、66.014%。得分情況如圖3所示。

圖3 熵權法得分情況
選取海南、安徽、河北、天津等地區(qū)共計72個土樣,采用因子分析-熵權法模型綜合評價其對鋼結構的腐蝕情況,將分析結果與GB50021-2001《巖土工程勘察規(guī)范》(2009年版)得到的腐蝕等級結果進行對比,結果如表5所示。GB50021-2001《巖土工程勘察規(guī)范》(2009年版)將土壤腐蝕性等級分為微、弱、中、強4個等級。由表5可知,72個土樣中微腐蝕有13個,弱腐蝕有10個,中腐蝕有30個,強腐蝕有19個。腐蝕性等級均未出現(xiàn)跨等級跳躍的情況。總體上,因子分析-熵權法模型評價指標得到的綜合評價結果與規(guī)范的評價結果基本一致。

表5 因子分析-熵權法模型土壤腐蝕性評價結果
(1)本文提供了一種系統(tǒng)、可靠的土壤對鋼結構腐蝕性綜合評價方法,該方法通過因子分析法得到的影響土壤腐蝕性的關鍵因素F1和F2作為評價指標,再通過熵權法計算權重得到各土壤的得分情況,從而最終得到土壤腐蝕性評價結果;
(2)經多個應用實例驗證其結果與該模型評價結果一致,說明該模型可推廣使用。同時,該評價方法為土壤腐蝕性評價工作提供了一種具有借鑒意義的新思路。