王新穎,胡磊磊,劉 嵐,徐 拓,林振源,黃旭安
(常州大學 環境與安全工程學院,江蘇 常州 213164 )
在儲罐罐底腐蝕中,點蝕破壞性最大,是科研人員監測和研究的重點[1]。聲發射由于其非破壞性技術(NDT),被廣泛用于管道泄漏[2]、疲勞斷裂[3]、損傷檢測[4]、腐蝕破壞和表面摩擦等檢測。運用聲發射技術分析因點蝕產生的缺陷及損傷信息,構建聲發射源診斷模型,是目前相關領域研究的關鍵[5]。
隨罐底腐蝕聲發射研究的不斷深入,卷積神經網絡(CNN)能夠解決傳統BP神經網絡收斂速度慢且易陷入局部極值的問題[6]。通過采用誤差梯度進行訓練,在一定程度上提高模型訓練效率,減小“過擬合”風險[7-8]。實際應用中點蝕聲發射源類別標簽難以獲取,而K均值聚類算法(K-means)無需標簽數據,但無法事先確定合適的聚類數目,聚類質量不高[9-10]。
良好聚類效果獲取的關鍵在于確定最佳的聚類數目,因此,本文在基于K-means引入肘部法則的思想,以確定最佳k值,并結合基于TensorFlow的CNN,建立儲罐底板點蝕過程診斷模型。
準備100 mm×250 mm×10 mm的Q235鋼試樣,實驗開始前,用砂紙將鋼試樣表面打磨光滑,用酒精棉擦拭表面并放入干燥箱內備用,腐蝕溶液選用質量分數3.0%NaCl、pH=2.0的酸性溶液,檢測儀器采用美國進口的micro-Ⅱ 2代聲發射儀。
儲罐底板模擬點蝕試樣如圖1所示,選取試樣中間部位,用打孔機打孔,表面形成凹槽,向孔中滴入配置好的腐蝕溶液,在孔周圍涂滿凡士林,防止邊緣處產生縫隙。
圖1 儲罐底板模擬點蝕試樣Fig.1 Simulated pitting corrosion specimen of tank bottom plate
實驗裝置如圖2所示。整個實驗在室內常溫中進行,傳感器涂滿凡士林與試樣表面緊密貼合,同軸電纜與通道連接,實時傳送腐蝕信號,為減少外界振動干擾,試樣底部與實驗臺之間襯有橡膠墊。
圖2 聲發射檢測工作示意Fig.2 Schematic diagram of acoustic emission detection
整個實驗進行6 h,將采集到的信號數據按時間先后順序每間隔2 h進行分組,標位前中后3種狀態,采用Matplotlib在Jupyter notebook中進行可視化處理,如圖3所示,整個過程產生豐富的聲發射信號。從頻域角度進行分析可知,前期頻帶較寬,主要分布在250~2 000 Hz,最大幅值為0.025 mV,能量較分散;中、后期聲發射信號頻帶分別分布于250~700 Hz和250~900 Hz,頻帶較窄并均集中在低頻區域,最高幅值分別為0.005,0.01 mV,能量較集中。
圖3 點蝕前中后期頻譜Fig.3 Spectrum of early,middle and later period of pitting corrosion
本文選取6個典型聲發射特征參數和2個衍生聲發射參數RA和RD。其中,RA值為上升時間與幅度的比值,表征信號的斜率,RD為上升時間與持續時間的比值,表征信號波形的陡峭程度。
由于聲發射信號特征參數類型和個數的選擇直接影響聚類結果,所以本文對提取的所有特征進行相關系數法,剔除相關性大的特征。
相關公式如式(1)~(2)所示:
(1)
(2)
8個特征參數的相關系數矩陣見表1,絕對能量與能量強相關,絕對能量包含的聲發射信息小于能量包含的聲發射信息,刪除絕對能量;RA與上升時間強相關,但上升時間受采集閾值影響較大,刪除上升時間。因此,本文選取計數、能量、持續時間、幅值、RA、RD這6個特征參數輸入聚類分析。
表1 特征參數相關系數矩陣Table 1 Correlation coefficient matrix of characteristic parameters
基于改進K-means的CNN故障診斷流程如圖4所示,首先采集點蝕聲發射信號,并預處理選取特征參數,再通過肘部法則確定該數據集的最佳k值,結合聚類確定聲發射源類別個數,建立CNN模型,輸出類別診斷結果及準確率。
圖4 基于改進K-means的CNN故障診斷流程Fig.4 CNN fault diagnosis process based on improved K-means
K-means算法是以最小化樣本與質點平方誤差作為目標函數,當目標函數達到最優化,表示達到聚類目的。但目標函數中需要確定類簇個數,傳統個數通過經驗得到,缺乏客觀性,因此,本文加入肘部法則,保證k值選取的準確性。
1)肘部法則
將每個類別與其類中心點的距離稱為畸變程度,畸變程度隨類別數增加而降低,在某個臨界點,畸變程度改善效果突然大幅度變化,表明此處聚類效果較好。肘部法則運用該思想確定最佳聚類數,體現在曲線最顯著的拐點,即表示正確的類別數。
2)最佳聚類個數確定
本文運用CH指標、輪廓系數指標和SSE指標作為表征畸變程度的損失函數,結合肘部法則選取k值。3種聚類評估指標計算如式(3)~(5)所示。
①CH指標
CH越大表示類自身越緊密,類與類之間越分散,即聚類結果更優,如式(3)所示:
(3)
式中:N為數據集樣本點的個數;k是類別個數;Bk是類別之間協方差矩陣;Wk是類別內部數據協方差矩陣;Tr為矩陣的跡。
②輪廓系數(S)指標
輪廓系數是對類中所有數據點緊密分組程度的度量,輪廓系數分值越高,分類效果越好,如式(4)所示:
(4)
式中:a代表同類中2點的均值;b代表1個點至除自身所在類外最近類的樣本間均值。
最后所有樣本的S(i)的均值稱為S,也就是輪廓系數[11]。
③誤差平方和(SSE)指標
SSE代表聚類效果的優劣,SSE值越小,說明各類之間分隔越明顯,聚類結果越好[12],如式(5)所示:
(5)
式中:Ci是數據點完成聚類后的第i類;p是Ci中的樣本點;mi是Ci中所有樣本數據點距離的均值;k為聚類數。
不同損失函數對應誤差平方和隨k值變化曲線如圖5所示,當聚類個數k增大,誤差平方和均逐漸減小,且在k=3時,有明顯轉折點,轉折點3就是最佳聚類個數。
圖5 誤差平方和隨k值變化的曲線Fig.5 Curves of sum of squares of errors varying with k value
3)聚類分析結果
k=3時,衍生特征值RA,RD隨時間分布3D如圖6~7所示,4個典型特征值隨時間分布如圖8所示。
圖6 RA隨時間的聚類分布Fig.6 Clustering distribution of RA over time
圖7 RD隨時間的聚類分布Fig.7 Clustering distribution of RD over time
圖8 4個典型特征值隨時間的聚類分布Fig.8 Clustering distribution of 4 typical characteristics values over time
由圖8可知,前期聚類1能量最小,計數最少,幅值相對較小,持續時間相對最短,是典型的脈沖型突發信號,理論上氣泡破裂會產生脈沖型信號,通過該特征確定這類信號為點蝕前氣泡破裂產生的聲發射信號;中期聚類2能量較高,幅值相對最高,持續時間較長,計數相對最大,理論上開裂或蝕坑擴展時信號最活躍,即計數和能量相對最高,可以判定聚類2是腐蝕開裂、相鄰點蝕坑貫穿生長和擴展產生的聲發射信號;后期聚類3持續時間較長,但幅值較低,能量值較大,體現為較明顯的連續型聲發射信號特征,理論上腐蝕產物層間摩擦和自身開裂均會產生連續型聲發射信號,因此,聚類3為腐蝕產物層間摩擦和開裂產生的信號[13]。
1)一維卷積神經網絡模型結構
本文提出的罐底點蝕卷積神經網絡模型結構參數如表2所示。為加快收斂速度,激活函數設置為Relu,第1層卷積層由大小為3的卷積核以及64個過濾器組成,為減少輸出的復雜性并防止數據過擬合,加入大小為3的最大值池化層;輸出矩陣大小為輸入矩陣的1/3;再者為均值池化層和Dropout層,為隨機去除50%神經元,避免過擬合發生,設置Dropout為0.5[14];平坦層中Softmax作為激活函數,強制模型最后3個輸出值總和為1。
表2 模型結構參數Table 2 Structural parameters of model
2)實驗結果分析
隨機從聚類結果中抽取2 400組數據,每個類別的數據組個數不相等,將所有數據輸入基于Tensorflow的CNN模型,設置該模型批處理量為20,共執行100個訓練周期。訓練完成后,用Matplotlib對訓練集和驗證集準確率和損失函數進行可視化分析,如圖9所示。
圖9 模型準確率和損失函數變化曲線Fig.9 Variation curves of model accuracy and loss function
由圖9可知,曲線在整個訓練過程中沒有太大波動。25世代后,訓練集與驗證集的準確率曲線基本保持一致并慢慢趨于穩定,準確率保持在98%左右;損失函數在0~0.2之間存在小范圍波動,魯棒性較高。綜上,說明模型準確率較高,誤差較小。
為進一步驗證模型準確性,進行多組平行實驗。隨機抽取3類聲發射源信號,共600組,每組抽取的聲發射源樣本個數不相等。利用已訓練好的CNN模型,識別平行實驗采集到的聲發射信號,得到混淆矩陣如圖10所示,聚類1識別準確率達100%,其余2個類型的識別準確率達99%,說明該CNN模型能夠有效對儲罐底板點蝕聲發射源進行識別,準確率較高。
圖10 600組測試集的混淆矩陣Fig.10 Confusion matrix of a 600-group test set
1)肘部法則結合CH、輪廓系數和SSE3種聚類評估指標選取k值,提高聚類算法的可信度;通過分析各特征參數隨時間變化的聚類分布,將點蝕數據分為3種信號類別,解決點蝕數據難以準確獲得類別標簽的難題。
2)一維卷積神經網絡模型可將點蝕原始聲發射信號直接輸入,對點蝕過程中3類聲發射源進行準確區分,準確率平均高達99%。
3)本文模型對現場常壓儲罐底板腐蝕聲發射檢測定量分析具有指導作用,可以將此模型與現場檢測相結合,應用于日常檢測。當現場檢測無法確定點蝕程度時,將出現持續時間長、幅值較低、能量值相對較大的聲信號特征,且模型輸出結果聚類標簽大部分為點蝕后期,此時需要重點關注運行過程和未來開罐檢測,進而確定最佳開罐周期,降低儲罐檢測成本和運行風險。