者 娜,劉才學,楊泰波,何 攀,簡 捷,王廣金
(中國核動力研究設計院,成都 610200)
隨著核電站反應堆運行時間的推移,反應堆某些零部件可能會因沖擊、振動等因素而發生脫落。同時,在核電站反應堆安裝或檢修時,存在著將金屬件遺留在反應堆系統內的風險。這些金屬部件會在冷卻劑的帶動下不斷游動而與壓力邊界產生碰撞,若不能及時將其發現,將使壓力邊界遭到嚴重破壞而危及反應堆安全。為了保證核電站反應堆系統的安全性,通常核電現場會采用松脫部件監測系統來對撞擊信號進行監測,以識別是否存在松脫部件[1]。但在實際情況中,監測系統可能會因為現場復雜的工況條件、環境因素等而記錄大量非撞擊信號的信號,即脈沖尖峰信號、噪聲信號、自檢信號、噪聲波動信號、通道閃斷信號。因此有必要從監測系統采集到的信號中將真實撞擊信號識別出來,以便于后期進一步的松脫部件確認。在國外,金屬撞擊信號識別過程主要依靠專家利用自身身經驗對監測系統所采集的數據進行分析以得出結論,可靠性依賴于專家的分析水平,并且無法避免數據量大耗時過長的缺點,一旦反應堆存在金屬松脫部件,可能由于無法實時給出診斷結論而導致嚴重的后果,對核電運行安全產生威脅。在國內,研究人員在采集端系統抗信號誤報警方法研究方面做了大量工作,取得了一些進展,但目前核電站監測系統由于外界干擾或其他因素導致的系統誤報警、誤觸發問題仍然未得到有效解決,大量干擾信號導致的“誤觸發”給診斷人員及時給出診斷結論帶來了極大困難,因此,有必要利用智能識別手段來快速識別監測系統已采集到的單個通道信號是否為金屬撞擊信號。反應堆松脫部件的診斷主要包括金屬撞擊信號識別和綜合診斷兩個過程,診斷結果的準確程度與能否準確識別金屬撞擊信號直接相關。六類信號中,撞擊信號來自外界真實撞擊,而其余信號并非由撞擊產生,如由于采集板卡的自激勵脈沖而產生的脈沖尖峰信號,監測系統為定期進行自身性能檢驗而通過力錘器產生的自檢信號,由于監測通道受外界運行環境影響而產生的噪聲波動信號,由于電荷轉換器過載保護導致的通道閃斷。與干擾信號頻率分布雜亂無規律相比,實際的金屬撞擊信號中包含了多種頻率成分,且存在于某一較寬頻帶范圍內,若采用全頻帶范圍內的單一特征作為信號特征,將很難全面描述撞擊信號與監測系統所采集的其他信號之間的差異,這給金屬撞擊信號的識別工作帶來一定的困難,進而影響后續松脫部件的精確診斷。
變分模態分解[2]是近些年國內外學者廣泛關注的一種信號分解方法,它能將信號按照其頻率自低到高的順序,自適應地分解為一定數目的固有模態分量(IMF),且分解過程中各分量頻帶無需人為干預,非常適用于處理非線性、非平穩信號。本文擬采用VMD方法將信號分解為若干個頻帶的分量并提取信號特征,以實現對信號的全面描述。但經VMD處理后得到的信號特征維數過高,支持向量機等智能分類方法分類準確率會隨著特征維數的上升而下降,且支持向量機這類智能算法的分類準確率很大程度上取決于模型參數的的選擇[3-5]。因此,需要尋找一種新的算法來進行信號的智能分類。
隨機森林[6]是在20世紀80年代提出的分類樹算法基礎上發展起來的一種無需調參的智能分類算法,它通過多棵分類樹的組合來實現分類,在處理高維數據方面具有明顯的優勢。
針對上述問題,筆者提出了一套新的反應堆撞擊信號識別方法,采用VMD方法對信號進行分解得到各IMF分量信號,分別提取各分量信號的時域、頻域特征構成原始信號特征向量,將原始信號特征向量作為輸入,信號類型作為輸出,建立隨即森林分類模型來實現反應堆金屬撞擊信號的識別。
Dragomiretskiy等[7]于2014年提出了一種新的信號處理方法—變分模態分解,作為一種新的信號處理方法,變分模態分解具有自適應、非遞歸特點,該方法在變分框架內來實現多成分信號的分解,通過迭代搜索變分模型的最優解,確定各個模態分量的帶寬及其頻率中心,從而自適應地實現包含多成分的信號中各個分量的有效分離,為從不同頻帶細致描述非線性且包含多種頻率成分的金屬撞擊信號提供了條件。
假定各個模態分量μk是頻率中心為wk的有限帶寬,則約束變分模型可表示為[8]
(1)
式中,k為最終分解得到的分量個數。
為獲得上述約束變分問題的最優解,引入二次懲罰參數α和拉格朗日乘子λ(t),將上述問題轉換為非約束變分問題來求解。其中,二次懲罰參數可很大程度上減少高斯噪聲帶來的影響,而拉格朗日乘子是常用的一種保持約束嚴格執行的方式[9]。增廣的拉格朗日函數可表示為
(2)
至此,初始的變分問題可通過拉格朗日法的交替方向乘子來實現求解,具體步驟如下:
步驟1 初始化μk、ωk、λ和n為0;
步驟2n=n+1,執行整個算法循環;
步驟4k=k+1,返回步驟3,重復至k=K時首個內層循環結束;
步驟6k=k+1,返回步驟5,直至k=K時內層第二個循環結束;
隨機森林算法是以CART決策樹作為弱分類器的一種組合分類算法,其本質是一種由隨機生成的若干個決策樹組成的強分類器[10]。它在實現分類時要經歷兩個過程,分別為生成決策樹過程和投票過程,其原理是針對原始樣本集,每次選擇樣本構成一個容量小于原始訓練樣本集的訓練子集并對應生成一棵決策樹,再由N個決策樹構成隨機森林完成對原始訓練樣本的分類訓練。其中,選擇子集的和生成決策樹的過程均是隨機的。
隨機森林是一種典型的Bagging方法,它應用自助法(bootstrap)重采樣技術生成多個決策樹分類器。決策樹的生長步驟如下:
步驟1 從由M個樣本數據構成的初始訓練集數據中有放回地隨機選擇樣本數據構成一個樣本數量為N(N 步驟2 針對具有K個特征屬性的樣本子集,在單棵決策樹的各個節點處,隨機地從K個特征屬性中選擇m個特征屬性,并且以節點不純度最小為標準從上述特征屬性中選擇某個特征屬性進行分裂生長,重復上述過程直至該決策樹遍歷所有的特征屬性。在整個森林的生長過程中m將保持恒定。 隨機森林中的單棵決策樹從根節點開始對訓練樣本子集進行劃分,它是一種自上而下遞歸分裂產生的二叉樹。決策樹分裂過程,是以分裂節點不純度最小為原則分裂為兩個節點,規則不變依次分裂直至滿足分支終止規則時分裂終止。 隨機森林采用的CART決策樹在節點處隨機選擇特征屬性的過程中,其選擇標準為各個節點Gini不純度最低。Gini不純度可表示為 (3) 式中:G(i)為節點i的不純度,設Pw是節點i上樣本屬于w類(假設樣本的特征屬性數量為W)的頻率。 圖1為單棵決策樹的結構示意圖,t0為根節點,ti(i≥1)表示分裂節點,Nt表示終端節點。 圖1 決策樹結構示意Fig.1 Decision tree structure 生成若干個決策樹后,由全部決策樹構成隨機森林分類器。采用隨機森林分類器對樣本數據進行分類時,最終的分類結果是通過對各決策樹的分類結果進行投票來確定的,投票過程可表示如下 (4) 式中:nt為構成隨機森林的決策樹個數;I(*)為性函數;nhi,C為決策樹hi對預測類樣本C的分類結果;nhi是決策樹hi的葉子結點數。 經投票后,生成混淆表CM,它是一個nc×nc表。表中的元素cm(ω≠∈)表示類型ω被分類為類型∈的次數,僅當(ω=∈)時,cm(ω,ω)表示類型ω被分類正確的個數。隨機森林分類正確率CRT為 (5) 隨機森林的分類原理決定了它在處理數據時,能夠避免由于模型輸入數據維數上升而使得分類精度下降的情況,保證了在原始信號特征維數較大的情況下,仍能獲得良好的分類效果。 本研究采用VMD和隨機森林相結合的方法進行反應堆金屬撞擊信號的識別,具體流程如下: 步驟1 對原始信號進行VMD分解,得到分解后的N個固有模態分量信號; 步驟2 針對每一個IMF分量信號,提取16個時域特征量[11],如峭度、方根幅值、偏斜度指標等,時域特征參數反映了信號時域振動幅值、能量以及時間序列分布情況,同時根據式(6)、式(7)和式(8),提取3個時域特征量,式(6)為標準差計算公式,式(7)為衡量數據穩態變化的指標,式(8)為衡量信號突變的程度。針對各IMF分量信號頻譜,提取13個頻域特征量[12],如重心頻率、均方頻率、頻率方差等,它們反映了振動信號頻譜集中程度、主頻帶位置的變化等頻域情況,將上述32個指標作為此IMF的特征; (6) (7) F3=max{|xi|}/F2 (8) 步驟3N個固有模態分量信號的特征構成一個包含N×32個元素的特征向量,作為原始信號的特征向量; 步驟4 將上述過程提取的原始信號特征向量作為輸入,信號類別作為輸出,建立隨機森林模型,利用測試樣本驗證模型分類的準確程度。 圖2為反應堆金屬撞擊信號識別流程圖。 圖2 反應堆金屬撞擊信號識別流程Fig.2 Recognition process of reactor metal impact signal 數據來源為國內某核電站現場LPMS監測系統記錄的數據,LPMS系統主要由加速度傳感器、信號調理、數據采集卡(A/D轉換)、數字信號處理芯片、計算機構成。加速度傳感器布置在反應堆壓力容器頂部和底部,監測系統的采樣頻率為50 kHz,采樣時間為1 s。本研究中獲得的樣本包含六種信號類型數據,信號類型分別為撞擊信號、自檢信號、噪聲信號、脈沖尖峰信號、通道閃斷信號、噪聲波動信號,六類信號時域波形如圖3所示。將樣本分為訓練集和測試集,其中訓練集樣本容量和測試集樣本容量分別為800和240,樣本數量如表1所示。 表1 各類信號樣本數量 筆者以金屬撞擊信號為例,說明VMD分解和特征提取過程。首先對原始信號進行VMD分解,研究表明[13],模態分量的分解層數影響著VMD分解結果的合理性,理論上經VMD分解后得到的各個模態分量信號的頻率分布情況為由低到高,當最后一個分量信號的中心頻率第一次達到最大值時的分解層數即為最佳分解層數,本研究中通過觀察最后一個分量信號的中心頻率確定出VMD最佳分解層數為4,信號分解后得到由低頻到高頻分布的4個IMF分量,如圖4所示。然后求取各個IMF分量信號的頻譜,結果如圖5所示。 其次,根據特征計算公式提取撞擊信號IMF1分量信號的19個時域特征量,以及13個頻域特征量,依次提取IMF2、IMF3及IMF4的相同特征。將從4個IMF分量信號及其頻譜中提取出的128個特征量作為原始信號的一組特征向量。同理,對脈沖尖峰信號、噪聲信號、自檢信號、噪聲波動信號以及通道閃斷信號提取特征向量。六類信號各自的128個特征的特征值如圖6所示。 (a) 撞擊信號 (b) 脈沖尖峰信號 (c) 噪聲信號 (d) 自檢信號 (e) 噪聲波動信號 (f) 通道閃斷信號圖3 原始信號時域波形Fig.3 Tine-domain waveform of original signals (a) IMF1 (b) IMF2 (c) IMF3 (d) IMF4圖4 撞擊信號各IMF分量信號Fig.4 IMF components of impact signal (a) IMF1 (b) IMF2 (c) IMF3 (d) IMF4圖5 撞擊信號各IMF分量信號頻譜Fig.5 Frequency spectrum of IMF components of impact signal 由圖6可以看出,不同類型信號經VMD分解后提取的特征在數值上和變化情況上存在明顯的差異,說明本研究所采用的特征提取方法提取出的特征的在全面表征原始信號所含的信息方面是有效的。 將上述過程提取出的訓練集特征作為輸入,訓練集樣本信號對應的類別標簽作為輸出,建立隨機森林模型,其中隨機森林模型的決策樹個數為500(默認參數)。將測試集特征作為隨機森林模型輸入,進行預測分類。為對比和評估模型分類效果,采用將訓練集特征作為輸入向量建立的支持向量機模型和從未經VMD分解的原始信號中提取的相同特征作為輸入建立的隨機森林模型來對測試集進行分類,其中,SVM的核函數為徑向基核函數,采用網格法進行參數尋優,懲罰參數c為84,核函數參數g為0.1,分類結果如圖7所示。 (a) 撞擊信號(b) 脈沖尖峰信號(c) 噪聲信號 (d) 自檢信號(e) 噪聲波動信號(f) 通道閃斷信號圖6 六類信號特征值Fig.6 Eigenvalues of six kinds of signals (a) VMD_SVM模型(b) RF模型(c) VMD_RF模型圖7 三類模型分類結果Fig.7 Classification results of three models 從圖7可以看出,三類模型均能實現六種信號的分類,但明顯可以看出,三類模型中,本研究提出的方法建立的VMD_RF模型在實現上述信號分類時錯分樣本最少。計算三種模型分類結果的分類誤差,誤差計算結果如表2所示。 表2 三類模型分類誤差 從表2可以發現,三類模型中支持向量機分類模型的分類誤差最大,為17.01%,RF模型的分類誤差為7.47%,而VMD_RF分類模型的誤差僅為2.90%,進一步說明了VMD分解后提取的信號特征更全面地表征了原始信號的信息,同時說明在實現反應堆金屬撞擊信號識別方面,VMD_RF模型的識別效果要優于單一的隨機森林模型和支持向量機模型。 通過實際工程實例驗證表明,采用基于變分模態分解和隨機森林的方法進行反應堆金屬撞擊信號識別是有效的。本研究主要結論如下: (1) 利用變分模態分解將原始信號分解為多個分量信號,能夠實現從多頻帶角度描述包含多個頻率成分的原始信號。 (2) 提出的基于變分模態分解的反應堆金屬撞擊信號特征提取新方法提取的特征可以更全面地表征原始信號所含的特征信息,解決了由于特征信息不足而導致的識別精度低的問題。 (3) 構造的VMD_RF分類模型,可實現反應堆金屬撞擊信號的識別,并獲得良好的識別效果,避免了由于特征維數上升后模型構建不合理而產生的識別精度下降的缺陷,為后續松脫部件的進一步確定奠定了良好基礎。
2.2 投票過程
2.3 基于VMD_RF的反應堆金屬撞擊信號識別方法


3 反應堆金屬撞擊信號識別分析
3.1 數據獲取

3.2 識別結果及分析


















4 結 論