丁天松,顏擁軍,謝宇希,李 翔
(南華大學(xué) 核科學(xué)技術(shù)學(xué)院,湖南 衡陽(yáng) 421001)
核探測(cè)器作為獲取各種核信息的源頭,是核輻射測(cè)控系統(tǒng)的重要部件,其可靠性對(duì)于監(jiān)測(cè)場(chǎng)所的穩(wěn)定運(yùn)行有著至關(guān)重要的影響。核探測(cè)器長(zhǎng)期工作在高溫濕度和高輻照強(qiáng)度的環(huán)境中,易導(dǎo)致探測(cè)器加速老化、工作性能下降或出現(xiàn)部分功能故障等現(xiàn)象。目前大多數(shù)核輻射監(jiān)測(cè)場(chǎng)所是采取人工巡檢的方式來(lái)實(shí)現(xiàn)核探測(cè)器的故障檢測(cè),不僅耗時(shí)費(fèi)力,而且易產(chǎn)生誤判漏判現(xiàn)象,嚴(yán)重情況下可能引發(fā)核事故[1-2]。文獻(xiàn)[3-4]開展了基于多支持向量機(jī)和BP神經(jīng)網(wǎng)絡(luò)的核探測(cè)器智能故障診斷方法的研究,嘗試將人工智能應(yīng)用到數(shù)字化核儀器故障監(jiān)測(cè)方面。本文以閃爍體探測(cè)器為研究對(duì)象,通過(guò)提取輸出信號(hào)的特征參數(shù),建立正常工況與故障工況下的數(shù)據(jù)特征庫(kù),利用基于機(jī)器學(xué)習(xí)的KNN算法對(duì)統(tǒng)計(jì)的信號(hào)特征進(jìn)行分類識(shí)別,以實(shí)現(xiàn)對(duì)核探測(cè)器故障的智能診斷。
閃爍體探測(cè)器是利用閃爍體原子分子激發(fā)后退激時(shí)會(huì)發(fā)出熒光的原理,將光信號(hào)變?yōu)殡娒}沖信號(hào)來(lái)實(shí)現(xiàn)探測(cè)輻射粒子的目的,可實(shí)現(xiàn)輻射強(qiáng)度測(cè)量,同時(shí)脈沖信號(hào)的幅值可反映核輻射的能量大小。閃爍體探測(cè)器的輸出信號(hào)是一系列具有特定形狀的隨機(jī)脈沖信號(hào),具有相鄰脈沖的時(shí)間間隔服從泊松分布、脈沖計(jì)數(shù)率滿足指數(shù)分布、輸出脈沖幅值與噪聲均服從正態(tài)分布的統(tǒng)計(jì)特性,信號(hào)經(jīng)閃爍體探測(cè)器后輸出的脈沖波形可近似由雙指數(shù)函數(shù)表示,即:
v0(t)=u(t)A(e-t/t1-e-t/t2)+v(t)
(1)
其中:v0(t)為探測(cè)器輸出信號(hào);u(t)為階躍函數(shù);A為信號(hào)幅值;v(t)為白噪聲信號(hào);t1和t2分別為雙指數(shù)函數(shù)的慢、快時(shí)間常量,信號(hào)脈沖的衰減時(shí)間tc和上升時(shí)間tf是由t1和t2共同決定的[4]。
當(dāng)探測(cè)器發(fā)生故障時(shí),輸出信號(hào)的脈沖幅值、下降沿時(shí)間、噪聲程度會(huì)出現(xiàn)不同程度的變化,同時(shí)也將會(huì)影響后續(xù)能譜信號(hào)的能峰位置、低道址計(jì)數(shù)等參數(shù),可對(duì)這些特征參數(shù)進(jìn)行提取,用于對(duì)探測(cè)器的故障診斷。長(zhǎng)期工作于高溫高輻射的惡劣環(huán)境下的閃爍體探測(cè)器會(huì)發(fā)生閃爍體老化現(xiàn)象,發(fā)光效率會(huì)基于老化程度發(fā)生不同程度的降低,導(dǎo)致光輸出減小,使A降低,同時(shí)由于幅值的下降會(huì)使軟件在提取信號(hào)下降沿時(shí)間時(shí)出現(xiàn)略微降低現(xiàn)象,使能譜信號(hào)的能峰位置發(fā)生偏移。閃爍體探測(cè)器的光電倍增管作為電真空管,在受到外力沖擊、管腳管座受潮或玷污及在強(qiáng)輻射場(chǎng)的環(huán)境下均會(huì)造成倍增管密封性變差,導(dǎo)致v(t)增大,同時(shí)離子渡越時(shí)間發(fā)生變化,導(dǎo)致t1和t2的變化。從輸出信號(hào)的特征上看,其能譜信號(hào)中的低道址部分計(jì)數(shù)會(huì)增加,由于噪聲增大疊加在核脈沖信號(hào)上,導(dǎo)致脈沖信號(hào)的幅值出現(xiàn)小幅增大,下降沿時(shí)間(信號(hào)幅值的10%~90%)在判斷時(shí)會(huì)出現(xiàn)降低現(xiàn)象。長(zhǎng)期工作于輻射環(huán)境下會(huì)使閃爍體探測(cè)器出現(xiàn)輻射損傷,導(dǎo)致發(fā)光效率降低,影響信號(hào)幅值A(chǔ),同時(shí)晶體內(nèi)的電子、空穴會(huì)落入深淺不一的晶體陷阱中,這些離子對(duì)從陷阱中釋放出來(lái)也會(huì)參與發(fā)光,導(dǎo)致發(fā)光拖尾,使得t1和t2增大,從輸出核信號(hào)的波形特征看,其信號(hào)幅值會(huì)下降,下降沿時(shí)間會(huì)增加,從能譜信號(hào)看其低道址計(jì)數(shù)會(huì)增加,能峰位置會(huì)左移。這些變化會(huì)導(dǎo)致核脈沖信號(hào)的幅值下降、下降沿時(shí)間增大,同時(shí)也會(huì)使能譜信號(hào)的低道址計(jì)數(shù)增加,能峰位置左移。
K近鄰(KNN)算法是一種理論上較成熟的有監(jiān)督學(xué)習(xí)的機(jī)器學(xué)習(xí)算法,其工作原理為:存在一個(gè)訓(xùn)練樣本集合A,在給定測(cè)試樣本b時(shí),基于某種距離度量,找出訓(xùn)練集A中與測(cè)試樣本b最靠近的k個(gè)訓(xùn)練樣本(通常k≤20且為整數(shù)),基于k個(gè)訓(xùn)練樣本的信息來(lái)預(yù)測(cè)種類或值。該算法具備簡(jiǎn)單、有效、無(wú)須參數(shù)估計(jì)、復(fù)雜度低等優(yōu)點(diǎn),其在多分類問(wèn)題中的表現(xiàn)性能要優(yōu)于單個(gè)支持向量機(jī)(SVM)算法[5]。由于在算法運(yùn)行時(shí),測(cè)試樣本需與所有樣本的屬性進(jìn)行計(jì)算,然而屬性中往往會(huì)包含不相關(guān)的屬性或相關(guān)度較低的屬性,此時(shí)標(biāo)準(zhǔn)的歐式距離將會(huì)變得不準(zhǔn)確,且會(huì)消耗大量的計(jì)算時(shí)間。不相關(guān)屬性過(guò)多將會(huì)導(dǎo)致維數(shù)災(zāi)難,嚴(yán)重時(shí)將影響到KNN算法的準(zhǔn)確率,為此進(jìn)行如下改進(jìn)。
1) 消除不相關(guān)屬性及進(jìn)行特征提取選擇,即在信號(hào)特征參量選取及數(shù)據(jù)預(yù)處理時(shí)剔除過(guò)多的無(wú)關(guān)特征量。
2) 屬性加權(quán),即將屬性權(quán)重引入到KNN算法中,原始KNN算法計(jì)算距離公式為:
(2)
引入權(quán)重后距離公式為:
(3)
其中:dij為樣本i與j之間的距離;n為屬性總數(shù);aih為樣本i中的第h個(gè)屬性;ωh為第h個(gè)屬性的權(quán)重。權(quán)重引入可均衡屬性值,類似于歸一化處理[5-8]。
原始KNN算法中實(shí)例鄰近的類別被認(rèn)為概率是相同的,當(dāng)樣本不均衡時(shí)將會(huì)對(duì)診斷結(jié)果產(chǎn)生較大影響,因此改進(jìn)的算法引入了與距離呈反比的相似度參數(shù)以解決此問(wèn)題。原始KNN算法中的權(quán)重為:
(4)
引入相似度參數(shù)后權(quán)重為:
(5)
其中:p(x,Cj)為待分類樣本x屬于j類的權(quán)重(假設(shè)待分類樣本x的k個(gè)最近鄰樣本共分為j類),Cj為樣本的類別;Sim(ai,x)為最近鄰樣本ai與x之間的相似度,可表示為ai與x之間歐式距離的倒數(shù);Pa(ai,Cj)為類別屬性函數(shù),當(dāng)ai∈Cj時(shí),Pa(ai,Cj)=1,否則Pa(ai,Cj)=0。
在系統(tǒng)正常工況與故障工況下對(duì)核探測(cè)器的信號(hào)進(jìn)行預(yù)處理,去除采集信號(hào)中所含有的部分高頻噪聲和粗差,然后對(duì)處理后的信號(hào)采用統(tǒng)計(jì)方法進(jìn)行特征信息提取,根據(jù)已有故障實(shí)例中的故障特征與故障類別集合訓(xùn)練KNN算法,得到故障診斷模型。對(duì)核探測(cè)器監(jiān)測(cè)時(shí),需從獲取的信號(hào)波形中提取數(shù)據(jù)的特征信息,處理后輸入建立的模型中,從而對(duì)核探測(cè)器進(jìn)行故障檢測(cè)和故障識(shí)別[9],其診斷流程圖如圖1所示。

圖1 故障診斷流程圖Fig.1 Flow chart of fault diagnosis
為獲取故障診斷時(shí)的核脈沖信號(hào)數(shù)據(jù),基于現(xiàn)場(chǎng)實(shí)驗(yàn)與理論分析,以平均脈沖幅值1 V、能量分辨率10%、白噪聲標(biāo)準(zhǔn)差0.005 V、采樣頻率6 MHz、采樣時(shí)間0.5 s為正常核脈沖信號(hào)模型參數(shù)。將實(shí)際發(fā)光效率降低至原效率的30%~80%時(shí)視為閃爍體老化故障(共6×100組);將噪聲增大至正常工作狀態(tài)下的10~15倍時(shí)視為光電倍增管故障(共6×100組);將發(fā)光效率降低至原效率的30%~80%,同時(shí)噪聲增大10~15倍時(shí)視為輻射損傷故障(6×6×100組)[10-13]。不同類別的信號(hào)波形模擬圖如圖2所示。

圖2 信號(hào)波形模擬圖Fig.2 Signal waveform simulation
用NaI探測(cè)器對(duì)距離45 mm(實(shí)驗(yàn)測(cè)量的最優(yōu)距離)的137Cs源進(jìn)行3 min測(cè)量,獲取正常探測(cè)器及部分故障探測(cè)器的137Cs能譜數(shù)據(jù),實(shí)驗(yàn)數(shù)據(jù)采集流程圖如圖3所示[14],同時(shí)為了應(yīng)對(duì)故障探測(cè)器能譜數(shù)據(jù)不足的問(wèn)題,采用數(shù)據(jù)擴(kuò)展的方式進(jìn)行特征量的仿真擴(kuò)充,在現(xiàn)有數(shù)據(jù)信息的基礎(chǔ)上利用回歸插值替換的方法推測(cè)缺失值,使數(shù)據(jù)量足夠豐富以滿足KNN算法對(duì)大量特征信息的要求[15-17]。

圖3 數(shù)據(jù)采集流程圖Fig.3 Data collection process
通過(guò)軟件分析核信號(hào)的統(tǒng)計(jì)特性,將核信號(hào)分為核脈沖波形信號(hào)和核能譜信號(hào)分別進(jìn)行特征提取,其具體流程為:對(duì)核脈沖波形信號(hào)幅值、下降沿時(shí)間等信息進(jìn)行統(tǒng)計(jì)特征提取,其中對(duì)信號(hào)的下降沿時(shí)間進(jìn)行特征提取時(shí),利用線性搜索方法選用一定時(shí)間范圍內(nèi)的感興趣區(qū)域(ROI)作為獲取區(qū)域,設(shè)信號(hào)階躍高度從90%到10%內(nèi)進(jìn)行下降沿時(shí)間獲取;在對(duì)信號(hào)的幅值信息進(jìn)行提取時(shí),采用局部最大的方法進(jìn)行尋峰并選用合適的ROI范圍,設(shè)高度閾值為40%,利用相鄰平均法對(duì)信號(hào)基線進(jìn)行平滑處理并提取幅值信息,其脈沖信號(hào)特征提取示意圖如圖4a所示。能譜信號(hào)的處理是通過(guò)軟件對(duì)能峰位置及前100道的總計(jì)數(shù)這兩個(gè)特征信息進(jìn)行提取,低道址計(jì)數(shù)選取前100道是為了盡可能排除康普頓沿對(duì)于低道址計(jì)數(shù)的影響,其能譜信號(hào)特征提取示意圖如圖4b所示,提取出的信號(hào)特征信息均值列于表1。

表1 信號(hào)特征信息均值Table 1 Mean of signal feature information

a——脈沖信號(hào);b——能譜信號(hào)
當(dāng)探測(cè)器發(fā)生故障時(shí),需先判斷其故障類型,為此采用均勻取值法選取正常信號(hào)與3種故障信號(hào)特征各360組進(jìn)行故障類別診斷,由統(tǒng)計(jì)方法得到的特征統(tǒng)計(jì)散點(diǎn)圖矩陣如圖5所示。

圖5 特征統(tǒng)計(jì)散點(diǎn)圖矩陣Fig.5 Characteristic statistical scatter matrix
在散點(diǎn)圖矩陣中,四列特征分別表示信號(hào)幅值、下降沿時(shí)間、低道址計(jì)數(shù)和能峰位置,其最左邊一列的X軸對(duì)應(yīng)信號(hào)幅值,底行的Y軸對(duì)應(yīng)能峰位置,因此矩陣左下方的散點(diǎn)圖將信號(hào)幅值與峰值位置作為橫縱坐標(biāo)進(jìn)行繪制,圖中每個(gè)點(diǎn)的顏色取決于信號(hào)的類型。將統(tǒng)計(jì)的不同故障信號(hào)及正常信號(hào)特征放入到診斷模型中,k選取為10,對(duì)探測(cè)器進(jìn)行故障類別診斷,診斷結(jié)果如圖6所示。由散點(diǎn)圖及混淆矩陣可知,利用診斷模型對(duì)閃爍體探測(cè)器進(jìn)行故障類別診斷的準(zhǔn)確率為100%,基于不同探測(cè)器故障所統(tǒng)計(jì)出來(lái)的信號(hào)特征具有較為明顯的差異,該模型對(duì)故障類型做出了良好的區(qū)分判別,體現(xiàn)出該算法針對(duì)多分類問(wèn)題的優(yōu)越性。

a——散點(diǎn)圖;b——混淆矩陣
探測(cè)器發(fā)生故障時(shí),除了對(duì)故障類別做出判斷外,還需對(duì)故障程度做出識(shí)別,通過(guò)故障程度識(shí)別可了解設(shè)備的故障發(fā)展趨勢(shì)。以閃爍體老化故障為例,將發(fā)光效率在40%~80%定義為輕微故障,發(fā)光效率在40%以下定義為嚴(yán)重故障,對(duì)于輕微故障的探測(cè)器,工作人員可盡早安排檢修修復(fù),延長(zhǎng)其使用壽命,而對(duì)于嚴(yán)重故障的探測(cè)器則需要及時(shí)更換。將統(tǒng)計(jì)的6種不同老化程度的故障信號(hào)特征與正常信號(hào)特征放入到KNN故障診斷模型中,設(shè)置k為10,加強(qiáng)幅值和峰值位置這兩個(gè)特征信息的權(quán)重,進(jìn)行核探測(cè)器老化故障診斷,診斷結(jié)果如圖7所示。
利用診斷模型對(duì)探測(cè)器進(jìn)行老化故障診斷時(shí),不同程度的老化故障診斷正確率在98%~100%之間(圖7b),其均值為99.0%,造成該結(jié)果的原因是以10%為刻度標(biāo)準(zhǔn)的每級(jí)老化程度特征仍有個(gè)別特征樣本存在相似性,導(dǎo)致了錯(cuò)分現(xiàn)象的產(chǎn)生。將統(tǒng)計(jì)的6種不同程度的光電倍增管故障信號(hào)特征與正常信號(hào)特征放入到KNN故障診斷模型中,其中光電倍增管峰值提取時(shí)提取方式改為局部500點(diǎn)最大值尋峰,同時(shí)由于噪聲較大,在尋找下降沿時(shí)間時(shí)設(shè)置平滑點(diǎn)數(shù)為200,下降區(qū)域平滑點(diǎn)為50,容差為0.03,以此來(lái)降低噪聲對(duì)特征獲取的不利影響,同時(shí)在KNN算法中加強(qiáng)低道址計(jì)數(shù)的權(quán)重以更好地實(shí)現(xiàn)對(duì)此故障類型的診斷,其診斷結(jié)果如圖8所示。
利用診斷模型對(duì)探測(cè)器進(jìn)行光電倍增管故障診斷時(shí),不同程度的光電倍增管故障診斷準(zhǔn)確率在98%~100%之間(圖8b),其均值為99.1%,診斷錯(cuò)誤率如混淆矩陣對(duì)角線外數(shù)值所示。造成該結(jié)果的原因是每級(jí)具有相似性的故障程度特征樣本較多、散點(diǎn)較集中,加大了診斷分類的難度,導(dǎo)致類別的錯(cuò)分。將統(tǒng)計(jì)的36種不同程度的輻射損傷故障信號(hào)特征與正常信號(hào)特征放入到KNN故障診斷模型中,由于故障類型較多,類域的交叉過(guò)多且各類型的故障特征出現(xiàn)重疊部分,因此對(duì)加權(quán)KNN算法進(jìn)一步優(yōu)化,在鄰點(diǎn)距離計(jì)算時(shí)舍棄前面故障診斷中所用的歐式距離,改用曼哈頓距離,即在歐幾里得空間的固定直角坐標(biāo)系上兩點(diǎn)所形成的線段對(duì)軸產(chǎn)生的投影距離總和,如在平面上,坐標(biāo)(x1,y1)的點(diǎn)P1與坐標(biāo)(x2,y2)的點(diǎn)P2的曼哈頓距離為:
d12=|x1-x2|+|y1-y2|
(6)
曼哈頓距離依賴坐標(biāo)系統(tǒng)的轉(zhuǎn)度,而非系統(tǒng)在坐標(biāo)軸上的平移或映射,兩個(gè)n維向量a(x11,x12,…,x1n)與b(x21,x22,…,x2n)間的曼哈頓距離為:
(7)
曼哈頓距離相對(duì)于歐式距離在特征數(shù)據(jù)重疊部分過(guò)多的情形下表現(xiàn)更好,能有效地降低因重疊而導(dǎo)致的誤分類,針對(duì)于數(shù)據(jù)量相對(duì)于前兩種故障過(guò)多的問(wèn)題,將KNN算法中的k設(shè)置為15,以此降低過(guò)多特征交叉引起的分類誤差,其診斷結(jié)果如圖9所示。

a——散點(diǎn)圖;b——混淆矩陣
利用診斷模型對(duì)探測(cè)器進(jìn)行輻射損傷故障診斷時(shí),不同程度的輻射損傷故障診斷準(zhǔn)確率在82%~100%之間(9b),其平均診斷率為92.5%,造成該結(jié)果的原因是本次分類樣本較多且診斷輸出類別較多、散點(diǎn)較集中,對(duì)最近鄰樣本的判定造成了一定程度的干擾,導(dǎo)致錯(cuò)分現(xiàn)象的產(chǎn)生。
對(duì)于核探測(cè)器故障診斷研究,文獻(xiàn)[3]提出了一種基于小波包變換與支持向量機(jī)的核探測(cè)器故障診斷方法,文獻(xiàn)[4]提出了一種基于小波包變換與BP神經(jīng)網(wǎng)絡(luò)的核探測(cè)器故障診斷方法,但二者基于小波包變化提取的特征不夠直觀,且只分析了核脈沖信號(hào)的輸出參數(shù),沒(méi)有對(duì)能譜信號(hào)進(jìn)行分析,存在數(shù)據(jù)分析不夠全面的問(wèn)題,因此有必要對(duì)SVM、BP神經(jīng)網(wǎng)絡(luò)、KNN 3種方法進(jìn)行診斷結(jié)果的比較與分析,從而更加有效地指導(dǎo)實(shí)踐應(yīng)用。3種方法的診斷時(shí)間及準(zhǔn)確率比較結(jié)果列于表2。可看出,KNN相對(duì)于SVM、BP兩種方法的診斷準(zhǔn)確率略低,但該模型更加簡(jiǎn)單、高效、復(fù)雜度低,其基于統(tǒng)計(jì)方法的數(shù)據(jù)預(yù)處理方式與小波包變換有所不同,且數(shù)據(jù)中包含了能譜信號(hào),能對(duì)復(fù)雜數(shù)據(jù)進(jìn)行診斷。3種方法的運(yùn)用可最終形成系統(tǒng)化且優(yōu)勢(shì)互補(bǔ)的基于機(jī)器學(xué)習(xí)的核探測(cè)器故障診斷方法,針對(duì)于核探測(cè)器典型故障種類較多且所監(jiān)測(cè)的核信號(hào)不僅包括核脈沖信號(hào),還包括核能譜信號(hào)的情況,可先采用統(tǒng)計(jì)方法對(duì)信號(hào)進(jìn)行預(yù)處理,然后選用基于KNN算法的故障診斷模型對(duì)信號(hào)進(jìn)行診斷;若核探測(cè)器故障信號(hào)可獲取的特征樣本量較小,則可先采用小波包時(shí)頻分析法對(duì)信號(hào)進(jìn)行預(yù)處理,然后選用泛化能力較強(qiáng)的多分類支持向量機(jī)故障診斷模型對(duì)信號(hào)進(jìn)行診斷;若對(duì)診斷準(zhǔn)確率要求較高且在故障特征樣本量較為充足的情況下,可選用非線性映射能力較強(qiáng)且具備自學(xué)習(xí)機(jī)制的BP神經(jīng)網(wǎng)絡(luò)故障診斷模型對(duì)信號(hào)進(jìn)行診斷。因此,這3種方法各具優(yōu)勢(shì),其綜合應(yīng)用可增強(qiáng)核探測(cè)器故障診斷系統(tǒng)的穩(wěn)定性與適應(yīng)性。

表2 診斷結(jié)果比較Table 2 Comparison of diagnostic result
本文通過(guò)對(duì)閃爍體探測(cè)器輸出的脈沖信號(hào)及能譜信號(hào)中的特征信息進(jìn)行提取,利用機(jī)器學(xué)習(xí)中的KNN改進(jìn)算法建立故障診斷模型對(duì)每組特征信息進(jìn)行分類計(jì)算,通過(guò)優(yōu)化鄰點(diǎn)距離的計(jì)算公式、調(diào)整不同特征權(quán)重因子的方式解決特征類域重疊與交叉的問(wèn)題,確定閃爍體探測(cè)器的故障類型及故障程度。該方法對(duì)故障類別的診斷準(zhǔn)確率為100%,對(duì)故障程度的診斷準(zhǔn)確率均達(dá)92.5%以上,且具備快速、特征直觀、對(duì)異常值不敏感,能同時(shí)對(duì)核脈沖信號(hào)及能譜信號(hào)分析等特點(diǎn),研究結(jié)果表明,該方法能實(shí)現(xiàn)對(duì)閃爍體探測(cè)器的智能故障診斷,且在實(shí)際過(guò)程中有較高應(yīng)用價(jià)值。