黃坤翔,張江梅,王嘉麒,蘇 覃
(1.西南科技大學 信息工程學院,四川 綿陽 621000;2.西南科技大學 核廢物與環境安全國防重點學科實驗室,四川 綿陽 621000)
中子探測在許多研究和應用領域均有涉及,如粒子物理學、材料科學、宇宙射線探測乃至環境監測、油井探測與核醫學等[1-2]。由于中子與周圍環境存在非彈性散射及慢中子的輻射俘獲等作用[3],使得中子射線的產生通常伴隨著大量不易被物理屏蔽的γ光子,而γ射線不僅對人體的危害程度大,同時也會與中子同時作用于閃爍體探測器,進而影響對中子射線的探測效果。因此,不論是對于輻射防護還是對于提高中子探測精度,研究在n/γ混合輻射場中實現n/γ有效甄別均有著重大的意義。
中子和γ射線依據其脈沖衰減時間不同,一般使用脈沖形狀甄別(PSD)方法進行區分,其主要可以劃分為時域分析法、頻域分析法和機器學習法3大類。時域分析法中最為經典的甄別方法有電荷比較法[4]、上升時間法[5]、過零時間法[6]和脈沖梯度法[7]4種,雖然這些方法已能滿足大部分工程需求,但對噪聲十分敏感且只能提取單一的時域特征。頻域分析法中常見的有頻率梯度分析法[8]和小波分析法[9]等,它們抗干擾能力強,但對硬件采樣性能要求較高且也僅能提取頻域特征。機器學習法是近年來新興的方法,以聚類法[10]和人工神經網絡法[11]為代表,其中后者是探索PSD極致性能的重要技術手段,目前應用在n/γ甄別的主流網絡有BPNN和卷積神經網絡(CNN)兩種。宋海聲等[12]利用電荷比較法與頻率梯度分析法選取學習樣本,通過BP神經網絡對樣本進行訓練后完成n/γ甄別工作。Griffiths等[13]開展了使用一維CNN架構進行PSD方法研究,結果表明比傳統方法效果更好。Lu等[14]設計了一種基于二維矩陣格式輸入的CNN PSD方法,其甄別性能優于電荷比較法和使用一維格式的CNN方法。然而,目前幾乎沒有一種人工神經網絡甄別法本身具備同時保留核脈沖時域和頻域特征的能力。本文受文獻[15]啟發并參考格拉姆角場(GAF)在其他信號識別領域[16]中對時間序列二維化的應用,提出一種基于GAF-CNN的n/γ甄別方法,既能有效保留核脈沖的時域特征,也能通過CNN將頻域特征利用起來。
數據采集實驗平臺系統結構如圖1所示,使用239Pu-Be作為中子源為探測器提供n/γ混合輻射場;探測器是由北京玻璃研究院生產的尺寸為φ1.4 cm×2.6 cm的Cs2LiYCl6:Ce3+(CLYC)閃爍體晶體和日本濱松公司生產的R2076光電倍增管(PMT)組成,高壓偏置電源為光電倍增管提供-1 kV的增益電源;使用型號為泰克DPO4034的數字示波器以2 GS/s的采樣率對輻射脈沖波形進行采集,通過USB總線傳輸到計算機進行脈沖數據樣本的存儲;采集獲取了n/γ總計20 000個脈沖樣本,每個脈沖樣本均為10 000×1的一維序列。

圖1 數據采集實驗平臺系統結構
格拉姆角場[17]是將一維時間序列轉化成二維圖像的方法,該方法將原本定義在典型笛卡爾坐標系下的時間序列在極坐標系下重新進行表示。通過GAF圖像轉換過程,可將時間序列的本質特征完整的轉化到圖像當中,由于n/γ脈沖樣本是典型的時間序列,因此考慮使用GAF來最大程度地保留n/γ甄別所需的脈沖時域特征,具體轉化過程如下。
對于一個給定的一維核脈沖樣本數據向量D={d1,d2,…,dn},其由n個按時間順序測量的實測值組成,使用式(1)將該樣本數據歸一化到[-1,1]區間:
(1)

(2)

經過式(2)表示后的極坐標編碼具有唯一性和時間相關性這兩個重要的性質,因此它可以在[0,π]角度范圍內隨著時間戳變化映射為一個隨角度變化彎曲的唯一極坐標曲線,且該曲線相對于笛卡爾坐標系下的原始脈沖序列保留了數據間絕對的時間關系。
使用Gram矩陣G來量化編碼后數據間的特征相關性,其定義為:
(3)

(4)
式中:φi(i=1,…,n)為第i個極坐標點的編碼夾角;n為核脈沖數據的長度;I為長度為n的單位行向量。GAF保持高時間依賴性和時間相關性,其對角線隨時間增加而自左上角到右下角遞進,同時保留了一維核脈沖序列的值與基于時間的位置信息,為神經網絡模型學習到高層次脈沖形狀特征提供了基礎。以一個中子脈沖樣本為例,圖2為核脈沖的GAF轉化過程。

圖2 核脈沖的GAF轉化過程
典型的CNN分類器由卷積層、池化層、全連接層及邏輯激活輸出層等部分組成[18]。卷積層通過一組可學習參數的濾波器在輸入數據上進行滑動卷積操作,這些濾波器也被稱為卷積核,它可將如圖像等輸入數據轉換為多個特征映射,從而實現不同局部特征的提取過程,卷積一般計算過程如式(5)所示。
(5)
式中:y為輸出的特征映射;σ為非線性激活函數;xi-r,j-c為第i-r行第j-c列的輸入數據,其中r和c表示卷積核的中心位置,具體取決于卷積核的大小與卷積的步長,通常為奇數;wi,j為卷積核第i行第j列的權重,為可學習的參數;b為偏置項;n為輸入數據的維度。
池化層是一種下采樣操作,通常與卷積層成對使用,它可以減小卷積層輸出的大量特征圖的空間維度,同時保留重要的特征信息。池化層常用的是最大池化和平均池化兩種方式,前者選擇窗口內的最大值作為輸出,后者選擇窗口內的平均值作為輸出,基于n/γ核脈沖由于信號微弱從而易受耦合噪聲擾動的特點,本文采用最大池化操作如式(6)所示。
yi,j,k=max(xi+p,j+q,k)
(6)
式中:yi,j,k為輸出特征圖;xi+p,j+q,k為輸入的第i+p行第j+q列第k個通道的特征圖;p和q為池化窗口內的坐標步長。
全連接層在CNN中往往使用于末尾,其將前面所有層的輸出結果按照神經元模型規律進行完全連接,它可以集中卷積池化操作后的所有特征,并將其輸出,通過邏輯激活函數映射到歸一化區間用于分類,式(7)為全連接層的邏輯表示:
(7)
式中:xi為輸入的第i個特征向量;yo為輸出的特征映射;n為輸入特征的維度;wi為每個輸入向量對應的權重,為可學習的參數;f為邏輯激活函數。
1) 原始脈沖數據集預處理
由于電荷比較法受樣本噪聲等因素影響較大,因此需要對原始脈沖信號進行一系列預處理操作,其一般過程為:(1) 平滑操作;(2) 基線調零操作;(3) 歸一化操作[19]。平滑操作采用滑動平均濾波算法對脈沖波形整體進行算術平均運算,基線調零操作選取了信號前100個點進行均值計算以得到基線位置,歸一化操作是對脈沖波形進行幅值歸一化,將脈沖幅值縮放到0~1區間內。圖3為預處理前后的n/γ脈沖波形對比。

a——原始脈沖信號;b——預處理后的脈沖信號
此外,為防止脈沖堆積對甄別效果產生影響,在預處理過程中還應專門將堆積信號去除,由于所用中子源的強度不高,脈沖堆積僅為小概率事件,因此本文通過人工方式進行堆積樣本的剔除,最終得到樣本個數為19 971的原始n/γ脈沖數據集,數據集的維度為19 971×10 000。
2) 電荷比較法實現
電荷比較法根據中子和γ射線在閃爍體中作用的時間常數不同,會出具有快慢兩種成分的電荷,即最終n/γ脈沖會產生不同形狀的上升沿和下降沿,可以選擇不同的波形積分窗口等效為電荷量進行甄別[20]:
Q=Qr+Qf
(8)
式中:Q為總積分量;Qr為脈沖上升沿的積分量;Qf為脈沖下降沿的積分量。
通常根據實際情況,會在Qr、Qf、Qr/Q、Qf/Q和Qr/Qf中選擇一項作為甄別依據,而在實際操作中為提高甄別效果,Qr和Qf往往會在更為寬泛的積分窗口進行變化;本文選擇Qr參數進行n/γ脈沖甄別,從信號起始位到上升沿的終止位作為最小積分時間窗,以此積分窗口作為下限進行動態變化,圖4為當積分窗口選為2 000時電荷比較法甄別統計結果。為評估不同PSD方法性能的強弱,一般定義FOM作為品質因子來進行判斷,定義[21]如下:
(9)

圖4 電荷比較法甄別統計結果
式中:μ1和μ2分別為甄別統計結果中γ峰和中子峰的峰位;FWHM1和FWHM2分別為甄別統計結果中γ峰和中子峰的半高寬。根據式(9)可計算出圖4所示甄別效果的FOM為1.57。
3) 電荷比較法的窗口優化
電荷比較法的實際PSD效果在很大程度上受積分窗口選擇的影響,為使得具有最佳的PSD性能,需要對積分窗口參數進行遍歷和優化[14]。本文將積分窗口設置在[1 500,8 500]范圍內,以步長為500進行遍歷計算,分別得到不同窗口所對應的FOM,以選出FOM最大時所對應的積分窗口。圖5為電荷比較法優化結果,當積分窗口選為3 000時,電荷比較法具備最好的甄別效果,此時FOM可達到1.76。可見此FOM已經能滿足實際使用需求,這是因為實驗所用CLYC探測器的性能本身就十分優秀,同時所用中子源提供的混合輻射場也遠高于傳統意義上的弱場,因此電荷比較法能具備不錯的甄別效果。經統計,原始數據集經過最佳性能的電荷比較法甄別后,得到γ脈沖個數為10 430,中子脈沖個數為9 541。

圖5 電荷比較法優化結果
1) GAF脈沖數據集的制作
GAF脈沖數據集的制作過程如圖6所示。首先將原始脈沖數據集遍歷,分別讀取每個樣本并進行GAF轉化;其次通過窗口優化后的電荷比較法對該n/γ樣本進行分類,將γ脈沖的標簽設為0,中子脈沖的標簽設為1;最后將該樣本的GAF圖像存儲到本地,循環往復直到遍歷完整個原始脈沖數據集。

圖6 GAF脈沖數據集制作流程圖
在使用GAF將n/γ脈沖樣本轉化為GAF圖像的過程中,由于原始樣本較長,導致直接轉化后的圖像分辨率高達10 000×10 000,這會極大增加運算開銷,因此需對GAF轉化過程增加降維操作。
本文使用傳統的分段近似聚合(PAA)算法,在保留原始一維序列重要特征的情況下將其縮小重塑成長度為100的序列,最終在經過GAF轉化后得到像素分辨率為100×100、通道數為3的GAF圖像。在制作完成的GAF脈沖數據集中隨機抽取γ和中子各5個樣本,兩種類型的GAF樣本示例如圖7所示。

a——γ脈沖樣本;b——中子脈沖樣本
2) CNN分類模型設計與實現
CNN在目標檢測、圖像分類等領域展現出了極為優秀的性能,它通過多級抽象特征進行有監督學習,最終實現樣本分類。一般來講,使用CNN完成分類任務需要大量的樣本支持,同時要求樣本信息具備多樣性和完整性,且所預測的問題必須實際可行。由于n/γ甄別領域能夠獲取較多的樣本量且樣本具有較高的區分度,具備可預測性,因此將CNN應用于該領域是十分契合的。本文基于大量實驗后,在經典的LeNet CNN模型基礎上進行適應性修改,最終設計能高效解決n/γ甄別問題的輕量級分類網絡框架,該網絡具有1個輸入層、兩個卷積層、兩個池化層、1個全連接層和1個輸出層,如圖8所示。

圖8 用于n/γ甄別的CNN分類框架
將準備好的n/γ脈沖信號GAF圖像輸入到CNN中,為保證圖像特征的完整性,使用零填充方式進行卷積。卷積過程采用ReLU函數作為式(5)中的σ非線性激活函數,其定義如式(10)所示,該函數在提升CNN模型非線性擬合性能的同時,基于其簡單性和計算效率,還有助于提高模型訓練的收斂速度。
ReLU=max(0,x)
(10)
將經過卷積后的特征圖輸入到最大池化層中以減少數據維度,能有效地減少網絡層數和訓練時間。在連續兩對卷積池化操作后將特征圖通過扁平層進行一維展寬,將得到一維的全局特征映射輸入到全連接層中,采用Sigmoid函數作為式(7)中的f邏輯激活函數。該函數可將神經網絡的輸出進行概率化表示進而實現分類的目的,其一般形式如式(11)所示。Sigmoid在淺層神經網絡中使用十分廣泛,是解決二分類問題的最佳選擇之一,十分適用于n/γ甄別場景。
(11)
此外,為提高網絡的泛化能力,在每組卷積池化操作和全連接層后都額外添加了隨機失活層。該層在訓練過程中使得每個神經元都有一定概率被丟棄,可減少神經元之間的依賴性,從而使得CNN模型更加穩定。本文將兩組卷積池化操作和全連接層后的隨機失活層概率參數分別設為0.25、0.25和0.5,能實現良好的效果。
在完成以上CNN正向推理過程后,需要計算目標與實際結果的損失值來指導模型的訓練過程。本文使用二元交叉熵損失函數來衡量模型訓練的損失值,計算公式為:
(1-yt,i)lg(1-yp,i))
(12)
式中:L為損失值;N為樣本總數;yp,i和yt,i分別為第i個樣本的預測輸出值和真實標簽值,其值只能為0或1。
通過CNN的反向傳播,使用梯度下降法調整各層可學習參數來降低損失值,重復正向推理步驟直到損失值減小至預設區間內收斂,此時CNN分類器便完成了最終訓練。表1列出了CNN分類模型的關鍵網絡結構與各層網絡參數。

表1 CNN分類模型的關鍵網絡結構與各層網絡參數
將GAF脈沖數據集的70%作為訓練集、30%作為測試集,來驗證GAF-CNN甄別方法的效果,其中訓練集樣本數為13 980、測試集樣本數為5 991。使用TensorFlow Keras平臺搭建CNN模型,以批量大小參數為16的設置進行訓練,每輪訓練對模型進行了874次數據投喂;由于數據集樣本量足夠大,僅訓練3次便可以得到損失值近乎收斂的訓練結果。在相同數據集分割配置和相同批量大小等實驗條件下,對使用二維卷積的傳統CNN甄別法進行訓練,該方法是將原始脈沖數據集的一維樣本序列通過簡單折疊的方式預處理成二維矩陣[14],再輸入到卷積層進行卷積;經實驗,在相同結構的CNN分類模型下需要訓練6次才能得到損失函數相對收斂的訓練結果。圖9為兩種CNN甄別法訓練過程中損失值的變化趨勢,可看出GAF-CNN的損失函數具有更快的收斂速度。

圖9 CNN損失函數收斂曲線
為評估兩種CNN甄別方法的甄別性能,定義辨別誤差率(DER)來作為評價指標[11],使用式(13)來計算γ射線與中子的DER,即CNN甄別錯誤的樣本數與數據總樣本數之比。
(13)
式中:Nγ和Nn分別為γ射線與中子的測試樣本數;Nγ-CNN與Nn-CNN分別為使用CNN甄別法甄別后γ射線與中子的測試結果數量。表2所列為兩種CNN甄別法的學習性能對比。由表2可知,兩種CNN甄別法均能達到較低的辨別誤差率水平,對n/γ甄別效果良好,且GAF-CNN的辨別誤差率較傳統CNN甄別法相對降低約38.8%。

表2 兩種CNN甄別法的學習性能對比
在CNN甄別模型訓練結束后,為探究CNN甄別法和電荷比較法的性能差異,分別對GAF-CNN法與傳統CNN法進行甄別統計測試以獲取FOM。首先將測試集中的樣本輸入模型,使用回調函數分別獲取每個樣本在模型最終分類前所輸出的在0~1區間的正類樣本概率,再將0~1區間10 000等分進行輸出結果計數統計,甄別結果如圖10所示。由圖6可知,正類樣本被設置為中子,因此在實際分類中輸出值大于0.5則判定為中子,反之則判定為γ射線。

a——GAF-CNN甄別法;b——傳統CNN甄別法
由圖10可看出,GAF-CNN甄別法的輸出分布相較于傳統CNN甄別法更趨于0和1兩極,結合圖9中GAF-CNN的損失值收斂速度更快的實際情況,說明使用GAF進行數據二維化相比于使用一維樣本折疊成矩陣的二維化方式能夠保留更多維度的脈沖時域信息,而進行卷積操作則有利于保留脈沖的頻域信息,因此在融合了時頻特征后,GAF-CNN能提取更加準確有效的n/γ脈沖形狀特征。
將電荷比較法、傳統CNN甄別法和GAF-CNN甄別法進行綜合性能對比分析,綜合測試后將數據列于表3。對測試集中的5 991個脈沖樣本分別使用3種方法進行了甄別處理,均能滿足甄別需求。同時,CNN甄別法相較于電荷比較法的甄別效果明顯提高,在樣本沒有進行專門濾波處理的情形下,其FOM能提升至少兩個數量級;而GAF-CNN甄別法在輕量級網絡分類框架上的FOM相對于傳統CNN甄別法有1個數量級的提升。

表3 3種n/γ PSD方法的性能對比
在處理時間方面,兩種CNN甄別法均比電荷比較法的甄別處理速度更為快捷。其中GAF-CNN法可達到1.2 s,比傳統CNN法耗時稍高,可見為進一步提高甄別性能上限,所輸入的3通道GAF圖像相比于傳統CNN法中輸入的折疊矩陣包含了更多維度的脈沖形狀信息,因此增加了處理脈沖信號的時間。
本文實現了一種基于GAF-CNN的PSD方法,并與傳統CNN甄別法和電荷比較法進行了對比。結果表明,GAF-CNN能同時獲取脈沖的時頻特征,相比于傳統CNN法具有更低的辨別誤差率。此外,GAF-CNN在甄別品質上有著較大的性能突破,在本實驗條件下,僅使用輕量級網絡模型的FOM便可比電荷比較法提升3個數量級且比傳統CNN法提升1個數量級。而在處理時間上,GAF-CNN甄別法比電荷比較法有著明顯地提升。同時,利用TensorFlow框架實現的輕量級GAF-CNN甄別網絡使得CNN PSD算法的嵌入式部署成為可能,為高性能n/γ復合探測能譜儀的研制提供了一種新思路。