吳蓉,趙敏,孫通,徐君,姚敏
(南京航空航天大學 自動化學院,江蘇 南京 211106)
正電子湮沒技術(positron annihilation technology, PAT)[1]作為一種非侵入式的核物理技術,是當今科學研究的重點領域之一。該技術通過回旋加速器獲得半衰期短的核素,該類核素經過β+衰變產生正電子,其與附近的電子發生碰撞,產生一對能量為511 KeV、方向互成180°、呈電中性的γ光子[2]。利用設備對其進行探測并成像獲得被測對象的γ光子圖像。
對γ光子圖像進行分類能夠在后續處理中有針對性地獲得圖像的有效信息。目前,常用的圖像分類算法如K最近鄰[3]、決策樹[4]、支持向量機[5]等在圖像分類任務中有不錯的效果。但由于γ光子圖像在快速采集情況下分辨率低且噪聲大的缺點,使得上述方法難以獲得理想的分類效果。因此,本文提出利用深度卷積神經網絡(deep convolutional neural network,DCNN)[6]對γ光子圖像進行分類識別,通過訓練可提高γ光子圖像分類識別的精度。
卷積神經網絡在很多視覺分類任務中達到了甚至超過了人類認知,其最大的特點在于局部感知和權值共享,有效減少了網絡參數,加快了網絡訓練速度。卷積神經網絡對平移、縮放、旋轉等畸變具有不變性,提高了特征的魯棒性和穩定性。本文采用構建在MATLAB上的卷積神經網絡工具包MatConvNet作為DCNN的平臺。
在分類任務中,如果僅采用γ光子圖像構成樣本空間,由于數據量大,實際上很難實現。因此,本文采用遷移學習(transfer learning)的方法,利用在大規模數據集ImageNet上預訓練卷積神經網絡模型,利用γ光子圖像樣本集對網絡參數進行不斷地訓練與微調,實現對γ光子圖像的準確分類。對于γ光子圖像這種小樣本空間,這是一種非常有效的構建DCNN分類器的方法。
GATE(geant application for tomographic emission)是一款能夠真實模擬正電子探測成像系統的仿真軟件。為驗證DCNN對γ光子圖像分類識別的有效性,本文構建了一系列在設計上考慮了工業應用特點的樣本模型:管材空腔呈現一定的幾何形狀,將其截面的γ光子圖像作為訓練樣本,圖形上既有差別明顯的,但也容易混淆。
仿真中設置了23對探測頭,每個探測頭由1×4個模塊組成,每個模塊由8×16個晶體組成。每個閃爍晶體分為兩層:內層為LSO晶體,外層為LuAP晶體,晶體大小均為1.1mm×2.2mm×10mm,探測器半徑約為69mm。管材模型內部填充核素溶液,其活度為每像素2 000Bq,探測器數量為184×64,掃描時間為1s,能量分辨率為15%,時間分辨率為300ps,能量窗口為350~650keV,時間窗口為10ns。設計掃描時間為1s是考慮工業應用采樣速度快的需求,這會導致圖像重建質量下降并使得圖像的識別與分類困難,卻恰好可以驗證DCNN的適應能力。
設計了10組管材模型,如圖1所示。其中形狀相同缺陷方向不同的圖形均容易造成識別錯誤。圖2是對這10組模型的探測數據采用極大似然期望值最大[7](maximum likelihood expectation maximization, MLEM)算法重建獲得的第36張切片圖(每類模型有64張切片圖,同一類的每張切片圖存在一定的差別)。

圖1 實驗模型

圖2 部分γ光子圖像樣本
由于被測對象的位置差異和探測器結構差異,相鄰切片圖像之間也存在微小差異。為了提高訓練數據的質量和豐富性,本文利用這種差異進行數據增強(data augmentation)。為此,選取一張γ光子切片圖n時,利用其相鄰的兩張切片n-1和n+1,構成RGB 3個通道的圖像,如圖3所示。

圖3 3張切片構成RGB圖像
為了盡可能地增加γ光子圖像的特征,本文采用建立索引表的方式構建有索引表的RGB圖像,這樣,就可以在圖像上充分反映出管材內的核素濃度分布情況,由此增加了γ光子圖像的細節特征。實際操作如下:獲得由相鄰3張γ光子切片圖生成的RGB圖像中某一張的顏色映射表,并將所有γ光子圖像的灰度級排列與該顏色映射表作一一對應,生成最終用于訓練的γ光子圖像樣本(圖4)。

圖4 經過圖像預處理后的圖像樣本
在10類模型的切片圖中任選30張作為訓練集,共有300張訓練圖像;再選擇6張作為驗證集,共60張驗證圖像;再另選擇6張作為測試集,共60張測試圖像。
為了得到γ光子圖像的最佳分類效果,需要對所構建的DCNN網絡中目標函數進行權重規整,以防止參數更新過程出現太大的權值,其相應的權重更新公式為
(1)
其中:β表示權重衰減因子;η表示學習率;ρ表示動量因子。對以上參數設置不同的值進行訓練。
1) 為了比較不同動量對網絡性能的影響,固定的權重衰減和學習率,設置動量分別為0.5、0.7、0.9、0.99進行了實驗。訓練結果如圖5所示。
從圖5中可以看出,當動量取0.5和0.7時,網絡無法收斂;當動量取0.99時,網絡要么無法收斂,要么精度極低;而當動量取0.9時,網絡不僅快速收斂,而且在驗證集上的準確率較高,因而選擇動量為0.9。


圖5 不同動量對網絡性能的影響
2) 為了比較不同學習率對網絡性能的影響,固定權重衰減,設置動量為0.9,學習率分別為0.000 01、0.000 1、0.001、0.01、0.1進行實驗。圖6是權重衰減分別為0.000 5和0.05時兩組訓練結果。

圖6 不同學習率對網絡性能的影響
從圖6中可以看出:當學習率取0.000 01、0.01和0.1時,網絡振蕩比較嚴重,收斂所需要的時間較長;當學習率取0.000 1和0.001時,網絡收斂速度均比較快,但從驗證集上的準確率來看,學習率取0.001更佳。
3) 為了比較不同權重衰減對網絡性能的影響,設置動量為0.9,學習率為0.001,權重衰減分別為0.000 1、0.000 5、0.005、0.05進行實驗。其訓練結果如圖7所示。

圖7 不同權重衰減對網絡性能的 影響
從圖7可以看出,權重衰減對網絡振蕩的影響不大,而當權重衰減為0.000 5時,網絡在驗證集上的準確率較高。
通過上述反復實驗,最終確定網絡參數為:動量為0.9,權值衰減參數為5×10-4,學習率為0.001。采用該參數對處理后的γ光子圖像樣本集進行訓練并分類識別,其在驗證集上分類的準確率可達到97.34%。將訓練好的網絡在測試集上進行測試,發現在測試集上的準確率達到了95.69%。
為了進一步驗證DCNN對γ光子圖像的分類能力,利用GATE仿真得到掃描時間為0.1s的γ光子圖像,如圖8中部分圖像所示。與掃描時間為1s的γ光子圖像相比,其圖像質量有明顯下降。利用訓練好的網絡對掃描時間為0.1s的γ光子圖像進行分類識別,發現其在該樣本集上的分類準確率也達到了94.72%。部分分類結果如圖8所示,表明本文所構建的DCNN分類器對正電子圖像有很強的分類能力。

圖8 部分分類結果示例
γ光子圖像具有分辨率低、噪聲大等特點,傳統的圖像分類識別方法很難對其進行有效地分類識別。因此,本文提出利用深度卷積神經網絡對其進行分類識別。利用建立顏色索引表的圖像預處理方法,通過對DCNN網絡參數的調整,使得其在γ光子圖像的訓練集和測試集上都獲得了令人滿意的結果。接下來,需要進一步擴大γ光子圖像樣本庫的數量及類別,同時需要在樣本庫中添加更為復雜的樣本以及與實際應用相關的樣本,從而進一步提高該算法的實際應用價值。