丘致榕
(福建師范大學,福建 福州350001)
阿爾茲海默病(AD)是一種記憶力衰退、大腦功能緩慢且逐漸變異引起的智力喪失表現的疾病,它給整個社會的經濟帶來巨大的負擔。想對AD 患者進行徹底的治療是不可能的。在AD的早期即輕度認知障礙(Mild Cognitive Impairment, MCI)時期進行及時干預是目前普遍認可的方法,輕度認知障礙(MCI)根據其不同臨床結果可分類為穩定型(sMCI)和進展型(pMCI)。神經影像學可以作為阿爾茨海默病(AD) 及其前驅期輕度認知障礙(MCI)的潛在診斷工具,其中核磁共振成像(Magnetic Resonance Imaging,MRI)由于技術成熟,在機器學習領域被廣泛利用。
由于需要對sMCI 和pMCI 的患者進行長期跟蹤回訪,其核磁共振圖像不易獲取,因此本文收集了121 個sMCI 和159 個pMCI 的核磁共振圖像。核磁共振圖像需要經過一定的預處理才能輸入到網絡進行訓練,預處理包括前聯合- 后聯合校正(AC-PC)、強度非均勻校正(N3)、去頭骨、配準到標準模板和重采樣成181*218*181 像素。本文使用了基于MATLAB 的SPM 12工具包進行對核磁共振圖像做預處理,最后獲得灰質、白質和去頭骨三種核磁共振的三維圖像。根據國內外的研究發現,白質圖像在機器學習算法中表現出最好的分類效果。但由于使用三維卷積神經網絡處理三維圖像會產生大量的參數,需要消耗很高的算力。為了減輕計算壓力,降低時間成本并且增大數據量,本文從三維圖像抽取部分切片作為最終實驗數據,抽取方式為:從俯視圖第75 號切片開始間隔一張抽取,共抽取15 張切片。
雖然早期LeNet 在圖像分類中取得了較好的成績,但是受限于計算機性能的影響,該網絡并沒有引起很多的關注。直到2012 年,Alex 等人提出的AlexNet 網絡在ImageNet 大賽上以遠超第二名的成績奪冠,卷積神經網絡才重新被廣泛的關注。AlexNet 是在LeNet 的基礎上加深了網絡的結構,并使用了一些新技術使得網絡能學習到更豐富更高維的圖像特征。具體來說,AlexNet 首次使用ReLU 作為網絡的激活函數,成功解決了Sigmoid 在網絡較深時的梯度彌散問題。雖然ReLU 激活函數在很久之前就被提出了,但是直到AlexNet 的出現才將其發揚光大。并且作者在訓練AlexNet 時使用Dropout 隨機忽略掉一部分神經元,以避免模型過擬合。Dropout 雖有單獨的論文論述,但是AlexNet 將其實用化,通過實踐證實了它的效果。可以說AlexNet是淺層神經網絡和深度神經網絡的分界線。
VGGNet 是Visual Geometry Group 提出的。該網絡主要工作是證明了增加網絡的深度能夠在一定程度上影響網絡最終的性能。VGGNet 16 包含了16 個隱藏層(13 個卷積層和3 個全連接層),它具有以下的優點:(1)結構簡潔,整個網絡都使用了同樣大小的卷積核尺寸(3x3)和最大池化尺寸(2x2);(2)幾個小濾波器(3x3)卷積層的組合比一個大濾波器(5x5 或7x7)卷積層好;(3) 驗證了通過不斷加深網絡結構可以提升性能。但VGGNet 使用了更多的參數并且耗費更多計算資源。
殘差網絡(ResNet)要解決的是深度神經網絡的“退化”問題。“退化”指的是給網絡疊加更多的層后,性能卻快速下降的情況。針對該問題有兩種解決思路:一種是調整求解方法,比如更好的初始化、更好的梯度下降算法等;另一種是調整模型結構,讓模型更易于優化——改變模型結構實際上是改變了誤差面的形態。
ResNet 從后者入手,探求更好的模型結構。將堆疊的幾層網絡層稱之為一個殘差塊。對于一個殘差結構當輸入為x 時其學習到的特征記為H(x),現在我們希望其可以學習到殘差F(x)=H(x)-x,這樣其實原始的學習特征是F(x)+x。之所以這樣是因為殘差學習相比原始特征直接學習更容易。當殘差為0 時,此時堆積層僅僅做了恒等映射,至少網絡性能不會下降,實際上殘差不會為0,這也會使得堆積層在輸入特征基礎上學習到新的特征,從而擁有更好的性能。殘差學習的結構有點類似與電路中的“短路”,所以是一種短路連接。
SE 模塊是SENet 中的基本結構。與傳統的CNN 不一樣的是,該模塊通過三個操作來重新標定前面得到的特征。
首先進行一個“壓縮”操作,假設輸入特征圖的維度為H*W*C,其中H 是高度,W 是寬度,C 是通道數。“壓縮”做的事情是把H*W*C 壓縮為1*1*C,相當于把H*W 壓縮成了一維,而實際中的網絡一般是用全局平均池化操作來實現的。H*W 壓縮成一維后,相當于這一維參數獲得了之前H*W 全局的視野,感受區域更廣。
其次是“激勵”操作,得到“壓縮”的1*1*C 的表示后,加入一個FC 全連接層,對每個通道的重要性進行預測,通過參數w來為每個特征通道生成權重,其中參數w 的學習是被用來表示特征通道間相關性的。

圖1 AlexNet

圖2 VGGNet

圖3 ResNet 18

圖4 SE-ResNet 18
最后是一個特征重標定的操作,將“激勵”的輸出的權重看做是經過特征選擇后的每個特征通道的重要性,然后通過乘法逐通道加權到先前的特征上,完成在通道維度上的對原始特征的重標定。
本文使用的SE-ResNet 是將SE 模塊嵌入到ResNet 模塊中。對分支上的殘差特征進行了特征重標定。這里我們使用全局平均池化作為“壓縮”操作。緊接著兩個全連接層去建模通道間的相關性,并輸出和輸入特征同樣數目的權重。首先將特征維度降低到輸入的1/16,然后經過ReLu 激活后再通過一個全連接層升回到原來的維度。這樣做比直接用一個全連接層的好處在于:a.具有更多的非線性,可以更好地擬合通道間復雜的相關性;b.極大地減少了參數量和計算量。然后通過一個Sigmoid的門獲得0~1 之間歸一化的權重,最后通過特征重標定操作來將歸一化后的權重加權到每個通道的特征上。
本實驗從灰質圖像中間部位的30 個切片中間隔一張抽取15 張切片,共計得到4200 個切片,使用5 折交叉驗證對Alexnet 8,VGG 16,resnet 18,se-resnet 18 進行測試。相關的參數設置為epoch=200,訓練到180 輪后減少學習率,讓網絡達到最優;受顯存限制batch_size 只能設置成8; 學習率1-180 輪設置成0.0001; adam 優化器使用默認參數。最終得到的結果如圖所示,四個網絡分別獲得了82.1%、96.37%、72.55%和81.62%的準確率。
總之,中國對診斷及預防該病的科學研究報道甚少。本研究針對此問題提出4 種用于輔助診斷輕度認知障礙患者的卷積神經網絡,這4 個卷積神經網絡都能對患者大腦成像進行有效診斷,其中VGGNet 性能表現出最優秀的性能。