林偉銘,高欽泉,杜 民
(1.福州大學 物理與信息工程學院,福州 350108; 2.福建省醫療器械與醫藥技術重點實驗室,福州 350108; 3.廈門理工學院 光電與通信工程學院,福建 廈門 361024; 4.福建省生態產業綠色技術重點實驗室,福建 南平 354300)
卷積神經網絡診斷阿爾茲海默癥的方法
林偉銘1,2,3,高欽泉1,2,杜 民1,4*
(1.福州大學 物理與信息工程學院,福州 350108; 2.福建省醫療器械與醫藥技術重點實驗室,福州 350108;
3.廈門理工學院 光電與通信工程學院,福建 廈門 361024; 4.福建省生態產業綠色技術重點實驗室,福建 南平 354300)
針對阿爾茲海默癥(AD)通常會導致海馬體區域萎縮的現象,提出一種使用卷積神經網絡(CNN)對腦部磁共振成像(MRI)的海馬體區域進行AD識別的方法。測試數據來自ADNI數據庫提供的188位患者和229位正常人的腦部MRI圖像。首先,將所有腦圖像進行顱骨剝離,并配準到標準模板;其次,使用線性回歸進行腦部萎縮的年齡矯正;然后,經過預處理后,從每個對象的3D腦圖像的海馬體區域提取出多幅2.5D的圖像;最后,使用CNN對這些圖像進行訓練和識別,將同一個對象的圖像識別結果用于對該對象的聯合診斷。通過多次十折交叉驗證方式進行實驗,實驗結果表明所提方法的平均識別準確率達到88.02%。與堆疊自動編碼器(SAE)方法進行比較,比較結果表明,所提方法在僅使用MRI進行診斷的情況下效果比SAE方法有較大提高。
阿爾茲海默癥;卷積神經網絡;磁共振成像;海馬體;計算機輔助診斷
阿爾茲海默癥(Alzheimer’s Disease, AD)是一種常發病于老年人群的癡呆癥狀,即老年癡呆癥,其患者通常具有進行性記憶喪失和語言障礙等癥狀。隨著社會老齡化的發展,其發病率也將隨之增長。預計在2050年,中國的老年癡呆癥患者將可能達到2 000萬[1]。對于阿爾茲海默癥的計算機診斷通常使用腦部成像,例如結構性磁共振成像(structural Magnetic Resonance Imaging, sMRI)[2]、功能性磁共振成像(functional Magnetic Resonance Imaging, fMRI)[3]和正電子發射計算機斷層顯像(Positron Emission computed Tomography, PET)[4]等圖像數據。其中sMRI由于其相對較低的成本和較好的成像效果,常被應用于腦部疾病的研究。MRI作為三維圖像含有大量的體素數據,其中大部分與阿爾茲海默癥無關,所以如何從大量的體素數據中進行疾病相關的特征提取成了研究的主要內容[5-6]。但是目前已有的方法中還較少使用卷積神經網絡(Convolutional Neural Network, CNN)進行阿爾茲海默癥相關特征的提取和疾病診斷。
本文主要研究利用卷積神經網絡對MRI進行阿爾茲海默癥的自動診斷。深度神經網絡常被應用于機器自動識別,在阿爾茲海默癥的自動識別上也具有良好的效果[7-8]。卷積神經網絡作為深度神經網絡的一種網絡結構[9],自2012年的ILSVRC比賽后就受到許多關注, 并在許多計算機視覺的應用中性能超越了其他算法。由于阿爾茲海默癥會導致患者海馬體區域出現萎縮,患者的腦部與正常人的腦部有視覺上的區別,如圖1所示,因此可以使用卷積神經網絡對MRI進行自動識別。本文提出了一種基于卷積神經網絡對MRI進行阿爾茲海默癥的計算機診斷方法,使用ADNI數據庫提供的229位正常人(Normal Control, NC)和188位患者(AD)共417個MRI進行分類測試。文獻[7-8]都采用了深度神經網絡的方法對阿爾茲海默癥進行分類診斷,而且兩者對NC和AD的分類準確率都達到91.4%,但是文獻[8]方法利用了MRI、PET數據,文獻[7]除了MRI、PET數據,還使用了脊髓液(CerebroSpinal Fluid, CSF)信息。使用多種數據信息在實際應用中成本相對較高,相關數據難以獲取。例如CSF數據可能需要通過脊椎穿刺獲取,大部分人群難以接受。而PET成像有較強的輻射,并且同時進行MRI和PET成像相對成本也較高。本文集中研究僅利用MRI圖像進行輔助診斷,利用非剛性配準、年齡矯正、海馬體區域2.5D圖像提取和數據增廣等處理以及卷積神經網絡進行識別,如圖2所示。經多次十折交叉驗證測試,該方法具有良好的診斷準確率。

圖1 三位患者與三位正常人的海馬體比較Fig.1 Hippocampus comparison of three AD and three NC

圖2 診斷方法數據處理流程Fig. 2 Flow chart of data processing in diagnostic method
本文使用的MRI數據來自ADNI(Alzheimer’s Disease Neuroimaging Initiative)數據庫(adni.loni.ucla.edu),該數據庫公開提供一系列測試對象的MRI、PET、其他生物標記和相關的診斷信息,為研究人員提供了一套標準的研究數據,用于研究阿爾茲海默癥的發病過程。其提供的數據包含了三套子庫,分別是ADNI-1、ADNI-2和ADNI GO。本文使用的數據來自ADNI-1的標準基準庫包含的818個測試對象的1.5T MRI[10]。該818位測試對象分別是229位正常人、188位患者和401位輕度認知功能障礙者。其中輕度認知功能障礙者并不屬于阿爾茲海默癥患者,但是其部分對象有可能在接下來的幾年中發病成為患者。本文主要使用全部417位正常人與患者的MRI數據進行識別測試,測試過程中未刪除任何樣本數據。這些測試對象的年齡分布從55歲到90歲,男性218人,女性199人。具體年齡和性別的分布如表1所示。

表1 測試對象年齡性別分布Tab. 1 Age and sex distribution of test subjects
本文使用的417位測試對象的MRI由于個體差異存在腦部尺寸、形狀、位置上的較大區別,因此首先需要對這些數據進行一系列預處理[11],保證圖形之間有可比較性。首先所有的MRI都進行標準的ADNI流水線處理,然后進行顱骨剝離,保留腦部圖像。為了進行比較,所有的MRI都需要進行配準,顱骨剝離后的圖像使用基于B樣條的自由變形配準到MNI152模板上。對于配準的精度選擇,如果配準太粗糙則配準效果不明顯;而如果配準太精確則會導致測試個體間的區別大量丟失,區分度不高。因此本文選擇5 mm距離的配準精度,可以達到較好的分類準確率[11]。最后對配準后的圖像進行基于直方圖的數值歸一化處理。
經過上述預處理的MRI已經可以進行卷積神經網絡的訓練和識別,但是為了提高準確率,本文采用了年齡矯正的預處理[12]。由于本文使用卷積神經網絡進行圖像識別的方式主要是基于海馬體區域的腦部形態,阿爾茲海默癥患者相較于正常人的腦部會出現萎縮現象。然而正常人的腦部隨著年齡的增加也會出現萎縮的情況,在識別過程中會與患者的病理萎縮混淆,年齡矯正可以降低腦部正常萎縮對識別的影響。
年齡矯正基本思路是:將某個坐標的體素值作為y,其年齡作為x,然后使用所有的正常人的該坐標體素值yn和年齡xn進行線性回歸,擬合到曲線y=ax+b,其中a和b是實數,可以從系數a得知該體素值隨著年齡增長的正常變化趨勢。然后對所有MRI(包含正常人和患者)的該坐標體素值矯正到某個固定年齡上,即完成該坐標點的年齡矯正。對所有的坐標點都進行上述處理,即完成年齡矯正的過程。
年齡矯正的具體實現過程為,設置年齡矩陣X、體素值矩陣Y和系數矩陣β:
其中:N是正常測試對象的數量;M是預處理后單個MRI的體素數量。建立線性回歸模型如下:
Y=Xβ+ε
(1)
式中,ε是線性回歸的誤差,目標是尋找最優的系數矩陣β使得∑ε2最小,其解為:
β=(XTX)-1XTY
(2)
由系數矩陣β可得到每個體素值與年齡的變化趨勢系數a1,a2…,aM。本文根據該系數與測試對象的年齡,將所有測試對象的體素值矯正到年齡70歲的數值上。最后由于后期輸入卷積神經網絡的數據數值范圍是0至255,矯正后的體素值超過255則置為255,低于0則置0。
2012年AlexNet在ILSVRC大賽上獲得優勝后,引發了卷積神經網絡的研究熱潮。雖然卷積神經網絡經常應用于計算機視覺對自然圖像的識別,然而它在醫學圖像上的視覺識別上也取得優秀的成績[13-14]。本文使用開源的深度神經網絡框架caffe搭建卷積神經網絡對預處理后的MRI進行訓練和識別測試。caffe實現了深度神經網絡中常用的各種網絡層,使用者只需要使用所需網絡層搭建起整個神經網絡。caffe還集成了Nvidia公司提供的cuda和cudnn,可以調用Nvidia顯卡GPU進行并行運算,大大提高了運行速度。本文使用caffe搭建了卷積神經網絡包含了三個卷積層和一個全連接層,網絡結構如圖3所示。

圖3 卷積神經網絡結構Fig. 3 Framework of convolutional neural network
該網絡第一層的輸入是長寬為32×32的3通道RGB圖像,中間經過了三次卷積、池化、局部響應歸一化(Local Response Normalization, LRN)和修正線性單元(Rectified Linear Units, ReLU)激活函數,輸出由softmax層提供的分類結果。該卷積神經網絡雖然不屬于大型網絡,但仍具有相對較多的網絡參數,例如第一個卷積層有參數1 216個,第二個卷積層有參數6 416個,第三個卷積層有參數12 832個,再加上全連接網絡的參數1 024個,該網絡的參數達到了21 488個。而本文使用的樣本數量只有417個,相對于網絡參數數量少了許多,訓練過程中會存在過擬合問題。在上述預處理后的MRI的數據是182×218×182大小的3D單通道圖像,為了符合該卷積神經網絡的輸入格式,本文采用2.5D圖像的提取方式[15]。首先在3D圖像中選擇一個點,然后以該點為中心從三個軸向上截取三幅32×32的2D圖像,如圖4所示。以這三幅圖像作為RGB圖像的三個通道,可以得到一幅32×32的3通道圖像作為卷積神經網絡的輸入。顯然一個MRI只提取一幅2.5D圖像無法準確提取有效信息,而且中心點的位置選擇也很重要。本文使用數據增廣的方式[9],在一個MRI中選擇多個中心點提取多幅2.5D圖像,然后使用這些2.5D圖像的分類結果共同判決該MRI的分類。該方式不僅保證了從MRI中提取足夠的信息,而且通過增加訓練圖像的數量有效抑制卷積神經網絡的過擬合問題。

圖4 2.5D圖像提取Fig.4 2.5D image extraction
對于多個中心點的位置選擇,本文將這些中心點設置在海馬體區域內。首先將所有測試對象的腦組織分割區域數據根據上述配準過程配準到MNI152模板上,之后將配準后的所有海馬體區域進行重疊,獲得一個能包含所有測試對象海馬體的區域。最后將該區域進行4個體素的收縮后作為興趣區域(Region Of Interest, ROI),收縮的原因是為了讓中心點的選擇在海馬體區域內,而不是在海馬體之外或邊緣處。在ROI區域中每隔2個體素設置1個中心點,一共提取出151個中心點均勻地分布在整個ROI區域,如圖5所示。雖然中心點的選擇限制在該ROI區域內,但每次提取的數據是以這些點為中心的32×32的圖像,所以實際提取的信息是包含海馬體及其周圍較大區域的信息。

圖5 數據增廣的中心點位置(白點)Fig. 5 Center point location (white point) of data augmentation
本文的測試對象共417個MRI,每個MRI提取151幅2.5D圖像,共62 967幅圖像。使用10折交叉驗證,則訓練圖像有56 776幅,測試圖像6 191幅。訓練樣本擴大到了5.67萬個,有效抑制了過擬合問題。對于每幅2.5D圖像,softmax輸出層會輸出該幅圖像對應兩種分類的概率,最終判決該圖像為概率最大的分類。而每個MRI的分類判決都由提取自該MRI的151幅圖像共同判決。本文采用兩種共同判決方式并進行比較:第一種是151幅圖像分別進行分類判決,然后統計各分類的數量,數量最多的分類為該MRI的分類,稱為判決平均;第二種屬于軟判決方式,將151幅圖像對應各分類的概率進行平均,最后平均概率值最大的分類為該MRI的分類,稱為概率平均。
本文使用Matlab對數據進行預處理,使用caffe開源框架搭建卷積神經網絡進行訓練和識別。測試運行環境是:CPU為Intel i7 7700,GPU為GeForce GTX 1070,內存為8 GB,操作系統為ubuntu16.04,安裝CUDA 8.0庫文件,Matlab版本為2014b。
使用417位對象的MRI進行測試,將MRI經過預處理和年齡矯正后,從每個MRI提取151幅2.5D圖像后打亂順序進行卷積神經網絡的訓練。卷積神經網絡的參數調整方法使用隨機梯度下降,學習率(learning rate)為0.001、動量因子(momentum)為0.9、權重衰減(weight decay)為0.004。每次訓練小塊(batch)大小為151幅2.5D圖像,共訓練11 280次,即訓練過程中每幅圖像被用于訓練30次(epoch)。
測試過程使用10折交叉驗證。首先將所有對象的順序打亂,各類型對象均勻分布;然后選擇其中41位對象作為測試樣本,其余376位作為訓練樣本進行訓練和測試,依次進行10次可以對410位對象進行測試,10次測試的平均準確率、平均敏感度(真實陽性對象中被診斷成陽性的數量 / 真實陽性對象數量)和平均特異度(真實陰性對象中被診斷為陰性的數量 / 真實陰性對象數量)作為本次的測試結果。該方式存在測試過程中會有7位對象未被測試,而且單次測量無法有效判斷真實的測試準確率。所以本文將上述測試過程重復30次,每次都重新打亂對象的順序,因此測試結果相對可靠,而且能測試到所有樣本。本文對未進過年齡矯正和經過年齡矯正,以及判決平均和概率平均兩種判決方式,共四種方法進行了測試,分別為:a)年齡矯正+判決平均;b)年齡矯正+概率平均;c)無年齡矯正+判決平均;d)無年齡矯正+概率平均。30次測試結果的平均值如表2所示。

表 2 不同方法診斷結果比較 %Tab. 2 Comparison of diagnosis results for different methods %
從表2中的測試結果可以看出:1) 概率平均方式略優于判決平均方式,但是兩者的效果接近。2)增加年齡矯正后,診斷準確率可以提高2個百分點左右。其中使用年齡矯正結合概率平均方式可以達到最好的診斷準確率88.02%。
本文在數據預處理過程中采用了5 mm精度的非剛性配準、年齡矯正到70歲和每個MRI提取151幅2.5D圖像數據增廣方法。本文對這些預處理參數設置的影響進行了測試:1)為了測試矯正年齡的影響,對矯正到65歲、75歲和80歲的準確率進行了測試,結果分別為88.1%、87.92%和88.03%,從該結果可以看出,矯正到其他年齡上具有相似的效果。2)為了測試配準精度的影響,對10 mm配準精度和2.5 mm配準精度的準確率進行測試,結果分別為86.83%和84.15%,說明了5 mm配準精度的效果最佳。3)本文采用數據增廣的中心點滿足間隔2個體素,可以提取151個中心點。如果滿足間隔3個體素,可以提取71個中心點。間隔1個體素可以提取465個中心點。測試71個中心點和465個中心點的準確率,結果分別為87.07%和88.11%,說明了減少中心點數量會導致數據增廣效果降低,增加中心點數量對效果有輕微提升,但會增加較多的計算量。
文獻[8]同樣采用了深度神經網絡在ADNI數據庫里的數據上進行了診斷測試,為了同其他深度神經網絡方法比較,本文將本方法與文獻[8]中的使用MRI數據的診斷方法進行比較,結果如表3所示。由表3可知,在使用文獻[8]同樣測試樣本的情況下,本文提出的方法比文獻[8]使用的堆疊自編碼器(Stacked AutoEncoder, SAE)方法和支持向量機(Support Vector Machine, SVM)方法準確率提高了5個百分點以上。雖然文獻[8]的方法在MRI樣本子集的基礎上增加了PET數據后準確率提升到了91.4%,但多個數據源在應用中成本也會相應增加。

表 3 不同方法在MRI數據上的診斷結果比較 %Tab. 3 Comparison of of diagnosis results for different methods on MRI data %
上述實驗結果表明阿爾茲海默癥引起的海馬體萎縮信息可以通過多幅2.5D圖像的方式提取出來,這些信息可以使用卷積神經網絡進行訓練和識別,從而達到診斷阿爾茲海默癥的目的,而年齡矯正方法可以提高卷積神經網絡的識別效果。與文獻[8]方法在同樣MRI數據的測試比較結果表明,本文方法進行分類的效果相比SAE有較大提升。
基于阿爾茲海默癥引起海馬體萎縮的現象,本文提出了一種使用卷積神經網絡結合2.5D的數據提取方式,利用海馬體區域磁共振圖像對阿爾茲海默癥患者進行計算機輔助診斷,通過非剛性配準、年齡矯正和數據增廣等處理方式,提高了診斷的準確率。最后通過10折交叉驗證和多次驗證的方式,測得該輔助診斷方法的準確率達到88.02%。本文所提方法僅使用MRI數據,雖然診斷準確率不如多數據源聯合診斷方式,但是應用成本相對較低。而對于只使用MRI數據的診斷方式,本文方法的識別準確率相對于使用SAE或SVM的分類方法較高。本文使用訓練后的神經網絡對阿爾茲海默癥進行了識別,說明該神經網絡在訓練過程中學習到了與阿爾茲海默癥相關的海馬體形態特征。下一步可采用卷積神經網絡的可視化技術,顯示并分析這些海馬體形態特征,為阿爾茲海默癥對海馬體影響的病理學研究提供參考。
References)
[1] 葉玉如.老年癡呆癥——現代腦科學和醫學研究面臨的嚴峻挑戰[J].生命科學,2014,26(1):1.(YE Y R. Alzheimer’s disease: the serious challenge of modern mental science and medical science [J]. Chinese Bulletin of Life Sciences, 2014, 26(1): 1.)
[2] MATSUDA H. MRI morphometry in Alzheimer’s disease [J]. Ageing Research Reviews, 2016, 30: 17-24.
[3] JIE B,WEE C Y, SHEN D G, et al. Hyper-connectivity of functional networks for brain disease diagnosis [J]. Medical Image Analysis, 2016, 32: 84-100.
[4] GARALI I, ADEL M, BOURENNANE S, et al. Brain region ranking for 18FDG-PET computer-aided diagnosis of Alzheimer’s disease [J]. Biomedical Signal Processing and Control, 2016, 27: 15-23.
[5] TONG T, WOLZ R, GAO Q Q, et al. Multiple instance learning for classification of dementia in brain MRI [J]. Medical Image Analysis, 2014, 18(5): 808-818.
[6] ZHANG J, GAO Y, GAO Y Z, et al. Detecting anatomical landmarks for fast Alzheimer’s disease diagnosis [J]. IEEE Transactions on Medical Imaging, 2016, 35(12): 2524-2533.
[7] LI F, TRAN L, THUNG K H, et al. A robust deep model for improved classification of AD/MCI patients [J]. IEEE Journal of Biomedical and Health Informatics, 2015, 19(5): 1610-1616.
[8] LIU S Q, LIU S D, CAI W D, et al. Multimodal neuroimaging feature learning for multiclass diagnosis of Alzheimer’s disease [J]. IEEE Transactions on Biomedical Engineering, 2015, 62(4): 1132-1140.
[9] KRIZHEVSKY A, SUTSKEVER I, HINTON G E. ImageNet classification with deep convolutional neural networks [C]// Proceedings of the 2012 25th International Conference on Neural Information Processing Systems. New York: Curran Associates Inc., 2012: 1097-1105.
[10] WYMAN B T, HARVEY D J, CRAWFORD K, et al. Standardization of analysis sets for reporting results from ADNI MRI data [J]. Alzheimer’s and Dementia, 2013, 9(3): 332-337.
[11] TONG T, GAO Q Q, GUERRERO R, et al. A novel grading biomarker for the prediction of conversion from mild cognitive impairment to Alzheimer’s disease [J]. IEEE Transactions on Biomedical Engineering, 2017, 64(1): 155-165.
[12] DUKART J, SCHROETER M L, MUELLER K, et al. Age correction in dementia-matching to a healthy brain [J]. PLoS One, 2011, 6(7): e22193.
[13] SHIN H C, ROTH H R, GAO M C, et al. Deep convolutional neural networks for computer-aided detection: CNN architectures, dataset characteristics and transfer learning[J]. IEEE Transactions on Medical Imaging, 2016, 35(5): 1285-1298.
[14] YAN Z N, ZHAN Y Q, PENG Z G, et al. Multi-instance deep learning: discover discriminative local anatomies for bodypart recognition [J]. IEEE Transactions on Medical Imaging, 2016, 35(5): 1332-1343.
[15] ROTH H R, LU L, LIU J M, et al. Improving computer-aided detection using convolutional neural networks and random view aggregation [J]. IEEE Transactions on Medical Imaging, 2016, 35(5): 1170-1181.
This work is partially supported by the Natural Science Foundation of Fujian Province (2016J05157), the Foundation of Educational and Scientific Research Project for Young and Middle-aged Teachers of Fujian Province (JAT160074), the Xiamen Municipal Science and Technology Project (3502Z20153017).
LINWeiming, born in 1983, Ph. D. candidate, lecturer. His research interests include machine learning, deep learning, medical image processing.
GAOQinquan, born in 1986, Ph. D., associate professor. His research interests include machine learning, medical image processing.
DUMin, born in 1955, Ph. D., professor. Her research interests include medical image processing.
ConvolutionalneuralnetworkbasedmethodfordiagnosisofAlzheimer’sdisease
LIN Weiming1,2,3, GAO Qinquan1,2, DU Min1,4*
(1.CollegeofPhysicsandInformationEngineering,FuzhouUniversity,FuzhouFujian350108,China;2.FujianProvincialKeyLaboratoryofMedicalInstrumentandPharmaceuticalTechnology,FuzhouFujian350108,China;3.SchoolofOpto-ElectronicandCommunicationEngineering,XiamenUniversityofTechnology,XiamenFujian361024,China;4.FujianProvincialKeyLaboratoryofEco-IndustrialGreenTechnology,NanpingFujian354300,China)
The Alzheimer’s Disease (AD) usually leads to atrophy of hippocampus region. According to the characteristic, a Convolutional Neural Network (CNN) based method was proposed for the diagnosis of AD by using the hippocampu region in brain Magnetic Resonance Imaging (MRI). All the test data were got from the ADNI database including 188 AD and 229 Normal Control (NC). Firstly, all the brain MRI were preprocessed by skull stripping and aligned to a template space. Secondly, a linear regression model was used for age correction of brain aging atrophy. Then, after preprocessing, multiple 2.5D images were extracted from the hippocampus region in the 3D brain image for each object. Finally, the CNN was used to train and recognize the extracted 2.5D images, and the recognition results of the same object were used for the joint diagnosis of AD. The experiments were carried out by using multiple ten-fold cross validation methods. The experimental results show that the average recognition accuracy of the proposed method reaches 88.02%. The comparison results show that, compared with Stacked Auto-Encoder (SAE) method, the proposed method has improved the diagnosis effect of AD in the case of only using MRI.
Alzheimer’s Disease (AD); Convolutional Neural Network (CNN); Magnetic Resonance Imaging (MRI); Hippocampus; Computer-Aid Diagnosis (CAD)
2017- 06- 29;
2017- 09- 06。
福建省自然科學基金資助項目(2016J05157);福建省中青年教師教育科研項目(JAT160074);廈門市科技計劃項目(3502Z20153017)。
林偉銘(1983—),男,福建漳州人,講師,博士研究生,主要研究方向:機器學習、深度學習、醫學圖像處理; 高欽泉(1986—),男,福建福清人,副教授,博士,主要研究方向:機器學習、醫學圖像處理; 杜民(1955—)女,福建惠安人,教授,博士生導師,博士,主要研究方向:醫學圖像處理。
1001- 9081(2017)12- 3504- 05
10.11772/j.issn.1001- 9081.2017.12.3504
(*通信作者電子郵箱dm_dj90@163.com)
TP391.4
A