惠瑞,高小紅,田增民
1.中國人民解放軍海軍總醫院 神經外科,北京 100048;2.布萊根婦女醫院 神經外科,波士頓 02115;3.密德薩斯大學 計算機科學部,倫敦 NW4 4BT,英國
基于深度學習的CT腦影像分類方法用于阿爾茨海默病的初步篩查
惠瑞1,2,高小紅3,田增民1
1.中國人民解放軍海軍總醫院 神經外科,北京 100048;2.布萊根婦女醫院 神經外科,波士頓 02115;3.密德薩斯大學 計算機科學部,倫敦 NW4 4BT,英國
目的本研究旨在探討卷積神經網絡(Convolutional Neural Network,CNN)深度學習在腦CT影像分類中的應用,達到提高影像分類智能化程度的目的,為臨床篩查阿爾茨海默病(Alzheimer Disease,AD)提供便利。方法收集2014~2016年3個類別的腦CT影像資料,其中包含AD、器質性病變(如腫瘤、腦出血等)和正常老年化的受試者的數據。由于本組CT腦圖像高度方向(z軸,層厚5 mm)單位長度相對水平方向大的特點,本研究將CT二維軸位CNN圖像和三維分割組塊進行融合運算分類后對照已有的診斷。結果AD、器質性病變和正常老年化的分類準確率分別為84.2%、73.9%和88.9%,平均為82.3%。結論本研究為初篩AD提供了新的方法。
卷積神經網絡;圖像分類;CT影像;阿爾茨海默病
阿爾茨海默氏癥(Alzheimer’s Disease,AD)在全世界65歲以上老年人的發病率約為4%~6%,最近統計數據表明全球已有將近4000萬名AD患者[1]。事實上,估計有60%的老年人有類似AD的表現但無法得到確診[2]。此外,患者到達AD中晚期后治療手段非常有限,因此AD的早期診斷顯得尤為重要。
計算機斷層掃描(CT)因其快速、簡單、廉價,同時又具備較好的成像質量的特點,幾乎在每一家醫院使用。此外,CT還可能是第一個被引入到人類大腦研究的成像工具[3]。然而,雖然大多數可疑的腦病患者雖都需要進行CT檢查,但就功能性腦病患者而言,其主要目的為排除其他可能的器質性疾病(例如,顱內腫瘤、腦出血、腦梗死等)。因為CT影像對軟組織的對比度較差,且檢查人員在手工測量腦結構(例如內側顳葉、海馬結構等)時會出現一些誤差,所以對于AD等功能性疾病,CT并沒有作為主要診斷工具[4]。
另外,在CT腦影像對AD的輔助診斷方面,特定的腦萎縮不僅與AD有關,也與正常老化和腦血管疾病有關。比如,內側顳葉萎縮已被證明是AD最重要的診斷標志物,但這不具備很強的特異性。此外,AD患者中也發現了海馬(尤其是左側海馬)的萎縮,這也會出現在健康的老年人身上[5]。然而,通過精確測量CT影像中顳角和鞍上池萎縮比率可以提高90.2%的診斷準確性[5]。因此,基于CT影像的線性測量在AD患者診斷過程工作是很有價值的。
目前已有利用核磁共振影像(MRI)訓練神經網絡模型以早期診斷AD的文獻報道,例如利用基于改進的AlexNet神經網絡模型進行MRI數據訓練,已取得了較好的測試結果[6]。但在實際臨床工作中CT較MRI更易獲得,所以本研究以CT影像為主要研究對象。為了降低在人工測量過程中可能出現的較大誤差[4],本研究是利用卷積神經網絡(Convolutional Neural Network,CNN)的最新技術,對阿爾茨海默病的CT影像數據的分類、分割和測量進行非監督的自動處理。在本研究中,對AD患者CT影像的分類,即對健康(正常)老年化和腦內病變CT影像的識別是本研究的重點。
深層學習模型是一類機器學習層次結構,通過從低層級構建高級特性[8-9],從而進行自動化特征構建。這些結構模型中應用較廣的是卷積神經網絡[9]。CNN由一組機器學習算法構成,包括涉及學習的算子處理層(線性和非線性)等多個層級(深層),因此必須通過從低層級數據構建高層級的數據,從而實現信息或特征的自動化構建[10]。已經證明,在適當的規則下訓練,神經網絡在不依賴手工采集特征的條件下可以很好的實現對物體的識別,如尺度不變特征變換、加速穩健特征[11-12]。此外,神經網絡已被證明對存在一定變量的輸入數據相對不敏感[10]。
受生物視覺信號處理機制的啟發,CNN運用前饋人工神經網絡來模擬變化的多層感知器[13]。利用此特性,它被廣泛地用于圖像和視頻的識別。目前,CNN已經被證明是理解圖像內容的有效模型,在圖像識別、圖形分割、圖像檢測與提取等方面可以得到很好的結果[14]。Liu等[15]利用了5個卷積層的CNN結構設計,采用最大池化的方法進行了3次降采樣取得預訓練網絡來計算MRI圖像在各層的特征,從而對AD等不同疾病進行分類。此外,計算機硬件技術的進步已經使CNN在圖像處理方面的應用成為現實。
然而,CNN在計算機視覺信息處理領域的成功應用主要基于二維圖像的處理。雖有少數研究報道CNN可以在處理二維視頻中發揮作用[13],但在一定程度上對三維圖像進行處理卻與此不同。在本研究中,我們使用二維和三維模式的CNN來處理CT腦影像。
本研究共收集了342位受試者的CT數據,其中71人為AD患者,138人患有各種類型的器質性病變,133人為老年正常受試者。在我們的資料中,每位受試者CT數據的層數和像素有所不同,層數為26到35層,像素為512×512 或 912×912(圖 1)。

圖1 本研究受試者的CT影像
對于二維影像,每個層面都進行圖像分割并標準化為360×360像素。對于正常人和AD患者的CT影像數據,取中間的20個層面作為此類影像的研究數據庫。而對于有器質性病變的CT影像數據,只選取包含可見病變(例如腫瘤)的層面作為研究數據庫。結果顯示,雖然而對于有器質性病變的CT影像研究數據庫是3類中最大的,但其層面的總數與其他數據相近。
同時,對于三維影像,每個受試者的CT影像數據分別進行注冊、圖像分割并標準化為200×200×20像素的三維圖像。這樣,CT數據相對層厚為5 mm。由于CT可很好地顯示腦周圍的骨性結構,我們選擇剛體幾何變換如公式(1)所示。

其中,T為需要確定的包含平移、旋轉和縮放參數的變換矩陣,Imoving為要注冊的源圖像,I fixed為圖像模板。因此,為了實現T中各參數的確定,公式(2)需被最小化。

其中,xi指從圖像模板(作為參考)和源圖像(作為源)圖像中選擇的若干對應點。為了補償每個圖像可能因強度不同而出現的縮放,增加了一個額外的強度縮放因子sa。
為了實現公式(2),我們選擇一個有30個層面的CT數據模版作為圖像模版,其他CT圖像數據則與之對齊。
完成標準化后,每個三維CT圖像數據被分解為40×40×10像素的組塊。與處理二維CT圖像類似,對于AD患者和正常人的數據,所有組塊都被用于數據訓練,而對于有器質性病變CT圖像數據,只使用含有可見病變的組塊。
在本研究中,二維CNN是沿大腦軸位方向使用基于MatConvNet[16-17]的Matlab軟件實現的。圖2顯示二維和三維CNN的融合過程。具體來說,針于訓練圖像數據[(x(i),y(i))],圖像x(i)為三維圖像,y(i)為圖像x(i)的指示符向量,圖像的特征參數,即w1……wL,將通過處理基于CNN的公式(3)來完成數據訓練。


圖2 二維和三維CNN的融合過程
其中,?為適當的損失函數(如hinge損失函數或log損失函數)。
為獲得這些特征參數,二維CNN使用二維卷積算法在同層面的卷積層提取上一層面的特征參數,然后應用疊加性偏差,結果通過S函數傳遞,如公式(4)中所示。

在公式(4)中,tanh(.)表示雙曲正切函數;m為上一層(i-1)th的數據參數指數;bij指特征參數的偏差;是指在位置(p,q)的內核連接到的第k個特征參數;pi,Qi是指內核的高和寬。
在二次采樣層,通過池化上一層面提取的特征參數使該層特征參數的分辨率降低,從而增加不變扭曲的輸入。CNN的架構可以通過交替的方式堆疊多層卷積和二次采樣來實現。在CNN的參數中,如偏差參數bij和權重參數通常使用監督或無監督的訓練方法[8,17-18]。
另外,為了保留CT影像Z軸方向的信息,人們對三維CNN進行了探索。在三維CNN中,通過三維內核向x-y軸方向(即二維)及z軸方向的卷積來實現,在這里公式(4)可以擴展為公式(5)用來計算在ith層面上jth特征參數中某點位置的值。

其中Ri為三維內核在z軸方向的數值,為內核(p,q,r)th連接到上一層的特征參數mth的數值。此外,三維池化也被引入以增加輸入圖像中失真和噪聲中的不變參數[19]。
在二維CNN模型中,每個層面的二維圖像應用于訓練模型,而三維CNN模型則使用立方體組塊(40×40×10)。因此,分類是在整體數據的級別上進行的,且均結合了這兩個模型。對于正常老年化組,使用二維和三維數據分別對模型進行訓練后,其95%以上的二維層面數據和全部的三維組塊被標記為“正常老年化”。因AD或病變通常表現于一個以上的層面,雖然有5%的二維數據(即一個層面)沒有被標記,但并不影響最終結果。而對于AD組和器質性病變組,因某CT影像可能同時具有AD組和器質性病變組的特征,經二維和三維模型訓練后,在用于測試的CT數據時,如果標記為AD的層面或組塊多,則分類為AD組,反之則分類為器質性病變組。
表1為圖像處理過程中的數據信息。一個受試者的CT影像通常包含26到35個層面,共有342個三維影像數據,5876個二維層面。這些數據被分為3組,應用CNN完成訓練、驗證(避免過度擬合)和數據測試。

表1 每個運算過程中使用影像數據的數量(n)
總共有180組數據被隨機抽選用來測試CNN分類系統,其中包含2700個二維圖像和3795個三維組塊。每個組之間的數據的劃分是隨機選擇的,測試的混淆矩陣,見表2。CNN分類完成后,對照受試者的診斷計算分類準確率。

表2 3個類別測試結果的混淆矩陣及準確率(例)
最終,經過CNN分類運算及與原診斷對照,3類CT影像AD組、腦器質性病變組和正常老年化組的分類準確率分別為84.2%、73.9%和88.9%,平均為82.3%。
本研究應用了目前流行的CNN深度學習的方法為一組腦CT影像分類,該組CT影像的受試者已明確診斷為AD、腦器質性病變和正常老年化,CNN完成了自動分類運算并具有很高的準確性。
在本組數據中,雖然屬于腦器質性病變的類別中包含最多的影像數據(n=138),但并非每個二維層面或三維組塊都包含病變信息。因此,腦器質性病變組圖像數目實際最少,只有1717個層面,AD組和正常老年化組分別為1430和2729個層面。雖然3個類別的數據總量差異不顯著,特別是AD和腦器質性病變組數據量十分接近,分類準確率的結果似乎與每組數據的數量有相關性。例如,正常老年化組的數據量最大,總共有2729個層面,其分類準確率88.9%也在3類中是最高的。所以,可以得到的結論是,更多的數據將獲得更好的分類結果。
此外,雖然CT影像實際為三維影像,但因其層厚較大(5 mm)導致三維CT影像的分類不如二維影像分類精確。因此,本研究融合使用二維和三維CT影像數據,以獲得更好的結果。結果顯示,對AD患者的CT影像分類準確率達到84.2%,其高準確性使該方法可以作為AD的初篩工具使用,為早期診斷AD提供重要保證。
[1] Querfurth HW,Laferla FM.Alzheimer’s disease[J].New Engl J Med,2010,362(4):329.
[2] Dementia: https://www.gov.uk/government/news/[EB/OL].[2015-03].
[3] Waldemar G,H?gh P,Paulson OB.Functional brain imaging with single-photon emission computed tomography in the diagnosis of Alzheimer’s disease[J].Int Psychogeriatrics,1997,91(1):223.2.
[4] Jobst KA,Smith AD,Szatmari M,et al.Detection in life of confirmed Alzheimer’s disease using a simple measurement of medial temporal lobe atrophy by computed tomography[J].Lancet,1992,340(8829):1179-1183.3.
[5] Zhang Y,Londos E,Minthon L,et al.Usefulness of computed tomography linear measurements in diagnosing Alzheimer’s disease[J].Acta Radiologica,2008,49(1):91-97.
[6] 呂鴻蒙,趙地,吃學斌.基于增強AlexNet的深度學習的阿爾茨海默病的早期診斷[J].計算機科學,44(6):50-60.
[7] Oksengaard AR,Haakonsen M,Dullerud R,et al.Accuracy of CT scan measurements of the medial temporal lobe in routine dementia diagnostics[J].Int J Geriatr Psych,2003,18(4):308-12.
[8] Fukushima, K.Neocognitron:A self-organizing neural network model for a mechanism of pattern recognition unaffected by shift in position[J].Biol Cyb,1980,36:193-202.
[9] Lécun Y,Bottou L,Bengio Y,et al.Gradient-based learning applied to document recognition[J].P IEEE,1998,86(11):2278-2324.
[10] Lecun Y,Huang FJ,Bottou L.Learning methods for generic object recognition with invariance to pose and lighting[A].Computer Vision and Pattern Recognition[C].Washington:Proceedings of the 2004 IEEE Computer Society Conference on IEEE,2004,2:97-104.
[11] Kumar P,Henikoff S,Ng PC.Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm[J].Nat Protoc,2009,4(7):1073-1081.
[12] Feng Q,Xu W,Zhang X,et al.Research of image matching based on improved SURF algorithm[J].Telk Indon J Elec Engin,2013,12(2):1395-1402.
[13] Lecun Y.LeNet-5, convolutional neural networks[J].
[14] 張柏雯,林嵐,吳水才.深度學習在輕度認知障礙轉化與分類中的應用分析[J].醫療衛生裝備,2017,38(9):105-111.
[15] Liu F,Shen C.Learning deep convolutional features for MRI based Alzheimer’s disease classification[EB/OL].https://www.researchgate.net/publication/261636125_Learning_Deep_Convolutional_Features_for_MRI_Based_Alzh- eimer’s_Disease_Classification.
[16] Xu W,Xu W,Yang M,et al.3D Convolutional Neural Networks for Human Action Recognition[J].IEEE T Pattern Anal,2012,35(1):221-231.
[17] Vedaldi A,Lenc K.MatConvNet: Convolutional neural networks for MATLAB[J].2014:689-692.
[18] Marc,Huang FJ,Boureau Y,et al.Unsupervised learning of invariant feature hierarchies with applications to object recognition[A].Columbus:Computer Vision and Pattern Recognition[C],2007:1-8.
[19] Lazar NA,Luna B,Sweeney JA,et al.Combining brains: a survey of methods for statistical pooling of information[J].Neuroimage,2002,16(2):538-550.
CT Brain Image Classification Based on Deep Learning in Application of Screening of Alzheimer Disease
HUI Rui1,2, GAO Xiaohong3, TIAN Zengmin1
1.Department of Neurosurgery, Navy General Hospital of the Chinese People’s Liberation Army, Beijing 100048, China;2.Neurosurgery Department, Brigham and Women’s Hospital, Boston 02115, US;3.Department of Computer Science, Middlesex University, London, NW4 4BT, UK
ObjectiveThe study aims to discuss the application of deep leaning based on the convolutional neural network (CNN) in the CT imaging classification, so as to improve the intelligent image classification for clinical screening of Alzheimer disease (AD).MethodsThree categories of brain CT image data, including the data from AD patients, organic lesion patients (eg. tumor, cerebral hemorrhage) and normal aging patients were collected. For the reason that the relative horizontal direction in CT brain image was high (z axis, seam thickness 5 mm), we fused the two dimensional and three dimensional CNN data in this study, and the results were compared with the diagnostic results. Results The accuracy rates of diagnosis for AD patients, organic lesion patients and normal aging patients were 84.2%, 73.9% and 88.9% respectively, with mean rate of 82.3%. Conclusion Our results supply a new method for preliminary screen of AD.
convolutional neural network; image classification; CT image; Alzheimer disease
R814.42
A
10.3969/j.issn.1674-1633.2017.12.004
1674-1633(2017)012-0015-05
2017-11-08
2017-11-26
國家863計劃(2007AA420100-1);European Union’s Framework 7 research program under grant agreement (PIRSESGA-2010-269124)。
作者郵箱:huirui2002@163.com
本文編輯 王靜