楚 陽,徐文龍
(中國計量大學信息工程學院,浙江 杭州 310018)
阿爾茲海默癥AD(Alzheimer’s Disease)為一種不可逆轉的進行性神經退行性疾病,約占目前所有癡呆病例的70%~80%。其表現為大腦記憶功能逐漸退化,認知功能逐步降低,語言表達能力出現障礙,甚至人格方面發生變化。晚期AD患者,往往個人生活不能自理,甚至不能識別出家人,最終記憶穩步惡化。該疾病一般開始于中年或者老年時期,可能是由神經元和周圍蛋白質的積累而引發的,與神經細胞突觸功能障礙、腦部萎縮、腦神經元細胞死亡有關[1]。有研究人員稱,由AD所引起的腦部相關變化有可能早于出現AD癥狀至少20年[2]。
按照發病過程情況,可將AD分為:正常對照組NC(Normal Controls)、主觀記憶抱怨SMC(Subjective Memory Complaints)、輕度認知功能障礙早期EMCI(Early Mild Cognitive Impairment)、輕度認知功能障礙晚期LMCI(Late Mild Cognitive Impairment)和AD。其中,對于早期的AD患者,被稱為輕度認知障礙階段MCI(Mild Cognitive Impairment)。這一階段被認為是從健康者到AD患者的過渡。統計顯示,患有MCI的65周歲及以上的人員中,有近40%的患者會在接下來的5年內發展成為AD患者[1]。
目前關于該疾病的發病原因還有待明確,同時由于AD的病情多樣化,這給疾病的預防、診斷和治療造成了非常大的困難。研究發現,從MCI到AD的年轉化率高達10%[3]。AD患者提早被確診難度大,且晚期患者治療效果不明顯,對AD進行早期分類研究具有重要臨床意義。
由臨床可知,AD的確切診斷需要依靠患者死亡后的腦組織檢查[4]。隨著計算機技術的不斷發展,計算機輔助AD早期診斷的分類研究成為可能。機器學習ML(Machine Learning)在醫學診斷中得到了廣泛應用,特別是近些年來,一些先進的腦部神經成像技術,如核磁共振成像技術MRI(Magnetic Resonance Imaging)、正電子發射斷層掃描技術PET(Positron Emission computed Tomography)等不斷發展成熟,一些高維度的更大規模的神經影像圖像為計算機輔助診斷CAD(Computer Aided Diagnosis)提供了更廣泛的素材,也極大地激發了廣大科研人員將此用于AD早期診斷的研究熱情,同時也為研究者開發更好的診斷模型提供了有力支持。
本文旨在綜述基于計算機輔助診斷技術的AD早期分類研究,把傳統機器學習和深度學習應用于AD的早期診斷中。計算機輔助AD檢測系統的典型框圖如圖1所示。

Figure 1 Block diagram of computer-aided AD classification system圖1 計算機輔助AD分類系統框圖
本文利用當下先進的復雜高維度腦部神經影像數據(如MRI、PET等)和其它有價值的生物學標記(聲音、腦電圖、腦磁圖、手寫字跡、身體、精神檢查、神經心理學測試)等,對AD早期階段MCI患者進行分類研究,對比采用不同生物學標記和不同分類方法的計算機輔助診斷研究,通過不同方式的分類方法,總結了近些年來將計算機輔助工具用于人腦醫學影像數據的AD早期診斷分類研究現狀,并提出了對未來AD研究方向的展望。
采用計算機輔助手段進行AD早期診斷的研究方法目前主要有傳統的機器學習方法和深度學習方法。前者在AD早期診斷方面已經有了十余年的發展歷程,有比較成熟的研究,研究者們采用不同的機器學習算法對AD進行分類研究。
深度學習作為機器學習的一個新的發展分支,在近些年取得了很大的發展,已被廣泛應用于語音識別、機器翻譯、自動駕駛和機器視覺等多領域。憑借深度學習更深層次的網絡模型,可提取到更加抽象的圖像特征,進而得到更高的分類準確率。在深度學習方法的有關研究中,特別是卷積神經網絡CNN(Convolutional Neural Networks)的使用,其分類結果已經被證明優于現有的機器學習方法[5]。
本文將從傳統機器學習和深度學習兩方面來描述基于計算機輔助診斷的AD早期分類研究。
使用傳統機器學習方法進行AD分類研究一般需經過以下步驟:(1)數據預處理;(2)特征提??;(3)特征選擇;(4)基于特征分類。
2.1.1 數據預處理
在獲取到醫學影像學數據等AD生物學標記后,需要對所獲得的數據進行預處理,主要的預處理環節包含了前連合AC (Anterior Commissure)和后連合PC(Posterior Commissure)對齊校正、顱骨分離、腦組織分割和配準等。AC-PC線用于基準線校正,防止因獲得的影像數據未確定AC-PC基準線而給后續實驗造成誤差。顱骨剝離,排除非腦部結構,減少不必要的干擾。顱骨剝離后,需對圖像不均勻部分進行校正。由于磁共振等影像采集設備的工作特點,所采集的影像中難免混雜有噪聲,濾除影像中的噪聲,對于實驗是非常必要的。圖2展示了不同預處理過程的分類情況。

Figure 2 Original image data preprocessing圖2 原始影像數據預處理
2.1.2 特征提取
特征提取是機器學習中模式識別和圖像處理過程中的常見應用。旨在從原始數據中除去因特征過多而產生過擬合問題的冗余部分,以便節省內存空間和提高計算能力,改善分類效果,同時也屬于降維過程。
特征提取重點針對所提取特征的大小、形狀和體積等要素來進行分類研究。AD早期診斷研究將主要涉及到海馬區、內嗅皮層結構等。常見的特征提取對象主要有以下幾種形式:(1)基于體積特征形式;(2)基于厚度特征形式;(3)基于形態特征形式;(4)基于紋理特征形式;(5)基于體素形態學分析形式。
(1)基于體積特征。
已有研究指出,有關海馬區在AD早期已出現萎縮,研究顯示約50%的AD患者存在海馬區萎縮[6]。因此,可將海馬體積作為AD診斷的生物標志物特征。
(2)基于厚度特征。
Lerch等[7]研究發現,AD患者相對于正常對照組NC的整個腦部皮質厚度有明顯差異,反映為大腦多部位的皮質厚度減小。已有的臨床研究發現,腦部萎縮引起的腦部體積變化是AD早期階段出現的一重要生物標記物。
(3)基于形態特征。
海馬區、內側顳葉萎縮所造成的腦部體積變化,已作為生物標記物特征用于AD早期檢測中。Gerardin等[8]在研究中發現,AD早期患者的腦部海馬區還未出現萎縮時就已經存在形態上的改變。以形態特征作為生物標記物特征用于AD早期診斷,表現更加敏感的特性。
(4)基于紋理特征分析。
紋理是一種視覺特征,反映影像或圖像的同質現象,體現物體表面緩慢變化或者呈現周期性變化的組織結構特征屬性。Freeborough等[9]采用紋理特征進行分類時發現,可以通過紋理質地分析得到AD患者和正常對照組(NC)之間顯著的差異。
(5)基于體素形態學分析。
體素(Volume Pixel)即體積元素,相對于二維空間的最小單位——像素,是數字數據于三維空間分割的最小單位。體素形態學分析VBM(Voxel-Based Morphometry)是基于體素單位針對MRI醫學影像的綜合、客觀和自動分析方法,能夠用來對活體人腦組織進行形態學方面的科學研究。通過VBM定量計算,分析MRI影像中不同體素所對應的腦灰質、白質密度和體積的相對變化,可用于AD早期診斷研究。Karas等[10]采用VBM技術進行AD研究時發現,AD患者和正常對照組存在GM(Grey Matter)體素形態學上的差異。
2.1.3 特征選擇
特征選擇指的是從一組特征中選擇出最有效的特征,以達到降低維度的目的,這是模式識別過程中的一個重要環節。特征選擇通過對腦部感興趣區域ROI(Region of Interest)進行分割獲取。根據實驗設定,可以將ROI定位為全腦區、海馬區、腦灰質(GM)、腦白質(WM)、腦脊液(CSF)和內側顳葉區等區域。在所有的腦部ROI中,大腦海馬區是最早受影響的區域之一[11],是AD病因學的重要解剖區域。Amoroso等[12]提出將雙側海馬的形狀和體積特征作為生物標記物用于AD早期分類研究。
2.1.4 基于分類算法
采用傳統機器學習手段用于AD早期診斷分類研究已不斷趨于系統化、成熟化。機器學習輔助手段用于AD早期分類的算法主要有以下幾類:(1)支持向量機SVM(Support Vector Machine);(2)Logistic回歸;(3)線性判別分析LDA(Linear Discriminant Analysis);(4)貝葉斯分類器;(5)隨機森林;(6)K近鄰KNN(K-Nearest Neighbor)等。
(1)支持向量機SVM。
支持向量機SVM是一類監督學習方式,是能對數據進行二分類的廣義線性分類器。決策邊界是樣本數據求解的最大超平面。在AD早期診斷分類研究中,SVM用于AD分類的頻率是最高的。Kim等[13]利用支持向量機提取特征后,再進行AD分類。
(2)Logistic回歸。
Logistic回歸又被稱為Logistic回歸分析,是一種廣義線性回歸分析模型,在醫學影像中多用于疾病診斷,常用于二分類研究。當學習訓練樣本量大時,可以取得較好的分類效果。Ieracitano等[14]采用Logistic回歸算法,基于單模態或多模態生物特征進行AD分類。
(3)線性判別分析(LDA)。
線性判別分析算法是對費舍爾的線性鑒別方法的歸納,其目的在于尋找2類失誤特征的線性組合來分類,常用于評估患者病情程度和對疾病的預測判斷等。當樣本數據較少時,也可取得較Logistic回歸更好的分類效果。Ahmad等[15]利用生物標記物模式和靜息狀態下的功能磁共振成像(FMRI),標記影響較大的海馬區(HP)、顳中回區(MTG)、內嗅皮層和后扣帶回PCC (Posterior Cingulate Cortex)等區域,再采用LDA對AD進行分類研究。
(4)貝葉斯分類器。
貝葉斯分類器,通過被分類對象的先驗概率,用貝葉斯公式計算得到被分類對象屬于某一類別屬性的最大概率值。該分類器擁有較小的分類錯誤率,常用于模式識別等領域。Yubraj等[16]提出將皮質厚度和皮質下體積作為生物學標記用于AD分類,使用主成分分析PCA(Principal Component Analysis)方法進行降維,并使用貝葉斯分類器進行分類研究。
(5)隨機森林。
隨機森林是一種融合多個決策樹算法的分類器,該分類器輸出由每一個決策樹輸出類別的眾數來確定。相對于決策樹算法有更高的準確率,且能處理更多的輸入數據。Dimitriadis等[17]在AD 分類研究中,提出使用隨機森林算法從特征集的子集選擇多個生物特征,融合這些生物標志物特征采用隨機森林算法進行分類。
(6)K近鄰(KNN)。
KNN算法屬于機器學習算法中較為簡單的一種,分類依據是樣本數據點特征空間中最近的K個樣本是否屬于某同一個類別。K近鄰算法常用于分類和回歸分析中。Farouk等[18]在結構核磁共振圖像(SMRI)中提取生物學標志物信息,融合灰度共生矩陣提取紋理特征和基于體素的形態學特征,采用KNN算法進行AD早期分類。
深度學習是機器學習方法的一種,屬于機器學習的子集。通過深層次的學習過程學習輸入數據特征,其結構類似于模仿人類大腦分析處理信息的神經網。自2006年以來,由于深度學習計算能力的不斷提高和數據量的不斷增大,深度學習已經得到了充分發展,特別是深度學習模型和算法的逐漸改進,其輸出準確率不斷刷新。得益于以上優勢,深度學習已廣泛應用于自然語言處理、無人駕駛、語音識別和機器視覺等各領域。用于AD分類的深度學習網絡模型主要有以下幾類:(1)LetNet-5;(2)AlexNet;(3)VGGNet(Visual Geometry Group Network);(4)GoogLeNet;(5)ResNet(Residual Network);(6)DenseNet(Dense convolutional Network);(7)3D-CNN(3D-Convolutional Neural Network)等。研究者利用這些網絡模型或者基于以上模型的改進模型進行AD分類研究。
2.2.1 神經網絡分類模型
(1)LetNet-5。
LeCun等[19]提出的卷積神經網絡(CNN)是第1個真正意義上的多層次結構學習模型,LetNet-5為卷積神經網絡(CNN)的一種經典框架,其結構如圖3所示。LetNet-5網絡模型共有包含輸入層在內的8層網絡構成,其中包含2個卷積層和2個下采樣層,屬于經典的CNN結構。Sarraf等[20]基于MRI影像,采用LeNet模型進行AD和NC的分類研究。LetNet-5能夠獲得原始圖像的有效表征,僅使用極少的預處理也能識別原始圖像規律,但鑒于其模型的特點,處理較大規模數據和復雜問題時結果欠理想。

Figure 3 LeNet-5 network model圖3 LeNet-5網絡模型
(2)AlexNet。
AlexNet是由Hinton和Krizhevsky等[21]在2012年提出的,該模型首次在CNN中成功應用了Dropout策略、ReLu函數和LRN(Local Response Normalization)層等,解決了深層神經網絡過擬合的問題,同時使用GPU進行加速運算操作,實現了在大規模圖像數據集上的深層卷積神經網絡結構。Afzal等[22]通過預訓練的AlexNet網絡模型,選取開放獲取系列成像研究數據集OASIS(the Open Access Series of Imaging Studies)數據集中199名受試者數據進行AD和NC的分類研究,分類準確率達到98.41%。
(3)VGG。
VGG模型是由牛津大學的Oxford Visual Geometry Group提出的,其通過增加網絡深度來提升網絡最終性能。它的2種結構VGG16和VGG19除了深度不同外,在本質上沒有太大區別。相比AlexNet而言,VGG采用連續的3*3卷積核代替11*11,7*7,5*5的較大卷積核,實現了增加網絡深度來學習更加復雜特征的同時減少模型參數的目的。Jain等[23]通過VGG-16網絡模型,采用MRI單模態影像進行NC、MCI和AD三分類研究,實驗數據來源于AD神經影像學計劃數據集ADNI,選取50個樣本用于實驗,其分類準確率能達到99.14%。
(4)GoogLeNet。
GoogLeNet是由Szegedy等[24]提出的,不同于AlexNet、VGG等網絡結構通過增加網絡層數來獲得好的訓練效果,GoogLeNet采用average pooling代替參數量大的全連接層,同時使用inception模塊來代替一般的卷積層,1*1卷積層的使用對模型降維和參數的減少起了重要作用。這些方法,提高了計算資源的利用率,使其能夠在計算量不變的情況下提取到更多的特征,訓練效果也得到提升。Sarraf等[20]分別基于MRI和FMRI模態影像數據,從ADNI數據集中分別獲取144例FMRI和302例MRI樣本數據,采用GoogLeNet網絡模型從大量訓練圖像中提取低層到高層特征,實驗訓練集和測試集占比為3∶1,GoogLeNet模型在FMRI影像下對AD和NC分類的平均準確率為94.24%。基于MRI影像的GoogLeNet和LeNet模型的分類平均準確率分別為98.74%和97.88%,GoogLeNet模型表現更優秀。
(5)ResNet。
殘差神經網絡ResNet于2015年被提出,它“簡單與實用”并存,一些研究方法也都建立在ResNet50或者ResNet101模型的基礎上,其在目標檢測、分類、分割和識別等領域都得到了廣泛的應用[25]。ResNet內部的殘差模塊使用了skip connection(跳躍連接)的殘差結構,加深了網絡層次,同時提高了網絡性能,消除了因網絡層次加深而出現的梯度爆炸、網絡無法收斂和網絡退化等問題。特點是易于優化,并且可通過增加一定的深度來提高準確率。Ji等[26,27]分別在單模態MRI和多模態MRI、FDG-PET影像下,基于ResNet網絡模型進行AD分類研究。
(6)DenseNet。
Huang等[28]提出了DenseNet模型,雖然其結構并不算復雜,但特征提取卻很高效。ResNet模型構建前面層和后面層的skip connection,有助于梯度反向傳播和訓練深層網絡;GoogLeNet構建了inception模塊,加大了模型寬度,實現了降維和多尺度再聚合。DenseNet模型不同于ResNet和GoogleNet模型,它建立前面所有層和后面層的密集連接(dense connection),并通過特征在channel上的連接實現特征重用(feature reuse),在計算成本和參數更少的情況下,得到了較ResNet網絡更優秀的性能。
(7)3D-CNN。
3D-CNN是在2D-CNN的基礎上改變而來的,是基于多場景中的多幅圖像,或者是在視頻連續幀之間的關聯信息背景下提出的[29]。其目的在于通過增加新維度(時間)信息,獲取圖像間的關聯信息,提取更具有表達性的特征,從而克服2D-CNN在捕捉時序信息上的缺陷。2D-CNN的卷積應用于2D特征圖,3D卷積通過對堆疊連續幀組成的立方圖進行3D卷積,使卷積層中的特征圖均與其上一層中多個幀相連,以獲取空間和時間維度特征。Kompanek等[30]使用3D-CNN基于MRI影像對NC和AD進行分類,采用體數據增強(Volumetric Data Augmentation)方法,提高分類準確率的同時也增強了網絡模型的泛化能力。
深度學習方法的優點使得其非常適合醫學影像的高維度和高復雜結構,其在醫學圖像上應用廣泛,如醫學圖像的分類與識別、定位與檢測、正常組織器官和病灶部位分割等。
本文所涉及到的文獻中有較多的是使用深度學習方法進行AD早期診斷研究,涉及不同神經網絡模型。本文將從所使用模態的角度出發進行綜述。
2.2.2 基于單模態深度學習方法
模態是指事物發生或存在的一種形式,可以是聲音、圖像和文字等信息。對于AD早期診斷的研究來說,可以是MRI、PET和SPECT等AD生物標記物。
將不同模態的生物標記物用于AD早期分類研究,是深度學習方法應用于生物醫學研究的主要任務之一。Barbaroux等[31]在探索AD分類任務時采用SCNN(Spherical CNN)模型對人腦皮質進行分析,SCNN通過定義同3D旋轉等邊的球形輸入上的卷積算子,使規則CNN從平面數據擴展為球形數據,實驗基于T1加權MRI影像的形態測量方法,其AD與NC的分類準確率可達92.16%,表明了使用SCNN模型直接應用于人腦皮質判別分析的可行性和優越性。
Kim等[32]基于FDG-PET影像數據,采用含GAP層的改進型深度學習方法,基于ADNI和來自于西弗蘭斯醫院核醫學部Severance dataset影像數據集進行實驗,在AD與NC的分類結果中分別獲得91.02%和86.09%的準確率。實驗應用切片選擇性學習來降低計算量,同時使用遷移學習和代替全連接層的GAP層,避免過擬合的同時提高了模型泛化能力。不同數據集上的實驗結果顯示了GAP層的性能同全連接層在模型準確性、敏感性、特異性方面具有統計學意義(p<0.01),同時也比較了不同數據集上模型在準確性、敏感性、特異性方面沒有統計學上的顯著差異(p>0.05)。
Bin 等[33]提出使用可分離卷積層構建的多個深層2D-CNN來學習腦局部的各種特征,基于OASIS橫斷面圖像數據集中SMRI影像進行AD分類研究,采用Xception和Inception version3結構作為遷移學習模型,實驗結果表明了該模型在AD分類中的性能優越性。
Suganthe等[34]提出建立深度卷積神經網絡DCNN和基于VGG-16的卷積神經網絡VCNN模型,利用ADNI數據庫的MRI影像對AD、NC、EMCI和LMCI 4個階段進行分類研究。通過改變卷積層數、卷積核大小和數量、dropout層、池化層等參數來對比模型分類結果,結果表明有7層卷積層的DCNN模型分類性能比4層卷積層的DCNN模型優秀得多,其中AD與LMCI的分類準確率達到93.76%。2個模型的對比實驗顯示了VCNN模型的準確率要高于DCNN模型的,但其可訓練參數量多于DCNN模型的。
2.2.3 基于多模態深度學習方法
多模態深度學習是相對于單模態而言的,指將多個單模態的信息用于深度學習方法中,以達到實現不同模態間的信息融合的目的。
很多研究者采用多模態數據用于AD早期分類研究。Huang等[35]基于海馬區TI加權核磁共振成像及FDG-PET影像下各種多模態特征信息,采用卷積神經網絡進行AD分類研究。獲得NC與PMCI、SMCI和PMCI、AD與NC的分類準確率分別為87.46%,76.90%和90.10%,結果表明結合多模態成像數據的分類結果優于單模態形式的。
Forouzannzhad等[36]結合正電子發射斷層掃描(PET)和核磁共振成像(MRI)多模態成像技術和標準神經心理學測試評分結果,采用深度神經網絡DNN(Deep Neural Networks)對AD早期診斷進行分類研究。對正常對照組NC與早期輕度認知障礙EMCI的分類準確率高達84.0%,對NC與晚期輕度認知障礙LMCI、CN與AD、EMCI與LMCI、EMCI與AD、LMCI與AD的分類準確率分別為84.1%,96.8%,69.5%,90.3%和80.2%,而單獨在MRI影像上,NC與EMCI的分類準確率僅為68.0%。研究表明多模態方法優于單模態影像分析。
Kang等[37]基于SMRI和擴散張量成像DTI(Diffusion Tensor Imaging)雙模態數據,構建VGG16模型的遷移學習方法,用于EMCI和NC的分類研究。數據來源于ADNI數據集,實驗采用多模態融合策略,將具有相同索引的切片合并成RGB切片,組成切片數據集輸入模型進行訓練,采用LASSO(Least Absolute Shrinkage and Selection Operator)算法提取與EMCI疾病相關部分特征,實驗獲得了94.2%的分類準確率,敏感度高達97.3%。實驗結果表明多模態數據可以為區分EMCI和NC提供更多更有用的信息,且從臨床角度驗證了DTI。圖像可作為EMCI的一個重要生物標志物。
Khvostikov等[38]通過對海馬感興趣區域進行SMRI和DTI成像模態的融合,并基于3D-CNN模型的AD分類算法,對比了單模態數據用于實驗的情況,在AD與MCI分類中,獲得了多模態情況下93.3%的準確率,相對于SMRI單模態情況下65.8%的準確率有較大優勢。實驗中為了平衡數據量大小不同的類,采用數據擴充方法進行數據增強,以消除不同大小的數據量對網絡訓練過程的影響。
AD的早期分類研究是一項復雜的任務,所需要的數據樣本的特點如下:(1)需要具備一定規模;(2)樣本需由專業醫生進行標注;(3)大量實驗數據和標注的獲得,往往需要大量的人力、物力。不同研究者所使用的數據樣本主要來源于以下數據集:(1)阿爾茲海默癥神經影像學計劃數據集(ADNI);(2)開放獲取系列成像研究數據集(OASIS);(3)澳大利亞成像、生物標記技術和生活方式研究數據集(AIBL);(4)阿爾茨海默病最小間隔共振成像數據集(MIRIAD);(5)其它合作性的醫學影像學數據。
ADNI創建于2003年,是到目前為止較為成功也是應用最多的針對AD的綜合研究數據集,它具有多中心、跨越多研究學科特點,主要研究人體腦部MRI神經影像、人腦PET影像、其他人體生物標記物如腦脊液(CSF)、血液生物標記物,同時還包含有人體遺傳學信息、臨床資料、神經心理學評估等信息。已招募來自于全球59個國家和地區的800名成年人作為受試者,年齡跨度在55~90周歲。為全球的AD研究提供了非常有價值的臨床醫學數據,ADNI已經成為研究人員采用的核心數據資源[39]。
OASIS數據集由2大類構成,分別是橫斷面數據集和縱向面數據集。橫斷面數據集涵蓋了416名年齡在18~96周歲受試者的MRI數據資源??v向面數據集涵蓋了150名年齡在60~96周歲的受試者的MRI數據資源,且每個受試者一般都有2次或2次以上間隔滿一年的掃描數據。目前,OASIS是僅次于ADNI的核心數據資源[40]。
AIBL提供了1 000名年齡在60周歲及以上的受試者有關基線人口統計學、診斷、認知功能、健康和生活方式等方面的調查統計信息。約25%的受試者參與了匹茲堡化合物(PiB PET)和MRI腦成像的淀粉樣蛋白PET成像掃描。AIBL對受試者進行超過18個月間隔的重復評估,能更充分地確定不同的生物標志物,并加強AD在認知參數和生活方式等因素參與下的預測性標準。AIBL在AD的科學研究中發揮著重要作用。
MIRIAD數據集受試者由輕度阿爾茲海默癥患者46人和正常對照組23人組成,包含了上述受試者一系列的縱向體積T1加權MRI掃描醫學影像圖像。以上這些影像均由同一位放射科技師采用相同掃描設備采集的相同序列的708次掃描結果組成。在這些圖像中,包含從基線起始的2周、6周、14周、26周、38周、52周、18個月和24個月不等的掃描間隔[41]。數據集包含了受試者關于性別、年齡和簡易精神狀態檢查得分等情況記錄。
一些研究人員傾向于使用本地數據集。如在研究AD等相關課題時,使用有些醫院的存檔數據或與醫院合作課題研究的就診者檢查數據。呂鴻蒙等[42]通過改進的AlexNet神經網絡模型,對阿爾茲海默癥進行多分類研究。為了研究出符合中國居民實際的分類診斷系統,除采用ADNI數據影像之外,還采用了首都醫科大學附屬北京天壇醫院提供的數據。
基于計算機輔助技術的AD分類研究,判斷其方法是否具有有效性、可靠性和普遍適用性,能否用于臨床輔助診斷,主要用以下幾個衡量標準來評價:(1)準確率(Accuracy);(2)敏感度(Sensitivity);(3)特異度(Specificity);(4)精確度(Precision);(5)ROC(Receiver Operating Characteristic curve)曲線下的面積AUC(Area Under Curve)。
準確率是在給定測試數據集上,分類器能正確分類的樣本數和總樣本數的比值,用ACC表示,反映了分類器準確分類出AD、MCI和NC的概率,通常其值越高,分類器性能越好;敏感度又稱真陽性率,表示所有真陽性(正例)能被正確檢測的概率,用TPR表示,通常其值越大,表示AD病例漏診就越少;特異度一般用TNR表示,又被稱為真陰性率,表示所有真陰性(負例)被正確檢測的概率,衡量分類器對真陰性的識別能力,在AD分類中體現分類器能準確分類出NC的能力,一般其值越大,表明正常人被誤診為AD的幾率就越??;精確度即PPV,指被分為真陽性(正例)的樣本實際為真陽性的比例;ROC曲線下的面積AUC是指以真陽性率(TPR)為縱坐標,假陽性率(FPR)為橫坐標所繪制圖形的曲線下面積,通常其值越大,分類器分類性能越好。表1列出了這些評價標準的數學表達式。

Table 1 Common evaluation criterias and their mathematical descriptions表1 常用評價標準及其數學描述
其中,TP(True Positive)表示預測為陽性,實際也為陽性的樣本數量;FP(False Positive)表示預測為陽性,實際不是陽性的樣本數量;FN(False Negative)表示預測為陰性,實際為陽性的樣本數量;TN(True Negative)表示預測為陰性,實際也為陰性的樣本數量。
將人工智能用于生物醫學研究會因使用不同來源的數據、不同的生物標記物而產生不同的研究結果;同樣,在數據來源相同的情況下,亦會因使用的算法不同而有不同的輸出。機器學習方法和深度學習方法均屬于人工智能范疇,且深度學習方法作為機器學習方法的一個新分支,運用到生物醫學研究中也會產生不同的研究結果。表2列出了不同模態的腦醫學影像及其功能和特點。
除表2列出的一些生物標記物外,還有其他形式的標記物,如彌散張量成像(DTI)、腦脊液(CSF)、視網膜圖像、腦電圖(EEG)、腦磁圖(MEG)和語音等。其中DTI是核磁共振成像的特殊形式,利用水分子的彌散各向異性成像,可用于腦白質纖維等研究,是一種描述大腦結構的新方法。
單一模態往往從某一個角度描述所要研究的對象,是在某一特定條件下獲得的關于研究對象的特征描述。深度學習受人腦神經細胞活動啟發,也貼近人類認識世界的形式,研究基于深度學習的多模態AD分類方法,賦予計算機處理“多視角”“多信息融合”、高復雜度、大數據量問題的能力。單一模態的影像在某一形態上巧妙地反映了AD病程不同階段的特征,在分類過程、特征提取上突出特異性;多模態融合方式,更能從結構和功能等不同角度表征多種形式的信息,往往可增強模型泛化能力,相對于單一模態而言,更具全面性,同時能起到良好的優勢互補作用。
傳統機器學習方法和深度學習方法使用不同的特征提取方式,往往有不同的分類效果。傳統機器學習通常會將問題分解為多個子問題逐個解決,最終結合所有子問題結果獲得最后結果;而深度學習提倡的是end-to-end(端到端)的模式,從輸出端得到預測結果,利用與真實結果相比得到的誤差進行反向傳播,再通過模型優化使誤差最小,并得到一個收斂的模型,從原始數據輸入到結果輸出,中間的神經網絡成為一個整體,省去了傳統機器學習每個子任務執行前復雜且耗時耗力的標注工作。
深度學習相對于傳統機器學習最大的優勢在于能夠自動提取特征,而傳統機器學習則需要利用特征工程人為對數據進行選擇。鑒于醫學影像的專業性和影像標注的復雜性等特點,深度學習采用原始的神經影像數據進行訓練并學習特征,在大規模、高維度醫學影像的計算機輔助診斷研究中得到了大量的關注[43]。在深度學習方法的有關研究中,特別是卷積神經網絡(CNN),其分類結果相對于傳統機器學習方法已經被證明更具優越性[5],且是未來研究的一個重要趨勢。

Table 2 Comparison of different modal biomarkers based on brain medical imaging表2 基于腦醫學影像的不同模態生物標記物對比
本文通過以下幾個方面對AD分類進行對比分析:(1)傳統機器學習方法和深度學習方法的AD分類對比;(2)單一模態情況下采用深度學習方法的AD分類對比;(3)多模態情況下,深度學習方法用于AD分類對比。
不同的研究方法往往會產生不同的分類結果,深度學習方法作為機器學習方法的一個新的分支,由于具有網絡層數多、能提取更深層特征信息、省去了一定的數據預處理工作、分類效果好等優點,近些年得到廣泛運用,表3對比了不同文獻的研究情況。其中部分處理訓練方式解釋為:雙樹復小波變換DTCWT(Dual Tree Complex;Wavelet Transform)+PCA+線性判別分析LDA(Linear Discriminant Analysis)+TSVM(Twin SVM);多元最小冗余最大相關性(MRMR)特征選擇算法+序列特征集合(SFC)算法+SVM;多任務深度學習MTDL(Multi-task deep learning)。
表4對比了傳統機器學習方法和深度學習方法的分類情況,對比發現,采用深度學習方法的分類準確率在整體上優于采用傳統機器學習方法的,尤其在AD與NC分類中;在選取具有相似數據量樣本的情況下,深度學習方法的分類準確率也優于傳統機器學習方法的,甚至超越了采用多模態的傳統機器學習方法,如Khan等[44]使用基于遷移學習的VGGNet-19網絡模型和Alam等[45]使用的DTCWT(雙樹復小波變換)方法的對比,前者對AD與NC的分類準確率高達99.36%,高于后者的準確率92.65%,且樣本量更少,表現出深度學習方法在特征提取上的相對優越性。
本節將對單獨采用結構型成像或功能性成像模態下,使用深度學習方法對AD分類情況研究。表5和表6對比了不同方法及其分類效果。其中,部分名詞解釋為:彌散張量成像DTI;多元最小冗余最大相關性(MRMR)特征選擇算法+序列特征集合(SFC)算法+SVM;奇異值分解技術(SVD)+核NNLS;韓國光州國家癡呆癥研究中心和相關癡呆癥數據集GARD;基于概率的集中模型PBEM(Probability-based ensemble model)。
通過表6可知,相同模態下取相似樣本量數據,會因使用的深度學習模型不同而產生分類準確率差異;如Jain等[22,44]均采用ADNI數據庫中的相同數量樣本,分別采用不同層數VGG網絡的模型,但得到的AD與NC的分類準確率不相同;Cui等[46,47]在實驗中,選取了數量相近的樣本,分別采用3D卷積和2D卷積模型進行分類,前者分類準確率高于后者超10%,反映出3D卷積模型用于3D影像的優勢,可以充分利用影像的3D立體信息,減少影像2D切片化帶來的特征損失。

Table 3 Comparison between traditional machine learning methods and deep learning methods表3 傳統機器學習方法和深度學習方法對比

Table 4 Classification results of traditional machine learning methods and deep learning methods表4 傳統機器學習方法和深度學習方法的分類結果 %

Table 5 Comparison of different deep learning methods based on single mode表5 單模態下基于深度學習的方法對比
與單獨采用結構型成像(SMRI)、功能性成像(PET、SPECT、FMRI等)單模態相對應,本節將充分結合不同模態影像,融合多特征信息,利用模態間互補特性,采用不同深度學習方法對AD分類進行對比分析,如表7和表8所示。其中,DMFNet表示深度多模型融合網絡。
表8對比了多模態下不同分類方法的AD分類情況,發現研究者多采用雙模態影像數據進行研究。在所有的分類中,對NC與MCI分類準確率普遍低于對AD與NC的分類準確率;采用相同模態的影像數據,不同的分類模型準確率差異較大;模態的選擇和分類方法以及樣本數量的差異都是最后分類準確率的影響因素,但分類方法更為關鍵;如Liu等[27]和Vu等[59]在相同模態下所獲取的AD與NC分類準確率幾乎相同,卻因使用的分類方法不同,使Liu等[25]能在受試樣本量少1/3的情況下獲取和Vu等[57]幾乎一樣的準確率。
對近些年文獻的研究發現,基于計算機輔助診斷技術的AD早期分類研究已經取得了前所未有的發展,利用人工智能手段進行生物醫學研究也逐步趨于成熟,采用傳統機器學習分類算法和深度學習方法進行AD分類的準確率不斷提高,但即便如此,也仍然存在一些問題,這對未來用于AD早期階段的研究帶來了挑戰。這些問題主要集中在構建數據集、數據處理、研究方向和模型推廣泛化能力等方面。面對以上這些問題,應充分做好迎接未來挑戰的準備。

Table 7 Comparison of different deep learning methods based on multi-mode表7 多模態下基于深度學習方法對比

Table 8 Classification results of different deep learning methods based on multi-mode表8 多模態下基于深度學習方法的分類結果 %
在數據集方面,依然存在數據集資源有限和部分數據缺失的情況。利用計算機輔助方法進行AD早期分類研究時,分類準確率在很大程度上取決于數據樣本量的大小和受試者不同模態的生物標記物是否缺失。小的樣本集在網絡訓練過程中,易出現過擬合現象,同時訓練集和測試集數據相互混雜、破壞相互獨立性等情況都會對最終分類準確率帶來負面影響。與單模態神經成像方法相比,多模態成像方法在分類上有明顯優勢,表現為時間和空間分辨率的提高,多樣化生物信息功能互補等。由于在最初采集受試者數據時,可能存在成像設備的限制、受試者人員關于隱私的要求、運行成本、受試者縱向數據研究的缺失等因素,并不能充分保證數據集包含滿足實驗和臨床需要的所有模態數據。時代發展的同時,醫學影像學也取得了很大的進步,是否可以在患者或是受試者進行影像采集時同時獲得獨立且具有互補性的多模態數據將是未來的一個挑戰。
在過去的十多年中,AD早期分類研究是眾多學者的研究重點。但是,未來的研究中,可以在分類研究的基礎上,把對AD早期診斷的分類轉化為對AD早期的預測,以早期預測為重點。這不僅是一種新的挑戰,對潛在AD早期患者進行必要的臨床治療干預、提高其生活質量和生存率也將具有重要的現實意義。
在模型的推廣和泛化能力等方面,依然存在著問題和挑戰。對于已經訓練好的模型,能否在其他新出現的患者數據上依然具有好的效果,這是一個需要面對的挑戰。可推廣性也同樣體現在所使用的數據集和實驗研究方案的可重復操作性上,盡可能地選擇公共的大型數據集,使用更加詳盡的數據處理方式和更優秀的分類算法,這對再現實驗、模型推廣、算法改進、提高科研成效等將產生強有力的推進作用。
某些疾病存在異質性,AD的發病機制較為復雜,不同個體發病機理多少存在一定差異。近些年來對于AD異質性的研究相對較少,本文所描述的有關傳統機器學習方法和深度學習方法對AD潛在的臨床病理亞型早期診斷的分類研究可能并不適用。Murray等[63]研究發現,基于體素的形態學研究表明,非典型AD的影像學特征和海馬備用亞型相同,這些非典型受試者存在頂葉萎縮現象,但海馬體體積比典型AD患者高。其中海馬體積保留現象的AD亞型可能占AD病例的25%,這將在一定程度上影響海馬體萎縮同認知能力下降之間的聯系。有關AD異質性的問題情況,不應被研究者所忽視。因此,在基于計算機輔助診斷技術進行AD早期分類的研究中,能夠針對AD異質性生物標記物開發和研究具有針對性和個性化的工具應該成為未來的一個研究方向和挑戰。
針對數據處理問題,基于ROI的研究需要加強。圖像感興趣目標區域或者對病灶的檢測是診斷的關鍵部分,加強對ROI的研究,可以提高檢測準確率或者減少臨床醫生的讀片時間。可以設法實現在全圖像空間中定位出ROI,再在感興趣區域進一步識別出特定病灶區;而影像在輸入網絡前,需要進行一系列標準化的預處理,這個過程并未實現完全的自動化。數據預處理能在模型訓練時加快收斂速度,且能提高模型性能,但是預處理的過程又太繁瑣,同時需要一定的專業背景知識,如何使用未處理的影像數據進行模型訓練并能取得良好的分類效果,是未來需要應對的挑戰。
在未來的研究中,應從多角度、多模態方式出發,綜合多方面特征來進行研究,尋找不同生物標記物的最佳組合。應不斷注重研究方法和所使用的模型,不斷優化模型參數,以構造最優模型。特別要注重研究用于臨床診斷的可行性和適用性,切實提高計算機輔助診斷技術在阿爾茲海默癥研究中的綜合意義。
本文回顧了近些年來基于計算機輔助診斷技術進行AD早期分類研究的情況。本文分析研究發現:在AD早期分類研究中,分類的準確率和敏感度對生物標記物的選擇有較高的依賴性。對于特征提取和ROI的分割,如海馬區、杏仁體、內側顳葉區、灰質和白質等,將這些區域作為特征提取對象區域將有助于提升AD早期分類效果。在采用計算機輔助診斷技術進行AD早期分類的研究中,神經影像學數據具有重要的研究意義。神經影像學數據MRI、PET和FMRI等屬于高維度圖像,含有空間結構或者時間序列信息,結構復雜,反映了受試者生理狀態和病灶區域的變化等情況?;趥鹘y機器學習或深度學習分析方法對影像圖數據進行AD分類研究,通過人工智能算法,最終實現輔助臨床診斷研究。在AD早期分類研究中,相對于單模態生物標記物,多模態生物標記物特征融合可以提供更高的分類準確率。將遷移學習用于深度學習方法中,能夠在一定程度上克服由于數據不足造成的過擬合問題;深度學習方法中,CNN的淺層中包含了圖像更一般的特征,該特征對諸多圖像分類任務有利,且應用轉移性好,在有限的數據樣本下,相對于無遷移學習方法的其他一般網絡模型,CNN具有更好的分類性能。關于AD早期診斷,各種方法和分類算法所得出的分類結果,最終還需要結合具有相應臨床經驗的醫生仔細嚴格的檢查和論證才能給出最后的確診結果,才能真正發揮好基于計算機輔助診斷技術用于AD早期分類的現實作用。