崔會芳,周夢妮,王 彬,相 潔,曹 銳,閻鵬飛
(太原理工大學 計算機科學與技術學院,山西 晉中 030600)
輕度認知障礙(mild cognitive impairment,MCI)是指有輕度的記憶和認知損害,但尚未達到癡呆狀態,是正常衰老和阿爾茲海默癥(Alzheimer's disease,AD)之間的過渡狀態[1]。已有研究表明,每年大約有10%~15%的MCI患者轉化成AD患者,而正常老年人的轉化率大約為1%~2%[2].因此,準確診斷MCI對盡可能早治療和推遲疾病的惡化非常重要。
MCI的傳統研究及診斷方法主要包括:量表檢查、認知測驗、神經影像學檢查、生物學標記物檢查等,這些檢查方法在實現過程中存在較多不足。目前,機器學習方法結合功能磁共振影像(functional magnetic resonance imaging,fMRI)數據分析的研究方法已廣泛應用于MCI診斷中。梁紅等人計算了無向腦功能網絡的節點屬性,并將異常的屬性值作為分類特征,運用支持向量機(support vector machine,SVM)算法,對正常人(normal control,NC)、早期輕度認知障礙(early mild cognitive impairment,EMCI)和晚期輕度認知障礙(late mild cognitive impairment,LMCI)進行了分類研究[3]。接標等提出了一種新型圖核并應用于MCI分類中,使用SVM分類方法對NC,MCI,EMCI和LMCI進行分類研究[4]。郭圣文等提取大腦皮層形態結構特征并選擇重要特征,使用SVM對NC、穩定型MCI患者 、轉化型MCI患者進行分類研究,得到了較好的分類效果[5]。邁阿密大學的MOHAMMED et al建立了被試的結合MRI體積和神經心理學評分信息的模型,并從中提取特征,使用線性判別分析分類器對NC,EMCI,LMCI,AD四組被試進行了分類研究[6]。印第安納大學醫學院的TRZEPACZ et al使用海馬體積、年齡、受教育程度等信息作為特征對NC,EMCI,LMCI,AD進行了分類研究[7]。北卡羅來納大學教堂山分校的CHEN et al構建了基于灰質和白質的腦區功能連接,并提取特征進行特征選擇,對NC和MCI進行了分類研究[8]。
無向腦網絡通過構建腦功能區域間的功能連接來探究特定腦功能區域間交互作用。盡管如此,功能連接從某種程度上說只可以反映出交互作用的腦區,而有效連接卻可以反映出交互腦區間的信息流向與強度。因此,通過有效連接構建有向腦網絡能夠更好地了解大腦皮層腦區間的交互模式。目前,格蘭杰因果分析(granger causality analysis,GCA)被廣泛應用于有向功能連通性分析中[9]。該方法在分析腦功能網絡時不需要任何先驗知識,強調腦區間相互作用的時間順序,能夠直觀地反映腦區或神經元之間的信息傳遞的方向性。盡管如此,有向腦網絡拓撲屬性分析在MCI分類中應用較少,伊朗的KHAZAEE et al根據有向腦網絡拓撲屬性對NC,MCI,AD進行了分類研究,并取得了較好的分類效果[10]。目前,還沒有依據有向網絡拓撲屬性對NC,EMCI,LMCI進行分類的研究。
本研究在靜息態fMRI數據上運用GCA方法構建了NC,EMCI,LMCI的有向腦網絡,并計算了網絡拓撲屬性。在特征選擇部分,使用雙樣本t檢驗篩選出組間差異顯著的拓撲屬性作為特征;在分類部分,使用SVM算法在3組被試中進行兩兩分類研究以此來輔助MCI的診斷;最后還對3組被試進行了單因素三水平的方差分析,進而確定了MCI在早期和晚期形成過程中具有顯著性差異的腦區。該研究的結果為MCI的早期和晚期診斷提供了新的視角。
本研究采用的靜息態fMRI數據來源于阿爾茨海默癥神經影像計劃(Alzheimer's disease neuroimaging initiative,ADNI)數據庫(http://adni.loni.ucla.edu/).該數據庫旨在通過分析各種醫學成像數據來研究老年癡呆疾病的發病機理及預防治療手段,此數據得到研究者廣泛使用。其中包括33例EMCI被試,32例LMCI被試以及30例NC被試。被試的年齡、性別、MMSE評分、CDR評分如表1所示。組間單因素方差分析結果顯示三組被試在年齡、性別上無顯著差異,MMSE,CDR評分有顯著差異。

表1 被試基本信息Table 1 Basic information of participants
在對靜息態fMRI數據的采集過程中,被試均被要求閉眼靜躺在磁共振掃描儀中。數據采集使用飛利浦(3T)MR掃描儀,掃描參數:slice thickness=3.3 mm;echo time (tE)=30 ms;repetition time(tR)=3 000 ms;48 slices.
本研究對采集到的靜息態fMRI數據進行了以下分析步驟:數據的預處理,提取時間序列,對時間序列進行GCA分析以構建有向腦網絡。
數據預處理主要使用了DPARSF(data processing assistant for resting-state fMRI)工具箱[11]。首先,去除被試所采集數據的前10個時間點;然后進行時間校正和頭動校正,剔除水平頭動大于1 mm或者轉動大于1°的被試;接下來的正規化操作將圖像映射到3 mm體素的MNI標準空間,并去除線性漂移;然后進行了空間高斯平滑,頻率為0.01~0.08 Hz的低頻濾波,以降低低頻漂移以及生物噪音;最后去除了白質和腦脊液等協變量。
對預處理完的fMRI數據,采用神經影像學研究中廣泛使用的自動化解剖學標簽(anatomical automatic labeling,AAL)模板[12],將全腦體素分割為90個感興趣的區域(region of interest,ROI),其中左右半腦各45個。接著對AAL模板中的90個腦區提取時間序列,以方便進一步的有向腦網絡構建,每個腦區被視為腦網絡中的一個結點。
對90個腦區的時間序列,通過GCA方法計算兩兩腦區之間的有效連接強度值,得到一個90×90的有向腦網絡連接矩陣。首先,使用REST(resting-state fMRI data analysis toolkit)工具箱(http://restfmri.net/forum/)[13]計算得到每對腦區間的多變量格蘭杰因果系數;接著,通過設置合理的自回歸模型階數,對90個腦區間的格蘭杰因果關系進行計算。任意兩個廣義平穩的時間序列(均值和方差不隨時間變化而變化)X和Y之間的格蘭杰因果關系可以通過自回歸模型來定義[14]:
(1)
(2)

在進一步的閾值化過程中,選取合適的閾值,將有向圖鄰接矩陣轉化為只包含0和1的布爾矩陣,并且設置對角線元素均為0以排除自回歸的影響[15-16]。在閾值化后,有向圖中可能存在一些孤立節點或子圖未連接到主圖中,使整個網絡無法形成一個連通圖,這給一些圖屬性(比如特征路徑長度)的計算帶來了困難[10]。為此,之后的添加邊操作將分離的子圖連接到了主圖當中,使整個網絡形成一個連通圖。但是,添加邊會使每個被試當中邊的數目不一致,因此在添加一條邊之前,在連通分支數不變的前提下,將主圖中權值最低的邊剪掉。即若有向圖中有n個連通分支,則先將主圖中權值最低的n條邊剪掉,再添加n條邊將n個連通分支連接到主圖中。
根據每個被試的有向腦網絡的鄰接矩陣,本研究計算了11種局部網絡特征,包括度(入度和出度)、介數中心性、局部效率、局部全局效率比、流系數、全局流路徑、K核中心性、PageRank中心性、節點強度等;10種全局網絡特征,包括同配性、聚類系數、全局效率、平均變化系數、傳遞性、特征路徑長度等。所以,每個被試共有90×11+10=1 000個網絡特征,均使用腦連接工具箱(brain connectivity toolbox,BCT)[17]計算。
基于局部特征和全局特征的計算產生了大量的原始特征。一方面,考慮到高維度的特征空間將增大模型的復雜度,而且會增大分類器訓練和測試的時間;另一方面,原始特征集中可能含有冗余或不相關的特征,這可能會降低分類器的性能。因此,在分類之前有必要進行特征選擇以降低特征空間維度。為此,我們使用了雙樣本t檢驗進行特征選擇[18-19],篩選出3個被試組間兩兩具有顯著性差異的特征用于分類。
隨后的分類過程使用SVM算法對NC,EMCI和LMCI進行分類。SVM分類器的主要思想是尋找一個超平面,使兩組類別不同的高維數據盡可能地遠離分類超平面。其分類準確率與預測精度均高于同類算法,如聚類分析、判別分析、神經網絡等方法。其特色在于通過核函數實現特征空間映射,有效地解決了分類中普遍存在的小樣本、非線性、高維數和局部極小點等問題[20-21]。
根據雙樣本t檢驗對NC,EMCI和LMCI進行兩兩比較分析,篩選出了p值小于0.05的特征用于進一步的分類,特征結果如表2—表4所示。

表2 NC vs EMCI特征選擇結果Table 2 Result of NC vs EMCI feature selection

表3 NC vs LMCI差異Table 3 NC vs LMCI feature selection

表4 EMCI vs LMCI差異Table 4 EMCI vs LMCI feature selection
基于特征選擇結果,使用SVM分類算法對NC和EMCI,NC和LMCI以及EMCI和LMCI三對被試組進行分類研究,結果如表5所示,NC vs EMCI,NC vs LMCI以及EMCI vs LMCI的分類準確率分別為88.24%,94.12%,81.25%,并且三組分類的靈敏度均達到了100%,可以發現NC vs LMCI的分類效果最好,準確率達到94.12%。受試者工作特征曲線(receiver operating characteristic,ROC)如圖1所示。

表5 SVM分類結果Table 5 Results for SVM classification between every pair of three groups

圖1 有向網屬性的分類ROC曲線Fig.1 Classification ROC curve of the directed network measures
對雙樣本t檢驗篩選出的組間有顯著差異的特征進行組間單因素三水平方差分析,尋找出比較過程中兩兩間均具有顯著性差異的網絡特征。結果顯示,在所有全局特征中,NC,EMCI和LMCI三組間均無明顯差異(p>0.05).局部特征中,顯著性差異(p<0.05)表現在顳葉區(顳中回、梭狀回、海馬旁回)、額葉區(三角部額下回、島蓋部額下回、中央旁小葉)、頂葉區(楔前葉、頂上回、緣上回)以及枕葉區(枕中回)。表6為具有顯著差異的全部腦區信息,從中可以看出,三組被試的右側顳中回腦區在出度、度、節點強度均表現出顯著差異,左側楔前葉在入度和K核中心性特征上表現出顯著差異,另外三組被試在前扣帶和旁扣帶腦回、豆狀蒼白球也表現出顯著差異。

表6 組間單因素方差分析差異腦區信息(p<0.05)Table 6 One-way ANOVA results:brain regions with significant difference on network features
如圖2所示,三組被試在局部特征入度、K核中心性、出度、PageRank中心性、流系數顯示差異的腦區信息,由于篇幅限制,未將全部局部特征差異腦區信息一一列出。

圖2 組間方差分析差異腦區信息差異Fig.2 One-way ANOVA results: brain regions with significant difference on network features
本研究運用有向腦網絡拓撲屬性對NC,EMCI和LMCI三組被試進行分類,與其他對MCI患者與正常人的分類研究相比,在沒有增加其他類型數據的情況下,實現了更好的分類效果。梁紅等計算了無向腦功能網絡的節點屬性,并將異常的屬性值作為分類特征,運用支持向量機算法,對NC,EMCI和LMCI進行了分類研究,實現了NC vs EMCI,NC vs LMCI,EMCI vs LMCI分類準確率分別為75.33%,83.79%,78.92%[3]。接標等使用一種新型圖核對NC和MCI以及EMCI和LMCI進行分類研究,得到的分類準確率分別為82.6%和67.7%[4].邁阿密大學的GORYAWALA et al使用被試的MRI體積和神經心理學評分信息,使用線性判別分析分類器實現了NC vs EMCI,NC vs LMCI, EMCI vs LMCI分類準確率分別為85.6%,90.8%,70.6%[6].印第安納大學醫學院的TRZEPACZ et al使用海馬體積、年齡、受教育程度等信息作為特征對NC,EMCI,LMCI及AD進行了分類研究,得到了對EMCI,LMCI的平均正確預測率分別為62.6%、72.7%[7].北卡羅來納大學教堂山分校的CHEN et al對NC和MCI進行了分類研究,得到了NC與MCI分類準確率為78.70%[8].本文研究的分類準確率分別為88.24%,94.12%,81.25%,并且三組分類的靈敏度均達到了100%.三組的分類效果均優于以上研究。其中NC和LMCI的分類效果最好,準確率達到94.12%,可能意味著在AD病理發展中,和正常老年人相比,LMCI患者大腦的網絡拓撲結構已經發生了較為顯著的改變。
單因素方差分析結果顯示,差異顯著的的許多腦區與之前MCI疾病研究發現的敏感腦區結果一致。在顳葉部分,NC,EMCI和LMCI三組被試的左右顳中回、左右梭狀回、左側海馬旁回在局部屬性上都表現出顯著差異(p<0.05),與之前MCI疾病許多相關研究發現一致[3-8]。KHAZAEE et al通過有向腦網絡拓撲屬性分析發現MCI患者的顳中回的多個局部屬性值均與正常對照組存在顯著差異,hub節點分析結果顯示左側海馬旁回是正常老年人腦網絡中的hub節點,但在MCI患者中缺失[10]。武政等人研究發現MCI患者的左右顳中回、右側梭狀回區域灰質體積發生了明顯改變[22]。
在額葉部分,三組被試的右側島蓋部額下回、左側三角部額下回、左側補充運動區、左側嗅皮質、左側中央旁小葉在局部屬性上表現出顯著差異(p<0.05)。梁紅等通過無向腦網絡拓撲屬性分析發現MCI患者右側島蓋部額下回的局部屬性與正常人相比有顯著差異[3]。接標等通過構建無向腦網絡的圖核發現MCI患者的左側三角部額下回、左側補充運動區、左側嗅皮質與正常對照組相比有顯著差異[4]。郭圣文等分析腦皮層特征發現MCI患者嗅皮質與正常對照組相比有顯著差異[5]。CHEN et al通過研究灰質、白質腦區間的動態功能連接發現MCI患者的島蓋部額下回、嗅皮質、中央旁小葉等腦區與其他腦區間的功能連接與正常對照組相比有顯著的差異[8]。KHAZAEE et al通過有向腦網絡拓撲屬性分析發現MCI患者的左側補充運動區與正常對照組存在顯著差異[10]。FRISONI et al研究指出在AD病變過程中,患者的感覺運動皮層功能逐漸缺失[23],BRIER et al,XIA et al研究也顯示AD患者感覺運動區發生了功能性改變[24-25]。武政等通過無向腦網絡拓撲屬性分析發現MCI患者的島蓋部額下回、三角部額下回、嗅皮質等腦區的局部屬性值與正常人相比有顯著差異[22]。
在枕葉部分,三組被試的左右枕中回在局部屬性上表現出顯著差異(p<0.05)。CHEN et al通過研究灰質、白質腦區間的動態功能連接發現MCI患者枕中回與其他腦區的功能連接發生了顯著改變[8]。
在頂葉部分,三組被試的左側頂上回、右側緣上回、左側楔前葉在局部屬性上表現出顯著差異(p<0.05).接標等人通過構建無向腦網絡的圖核發現MCI患者的左側頂上回與正常對照組相比有顯著差異[4]。GORYAWALA et al研究發現NC與LMCI患者左側頂上回皮質體積有顯著差異[6]。本研究中左側楔前葉在入度、K核中心性表現出組間顯著差異。CHEN et al通過研究灰質、白質腦區間的動態功能連接發現MCI患者楔前葉與其他腦區的功能連接發生了顯著改變[8]。PEREZ et al[26]研究指出在AD病變過程中左側楔前葉發生病變,可能與患者情景記憶被破壞有密切的聯系。武政等[22]通過無向腦網絡拓撲屬性分析發現MCI患者的頂上回、緣上回、楔前葉等腦區的局部屬性值與正常人相比有顯著差異。
此外本研究還發現了其他具有組間顯著差異的腦區,包括右側前扣帶和旁扣帶腦回[3,22]、左側豆狀殼核、右側豆狀蒼白球,這些差異與已有的研究結論較為一致。說明MCI患者的認知功能障礙并非由少數腦區受損導致,而是全腦多個腦區均有不同程度的損傷。使用有向腦網絡屬性進行分類實現了更好的分類效果,進一步證實了MCI的信息傳遞異常是有方向性的。這些發現都有可能成為MCI的生物學監測指標及評估病情嚴重程度的一個客觀依據。
本研究采用基于格蘭杰因果分析的方法,構建了NC,EMCI和LMCI三組被試的靜息態有向功能腦網絡,利用統計學方法對有向腦網絡拓撲屬性進行特征選擇,將具有顯著組間差異的屬性值作為分類特征,使用SVM機器學習算法對任意兩組被試進行了分類研究,實現了較好的分類效果。說明本研究的方法可以更準確地度量MCI患者腦網絡的拓撲結構變化,從而更好地輔助MCI的診斷,以便及早發現病情。