王中陽,信俊昌,汪新蕾,王之瓊,4 ,趙 越
1(東北大學 計算機科學與工程學院,沈陽 110169) 2(東北大學 醫學與生物信息工程學院,沈陽 110169) 3(遼寧省大數據管理與分析重點實驗室,沈陽 110169) 4(沈陽東軟智能醫療科技研究院有限公司,沈陽 110179)
阿爾茨海默病(Alzheimer′s Disease,AD)是繼心臟病、腫瘤和腦血管疾病之后一種老年人較多發的疾病[1].有研究表明了AD患者大腦網絡的功能和結構可以利用靜息態核磁共振(Resting-state functional Magnetic Resonance Imaging,rs-fMRI)研究,并且研究結果顯示患者的腦功能網絡連接發生了改變.這些研究主要是通過一定的腦模板將患者的大腦分成多個感興趣區域(Region of Interest,ROI),并計算這些ROI間的血氧飽和依賴信號(Blood Oxygen Level Dependent,BOLD)信號相關系數來建立一個功能網絡.而后利用圖論的方法實現這個功能網絡的拓撲特征分析[2,3].這些研究認為腦功能網絡揭示了不同大腦區域間功能的傳遞,可以為AD的研究提供新的視角.在此基礎上,已有研究將網絡拓撲特征與機器學習方法相結合,以實現AD的計算機輔助診斷.
而現階段BOLD信號相關性的計算通常是基于濾波去噪后的全頻信號計算的.在通常的研究中把這個范圍保留在0.01 Hz-0.1 Hz之間,然而這個頻率范圍較為寬泛[4-6].而Achard等人[4]利用離散小波變換應用于fMRI時間序列,分析發現,在0.007-0.45Hz的頻率范圍內,不同的大腦功能網絡的“小世界”屬性都有著顯著的不同[5].研究發現利用分頻的方式建立不同下的腦功能網絡,可以實現對大腦功能網絡結構特征的多樣化描述,并且這種多頻段的利用可以提高AD分類的準確性[6].
因此,本文提出了基于多頻體網絡融合模型的AD患者與健康對照組(Healthy Control,HC)間的分類研究.通過建立大腦多頻段的體素級網絡模型結構,并將計算得到的不同頻段下的拓撲特征進行整合,并將整合后的特征用于機器學習方法進行分類.首先,對數據進行預處理,對于每一個受試者,保留0.01-0.2Hz信號;其次將離散小波變換用于fMRI時間序列,得到體素在不同頻域下的信號,而后計算信號的相關性得到不同頻段下的相關性矩陣;接著,通過圖論方法計算所有矩陣的特征;最后將這些特征進行選擇與整合,并將其用于支持向量機(Support Vector Machine,SVM)來實現不同患者的分類研究.通過ADNI(Alzheimer′s Disease Neuroimaging Initiative)數據庫中獲取的數據進行實驗驗證結果了所提出方法的效率和有效性.
本文的主要貢獻如下:
1) 將腦功能網絡的規模從腦區級變為體素級,將小規模的腦網絡分析轉變為大規模的腦網絡分析充分利用了全腦體素的特征信息;
2) 提出了一種多頻段的網絡模型,考慮了腦功能網絡特征在不同頻段下的變化;
3) 通過整合不同頻段下體素的拓撲特征變化,實現了阿茲海默癥患者與正常對照組間的分類.
在腦功能網絡分析中,2005年,Salvador等人[7]通過一個先驗的腦圖譜(Anatomical Automatic Labeling,AAL)將大腦分成 90 個區域,首次構建了靜息狀態下正常被試的大腦功能網絡.
而后在利用腦區信息進行換分的腦功能網絡研究受到了很大的關注,如Wang等人[8]采用圖論分析和統計分析的方式研究了檳郎成癮者、煙酒成癮者與健康人群間的腦功能網絡差異.而隨著神經影像技術的最新進展,腦功能網絡的規模也在不斷增加,研究從較大的腦區發展到了體素級.網絡中定義的節點數量隨著腦功能網絡尺度的定義從幾十發展到了幾萬.如Zweerings等人[9]從體素級的角度分了抑郁癥患者的腦功能我拿過來差異,發現患者聽覺皮層和丘腦以及后扣帶回之間的連接減弱.Lusher等人[10]構建了一種快速生成高分辨率腦連接性圖的新方法,降低了體素級網絡構建的難度,使得建立具有幾百萬節點的腦網絡成為了可能.
研究中發現隨著功能網絡尺度的逐漸增大,腦功能網絡中表現出來的特性也越來越豐富,這些特性為人類腦功能網絡中新的連接模式研究提供了更多支撐.
當腦疾病產生后,這些拓撲屬性會產生哪些變化,以及網絡拓撲結構的變化能否為神經疾病的診斷提供新的參考等已經成為了腦功能網絡在疾病中研究中的重要內容.計算機輔助診斷(Computer-aided Diagnosis,CADx)方法[11]為腦功能網絡拓撲結構的變化提供了新的方式.該方法通常利用機器學習算法分類.將單個腦區的功能拓撲特征或者腦區間的相關性特征作為分類特征.如Zhu等人[12]提出了一種新的非負判別功能連接性選擇方法,以提取精神分裂癥患者與健康對照者之間腦功能連接性的變化,實現了精神障礙患者的分類.Yang等人[13]認為如果將多個時間點數據添加到腦成像應用中,可以更好地揭示縱向分析中的疾病進展模式.因此提出了一種基于多任務學習的功能認知障礙縱向分類方法.可見基于腦功能網絡的CADx方法有著一定的使用價值和研究價值.
對獲取到的fMRI數據使用統計參數映射軟件包(Statistical Parametric Mapping Software Package,SPM12)[14].進行時間片校正和頭動校正來完成預處理.首先,對每個樣本中的序列圖進行掃描層間采集時間延遲的校正,使一個TR中各層的獲取時間相同.而后進行頭動校正,消除頭部不由自主的輕微運動帶來的影響.接著對BOLD信號進行濾波處理,在盡可能降低干擾的同時保留較多的信息,因此,保留0.01-0.2Hz內的信號作為有效信號.
在以往的網絡模型建立中,通常利用BOLD時域信號間的相似性,然而由于已知的研究中不同頻段下的BOLD信號有著明顯的差異.因此本文利用多頻段網絡模型來實現更加有效的腦功能網絡的連接模式描述[15].
利用離散小波變換將預處理后的BOLD信號逐層分解[16].將這些rs-fMRI圖像經小波變換后得到的不同頻段下的信號x1,H[n],x2,H[n],…,xK,H[n],也就是對fMRI 圖像進行分頻段處理所產生的一組每個頻段下所有腦區的信號頻域圖,記為:
φ={x1,H[n],x2,H[n],…,xK,H[n]}={φ1,φ2,…,φK}
(1)
φ中的每個矩陣描述了一幅圖像在不同的區域間信號的功能連接.其中,將rs-fMRI圖像小波變換產生的第m個的結果為:
(2)
根據每個rs-fMRI圖像在第m個上得到的分頻結果,對分頻得到圖像的各個節點之間的匹配關系進行計算,確定在該下的腦網絡中邊的表示,采用互信息的方法來計算各個節點之間的相關關系,即:
(3)
其中,p(x,y)是圖像φ中X和Y兩個節點產生的序列的聯合概率分布函數,而p(x)和p(y)分別是節點X和Y產生的序列的邊緣概率分布函數.
同時可以將式(3)等價表示為兩個序列的熵的形式,即:
M(X,Y)=H(X,Y)-H(X|Y)-H(Y|X)
(4)
其中,H(X,Y)為X,Y兩個序列的聯合熵,H(X|Y)和H(Y|X)為條件熵.
通過上式計算出任意兩個節點序列之間的互信息值后,設定閾值k來判斷兩個節點之間的匹配關系,建立每個下的腦功能網絡.因此圖像中每兩個節點之間的關系有著多個的描述,即得到的腦網絡中任意兩個節點之間存在著多條邊,因此構成了一個可以描述多頻信息的多頻腦網絡.
對于每一個受試者,利用腦連接工具箱(Brain Connectivity Toolbox,BCT)計算不同下的拓撲特征[17].這些特征包含兩部分,分別是圖像的全局特征和局部特征[18].其分類情況如表1所示.

表1 腦網絡全局特征和局部特征Table 1 Global and local features of brain networks
特征提取后得到的特征模型中可能存在某些特征受其他特征制約的現象.因此,通過特征選擇算法從已提取的特征中選出較優的組合來提升分類的效果.由于每一個受試者用于機器學習的特征向量中包含了多個網絡下的多個特征,因此需要能處理較大維度特征的特征選擇方法.
在多頻網絡模型中,利用Khazaee等人[18]采用的Filter 和wrapper用于特征的選擇,首先,利用特征選擇Filter算法,即fisher算法,根據個體識別能力對所有特征進行分類.然后選取識別能力最強的前一半特征,并應用wrapper特征選擇算法對其進行識別.采用前序特征選擇法和10折交叉驗證實現了wrapper算法.
而后然后通過K個下特征的線性組合來整合出一個多特征向量,即
(5)

本實驗基于MATLAB R2017b進行,實現fMRI圖像的預處理及AAL模板匹配、多頻腦網絡的構建以及AD分類準確率參數分析等,通過實驗驗證了提出方法的準確性和有效性.

表2 ADNI數據集詳情Table 2 Details of ADNI data set
實驗數據來自ADNI數據庫,共獲取了184例靜息態功能性磁共振數據樣本,其中包含92例AD病人數據和92例正常對照組(Normal control)數據.數據詳情如表2所示.

表3 實驗參數取值Table 3 Values of experimental parameters
在實驗中通過與未分頻網絡模型進行對比來驗證算法的有效性.實驗參數如表3所示,表中加黑參數為實驗中的最優參數.每次實驗只改變表中一種參數.
實驗中對比了分頻與未分頻的網絡模型,并且為了對比體素級腦網絡與腦區級的差異,將每個受試者的采集數據匹配到了AAL腦模板上,同時根據數據分析,從每個fMRI數據中提取了15000個體素點作為對比.對比結果如表4所示:

表4 模型對比結果Table 4 Classification performance of proposed methods
如表4所示,所提出的分頻模型的分類性能比未分頻模型好得多.體素級多頻腦功能網絡的分類準確率為85.5%,而對比的未分頻體素級腦功能網絡的分類準確率分別為73.4%.結果表明,所提出的腦網絡分頻模型在計算腦網絡相似度時能取得較好的結果,從而能更好地輔助AD患者的診斷.
此外,通過實驗可知,未分頻模型的AUC值為0.69,而所提出模型的AUC值為0.82,也說明了所提方法在輔助診斷阿爾茨海默病中的準確性和有效性.
為了驗證提出方法中將rs-fMRI圖像分所產生的最優結果,分別將rs-fMRI圖像分成1-9個用于腦網絡分類的計算(1為未分頻),并分別將不同個數得到的模型用于SVM分類器中進行AD和NC的分類,圖1表示不同個數對分類準確性的影響.

圖1 分頻數量對分類準確率的影響Fig.1 Classification accuracy of frequency bands
如圖1所示,在選擇其他參數的最佳值的前提下,當頻段數為5時,AD的診斷準確率最高,分類準確率為85.5%.當頻段數為4時,分類準確率略小于最高值,為83%.
k表示構建多頻腦網絡過程中比較互信息值時的閾值,為了評價這個參數對分類性能的影響,分別使用不同的參數值來計算分類精度.已知研究中通常的連接密度在[20%,70%]時分類效果最好,因此設置閾值k=[0.2-0.7]的連接網絡來獲取多頻腦網絡.其結果如圖2所示.

圖2 網絡連接密度對分類準確率的影響Fig.2 Classification accuracy of network density coefficient k
可知,k取0.4時診斷結果最優.
由上述實驗可知,最優的分頻數量為5.目前已有的的研究證明了腦功能的網絡中存在著小世界屬性,因此需要討論獲取的5個頻段下是否存在屬性的變化[19].

表5 不同頻段下正常人群的小世界屬性Table 5 Small world properties under different frequency bands of HC

表6 不同頻段下AD患者的小世界屬性Table 6 Small world properties under different frequency bands of AD
本文使用了Khazaee等[17]提出的局部特征和全局特征等多種圖特征結果如表7所示.

表7 分頻模型在不同特征下的準確率Table 7 Accuracy of multiband under different features
實驗中,每個局部特征包含多個值,全局特征包含一個值.通過特征的選擇,可以看到不同的特征對分類的準確性有較大的影響.利用上述參數對每一組特征測試分類的性能.在每個分類中,除了只使用一個圖度量作為特征集外,算法的所有步驟都被執行.特征集包含5個頻段的特征.為了考察分類能力,每次僅使用一種圖尺度進行分類.由表5中可知局部特征略優于全局特征,而局部和全局特征的組合經過選擇可以達到最優的組合.
為了研究圖特征對分類準確性的影響,每次利用一個特征分析其分類準確性,如表7所示中.采用Betweenness centrality時,腦區級分類準確度為77.3%,腦區級為78.7%.其次是Pagerank centrality,腦區級分類準確度為76.2%,腦區級為78.2%,這兩種特征達到了單一特征的最高值.分類的準確與否是特征的重要度量指標.一個網絡特征的分類性能代表了網絡的節點與其他具有相似程度的節點連接的趨勢.雖然沒有一個單獨的特征在分類中達到較高的準確性,但所有特征的集合提供了85.5%的準確度.這一結果表明,單獨使用一個圖特征可能不足以描述腦網絡變化的各個方面.
實驗結果表明,網絡的中心度特征(Betweenness centrality,Pagerank centrality等)在作為單個特征進行識別時,取得了最佳的性能.AD患者的Betweenness centrality或Pagerank centralityd等特征表現出腦功能網絡的中心性發生了顯著變化.而由于阿爾茲海默患者腦功能網絡變化的復雜性使得需要利用多個特征來實現網絡的全方位描述.
現有的腦功能網絡基于時域信號匹配,忽略了不同頻段下腦信號的差異.本文從多頻段融合的角度構建了體素級腦功能網絡,充分考慮了不同頻段下的頻域信息以及腦區內部信息.腦網絡的局部拓撲結構證明,分頻下的腦功能網絡特征與未分頻網絡相比能在一定程度上提高分類的準確性.并且體素級腦網絡由于有著更高的維度,更多的特征以及更多的腦區內傳遞結構也有著更好的分類效果.