999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

用于阿爾茨海默病診斷的權值分布特征學習*

2019-05-20 06:56:24張道強
軟件學報 2019年4期
關鍵詞:模態分類特征

程 波,丁 毅,張道強

1(重慶三峽學院 智能信息處理與控制重點實驗室,重慶 404020)

2(南京航空航天大學 計算機科學與技術學院,江蘇 南京 210016)

阿爾茨海默病(Alzheimer’s disease,簡稱 AD),又稱為老年癡呆癥,是當前危害老年人健康的重要疾病之一.根據阿爾茨海默病的病理,盡早發現并治療能有效延緩疾病發展進程.在醫學上,通常將阿爾茨海默病的病程劃分成3個階段:首先是癥狀前AD,然后發展為輕度認知功能障礙(mild cognitive impairment,簡稱MCI),最后逐步發展成AD.因此,對早期阿爾茨海默病(MCI或者癥狀前AD階段)做出診斷將十分有助于治療或延緩AD的發展進程.近年來,基于機器學習的腦圖像分析方法與技術被越來越多地應用于早期阿爾茨海默病的診斷中[1-12].這些腦圖像通常有結構磁共振成像(magnetic resonance imaging,簡稱 MRI)、正電子發射型計算機斷層成像(positron emission tomography,簡稱PET)等等.除了腦圖像,生物標志物檢測對早期阿爾茨海默病的診斷也具有較高的靈敏度和特異性,其中,典型的生物標志物有腦脊液(cerebrospinal fluid,簡稱CSF)中的生化標記物水平檢測.研究認為,綜合使用腦圖像與生物標志物能夠有效提高早期阿爾茨海默病診斷的準確度與敏感度.所以,越來越多的多模態機器學習方法被應用于早期阿爾茨海默病的診斷中[4,5,7,9,11-16].

在醫學實踐中,收集大量腦圖像來訓練機器學習算法是一件費時且代價昂貴的任務.所以,通常情況下只有少量訓練樣本可以使用,但是,為了獲得較好的診斷性能,很多研究采用了多模態腦圖像與生物標志物來提高學習算法的性能[4,5,7,9,11,12,14,16],然而這樣又增加了特征維數.面對高維小樣本的多模態學習問題,大量研究設計了特征選擇來避免過學習[4,5,7,9,13].其中,有一些研究采用稀疏學習來設計多模態特征選擇模型.例如,Zhang等人[14]根據多模態腦圖像與生物標志物特征之間對 AD診斷具有互補性原理,提出一種多模態多任務學習方法,能從分類與回歸學習任務中學習出共同的最優特征子集;Jie等人[4]提出一種半監督多模態稀疏學習方法,可從標記和未標記的MRI與PET圖像上學習出共同的最優特征子集;Zhu等人[9]提出一種基于矩陣相似性度量的多任務學習方法,可同時從多模態多任務訓練集中學習出最優特征子集.此外,Ye等人[13]提出一種基于 Lasso(least absolute shrinkage and selection operator)模型的穩定特征選擇算法,可從串聯的多模態腦圖像與生物標志物上學習出穩定的最優特征子集.雖然以上研究都能獲得判別性較好的特征子集,并能完成較好的分類性能,但是這些研究并未深入挖掘多模態特征之間的數據分布信息.

在當前基于神經圖像的早期 AD診斷中,現存很多研究通過設計稀疏特征學習模型以獲取最優特征子集,其中有不少研究利用Lasso模型進行特征選擇[4,5,10,13,14,16],其原理是根據Lasso模型優化學到的權值進行特征篩選,大多數研究都是選擇非零權值對應的特征,而無法獲取多模態特征之間的數據分布信息.由于傳統 Lasso模型只包含權值的L1范數正則化項,而它通常用于選擇那些能降低分類器泛化誤差的特征,無法獲取多模態特征的數據分布信息.實際上,針對分類問題,Lasso模型中的權值可以理解為調整特征貢獻度的權重值,若對傳統Lasso模型進行改進,便可獲取特征的數據分布信息.此外,一些研究認為,多模態腦圖像與生物標志物特征之間對AD的診斷具有互補性[4,5,7,9,11,12,14,16].獲取多模態特征的數據分布信息,就是為了保持從多模態特征中選出的特征子集仍具有良好的互補性.

傳統支持向量機(support vector machine,簡稱SVM)以其優良的分類性能,被廣泛應用于基于神經圖像的早期AD診斷中[12,14,16,17],其核心思想是最大化“最小間隔”,以解決機器學習中“過學習”問題.然而現有一些研究表明,相比于最小間隔,“間隔分布”能夠更好地降低分類器的泛化誤差[18-20].因此,大間隔分布學習機(large margin distribution machine,簡稱LDM)受此啟發,提出通過同時最大化間隔均值并最小化間隔方差來優化間隔分布.另一方面,Lasso模型中的“權值”與SVM中的“間隔”對學習器的泛化性能起著相似的作用.此外,充分利用數據分布或變量分布先驗信息能夠有效提高學習算法的性能,比如Geng提出的標記分布學習[21]能夠解決除了單標記與多標記學習之外更多標記學習問題.因此,為了保持多模態特征之間的互補性,應充分利用多模態特征之間的分布信息.為了從多模態特征獲得泛化性能更好的特征子集,受大間隔分布學習[18-20]與標記分布學習[21]的共同啟發,對傳統 Lasso模型進行改進,通過增加同時最小化權值均值并最大化權值方差來優化權值分布,以獲取多模態特征之間的分布信息,提出了基于權值分布的 Lasso特征選擇模型(weight-distribution based Lasso,簡稱WDL).

此外,由于多模態腦圖像與生物標志物特征之間對AD診斷具有互補性,設計權值分布Lasso特征選擇方法就是為了使選出的最優特征子集不但具有良好的泛化性與可分性,還要盡量保持多模態特征之間的互補性.相比于支持向量機 SVM,大間隔分布學習機 LDM 能夠利用樣本數據分布的先驗信息,所以能夠更有效地利用多模態特征之間的互補性.因此,LDM 更適合基于多模態特征的早期 AD診斷.綜合以上研究動機,本文提出了基于權值分布的稀疏特征學習框架,由于該框架結合了WDL特征選擇模型和LDM分類器,因此將該分類學習模型表示為 WDL-LDM.為了驗證本文提出的學習框架用于早期阿爾茨海默病診斷的有效性,采用國際老年癡呆癥數據庫(Alzheimer’s disease neuroimaging initiative,簡稱ADNI)上的MRI、PET和CSF多模態特征數據,并與一些相關方法進行比較.實驗結果表明,WDL-LDM方法能夠有效地提高分類性能.

1 方法概述

為了獲得泛化性較好且分類精度較高的分類模型,本文根據 Lasso特征選擇模型以及大間隔分布學習模型,提出了基于權值分布稀疏特征學習的早期阿爾茨海默病診斷框架.圖 1給出了該學習框架用于早期阿爾茨海默病診斷流程圖.具體來說,使用該學習框架進行早期阿爾茨海默病診斷包括以下3個步驟.

(1) 首先,分別對采集的MRI和PET腦圖像進行預處理,其中,預處理方法采用文獻[12]中的方法.通過預處理,分別從MRI和PET圖像上提取了93維感興趣區域體積(volume)特征;

(2) 將提取的MRI、PET特征以及CSF檢測值串聯成183維的多模態特征矩陣X,再結合類別標記向量y,設計出基于權值分布的 Lasso特征選擇模型,用于從多模態特征中尋找最優特征子集以解決高維小樣本學習問題;

(3) 將第(2)步求解的最優特征子集訓練數據以及類別標記向量y輸入到大間隔分布分類器.

Fig.1 The system diagram of weight-distribution based sparse feature learning framework for early diagnosis of AD圖1 基于權值分布稀疏特征學習的早期阿爾茨海默病診斷框架示意圖

2 基于權值分布稀疏特征學習的早期AD診斷方法

2.1 腦圖像預處理

對來自ADNI數據庫上的MRI和PET腦圖像采用文獻[12]中的預處理方法進行預處理.具體過程為:首先采用N3算法[22]對所有圖像進行前連合與后連合校正,再使用BSE(brain extraction tool)工具包[23]將顱骨剝離,去除小腦.然后使用FSL工具[24]把MRI圖像分割成3個不同的組織:灰質、白質、腦脊髓液.然后使用HAMMER算法[25]對所有MRI和PET圖像進行配準,并標注出所有圖像的93個感興趣區域.接著,再計算每個被試者MRI圖像的93個感興趣區域的灰質體積(volume)值.而對PET圖像計算各個感興趣區域的圖像平均強度值.經過預處理后得到的特征是:來自MRI圖像的93個特征、來自PET圖像的93個特征和來自非圖像數據CSF的3個特征(分別是CSF Aβ42、CSFt-tau和CSFp-tau水平檢測值).

2.2 基于權值分布的Lasso特征學習模型

在基于機器學習的多模態阿爾茨海默病診斷領域里,通常面臨著高維小樣本學習問題.為了克服高維小樣本容易導致的“過學習”問題,本文采用權值L1范數來限制模型復雜性以獲得稀疏特征子集.另外,為了充分利用多模態腦圖像與生物標志物特征之間對AD診斷的互補性,本文通過獲取多模態特征的數據分布信息來加以實現.大間隔分布學習通過增加“間隔分布”正則化項,深入挖掘出支持向量機中間隔分布方面先驗信息,可有效降低支持向量機的泛化誤差.而傳統 Lasso模型中的權值與特征存在——對應關系,獲取多模態特征的數據分布信息,可以通過獲取權值分布信息來實現.綜合以上動機,本文提出基于權值分布的 Lasso特征學習模型 WDL.實際上,WDL就是在傳統Lasso模型中同時增加最小化權值均值與最大化權值方差正則化項.由于在本文中大間隔分布學習一方面作為引出基于權值分布的 Lasso特征學習模型的鋪墊,另一方面也直接作為分類的分類器,所以在第2.2.1節中將加以介紹.

2.2.1 大間隔分布學習機

在基于神經圖像的阿爾茨海默病輔助診斷領域里,大量研究采用支持向量機(SVM)作為分類器,且能獲得較好的分類性能,其核心思想是通過最大化“最小間隔”來優化模型復雜度,以獲得泛化誤差較小的分類模型.實際上,間隔理論不僅在支持向量機中起著重要作用,還可以用于解釋其他優秀學習算法的推廣性能,例如boosting集成學習[18].此外,根據間隔學習原理,近年來發展出代價敏感大間隔分布學習[20]與大間隔分布學習[19].其中的大間隔分布學習機(LDM)[19]是近年來發展起來的學習模型,該模型認為優化“間隔分布”比優化“最小間隔”更加重要,提出同時增加最大化間隔均值并最小化間隔方差正則化項,以降低分類器的泛化誤差.通過引入間隔分布正則化項,研究結果顯示,LDM能夠獲得優于SVM的分類性能與推廣性能[19].

給定一組訓練樣本集S={(x1,y1),(x2,y2),…,(xn,yn)},其中,n為訓練樣本的數量.為了解決線性不可分的問題,支持向量機 SVM需要將原始特征空間的任意一個訓練樣本xi通過φ映射到高維空間.此外,支持向量機是傳統的大間隔學習方法,核心思想是最大化“最小間隔”以降低分類器的泛化誤差.其中,支持向量機y=ωTφ(x)中樣本(xi,yi)的間隔定義為[26]

其中,最小間隔是所有訓練樣本中樣本間隔的最小值.

大間隔分布學習機LDM通過同時最大化間隔均值并最小化間隔方差來優化間隔分布,以進一步降低分類器的泛化誤差.那么最能表示間隔分布的統計量就是間隔均值和間隔方差了.為了方便公式表達和推導,設X=[φ(x1),φ(x2),… ,φ(xn)],y= [y1,y2,…,yn]T.這樣,根據式(1)則可以計算得到間隔均值與方差分別為

實際上,LDM就是在原SVM優化問題基礎之上增加了間隔均值和間隔方差正則化項,其形式化目標函數[19]為

其中,β1≥0和β2≥0分別是用于調節模型復雜度與間隔方差和間隔均值的正則化參數,懲罰參數C>0用于調節分類模型的誤差.式(3)的優化問題通過文獻[19]提出的平均隨機梯度下降(average stochastic gradient descent,簡稱ASGD)算法進行求解.

2.2.2 基于權值分布的Lasso特征選擇模型

為了從串聯的 183維多模態特征向量中尋找泛化性能更好的特征子集,并獲取特征分布信息以保持多模態特征之間的互補性,受大間隔分布學習啟發,本文提出了基于權值分布的 Lasso特征選擇模型.與傳統 Lasso特征選擇模型不同的是,基于權值分布的 Lasso模型增加了權值分布正則化項,亦即權值均值和權值方差.與大間隔分布學習不同的是,一方面通過最小化權值均值使優化的權值向量更稀疏,另一方面最大化權值方差可以使判別性好的特征具有較大權重,從而更有利于從高維小樣本上學習最優特征子集.

對式(4)目標函數的優化問題,可以采用近端梯度下降(PGD)法[27,28]進行求解.具體來說,式(4)的目標函數J(w)可以分成兩個部分:平滑可求導部分G(w)和不可求導部分H(w),它們分別為

則式(4)的目標函數J(w)又可表示為

由于H(w)不可導,因此不能采用傳統梯度下降法進行求解,但是根據文獻[27,28],可以采用式(4)目標函數的近鄰梯度來求解.由于G(w)可導,若G(w)梯度函數?G(w)滿足Lipschitz條件,即存在常數L>0,又根據泰勒公式對進行G(w)展開,使得式(4)目標函數J(w)在wk上基于近鄰梯度迭代的求解等式為

令wj表示w的第j個分量,其中,w的各分量互不影響,于是式(9)有閉式解:

3 實驗分析

3.1 ADNI數據庫

本文實驗數據均來自于國際阿爾茨海默病(ADNI)數據庫(http://adni.loni.usc.edu/).ADNI由國際老年研究所(National Institute on Aging,簡稱 NIA)、生物醫學成像和生物工程研究所(National Institute of Biomedical Imaging and Bioengineering,簡稱NIBIB)、美國食品和藥物管理局(Food and Drug Administration,簡稱FDA)、民營醫藥企業和非營利組織在 2003年啟動建立,其主要目標是測試能否通過組合 MRI、PET、其他生物標志物以及臨床神經心理學評估來測定MCI和早期AD的進展(progression).該數據庫包含的數據模態有:基于時間序列的MRI圖像數據、PET圖像數據以及其他類型生物標記值,例如:CSF,還包括一些臨床的神經心理學評估評分值,例如:簡易精神狀態檢查量表(mini-mental state examination,簡稱 MMSE)和老年癡呆癥評定量表(Alzheimer’s disease assessment scale-cognitive,簡稱ADAS-Cog).這些數據類別主要為:早期阿爾茨海默病患者(AD)、輕度認知障礙患者(MCI)和認知正常對照組(NC).ADNI數據庫的被試者從橫跨美國與加拿大50個網站招募而來.他們的最初目標是招募800個成年志愿者,年齡段是55歲~90歲;其中有200人是連續3年跟蹤測試認知正常的老人,有400人是連續3年跟蹤測試的輕度認知障礙患者,還有200人是連續2年跟蹤測試的阿爾茨海默病患者.這些被試者的個人基本信息可從ADNI官網上獲得.

本文同時選擇了具有MRI、PET和CSF模態的被試者樣本數據進行實驗,并只選擇這些被試者的基準時間點采集的數據.在國際阿爾茨海默病數據庫中,同時具有以上3個模態數據的被試者為202個,更多詳情請參考文獻[12].表1列出這些被試者的人口統計資料信息.

Table 1 Subject information (mean±std)表1 被試者樣本信息(均值±標準差)

3.2 實驗設置

為了測試分布學習模型性能,本文采用 10折交叉驗證策略來評價算法的分類性能.具體來說,將樣本集平均劃分成 10份,逐一地選擇其中 1份作為測試集,剩余 9份作為訓練集.計算這 10次實驗的平均精度(ACCuracy)、敏感度(SENsitivity)、特異度(SPEcificity)、受試者工作特征(receiver operating characteristic,簡稱ROC)曲線下面積(area under curve,簡稱AUC)值,以作為1次劃分的實驗結果.然后隨機地交換樣本排列順序,再進行1次10折交叉驗證的劃分,并計算平均精度、敏感度、特異度、AUC值.重復10次劃分,并計算這10次劃分的平均精度ACC、敏感度SEN、特異度SPE和AUC值.

另外,傳統支持向量機SVM以及其他需要采用支持向量機分類的比較方法,均采用LIBSVM(a Library for Support Vector Machine,簡稱LIBSVM)工具箱[29]仿真實現.其中,所有使用SVM分類的方法都采用線性核,其他參數均采用系統缺省值.在基于權值分布的 Lasso特征選擇步驟中,正則化參數λ1,λ2,λ3通過網格搜索方法進行優化,其搜索范圍為 0~1,步長為 0.01.在采用大間隔分布學習機進行分類的步驟中,采用文獻[19]中提出的大間隔分布學習機工具包(http://lamda.nju.edu.cn/code_LDM.ashx),參數β1,β2,C也通過網格搜索方法進行優化,其搜索范圍為 0~100,步長為 1.Lasso特征選擇模型采用 Zhou等人提出的 MALSAR工具包(http://www.yelab.net/software/MALSAR/),正則化參數同樣也通過網格搜索方法進行優化,其搜索范圍為 0~1,步長為 0.01.值得注意的是,本文所有方法的參數優化都是在訓練集上通過內嵌的10折交叉驗證優化得到的.此外,采用文獻[12]中的歸一化方法進行數據歸一化.

3.3 實驗結果

3.3.1 不同方法分類性能比較

為了驗證本文提出的分布學習模型(WDL-LDM)用于早期阿爾茨海默病診斷的性能,分別和與之相關性較強的4種分類方法進行比較.這4種分類方法分別是:傳統支持向量機(SVM)、大間隔分布分類機(LDM)、基于t-檢驗(t-test)的特征選擇方法結合支持向量機分類器以及基于Lasso特征選擇方法結合支持向量機分類器.表2給出了WDL-LDM方法與其他4種方法在串聯的多模態數據上分別分類AD/NC、MCI/NC、pMCI/sMCI的性能比較實驗結果.在表2中,SVM表示只采用SVM分類模型進行分類實驗;LDM表示只采用LDM分類模型進行分類實驗;t-test表示先采用 t-檢驗進行特征選擇,再使用 SVM 分類模型進行分類實驗;Lasso表示先采用Lasso模型進行特征選擇,再使用 SVM 分類模型進行分類實驗;SLasso-LDM 表示先采用文獻[30,31]提出的Lasso-path方法進行特征選擇,再使用LDM分類模型進行分類實驗.其中,表2中列出的所有實驗結果都是通過10次10折交叉驗證劃分的平均值.此外,為了進一步比較各種分類方法的性能,圖2繪制了表2中所有方法對應的ROC曲線.

Table 2 For three binary classification problems (AD/NC,MCI/NC,and pMCI/sMCI),our proposed method (WDL-LDM) compare with other state-of-the-art methods(SVM,Lasso,LDM,SLasso-LDM and t-test) using multimodal data表2 不同方法在多模態數據上分別分類AD/NC、MCI/NC、pMCI/sMCI的性能比較

表2和圖2的實驗結果表明,采用特征選擇步驟能夠改進分類模型診斷早期阿爾茨海默病的性能.其中,在AD/NC分類實驗中,采用本文提出的基于權值分布的Lasso(WDL)特征選擇方法能夠明顯提高僅采用LDM分類器的分類性能.然而,相比于僅采用SVM分類器,采用t-test和Lasso特征選擇方法只是輕微提高了分類精度、敏感度和特異度,而AUC值并未改變,這表明,采用以上兩種特征選擇方法不能有效改進分類模型的性能.其次,在 MCI/NC分類實驗中,采用特征選擇步驟能夠較明顯地改進分類模型的性能.其中,采用本文提出的 WDL特征選擇方法能夠顯著提高LDM分類器的分類性能;采用t-test和Lasso特征選擇方法也能改進一些SVM分類器的分類性能;而僅采用LDM分類器的性能不如僅采用SVM分類器的性能.最后,在pMCI/sMCI分類實驗中,采用特征選擇步驟能夠顯著改進分類模型的性能.其中,采用 t-test特征選擇方法只能輕微提高分類性能,然而分別采用WDL和Lasso特征選擇方法能夠顯著改進LDM與SVM分類器的分類性能;尤其是WDL特征選擇方法能夠十分顯著地改進LDM分類器性能;此外,僅采用LDM分類器的性能也明顯優于僅采用SVM分類器的性能.同時,為了進一步驗證 WDL-LDM 的性能,實驗中也采用文獻[30,31]提出的 Lasso-path方法來替換WDL-LDM中的WDL特征選擇方法,亦即表2中的SLasso-LDM方法;實驗結果顯示,在3組分類實驗中,WDL仍優于Lasso-path方法.綜合以上表2和圖2的實驗分析結果可以得出以下結論:本文提出的WDL特征選擇方法能夠有效地改進分類器性能,其中,對pMCI/sMCI分類性能的改進尤其顯著,并結合LDM分類器能夠完成較高的分類性能,因此本文提出的WDL-LDM方法能夠很好地應用于早期阿爾茨海默病的診斷.

Fig.2 ROC curves of different methods for three binary classification problems(AD/NC,MCI/NC,and pMCI/sMCI)圖2 不同方法在多模態數據上分別分類AD/NC、MCI/NC、pMCI/sMCI的ROC曲線

3.3.2 多模態與單模態數據上的分類性能比較

為了驗證本文提出的分布學習模型(WDL-LDM)在多模態與單模態數據上的分類性能,分別將多模態特征數據(MRI+PET+CSF,簡稱MPC)和單模態特征數據(MRI、PET、CSF)輸入到WDL-LDM.表3就是WDL-LDM方法分別運行在多模態特征和單模態特征數據上分類AD/NC、MCI/NC、pMCI/sMCI的實驗結果.為了更直觀、更全面地比較這些方法的差異性,圖3繪制了表3中所有方法對應的ROC曲線.表3和圖3的實驗結果表明,采用多模態特征數據能夠獲得更好的分類性能,這是因為,這些多模態特征數據之間存在互補性的診斷信息.這也說明,WDL-LDM方法能夠有效融合多模態特征數據.在3組都采用單模態特征數據的分類實驗中,采用MRI模態特征能夠獲得最好的分類性能,這表明,早期阿爾茨海默病患者在腦組織的結構形態上逐漸發生了萎縮.此外,除了使用MRI,采用PET或CSF模態特征也能獲得不錯的診斷性能,這說明,早期阿爾茨海默病患者不僅在腦組織結構上出現了變化,也在腦組織功能上出現了變化.然而,單獨使用某一種模態特征都無法獲得同時使用這些多模態特征的分類性能,這也再次驗證了 WDL-LDM 方法能從多模態特征中找到那些具有互補性的特征子集,從而避免多模態特征易引起的過學習問題,達到有效提高分類模型性能的目的.

Table 3 Comparison of performances that the WDL-LDM method performs on multimodal and single modality data表3 分布學習模型分別在多模態數據與單模態上分類性能的比較

Fig.3 ROC curves of the WDL-LDM method with multi-modality and single-modality data,respectively圖3 WDL-LDM分別在多模態數據與單模態上分類AD/NC、MCI/NC、pMCI/sMCI的ROC曲線

3.3.3 判別性腦區檢測

為了驗證本文提出的分布學習模型(WDL-LDM)用于特征選擇與排序的有效性,表4~表6列出了在3組分類實驗中 WDL方法選出的穩定特征子集,然后根據選出特征對應的平均權值進行了排序,最后為了驗證這個排序的準確性,表中列出了這些特征在不同分類實驗中的P值.表4~表6中穩定特征就是在10次10折交叉驗證實驗中都被 WDL方法選中的特征,這些特征具有很好的泛化性和判別性.類似地,平均權值也就是 10次 10折交叉驗證實驗權值的均值.本文提出的WDL特征選擇方法與傳統Lasso最大的區別就是可利用權值分布信息進行多模態特征選擇,這歸因于最小化權值向量均值與L1范數保證特征的稀疏性,同時最大化權值向量方差保持最優特征子集的有序性.表 4~表 6中根據權值進行的穩定特征排序與P值排序保持一致,這證實了 WDL方法進行最優特征子集排序的有效性.此外,在表4~表6中,從MRI模態上選出的穩定腦區特征均多于PET和CSF模態,這也表明,單獨MRI模態在早期阿爾茨海默病的診斷性能優于單獨采用PET或CSF模態.在表4~表6的3組分類實驗中,選出的穩定特征子集均包含了3個模態的特征,這驗證了多模態腦圖像與生物標志物特征對AD診斷具有互補性.表4~表6中還有一個值得注意的現象,就是除了那些P值小于0.05的特征被選出以外,還有一些P值大于0.05的特征也被選中,這表明,t-test方法采用P值進行特征選擇的局限性,也解釋了表2中WDL-LDM 方法分類性能明顯優于 t-test方法的原因.WDL方法選出的穩定腦區在其他相關文獻中都有報道[4,12-14,32,33],例如:hippocampal、amygdala、temporal lobe、precuneus、insula等等,這些腦區在醫學上被證實與早期阿爾茨海默病的診斷密切相關.

Table 4 Selected stable features ranking using the WDL-LDM method on AD/NC classification表4 在AD/NC分類實驗中WDL-LDM選出的穩定特征排序

Table 5 Selected stable features ranking using the WDL-LDM method on MCI/NC classification表5 在MCI /NC分類實驗中WDL-LDM選出的穩定特征排序

3.3.4 正則化參數對分類性能的影響

表2的實驗結果表明,增加WDL特征選擇步驟能夠明顯改進LDM的分類性能,這也驗證了本文提出WDL特征選擇方法的有效性.在WDL特征選擇模型中,通過添加權重分布正則化項到傳統Lasso模型中以提高模型泛化性能,這是由于權重分布對應于特征分布,然而傳統 Lasso模型沒有考慮特征分布信息,所以本文提出在傳統 Lasso模型引入權重分布先驗信息,亦即最小化權值均值并最大化權值方差.為了驗證這個假設的有效性,在WDL-LDM模型中通過對WDL進行不同正則化參數設置來探討分類性能的變化,以此來驗證引入權重分布先驗信息的有效性,表7給出了WDL特征選擇方法采用不同正則化參數設置時的WDL-LDM分類性能.

Table 6 Selected stable features ranking using the WDL-LDM method on pMCI/sMCI classification表6 在pMCI/sMCI分類實驗中WDL-LDM選出的穩定特征排序

Table 7 Classification performance comparison of our proposed method (WDL-LDM)using different setting of regularization parameters on the step of WDL feature selection表7 WDL特征選擇方法采用不同正則化參數設置的WDL-LDM分類性能比較

在表 7中,正則化參數設置為“λ2,λ3=0”,表示沒有權重分布正則化項,此時,WDL特征選擇模型就是傳統的Lasso;若設置為“λ2=0”,則表示沒有最小化權值均值正則化項;若設置為“λ3=0”,則表示沒有最大化權值方差正則化項;另外,若設置為“λ1,λ2,λ3>0”,則表示同時存在權重L1范數和權重分布正則化項.表 7 的實驗結果表明,在3組分類實驗中同時采用權重L1范數和權重分布正則化項的WDL-LDM分類性能都優于其他3種正則化參數設置方案.其中,不采用權重分布正則化項,WDL-LDM 分類性能明顯不如“λ1,λ2,λ3>0”參數設置方案;單獨采用最小化權值均值或者最大化權值方差正則化項,WDL-LDM 分類性能也明顯差于“λ1,λ2,λ3>0”參數設置方案.綜合以上實驗結論表明,在傳統Lasso模型中同時加入最小化權值均值和最大化權值方差正則化項能夠有效改進分類模型的性能.

4 結束語

為了獲得泛化性較好且分類精度較高的分類模型,本文根據 Lasso特征選擇模型以及大間隔分布學習模型,提出了基于權值分布稀疏特征學習的早期阿爾茨海默病診斷框架.具體來說,該診斷框架包含3個部分:首先對采集的 MRI和 PET腦圖像進行一系列預處理并提取特征;然后根據傳統 Lasso模型提出基于權值分布的Lasso特征選擇模型(WDL),可用于從多模態特征中尋找性能更好的特征子集;最后采用大間隔分布分類機(LDM)訓練分類模型.在國際老年癡呆癥數據庫(ADNI)上,采用 MRI、PET和 CSF多模態數據進行實驗驗證,并與一些相關的方法進行比較.實驗結果表明,WDL-LDM 方法能夠有效提高分類性能,并能有效利用多模態特征分布信息.

盡管本文取得了較好的結果,但仍有改進空間.一方面,本文只針對數量有限的標記訓練數據設計了監督學習算法,而臨床上存在許多未標記的多模態數據還可利用,考慮將當前的模型擴展為半監督學習方式是未來的發展方向之一.另一方面,臨床上也存在大量不完全的多模態數據,充分利用這些不完全的多模態標記數據,不但可以增加訓練樣本數量,針對不完全的多模態數據設計學習算法,還可以提高模型推廣性能.

猜你喜歡
模態分類特征
分類算一算
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
抓住特征巧觀察
國內多模態教學研究回顧與展望
基于HHT和Prony算法的電力系統低頻振蕩模態識別
由單個模態構造對稱簡支梁的抗彎剛度
計算物理(2014年2期)2014-03-11 17:01:39
主站蜘蛛池模板: 日本人又色又爽的视频| 亚洲无码37.| 国产视频a| 欧美精品色视频| 国产精品免费电影| 国产无码在线调教| 亚洲欧洲天堂色AV| 国产99精品视频| 亚洲国产日韩在线成人蜜芽| 国产性爱网站| 青青青视频蜜桃一区二区| 日韩中文无码av超清 | 欧美、日韩、国产综合一区| 六月婷婷综合| 中文字幕久久亚洲一区| 无码中文字幕乱码免费2| 囯产av无码片毛片一级| 伊人五月丁香综合AⅤ| 国产交换配偶在线视频| 国产成人亚洲无码淙合青草| 久无码久无码av无码| 伊人色天堂| 青青青视频91在线 | 国产成人免费高清AⅤ| 少妇精品网站| 色综合婷婷| 五月婷婷导航| 五月天在线网站| 亚洲国产精品美女| 婷婷五月在线视频| 国产精品美女免费视频大全| 亚洲无码37.| 欧美性久久久久| 欧美国产综合视频| 久久免费观看视频| 亚洲欧洲AV一区二区三区| 日韩在线第三页| 日韩中文精品亚洲第三区| 天天色综网| 天天综合天天综合| 亚洲欧美成人综合| 激情视频综合网| 色综合综合网| 亚洲美女高潮久久久久久久| 91精品亚洲| 综合色婷婷| 国产日韩欧美在线播放| 国产麻豆aⅴ精品无码| 欧美丝袜高跟鞋一区二区 | 性色一区| 国产精品yjizz视频网一二区| 色综合天天娱乐综合网| 欧美成人怡春院在线激情| 国产精品对白刺激| 在线视频精品一区| 久久精品国产亚洲AV忘忧草18| 免费高清a毛片| 日韩资源站| 亚洲欧美综合在线观看| 亚洲香蕉久久| 国产精品美乳| 无码免费的亚洲视频| 中文字幕人妻无码系列第三区| 午夜无码一区二区三区| 亚洲天堂日韩在线| 69精品在线观看| 午夜性刺激在线观看免费| 亚洲精品高清视频| 香蕉eeww99国产精选播放| 鲁鲁鲁爽爽爽在线视频观看| 欧美日韩北条麻妃一区二区| 色综合激情网| 尤物精品视频一区二区三区| 国产精品无码制服丝袜| 日韩国产 在线| 亚洲欧美日本国产综合在线 | 青青青视频蜜桃一区二区| 国产婬乱a一级毛片多女| 国产精品人人做人人爽人人添| yjizz视频最新网站在线| 国产一区二区三区日韩精品| а∨天堂一区中文字幕|