999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于弱匹配典型相關性分析的阿爾茨海默病識別

2016-08-05 02:21:22馬金鳳張昌明
中國老年學雜志 2016年13期

郝 杰 張 博 朱 紅 馬金鳳 張昌明

(徐州醫科大學醫學信息學院,江蘇 徐州 221000)

?

基于弱匹配典型相關性分析的阿爾茨海默病識別

郝杰張博1,2,3朱紅馬金鳳張昌明

(徐州醫科大學醫學信息學院,江蘇徐州221000)

〔摘要〕目的為了增強阿爾茨海默病(AD)的識別能力。方法該文采用多模態異構生物標志物數據在統計意義上潛在的相關性,利用互補原理,最大化不同模態數據之間的相關性,并在典型相關性分析的基礎上,引入流形正則化技術提出了弱匹配典型相關性分析算法。結果解決了弱匹配多模態數據相關性建模問題。結論多模態異構生物標志物數據融合方法的預測性能優于單模態,能對AD的發病和病理研究提供更準確的信息。

〔關鍵詞〕阿爾茨海默病;多模態數據融合;典型相關性分析;弱匹配多模態數據

老年認知障礙逐年增多,其中最常見的阿爾茨海默病(AD),AD是一種進行性發展的致死性神經退行性疾病,通常被認為是由于腦疾病等原因造成神經細胞和神經元突觸的大量喪失所導致〔1,2〕。輕度認知障礙(MCI)被廣泛認為是AD與正常老齡化之間的一種過渡狀態〔3~5〕。MCI狀態并不是一個穩定的中間狀態,病情有可能好轉,也有可能發展成為完全的AD。有研究報道,每年由MCI轉化成AD的比例約為10%~15%〔6〕。因此,對MCI的早期診斷與早期干預是臨床診療工作的關鍵,延緩MCI向AD的轉化速度,可降低患病率、死亡率,有效地提高患者的存活率和患者的生活質量。目前,大部分研究使用單模態分析法研究神經影像數據或其他生物標志物。所謂的單模態分析是指利用從單一信息渠道獲得的觀察樣本進行識別的技術,如使用主成分分析(PCA)分析正電子發射斷層掃描(PET)腦顯像,使用獨立成分分析(ICA)分析功能磁共振成像(MRI)數據。這些研究都是將AD群體和MCI群體的腦結構與正常老年人的腦結構相比,分析其腦結構的異常,評價從正常的認知老齡化到MCI、從MCI到輕度的AD和從輕度到重度癡呆這一過程的進展,以及利用這些標記物做早期診斷。然而,單模態數據的統計分析存在以下問題①許多生物標志物研究是基于以往臨床標準診斷的病例,病例選擇的準確性直接關系到單一標志物驗證的準確性;②部分生物標志物在許多非AD人群也會出現,如斑塊和纏結,需要大量縱向觀察才能得出這些標志物在認知正常者中存在的意義和預測價值的客觀結論,這需要付出大量的資金和人力成本。不同類型的生物標志物特征之間存在著關聯信息。這些信息作為一種附加特征是有效且重要的,它們能在對AD預測和診斷的過程中有效地完成信息的互補和增強。本文采用多模態異構生物標志物數據在統計意義上潛在的相關性,如MRI與PET的融合、MRI與腦脊液(CSF)或蛋白質組等非影像生物標志特征融合。利用互補原理,最大化不同模態數據之間的相關性,減少數據之間的不確定性,從而達到增強識別能力的目的。由于在生物標記物的開發使用中,多個指標聯合使用會比單個指標更有優勢,所以通過多模態異構數據源的融合,可以對AD的發病和病理研究提供更準確的信息,同時也能在發病前,至少是發病的早期階段預測到認知功能的下降。

1資料與方法

其中,

cxx=XXT∈Rp×Rp和cyy=YYT∈Rq×Rq

表示集合內協方差矩陣,cxy=XYT∈Rp×Rq表示集合間協方差矩陣,且Cyx=CxyT。

常將CCA問題等價地描述為以下特征值問題:

1.2弱匹配多模態數據的相關性建模在生物醫學研究中,數據不完整的樣本無處不在。如本文實驗中使用的ADNI數據庫,超過一半的受試者缺少CSF數據,還有很多的受試者沒有FDG-PET或蛋白質組學數據。如圖1所示,819組樣本中,只有203份數據完整的樣本,1~199號樣本缺少CSF數據,403~819號樣本缺少PET數據,609~819號樣本只有MRI數據。數據缺失的原因很多,可能是由于某些檢查的成本過高(如PET掃描)或屬有創性檢查(如CSF需要腰椎穿刺),不是所有的研究參與者都愿意參與,也可能是一些長期的縱向隨訪研究中,研究參與者可能會錯過定期評價中的一些科目或者受試者中途退出等。

圖1 ADNI數據庫——819組患者樣本

CCA中兩組相關的隨機變量可以來自多種信息來源(如同一個人的聲音和圖像),也可以是從同一來源的信息中抽取的不同特特征(如圖像的顏色特征和紋理特征),但訓練數據必須一對一嚴格匹配。面向弱匹配多模態數據的CCA有兩種基本的方法:①丟棄未匹配數據,只使用CCA處理嚴格匹配的多模態數據;②根據特定準則,匹配多模態數據。但這兩種方法都無法獲得理想的結果。

為了解決弱匹配多模態數據相關性建模問題,本文使用流形正則化技術改進CCA,提出了弱匹配算法。弱匹配CCA算法構造了以下優化問題:

(1)

s.t.

1.3弱匹配CCA求解方法弱匹配CCA算法的求解過程描述如下。為解式(1),使用Lagrange乘子法。令:

(2)

(3)

用αT和βT分別乘以式(3)兩邊,得:

(4)

由式(4)得:

λ2=λ1

記λ2=λ1=λ,式(3)表示為以下矩陣形式:

(5)

式(5)是一個典型的廣義特征值問題,可以直接進行求解。只要對矩陣進行特征值分解,依次取大特征值對應的特征向量,便可得到最終的典型(投影)向量。

求得d階典型(投影)向量和后,對于任意樣本,即可用如下方式進行特征融合:

ATx+BTy

(6)

(7)

其中A=〔α1,α2,···,αd〕,B=〔β1,β2,···,βd〕,d≤min(p,q)。基于式(6)和式(7)的特征組合方法分別簡稱為“并行組合”與“串行組合”。組合后的特征可用于任何分類器進行分類,本文中采用隨機森林算法。

2結果

本文首先通過一個簡單的模擬數據實驗直觀地考察經過弱匹配CCA算法降維后的組合特征對分類效果的影響,然后在ADNI數據庫上檢驗弱匹配CCA算法降維后對正常老年人、MCI群體和AD群體識別能力的影響。

+:第一類樣本;□第二類樣本,下圖同圖2 二維樣本的分布情況

圖3 原始數據集與經CCA降維后對組合特征的分布

圖4 CCA提取第一對組合特征的分布

圖5 弱匹配CCA提取第一對組合特征的分布

可以看出:①CCA揭示了特征之間的線性關系,但降維后兩類之間存在一定程度的重疊,不利于分類;②在缺少30%樣本的情況下,CCA出現了過擬合現象,樣本間的相關程度降低;③在弱匹配CCA算法實驗中,由于引入了各模態全部樣本集合中蘊含的內部結構信息,獲得了較為理想的結果,同時WXij的計算過程使得同類樣本盡可能地靠近,不同類樣本盡可能遠離,所以兩類樣本可以被較好地分開。實驗結果表明,弱匹配CCA算法提取的特征有利于分類。

2.2AD識別實驗本文中,實驗數據都是來自于ADNI數據庫。ADNI是有史以來規模最大的醫學影像學項目之一,其數據庫涉及正常老年人、MCI群體和AD群體的結構磁共振成像(sMRI),功能磁共振成像(fMRI)和PET等腦影像數據和血液、脊髓、年齡、性別、患病時間和臨床評分等各種生物指標。ADNI項目始于2004年10月,其數據庫不斷更新。ADNI項目的主要目的是通過腦影像的綜合研究來了解MCI與早期AD的發病歷程,試圖找出有效的臨床治療方案和預防措施。有關ADNI數據庫的具體介紹請登錄網站查詢(其網站鏈接為http://adni.loni.ucla.edu/)。

2.2.1特征提取實驗中使用ADNI數據庫提供的819份樣本(193例AD患者,397例MCI患者,229例正常人)建立AD分類模型。MRI腦影像數據的預處理使用基于Ubuntu操作系統的Maltab 7.0平臺下的Statistical Parametric Mapping(SPM5,http://www.fil.ion.uel.ae.uk/spm)軟件包,對原始數據進行空間標準化,把原始的結構腦影像配準到標準空間中,然后對配準好的圖像進行組織分割,去除非腦組織后,把腦組織分割成灰質、白質和腦脊液三部分,提取305為特征向量。對PET圖像,使用AAL(Automated Anatomical Labeling)算法提取116維ACOI興趣點作為特征向量。CSF數據提取Aβ1~42濃度、t-tau和p-tau水平以及t-tau/Aβ1~42、p-tau/Aβ1~42組成5維特征向量。見圖6。

圖6 特征向量提取

2.2.2實驗設置和結果分析MRI特征集和PET特征集,分別使用PCA降維至50維,典型向量的階數設置為5,10,15,…50。使用“串行”融合策略生成最終的分類特征。分類基于隨機森林算法(Random Forests)〔9〕,直接使用Random forest-matlab軟件包 。

為了對比分析,本文選取了3種比例的數據作為訓練集,剩余進行測試,進行50次實驗取均值。實驗結果如表1~表3所示,列出了單特征方法,兩組和三組異構特征融合方法、弱匹配CCA融合分類結果。對該組實驗結果的分析:①由于多個指標聯合使用會比單個指標更有優勢,所以較之單特征方法,兩組或三組異構特征融合的方法具有一定的識別優勢。②相對于單特征方法與異構特征融合的方法,弱匹配CCA融合的方法具有顯著的識別優勢。而且,這表明,弱匹配CCA直接提取了各異構特征間的綜合相關特征,最大化了不同模態數據之間的相關性,同時減少數據之間的不確定性,使相同類型的樣本盡可能靠近,不同類型的樣本盡可能遠離,從而達到增強識別能力的目的。因此具有更高的分類精度。③整體而言,各方法分類精度隨著訓練集中樣本數量的增加而提高。

表1 訓練集大小50%的分類準確率(%)

AD:AD患者;NL:正常人群;MCI:MCI患者,下表同

表2 訓練集大小66.7%的分類準確率(%)

表3 訓練集大小75%的分類準確率(%)

3討論

與傳統單模態分析法研究神經影像數據或其他生物標志物的方法不同,本文使用弱匹配CCA方法分析多模態異構生物標志物數據在統計意義上潛在的相關性,最大化不同模態數據之間的相關性,同時減少數據之間的不確定性,使相同類型的樣本盡可能靠近,不同類型的樣本盡可能遠離,從而達到增強識別能力的目的。本實驗表明,在生物標記物的開發使用中,多個指標聯合使用會比單個指標更有優勢,而且通過弱匹配CCA方法對各模態異構數據源的融合,可以對AD的發病和病理研究提供更準確的信息,同時也能在發病前,至少是發病的早期階段預測到認知功能的下降。多重集典型相關性分析(MCCA)是CCA向多個數據集的自然推廣,用于分析多個(多于2個)數據集合變量間的線性關系。1971年Kettenring〔10〕提出了一系列的MCCA,并給出了迭代解法。2003年Yamanishi等〔11〕提出了多重集的核典型相關性分析(MKCCA),用于提取多基因組的相關性。

4參考文獻

1Terry RD,Masliah E,Salmon DP,etal.Physical basis of cognitive alterations in Alzheimer′s disease:synapse loss is the major correlate of cognitive impairment〔J〕.Ann Neurol,1991;4(30):572-80.

2Wenk GL.Neuropathologic changes in Alzheimer′s disease〔J〕.J Clin Psychiatry,2003;(64):7-10.

3Petersen RC,Smith GE,Waring SC,etal.Mild cognitive impairment:clinical characterization and outcome〔J〕.Arch Neurol,1999;56(3):303-8.

4Morris JC,Storandt M,Miller JP,etal.Mild cognitive impairment represents early-stage Alzheimer disease〔J〕.Arch Neurol,2001;58(3):397-405.

5Rombouts SARB,Barkhof F,Goekoop R,etal.Altered resting state networks in mild cognitive impairment and mild Alzheimer′s disease:An fMRI study〔Z〕.Wiley Subscription Services,Inc.,A Wiley Company,2005:231-9.

6Grundman M,Petersen RC,Ferris SH,etal.Mild cognitive impairment can be distinguished from Alzheimer disease and normal aging for clinical trials〔J〕.Arch Neurol,2004;61(6):59-66.

7Belkin M,Niyogi P,Sindhwani V.Manifold regularization:a geometric framework for learning from labeled and unlabeled examples〔J〕.J Mach Learning,2006;7:2399-434.

8彭巖,張道強.半監督典型相關分析算法〔J〕.軟件學報,2008;19(11):2822-32.

9Liaw A,Wiener M.Classification and regression by random forest〔J〕.R News,2002;2(3):18-22.

10Kettenring J.Canonical analysis of several sets of variables〔J〕.Biometrika,1971;(58):433-51.

11Yamanishi Y,Vert JP,Nakaya A,etal.Extraction of correlated gene clusters from multiple genomic data by generalized kernel canonical correlation analysis〔J〕.Bioinformatics,2003;19(Suppl 1):i323-30.

〔2014-12-06修回〕

(編輯趙慧玲/曹夢園)

通訊作者:朱紅(1970-),女,副教授,博士,主要從事屬性約簡、聚類分析、粒度計算研究。

〔中圖分類號〕TP391

〔文獻標識碼〕A

〔文章編號〕1005-9202(2016)13-3259-05;

doi:10.3969/j.issn.1005-9202.2016.13.081

1中國科學院計算技術研究所智能信息處理重點實驗室

2中國礦業大學計算機科學與技術學院3中國科學院研究生院

第一作者:郝杰(1980-),女,副教授,碩士,主要從事人工智能、機器學習研究。

主站蜘蛛池模板: 亚洲欧美一区二区三区蜜芽| 女人一级毛片| 手机在线免费不卡一区二| 伊人久热这里只有精品视频99| 99久久精品美女高潮喷水| 香蕉视频在线观看www| 成人噜噜噜视频在线观看| 欧美高清国产| 亚洲欧洲日产无码AV| 精品一区二区三区中文字幕| 欧美成人手机在线观看网址| 四虎影视库国产精品一区| 亚洲第一极品精品无码| 午夜色综合| 2021国产v亚洲v天堂无码| 福利视频一区| 伊人蕉久影院| 亚洲无线国产观看| 精品福利一区二区免费视频| 国产一线在线| 欧美午夜视频在线| 精品国产成人国产在线| 日韩美女福利视频| 国产成人高清精品免费| 波多野结衣一区二区三区四区视频| 日本在线国产| 中文字幕不卡免费高清视频| 久久青草免费91观看| v天堂中文在线| 无码网站免费观看| 日韩毛片视频| 超清人妻系列无码专区| 国国产a国产片免费麻豆| 久精品色妇丰满人妻| 国产一级毛片在线| 美女毛片在线| 亚洲第一成网站| 国产制服丝袜无码视频| 国模粉嫩小泬视频在线观看| 99热亚洲精品6码| 国产成人免费| 大陆精大陆国产国语精品1024| 久久熟女AV| 一本大道香蕉中文日本不卡高清二区| 国产福利影院在线观看| 欧美成人亚洲综合精品欧美激情| 欧美日韩午夜| 天堂va亚洲va欧美va国产| 国产成熟女人性满足视频| 欧美精品1区| 91po国产在线精品免费观看| 男女性色大片免费网站| 免费女人18毛片a级毛片视频| 亚洲无码高清视频在线观看| 亚洲三级a| 日韩毛片在线播放| 亚洲精品波多野结衣| 亚洲午夜天堂| 国产一级在线观看www色| 毛片久久网站小视频| 国产美女叼嘿视频免费看| 黄片在线永久| 成AV人片一区二区三区久久| 香蕉久久永久视频| 亚洲男人天堂2020| 国产综合色在线视频播放线视| 一本色道久久88综合日韩精品| A级毛片无码久久精品免费| 青青草国产精品久久久久| 亚洲精品在线观看91| 欧美一区二区三区欧美日韩亚洲| 日韩福利在线视频| AV无码一区二区三区四区| 中文字幕亚洲综久久2021| 国产欧美日韩va| 日韩av高清无码一区二区三区| 午夜毛片福利| 亚洲 欧美 日韩综合一区| 国产福利大秀91| 特级欧美视频aaaaaa| 国产精品黑色丝袜的老师| 久久精品国产亚洲麻豆|