999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于結(jié)構(gòu)MRI和機(jī)器學(xué)習(xí)的阿爾茨海默病病程分類研究

2021-08-04 08:09:30姚麗麗范炤
磁共振成像 2021年6期
關(guān)鍵詞:分類特征模型

姚麗麗,范炤

阿爾茨海默病(Al zheimer's disease,AD)是一種具有記憶障礙和認(rèn)知衰退特征的神經(jīng)退行性疾病[1]。現(xiàn)有的治療只能暫時幫助緩解記憶和認(rèn)知問題,不能根治。為了獲得疾病的控制治療,迫切需要對AD病程進(jìn)行分類,以便早期準(zhǔn)確診斷,及時治療。國內(nèi)外大量研究人員通過研究AD患者腦神經(jīng)影像學(xué)結(jié)構(gòu)和功能的變化[2],試圖尋找能夠有助于AD臨床診斷的生物標(biāo)志物,為早期診斷提供價值。結(jié)構(gòu)磁共振成像(structural magnetic resonance imaging,sMRI)由于其無創(chuàng)性和高普及性的優(yōu)點(diǎn),廣泛應(yīng)用于AD早期診斷。近年來,隨著科學(xué)技術(shù)的發(fā)展,大量結(jié)合機(jī)器學(xué)習(xí)的醫(yī)學(xué)圖像數(shù)據(jù)被用于AD的分類預(yù)測[3],如何選擇特征選擇算法對疾病預(yù)測至關(guān)重要。目前,在影像學(xué)的AD研究中常采用主成分分析法、偏最小二乘法等進(jìn)行降維[4],使用支持向量機(jī)(suppor t vect or machine,SVM)、邏輯回歸(l ogistic regression,LR)、隨機(jī)森林(random f orest,RF)等各種分類模型[5-7]來驗(yàn)證和評估提取的特征是否具有良好的分類性能。這些研究證實(shí),基于圖像結(jié)構(gòu)信息的疾病分類技術(shù)對臨床診斷更有幫助。然而,MRI原始圖像維數(shù)高,早期AD結(jié)構(gòu)變化不明顯以及研究樣本總數(shù)的限制使得AD早期評估和診斷的發(fā)展受到限制,并且由于不同的實(shí)驗(yàn)條件導(dǎo)致研究結(jié)果的不同,至今很難有高效準(zhǔn)確的算法能夠應(yīng)用于臨床。因此,本研究基于sMRI數(shù)據(jù)和患者臨床信息特征[年齡、性別、教育水平、簡易智力狀態(tài)檢查(Mini-Mental State Examination,MMSE)評分]提出一種L1-SVM特征選擇法,通過與SVM、RF、LR、誤差逆?zhèn)鞑?back pr opagat ion,BP)神經(jīng)網(wǎng)絡(luò)這4種分類算法結(jié)合建立并選出最合適的預(yù)測模型,并創(chuàng)造性地針對每一階段病程轉(zhuǎn)化給出具體的生物標(biāo)志物。

1 材料與方法

1.1 研究數(shù)據(jù)來源

本研究數(shù)據(jù)來自AD神經(jīng)成像倡議(Al zheimer's Disease Neuroimaging Initiative,ADNI)數(shù) 據(jù) 庫(http://adni.l oni.usc.edu/),回顧性分析編號為4018~5210的符合標(biāo)準(zhǔn)的受試對象543例。根據(jù)ADNI標(biāo)準(zhǔn),接受教育(或參加工作)不得少于6年的60~90歲老年人,經(jīng)倫理委員會批準(zhǔn),所有對象均簽署知情同意書。共分為4組:139名正常認(rèn)知者(normal control s,NC)、220例早期輕度認(rèn)知障礙患者(earl y mil d cognitive impairment,EMCI)、108例晚期輕度認(rèn)知障礙患者(l ate mil d cognitive impairment,LMCI)和76例AD患者。各組納入標(biāo)準(zhǔn)如下:(1)NC組:年齡、性別及教育水平均匹配;無記憶力下降;MMSE評分為24~30分;臨床癡呆評定量表(cl inical dementia rat ing,CDR)0分;認(rèn)知功能正常,基本日常活動沒有障礙。(2)EMCI組:教育水平達(dá)到初中畢業(yè)水平及以上;MMSE評分為24~30分;邏輯記憶量表進(jìn)行測試:教育水平為16年以上得分9~11分,8~15年得分5~9分,7年以下得分3~6分;CDR為0.5 且沒有其他認(rèn)知障礙;基本日常活動無障礙。(3)LMCI組:同EMCI,區(qū)別是教育水平16年以上為≤8分,8~15年得分≤4分,0~7年得分≤2分。(4)AD組:MMSE評分為20~26分;CDR為0.5 或1.0 ;根據(jù)NINCDS/ADRDA新標(biāo)準(zhǔn)診斷為AD。

1.2 數(shù)據(jù)預(yù)處理

收集這些研究對象的sMRI圖像數(shù)據(jù),數(shù)據(jù)集由Phil ips 3.0 T磁共振掃描設(shè)備采集,采集參數(shù)為:射頻TR為6.8 ms,TE為3.1 ms,翻轉(zhuǎn)角為9°,視野大小 為:RL=204 mm/AP=240 mm/FH=256 mm,層 厚 為1.2 mm,層 數(shù) 為170,體 素 為1.0 mm×1.0 mm×1.2 mm。利用Free sur f er 3.4 .0 軟件將sMRI三維圖像經(jīng)過空間標(biāo)準(zhǔn)化、圖像平滑、圖像分割等一系列預(yù)處理后得到272項(xiàng)結(jié)構(gòu)形態(tài)學(xué)指標(biāo)包括70項(xiàng)皮層表面積(sur f ace ar ea,SA)、68項(xiàng)皮層厚度(cor t i cal t hi cknesses,TA)、16項(xiàng)海馬亞區(qū)體積(hippocampal subf iel d,HS)、49項(xiàng) 皮 層 下 體 積(subcortical vol ume,SV)和69項(xiàng)皮層體積(cor t ical vol ume,CV)。除此之外還獲得了對應(yīng)4項(xiàng)臨床統(tǒng)計(jì)數(shù)據(jù),包括性別、年齡、教育水平和MMSE評分(見表1)。

表1 研究對象人口統(tǒng)計(jì)臨床信息Tab.1 Demographic and clinical information of study subjects

1.3 特征選擇算法

本研究首先通過特征選擇獲得與分類相關(guān)的重要特征來增強(qiáng)學(xué)習(xí)算法的泛化能力,但是不再沿用傳統(tǒng)統(tǒng)計(jì)學(xué)方法來進(jìn)行,而是希望與分類模型一樣,也通過機(jī)器學(xué)習(xí)算法能夠智能化選擇最優(yōu)特征。SVM在分類領(lǐng)域里得到了廣泛的研究和應(yīng)用且適合本研究數(shù)據(jù)的分類問題,而其本身不具備特征選擇能力,因此在SVM模型中引入正則化懲罰項(xiàng)來使特征個數(shù)最小化并且解決過擬合問題[8]。L1和L2正則化都可以達(dá)到這種目的,但L1比L2更容易獲得稀疏解[9]。L1正則化是損失函數(shù)的懲罰項(xiàng),可以對某些參數(shù)作一定的限制。因此得到損失函數(shù):

針對272項(xiàng)數(shù)據(jù)集和加入4項(xiàng)臨床信息后的276項(xiàng)數(shù)據(jù)集這兩種進(jìn)行特征選擇。根據(jù)特征選擇后排名順序決定預(yù)測相關(guān)度大小,各組得到的特征中排名越靠前說明對該階段病程的影響越大。本研究數(shù)據(jù)由Pyt hon 3.7 實(shí)現(xiàn),包括分類模型算法的運(yùn)行。

1.4 機(jī)器學(xué)習(xí)分類模型

1.4.1 SVM模型

SVM可以利用結(jié)構(gòu)風(fēng)險最小化的原理將輸入樣本映射到高位特征空間,在此空間上構(gòu)造最優(yōu)分類超平面,使分類問題獲得良好的泛化能力[5]。給定訓(xùn)練樣本(xi,yi),每一個樣本點(diǎn)xi對應(yīng)一個類別標(biāo)簽y i,yi∈{-1,1}。SVM的最優(yōu)分類函數(shù)為:

其中,n是樣本總數(shù),參數(shù)γ是決策面位置的截距,ω為控制方向的行向量,當(dāng)xi為決策面ωTx+γ=0所對應(yīng)的支持向量樣本點(diǎn)時,ωTxi+γ為-1或1。

1.4.2 BP神經(jīng)網(wǎng)絡(luò)模型

1.4.3 LR模型

1.4 .4 RF模型

RF屬于集成學(xué)習(xí)的一種,由許多決策樹組成。通過構(gòu)建并結(jié)合多個學(xué)習(xí)器來完成學(xué)習(xí)任務(wù)。算法的本質(zhì)是通過集合樹型分類器,構(gòu)造不同的訓(xùn)練集來增加分類模型間的差異并通過投票進(jìn)行分類和預(yù)測[7]。RF的決策函數(shù)為:

其中,H(x)為組合模型函數(shù),hi(x)表示單個決策樹,Y表示目標(biāo)變量,經(jīng)過k輪訓(xùn)練得出最多決策樹支持的一類。

1.5 模型性能評估

本研究采用最小偏差和方差的十折交叉驗(yàn)證方法對各個分類模型進(jìn)行評估。將數(shù)據(jù)集分成10份,隨機(jī)抽取9份作為訓(xùn)練樣本構(gòu)建分類模型,另一份作為測試集對模型性能進(jìn)行檢驗(yàn),獲得分類結(jié)果,重復(fù)10次訓(xùn)練和測試后得到的10個測試結(jié)果均值即為該模型算法的準(zhǔn)確率,針對本研究數(shù)據(jù)類別分布的不平衡,除了準(zhǔn)確率這項(xiàng)評價指標(biāo)外,還考慮了敏感度和特異度。此外,AUC也用作評估分類器性能的指標(biāo)。

2 結(jié)果

2.1 特征選擇結(jié)果與分類

2.1 .1 272項(xiàng)特征選擇結(jié)果

通過L1-SVM特征選擇模型提取后,在識別NC與EMCI組時,有133項(xiàng)特征被提取并進(jìn)入分類模型。其他NC-LMCI、NC-AD、EMCI-LMCI、EMCI-AD和LMCI-AD組中,分別有86、58、112、78和78項(xiàng)被提取。特征選擇的結(jié)果根據(jù)它們對該分類組的重要程度來排列,本研究只顯示各組前10項(xiàng)(見表2)。從整體來看,最主要的10項(xiàng)特征分別為TA-左顳橫回、SA-左顳下回、SV-右杏仁核、CV-右額眶回內(nèi)側(cè)、TA-左顳中回、HS-右海馬前下托、SA-左顳極、CV-右額上回、CV-左扣帶回后部、SA-左額眶回內(nèi)側(cè)。

表2 272項(xiàng)特征中貢獻(xiàn)最大的前10項(xiàng)特征Tab.2 Top 10 important features of 272 features

2.1 .2 276項(xiàng)特征選擇結(jié)果

將4項(xiàng)臨床人口學(xué)指標(biāo)加入到272個形態(tài)學(xué)指標(biāo)后,各指標(biāo)在區(qū)分每一組時的重要程度發(fā)生改變。在區(qū)分NC和EMCI組時,從276項(xiàng)特征中提取到的最優(yōu)特征子集有121項(xiàng)。同樣,對于NC-LMCI、NC-AD、EMCI-LMCI、EMCI-AD以及LMCI-AD這些組,分別有82、22、113、39和53項(xiàng)特征被提取到BP神經(jīng)網(wǎng)絡(luò)及其他模型。同樣只顯示貢獻(xiàn)最大的前10項(xiàng)。從整體來看,最主要的10項(xiàng)特征分別為TA-左顳橫回、MMSE評分、SA-左額眶回內(nèi)側(cè)、CV-右額眶回內(nèi)側(cè)、SA-左顳下回、SV-左腹側(cè)間腦、TA-左顳中回、年齡、TA-右眶回、HS-右海馬前下托。

從表3可看出,MMSE評分在AD病程的各個階段表現(xiàn)出非常明顯的變化。在識別NC-LMCI、EMCI-AD、LMCI-AD這3組分類時,年齡有很大影響。性別的重要性微乎其微。值得一提的是,在本研究中,針對疾病病程的各個階段特征的重要程度都展示出來。其中,在區(qū)分NC-EMCI組時,年齡排名第14位,性別排名第31位,文化程度排名第70位。對于NC-AD組,教育水平表現(xiàn)出顯著差異,年齡和性別沒有出現(xiàn)在最優(yōu)特征的子集中;對于EMCI和LMCI組,年齡排在第11位,性別排在第28位,教育水平排在第63位;對于EMCI和AD組,教育水平排在第23位,對于LMCI和AD組,性別排在第14位。

表3 276項(xiàng)特征中貢獻(xiàn)最大的前10項(xiàng)特征Tab.3 Top 10 important features of 276 features

2.2 不同分類模型預(yù)測結(jié)果

本研究基于兩種數(shù)據(jù)集提取特征后進(jìn)入BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行分類,并與RF、SVM、LR 3種常用預(yù)測模型進(jìn)行對比。結(jié)果發(fā)現(xiàn)BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測效果高于其他3種模型(見圖1、2),而且從整體來看,在276項(xiàng)數(shù)據(jù)集下分類預(yù)測結(jié)果更高,尤其識別NC-AD組時準(zhǔn)確率最高,為98.9 0%,而LR、SVM、RF 3種模型在識別該組時準(zhǔn)確率分別為90.6 6%、92.0 2%、96.7 7%。在272項(xiàng)數(shù)據(jù)集下BP神經(jīng)網(wǎng)絡(luò)、LR、SVM、RF模型在識別NC-AD組時準(zhǔn)確率分別為95.3 9%、89.4 2%、91.6 3%、92.1 8%。除此之外,BP神經(jīng)網(wǎng)絡(luò)分類模型基于276項(xiàng)數(shù)據(jù)集在NC-EMCI、NC-LMCI、EMCI-LMCI、EMCI-AD、LMCI-AD組的準(zhǔn)確率分別為83.5 3%、95.0 4%、93.0 1%、96.9 3%、92.4 1%。除了準(zhǔn)確率,各組在兩種數(shù)據(jù)集下的特異度、敏感度也比較高,AUC值更是高達(dá)1.0 0(見表4),且增加人口統(tǒng)計(jì)學(xué)指標(biāo)前后模型的泛化能力有所提高。

圖1 272項(xiàng)特征選擇下4種分類模型結(jié)果 圖2 276項(xiàng)特征選擇下4種分類模型結(jié)果Fig.1 The results of four classification models were selected for 272 features.Fig.2 The resultsof four classification modelswere selected for 276 features.

表4 BP神經(jīng)網(wǎng)絡(luò)在兩種特征數(shù)據(jù)集下的分類結(jié)果Tab.4 Classification results of BPneural network under two characteristic data sets

3 討論

本研究發(fā)現(xiàn)了區(qū)分各分組時的關(guān)鍵病變部位,并按重要程度排名,更有助于預(yù)測病程進(jìn)展。從272項(xiàng)sMRI形態(tài)學(xué)指標(biāo)特征選擇結(jié)果來看,最優(yōu)特征子集集中分布在邊緣系統(tǒng)和顳葉,海馬、海馬亞區(qū)、以及杏仁核隸屬于邊緣系統(tǒng)的組成結(jié)構(gòu)[12]。這些結(jié)構(gòu)都可以單獨(dú)被作為研究AD病程發(fā)展的指標(biāo)。

除了與已有研究一致的腦部形態(tài)學(xué)變化之外,本研究還發(fā)現(xiàn)僅在某個分組中的特征變化有助于預(yù)測病程判斷。TA-左顳橫回在識別NC-EMCI、NC-LMCI、EMCI-AD、LMCI-AD分組的各個病程中都尤為重要,顳橫回為聽覺皮質(zhì)區(qū),可見在AD疾病進(jìn)程中聽覺的不斷弱化是判斷病程的重要依據(jù),與已有研究[13]一致。而在NC-AD組中SV-左海馬貢獻(xiàn)最大,說明海馬在正常人和AD患者之間的差異非常明顯,海馬主要負(fù)責(zé)學(xué)習(xí)和記憶,其萎縮情況反映AD病情的嚴(yán)重程度[14]。并且左側(cè)大腦比右側(cè)大腦嚴(yán)重,這與之前報(bào)道[13]一致。而HS-右海馬前下托在識別NC-LMCI組、NC-AD組以及LMCI-AD組時排名在最優(yōu)特征的前十,表明海馬亞區(qū)也可被用來反映或預(yù)測疾病病程的發(fā)展,甚至有研究表明海馬亞區(qū)可能更適合預(yù)測AD[15]。在區(qū)分NC-EMCI、NC-LMCI和EMCI-LMCI這3組時,SA-左顳下回對分類決策起重要作用,顳下回負(fù)責(zé)學(xué)習(xí)和記憶,在進(jìn)展為LMCI的時候,患者的學(xué)習(xí)記憶表現(xiàn)出更多差異;由此可見,顳葉萎縮可以用來預(yù)測AD疾病的進(jìn)展情況。

本研究將MCI分成EMCI和LMCI兩個階段,對NC、EMCI、LMCI、AD 4組進(jìn)行兩兩分類,通過具體化分類更早識別MCI階段進(jìn)而能夠?qū)D進(jìn)行早期診斷,而以往的研究[16]只對NC、MCI、AD 3組進(jìn)行兩兩分類,也涉及BP神經(jīng)網(wǎng)絡(luò)以及其他模型,然而在NC-AD組的分類準(zhǔn)確率一般在80%~95%。

在sMRI基礎(chǔ)上增加年齡、性別、教育水平3項(xiàng)人口統(tǒng)計(jì)學(xué)指標(biāo)和MMSE評分后在疾病病程各階段的準(zhǔn)確率均高于只有272項(xiàng)sMRI指標(biāo)的準(zhǔn)確率,可以實(shí)現(xiàn)最優(yōu)分類精度。無論是272項(xiàng)特征還是276項(xiàng)特征,BP神經(jīng)網(wǎng)絡(luò)分類器的整體預(yù)測效果都優(yōu)于其他3種分類器。尤其在NC轉(zhuǎn)化為AD的過程中,BP神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確率高達(dá)98.9 0%,而已有研究在引入性別、年齡后對NC-AD組的預(yù)測準(zhǔn)確率達(dá)91.0 7%[17]。

本文方法對病程分類的準(zhǔn)確率由高到低依次為NC-AD、EMCI-AD、NC-LMCI、EMCI-LMCI、LMCI-AD、NC-EMCI組。當(dāng)同樣的數(shù)據(jù)集采用傳統(tǒng)統(tǒng)計(jì)學(xué)方法進(jìn)行特征選擇后用SVM分類研究[18]時準(zhǔn)確率達(dá)90.9 0%,而本研究L1-SVM特征選擇下該模型準(zhǔn)確率為91.6 3%。傳統(tǒng)統(tǒng)計(jì)學(xué)方法識別NC-AD組時準(zhǔn)確率最高為96.4 5%,而本研究為98.9 0%,總體預(yù)測效果高于傳統(tǒng)統(tǒng)計(jì)法,不同組別中結(jié)果略有差異。

本研究順應(yīng)當(dāng)下人工智能時代,提出的BP神經(jīng)網(wǎng)絡(luò)模型在L1-SVM特征選擇下對NC-EMCI-LMCI-AD兩兩分類的預(yù)測效果較好,這種聯(lián)合算法可以作為臨床輔助診斷AD的有效工具。綜合考慮影像數(shù)據(jù)與臨床特征信息有利于精準(zhǔn)預(yù)測AD病程,希望能夠?yàn)楹罄m(xù)的研究提供參考。同時,本研究存在局限性,后續(xù)也會增加樣本量,嘗試用其他影像數(shù)據(jù),比如DTI、PET、f MRI或其他生物標(biāo)志物,進(jìn)一步提高比較難區(qū)分的病程分類組識別率,從而及時進(jìn)行干預(yù),阻礙病程進(jìn)展,為國家和社會減輕負(fù)擔(dān)。

作者利益沖突聲明:全體作者均聲明無利益沖突。

猜你喜歡
分類特征模型
一半模型
分類算一算
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
如何表達(dá)“特征”
不忠誠的四個特征
分類討論求坐標(biāo)
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
抓住特征巧觀察
主站蜘蛛池模板: 女人毛片a级大学毛片免费| 国产日韩欧美一区二区三区在线| 亚洲制服丝袜第一页| 日韩在线2020专区| 国产全黄a一级毛片| 精品国产中文一级毛片在线看| 欧美高清国产| 久久综合丝袜日本网| 成人小视频在线观看免费| 四虎免费视频网站| 国产91透明丝袜美腿在线| 青青青国产视频手机| 亚洲第一区欧美国产综合| 日韩激情成人| 久青草免费在线视频| 欧美另类视频一区二区三区| 福利片91| 毛片久久网站小视频| 亚洲欧美另类视频| 久久久久青草大香线综合精品| 欧美午夜一区| 在线观看欧美精品二区| jizz国产视频| 日韩区欧美区| 99久久国产自偷自偷免费一区| 国产亚洲现在一区二区中文| 天堂中文在线资源| 狠狠亚洲五月天| 国产呦视频免费视频在线观看| 国产嫖妓91东北老熟女久久一| 国产av色站网站| 大香伊人久久| 国产精品视频免费网站| 亚洲日本在线免费观看| jizz在线观看| 91探花国产综合在线精品| 成年看免费观看视频拍拍| 久久久成年黄色视频| 免费国产高清视频| 夜夜操狠狠操| 综合色88| 美女视频黄又黄又免费高清| 午夜免费小视频| AV天堂资源福利在线观看| 国产区福利小视频在线观看尤物| 亚洲天堂免费| V一区无码内射国产| 国产毛片不卡| 久久永久精品免费视频| 日本欧美一二三区色视频| 亚洲区第一页| 麻豆精品在线播放| 91成人在线观看| 亚洲无码高清一区二区| 色婷婷亚洲综合五月| 伊大人香蕉久久网欧美| 欧美精品影院| 欧美中文字幕在线视频| 国产精品免费露脸视频| 国产成人福利在线| 国产不卡国语在线| 老司国产精品视频91| 伊人色综合久久天天| 欧美激情综合| 久草视频精品| 中国精品自拍| 日本午夜精品一本在线观看| 国产无码高清视频不卡| 久久精品视频亚洲| 尤物视频一区| 欧美一区二区精品久久久| 手机在线国产精品| 日韩精品专区免费无码aⅴ| 亚洲精品不卡午夜精品| 欧美亚洲国产一区| 中文字幕无码制服中字| 91在线播放免费不卡无毒| 午夜无码一区二区三区| 91无码人妻精品一区二区蜜桃| 无码aⅴ精品一区二区三区| 亚洲免费毛片| 日韩无码黄色|