駱 文,劉育青,勞鈺鈔,陸麗明,劉秀峰
阿爾茨海默?。ˋlzeimer’s disease,AD)是一種神經(jīng)退行性疾病[1],是臨床最常見(jiàn)的癡呆類(lèi)型[2],有多個(gè)病程階段,包括臨床前阿爾茨海默病、早期輕度認(rèn)知障礙(early mild cognitive impairment,EMCI)、輕度認(rèn)知障礙(mild cognitive impairment,MCI)、晚期輕度認(rèn)知障礙(late mild cognitive impairment,LMCI)、阿爾茨海默病相關(guān)癡呆。全球老齡化日益加劇,預(yù)計(jì)到2050 年全球65 歲及以上阿爾茨海默病患者的數(shù)量將達(dá)到1.52億[1],給社會(huì)及患者家屬帶來(lái)極大的負(fù)擔(dān)。輕度認(rèn)知障礙以輕度的認(rèn)知功能障礙和日常生活能力減退為特征,未達(dá)到癡呆的癥狀診斷標(biāo)準(zhǔn)[2]。但有學(xué)者對(duì)65 歲以上的輕度認(rèn)知障礙患者進(jìn)行隨訪,發(fā)現(xiàn)在2 年后發(fā)展為阿爾茨海默病的輕度認(rèn)知障礙患者占15%[3],在5 年后發(fā)展為阿爾茨海默病的患者占32%[4]或38%[5]。研究結(jié)果顯示,輕度認(rèn)知障礙患者迅速轉(zhuǎn)化為阿爾茨海默病的風(fēng)險(xiǎn)很高,若能通過(guò)簡(jiǎn)單的日常生活能力和日常認(rèn)知能力初步篩查,發(fā)現(xiàn)可能的、存在潛在風(fēng)險(xiǎn)的輕度認(rèn)知障礙甚至阿爾茨海默病患者,具有較高的臨床意義。許多研究者也提出使用機(jī)器學(xué)習(xí)方法預(yù)測(cè)輕度認(rèn)知障礙的轉(zhuǎn)化。本文利用阿爾茨海默病相關(guān)患者的日常認(rèn)知自我報(bào)告清單,基于BP(back propagation,BP)神經(jīng)網(wǎng)絡(luò)模型構(gòu)建阿爾茨海默病不同病程的預(yù)測(cè)分類(lèi)器并對(duì)預(yù)測(cè)分類(lèi)器的性能進(jìn)行評(píng)估,研究利用阿爾茨海默病患者認(rèn)知診斷的分類(lèi)器判斷患者處于阿爾茲海默癥哪一個(gè)階段,為臨床治療提供依據(jù);同時(shí),盡早發(fā)現(xiàn)并診治也可防止產(chǎn)生更多的阿爾茨海默病患者。若該分類(lèi)器能普遍應(yīng)用于市場(chǎng)還可以讓老年人進(jìn)行自測(cè),從而能更早發(fā)現(xiàn)阿爾茲海默癥,并防止病情惡化。
輕度認(rèn)知障礙在醫(yī)學(xué)上被認(rèn)為是癡呆癥的早期癥狀,有些輕度認(rèn)知障礙患者會(huì)轉(zhuǎn)為阿爾茨海默病,但也會(huì)有些患者保持穩(wěn)定甚至出現(xiàn)逆轉(zhuǎn)恢復(fù)到正常狀態(tài),前者被稱(chēng)為進(jìn)展型輕度認(rèn)知功能障礙(progressive mild cognitive impairment,P-MCI),后者被稱(chēng)為穩(wěn)定型輕度認(rèn)知功能障礙(stable mild cognitive impairment,S-MCI)。國(guó)內(nèi)外許多研究者也提出使用機(jī)器學(xué)習(xí)方法預(yù)測(cè)輕度認(rèn)知障礙的轉(zhuǎn)化,如有學(xué)者利用MRI 數(shù)據(jù)的形態(tài)因子方法對(duì)49 名輕度認(rèn)知障礙患者進(jìn)行預(yù)測(cè),其準(zhǔn)確率為72.3%[6];有學(xué)者提出將多任務(wù)學(xué)習(xí)方法用于阿爾茨海默病的診斷,在43 名進(jìn)展型輕度認(rèn)知功能障礙P-MCI 和48 名S-MCI 患者的數(shù)據(jù)上進(jìn)行實(shí)驗(yàn),準(zhǔn)確率達(dá)到73.9%[7];有學(xué)者提出用于輔助阿爾茨海默病診斷的增量學(xué)習(xí)分類(lèi)方法,其中阿爾茨海默病和認(rèn)知正常(normal cognition,NC)的分類(lèi)準(zhǔn)確率為82%,P-MCI 與S-MCI 的分類(lèi)準(zhǔn)確率是71%[8];有學(xué)者提出一種新的用于阿爾茨海默病分類(lèi)的判別性稀疏學(xué)習(xí)方法,通過(guò)關(guān)系正則化項(xiàng)聯(lián)合預(yù)測(cè)阿爾茨海默病的臨床評(píng)分,并對(duì)阿爾茨海默病進(jìn)行分類(lèi),其中輕度認(rèn)知障礙與認(rèn)知正常的分類(lèi)準(zhǔn)確率為80.32%,P-MCI 和S-MCI 的分類(lèi)準(zhǔn)確率為74.58%[9]?,F(xiàn)有的研究側(cè)重于使用不同的數(shù)據(jù)及采用不同的分類(lèi)學(xué)習(xí)方法對(duì)病情階段進(jìn)行分類(lèi)。與一般研究常用的影像數(shù)據(jù)不同,本文利用阿爾茨海默病相關(guān)患者的日常認(rèn)知自我報(bào)告清單,基于BP神經(jīng)網(wǎng)絡(luò)模型構(gòu)建阿爾茨海默病不同病程的預(yù)測(cè)分類(lèi)器并評(píng)估預(yù)測(cè)分類(lèi)器的性能。與其他文獻(xiàn)方法比較,該方法準(zhǔn)確率更高,診斷性能更好,具有精度高、泛化能力良好、穩(wěn)定性好、易操作等優(yōu)勢(shì)。
阿爾茨海默病神經(jīng)影像學(xué)計(jì)劃(Alzheimer's Disease Neuroimaging Initiative,ADNI)是綜合臨床認(rèn)知功能評(píng)價(jià)、神經(jīng)影像學(xué)檢查、腦脊液和血液分子生物學(xué)標(biāo)志檢測(cè)等多種方法,以阿爾茨海默病為研究對(duì)象,開(kāi)展的多中心、跨學(xué)科縱向研究[10]。從研究計(jì)劃開(kāi)展以來(lái),阿爾茨海默病神經(jīng)影像學(xué)計(jì)劃的參與者跨越了ADNI-1、ADNI-GO、ADNI-2、ADNI-3 等4 個(gè)階段,目前正處于ADNI-3 階段,每個(gè)階段都會(huì)有新的志愿者加入?yún)⑴c調(diào)查。由于ADNI-1計(jì)劃階段未進(jìn)行參與者日常認(rèn)知自我報(bào)告清單的評(píng)估,因此本文只納入了ADNI-GO、ADNI-2、ADNI-3 等3 個(gè)階段參與者數(shù)據(jù),訪視期不限,參與者日常認(rèn)知自我報(bào)告清單和當(dāng)前診斷數(shù)據(jù)齊全即可作為有效數(shù)據(jù),其中ADNI-GO 計(jì)劃階段的有效數(shù)據(jù)共有468 例,ADNI-2 計(jì)劃階段的有效數(shù)據(jù)共有4 486 例,ADNI-3 計(jì)劃階段的有效數(shù)據(jù)共有1 372 例。ADNI-GO 包含認(rèn)知正常者、早期輕度認(rèn)知障礙、輕度認(rèn)知障礙、阿爾茨海默病4 種病程數(shù)據(jù);ADNI-2 包含認(rèn)知正常者、早期輕度認(rèn)知障礙、輕度認(rèn)知障礙、晚期輕度認(rèn)知障礙、阿爾茨海默病5 種病程數(shù)據(jù);ADNI-3 包含認(rèn)知正常者、輕度認(rèn)知障礙、阿爾茨海默病3 種病程數(shù)據(jù)。
參與者日常認(rèn)知自我報(bào)告清單包括記憶、語(yǔ)言、定位、計(jì)劃、條理、專(zhuān)注6 類(lèi),共40 個(gè)條目,各條目的計(jì)數(shù)資料編碼賦值結(jié)果見(jiàn)表1。

表1 阿爾茨海默病相關(guān)參與者日常認(rèn)知自我報(bào)告清單的條目賦值
BP 神經(jīng)網(wǎng)絡(luò)是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò)[11],其基本思想是梯度下降法,利用梯度搜索技術(shù),以期使網(wǎng)絡(luò)的實(shí)際輸出值和期望輸出值的誤差均方差達(dá)到最小。如圖1所示,BP 神經(jīng)網(wǎng)絡(luò)由輸入層、隱含層、輸出層3層構(gòu)成,包含信號(hào)的正向傳播和誤差的反向傳播2個(gè)過(guò)程[12]。正向傳播時(shí),輸入信號(hào)通過(guò)隱含層作用于輸出節(jié)點(diǎn),經(jīng)過(guò)非線性變換,產(chǎn)生輸出信號(hào),若實(shí)際輸出與期望輸出不相符,則轉(zhuǎn)入誤差的反向傳播過(guò)程。誤差反傳是將輸出誤差通過(guò)隱含層向輸入層逐層反傳,并將誤差分?jǐn)偨o各層所有單元,以從各層獲得的誤差信號(hào)作為調(diào)整各單元權(quán)值的依據(jù)。通過(guò)調(diào)整輸入節(jié)點(diǎn)與隱含層節(jié)點(diǎn)的鏈接強(qiáng)度和隱含層節(jié)點(diǎn)與輸出節(jié)點(diǎn)的鏈接強(qiáng)度及閾值,使誤差沿梯度方向下降,經(jīng)過(guò)反復(fù)學(xué)習(xí)訓(xùn)練,確定與最小誤差相對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù),訓(xùn)練即告停止[13]。

圖1 BP 神經(jīng)網(wǎng)絡(luò)
假設(shè)1 個(gè)BP 神經(jīng)網(wǎng)絡(luò)有R個(gè)節(jié)點(diǎn),每一層的傳遞函數(shù)均選擇Sigmoid 函數(shù)。a1i為隱含層節(jié)點(diǎn)i的輸出;a2k為輸出層節(jié)點(diǎn)K的輸出;w1ij是節(jié)點(diǎn)i與節(jié)點(diǎn)j之間的權(quán)值;w2ki是節(jié)點(diǎn)i跟節(jié)點(diǎn)k之間的權(quán)值;b1i為隱含層節(jié)點(diǎn)i的閾值;b2i為輸出層節(jié)點(diǎn)k的閾值。
BP 神經(jīng)網(wǎng)絡(luò)的主要實(shí)現(xiàn)步驟如下:
第一步:輸入樣本的正向傳播,計(jì)算隱含層和輸出層各神經(jīng)元的輸出值。
隱含層的第i個(gè)神經(jīng)元的輸出值的計(jì)算公式為:

輸出層的第k個(gè)神經(jīng)元的輸出值的計(jì)算公式為:

第二步:輸出誤差的反向傳播。
誤差函數(shù)的計(jì)算公式為:

在輸出層,從第i個(gè)輸入直至第k個(gè)輸出的權(quán)值的計(jì)算公式為:

其中,公式(4)中的γ為學(xué)習(xí)系數(shù)。
隱含層權(quán)值校正后,從第j個(gè)輸入到第i個(gè)輸出的權(quán)值的計(jì)算公式為:

第三步:循環(huán)記憶訓(xùn)練。為了進(jìn)一步提高網(wǎng)絡(luò)的精度,在不存在較大輸出誤差的情況下,對(duì)輸入到BP 神經(jīng)網(wǎng)絡(luò)的樣本進(jìn)行循環(huán)記憶訓(xùn)練。
第四步:檢驗(yàn)終止。完成循環(huán)記憶訓(xùn)練后,檢查輸出誤差的大小,達(dá)到標(biāo)準(zhǔn)則終止循環(huán)過(guò)程,否則持續(xù)循環(huán)。
為了減少模型訓(xùn)練時(shí)間、提高收斂性能,在確定輸入樣本后,需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理[14]。本文采用最值進(jìn)行標(biāo)準(zhǔn)化,公式為:

在3 個(gè)計(jì)劃階段的樣本集中,分別隨機(jī)抽取70%的樣本作為訓(xùn)練集(其中ADNI-GO 的數(shù)據(jù)為328 條、ADNI-2 的數(shù)據(jù)為3 140 條、ADNI-3 的數(shù)據(jù)為960 條),剩余的30%樣本作為測(cè)試集(其中ADNI-GO 的數(shù)據(jù)為140 條、ADNI-2 的數(shù)據(jù)為1 346條、ADNI-3 的數(shù)據(jù)為412 條),可一定程度上評(píng)估模型的泛化能力。本文在訓(xùn)練集上使用網(wǎng)格搜索方法,設(shè)置十折交叉驗(yàn)證優(yōu)化參數(shù)評(píng)估函數(shù),確定最佳模型,將最佳模型應(yīng)用到測(cè)試集上評(píng)估泛化能力。
本文運(yùn)用了雙隱含層BP 神經(jīng)網(wǎng)絡(luò),表2 匯總了3 個(gè)階段的訓(xùn)練中雙隱含層不同網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)組合對(duì)應(yīng)的模型準(zhǔn)確率,通過(guò)對(duì)比分析,確定模型最高準(zhǔn)確率對(duì)應(yīng)的最佳節(jié)點(diǎn)數(shù)組合。ADNI-GO 階段訓(xùn)練模型準(zhǔn)確率最高時(shí)隱含層節(jié)點(diǎn)數(shù)為(98,126),ADNI-2 階段訓(xùn)練模型準(zhǔn)確率最高時(shí)隱含層節(jié)點(diǎn)數(shù)為(224,216),ADNI-GO 階段訓(xùn)練模型準(zhǔn)確率最高時(shí)隱含層節(jié)點(diǎn)數(shù)為(170,36)。

表2 不同隱含層網(wǎng)絡(luò)結(jié)構(gòu)的部分訓(xùn)練結(jié)果
圖2 至圖7 是3 個(gè)獲取對(duì)應(yīng)的BP 神經(jīng)網(wǎng)絡(luò)模型計(jì)算的迭代次數(shù)與訓(xùn)練準(zhǔn)確率、測(cè)試準(zhǔn)確率之間的關(guān)系,以及迭代次數(shù)與訓(xùn)練丟失率、測(cè)試丟失率之間的關(guān)系。整體上,準(zhǔn)確率與迭代次數(shù)呈正比關(guān)系,丟失率與迭代次數(shù)呈反比關(guān)系。與ADNI-GO、ADNI-2 階段相比,ADNI-3 階段的準(zhǔn)確率和丟失率在訓(xùn)練集和測(cè)試集之間的差異最大。

圖2 ADNI-GO 階段迭代次數(shù)對(duì)準(zhǔn)確率的影響

圖3 ADNI-GO 階段迭代次數(shù)對(duì)丟失率的影響

圖4 ADNI-2 迭代次數(shù)對(duì)準(zhǔn)確率的影響

圖5 ADNI-2 階段迭代次數(shù)對(duì)丟失率的影響

圖6 ADNI-3 階段迭代次數(shù)對(duì)準(zhǔn)確率的影響

圖7 ADNI-3 階段迭代次數(shù)對(duì)丟失率的影響
ADNI-GO 階段訓(xùn)練模型的準(zhǔn)確率最高,ADNI-2階段的次之,ADNI-3 階段的最低,而ADNI-GO 階段的樣本量最小。因此,模型的準(zhǔn)確率并不是由樣本量決定的。ADNI-3 階段只有認(rèn)知正常者、輕度認(rèn)知障礙、阿爾茨海默病3 種類(lèi)型的參與者,并沒(méi)有區(qū)分早期輕度認(rèn)知障礙或晚期輕度認(rèn)知障礙患者,可能由于輕度認(rèn)知障礙患者劃分不夠細(xì)致,導(dǎo)致ADNI-3 階段訓(xùn)練模型的預(yù)測(cè)性能較差。
表2 的對(duì)比分析結(jié)果顯示,模型的準(zhǔn)確率并不是嚴(yán)格隨著隱含層節(jié)點(diǎn)數(shù)的增加而提高。理論上來(lái)說(shuō),隱含層的節(jié)點(diǎn)數(shù)越多,對(duì)信息重構(gòu)的損失越?。欢?jié)點(diǎn)數(shù)過(guò)少,在訓(xùn)練過(guò)程中可能丟失重要的特征信息。但是隱含層節(jié)點(diǎn)數(shù)過(guò)多,會(huì)導(dǎo)致模型的過(guò)擬合問(wèn)題。BP 神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力會(huì)隨著隱含層節(jié)點(diǎn)數(shù)的增加而增加,但學(xué)習(xí)能力變強(qiáng)一定程度上會(huì)導(dǎo)致模型將數(shù)據(jù)中的噪聲一并訓(xùn)練,噪聲可能將某些有效信息湮沒(méi),反而降低測(cè)試準(zhǔn)確率。因此,要綜合考量訓(xùn)練模型和測(cè)試模型的性能確定BP 神經(jīng)網(wǎng)絡(luò)的參數(shù)。
圖2 至圖7 顯示,模型準(zhǔn)確率會(huì)隨著迭代次數(shù)的增加而提升,但到了一定迭代次數(shù)之后模型準(zhǔn)確率將停止提升。理論上認(rèn)為迭代次數(shù)越多學(xué)習(xí)的程度更高,但迭代次數(shù)過(guò)多會(huì)消耗大量的時(shí)間和存儲(chǔ)空間,反而降低模型性能。相比于ADNI-GO 和ADNI-2 階段,ADNI-3 階段的訓(xùn)練集和測(cè)試集的準(zhǔn)確率和丟失率的差異都較大,即訓(xùn)練準(zhǔn)確率最高,而測(cè)試準(zhǔn)確率最低,說(shuō)明該模型出現(xiàn)了過(guò)擬合及泛化能力低下的問(wèn)題。ADNI-3 階段的輕度認(rèn)知障礙患者并沒(méi)有區(qū)分早期輕度認(rèn)知障礙或晚期輕度認(rèn)知障礙患者,由于早期和晚期癥狀的延續(xù)性和存在相似性導(dǎo)致劃分不細(xì)致,因此可能分類(lèi)不靈敏。阿爾茨海默病相關(guān)患者的病程劃分越細(xì)致,越能在早期準(zhǔn)確地被識(shí)別出來(lái)。
本文利用阿爾茨海默病相關(guān)患者的日常認(rèn)知自我報(bào)告清單,基于BP 神經(jīng)網(wǎng)絡(luò)模型構(gòu)建阿爾茨海默病不同病程的預(yù)測(cè)分類(lèi)器。實(shí)驗(yàn)結(jié)果顯示,ADNI-GO和ADNI-2計(jì)劃階段的訓(xùn)練模型均能達(dá)到90%的分類(lèi)準(zhǔn)確率,且具有精度高、泛化能力良好、穩(wěn)定性好、易操作等優(yōu)勢(shì)。因此,利用患者當(dāng)前日常認(rèn)知自我報(bào)告清單可以準(zhǔn)確預(yù)測(cè)分類(lèi)患者的病程階段,有利于患者盡快進(jìn)一步檢查或治療,具有一定的臨床價(jià)值。