基于BP 神經(jīng)網(wǎng)絡(luò)的阿爾茨海默病預(yù)測(cè)模型研究

2022-11-18 03:56:28劉育青勞鈺鈔陸麗明劉秀峰

中華醫(yī)學(xué)圖書(shū)情報(bào)雜志 2022年1期

關(guān)鍵詞：模型

駱文，劉育青，勞鈺鈔，陸麗明，劉秀峰

阿爾茨海默?。ˋlzeimer’s disease，AD）是一種神經(jīng)退行性疾病［1］，是臨床最常見(jiàn)的癡呆類(lèi)型［2］，有多個(gè)病程階段，包括臨床前阿爾茨海默病、早期輕度認(rèn)知障礙（early mild cognitive impairment，EMCI）、輕度認(rèn)知障礙（mild cognitive impairment，MCI）、晚期輕度認(rèn)知障礙（late mild cognitive impairment，LMCI）、阿爾茨海默病相關(guān)癡呆。全球老齡化日益加劇，預(yù)計(jì)到2050 年全球65 歲及以上阿爾茨海默病患者的數(shù)量將達(dá)到1.52億［1］，給社會(huì)及患者家屬帶來(lái)極大的負(fù)擔(dān)。輕度認(rèn)知障礙以輕度的認(rèn)知功能障礙和日常生活能力減退為特征，未達(dá)到癡呆的癥狀診斷標(biāo)準(zhǔn)［2］。但有學(xué)者對(duì)65 歲以上的輕度認(rèn)知障礙患者進(jìn)行隨訪，發(fā)現(xiàn)在2 年后發(fā)展為阿爾茨海默病的輕度認(rèn)知障礙患者占15%［3］，在5 年后發(fā)展為阿爾茨海默病的患者占32%［4］或38%［5］。研究結(jié)果顯示，輕度認(rèn)知障礙患者迅速轉(zhuǎn)化為阿爾茨海默病的風(fēng)險(xiǎn)很高，若能通過(guò)簡(jiǎn)單的日常生活能力和日常認(rèn)知能力初步篩查，發(fā)現(xiàn)可能的、存在潛在風(fēng)險(xiǎn)的輕度認(rèn)知障礙甚至阿爾茨海默病患者，具有較高的臨床意義。許多研究者也提出使用機(jī)器學(xué)習(xí)方法預(yù)測(cè)輕度認(rèn)知障礙的轉(zhuǎn)化。本文利用阿爾茨海默病相關(guān)患者的日常認(rèn)知自我報(bào)告清單，基于BP（back propagation，BP）神經(jīng)網(wǎng)絡(luò)模型構(gòu)建阿爾茨海默病不同病程的預(yù)測(cè)分類(lèi)器并對(duì)預(yù)測(cè)分類(lèi)器的性能進(jìn)行評(píng)估，研究利用阿爾茨海默病患者認(rèn)知診斷的分類(lèi)器判斷患者處于阿爾茲海默癥哪一個(gè)階段，為臨床治療提供依據(jù)；同時(shí)，盡早發(fā)現(xiàn)并診治也可防止產(chǎn)生更多的阿爾茨海默病患者。若該分類(lèi)器能普遍應(yīng)用于市場(chǎng)還可以讓老年人進(jìn)行自測(cè)，從而能更早發(fā)現(xiàn)阿爾茲海默癥，并防止病情惡化。

1 相關(guān)研究

輕度認(rèn)知障礙在醫(yī)學(xué)上被認(rèn)為是癡呆癥的早期癥狀，有些輕度認(rèn)知障礙患者會(huì)轉(zhuǎn)為阿爾茨海默病，但也會(huì)有些患者保持穩(wěn)定甚至出現(xiàn)逆轉(zhuǎn)恢復(fù)到正常狀態(tài)，前者被稱(chēng)為進(jìn)展型輕度認(rèn)知功能障礙（progressive mild cognitive impairment，P-MCI），后者被稱(chēng)為穩(wěn)定型輕度認(rèn)知功能障礙（stable mild cognitive impairment，S-MCI）。國(guó)內(nèi)外許多研究者也提出使用機(jī)器學(xué)習(xí)方法預(yù)測(cè)輕度認(rèn)知障礙的轉(zhuǎn)化，如有學(xué)者利用MRI 數(shù)據(jù)的形態(tài)因子方法對(duì)49 名輕度認(rèn)知障礙患者進(jìn)行預(yù)測(cè)，其準(zhǔn)確率為72.3%［6］；有學(xué)者提出將多任務(wù)學(xué)習(xí)方法用于阿爾茨海默病的診斷，在43 名進(jìn)展型輕度認(rèn)知功能障礙P-MCI 和48 名S-MCI 患者的數(shù)據(jù)上進(jìn)行實(shí)驗(yàn)，準(zhǔn)確率達(dá)到73.9%［7］；有學(xué)者提出用于輔助阿爾茨海默病診斷的增量學(xué)習(xí)分類(lèi)方法，其中阿爾茨海默病和認(rèn)知正常（normal cognition，NC）的分類(lèi)準(zhǔn)確率為82%，P-MCI 與S-MCI 的分類(lèi)準(zhǔn)確率是71%［8］；有學(xué)者提出一種新的用于阿爾茨海默病分類(lèi)的判別性稀疏學(xué)習(xí)方法，通過(guò)關(guān)系正則化項(xiàng)聯(lián)合預(yù)測(cè)阿爾茨海默病的臨床評(píng)分，并對(duì)阿爾茨海默病進(jìn)行分類(lèi)，其中輕度認(rèn)知障礙與認(rèn)知正常的分類(lèi)準(zhǔn)確率為80.32%，P-MCI 和S-MCI 的分類(lèi)準(zhǔn)確率為74.58%［9］?，F(xiàn)有的研究側(cè)重于使用不同的數(shù)據(jù)及采用不同的分類(lèi)學(xué)習(xí)方法對(duì)病情階段進(jìn)行分類(lèi)。與一般研究常用的影像數(shù)據(jù)不同，本文利用阿爾茨海默病相關(guān)患者的日常認(rèn)知自我報(bào)告清單，基于BP神經(jīng)網(wǎng)絡(luò)模型構(gòu)建阿爾茨海默病不同病程的預(yù)測(cè)分類(lèi)器并評(píng)估預(yù)測(cè)分類(lèi)器的性能。與其他文獻(xiàn)方法比較，該方法準(zhǔn)確率更高，診斷性能更好，具有精度高、泛化能力良好、穩(wěn)定性好、易操作等優(yōu)勢(shì)。

2 數(shù)據(jù)收集與處理

阿爾茨海默病神經(jīng)影像學(xué)計(jì)劃（Alzheimer's Disease Neuroimaging Initiative，ADNI）是綜合臨床認(rèn)知功能評(píng)價(jià)、神經(jīng)影像學(xué)檢查、腦脊液和血液分子生物學(xué)標(biāo)志檢測(cè)等多種方法，以阿爾茨海默病為研究對(duì)象，開(kāi)展的多中心、跨學(xué)科縱向研究［10］。從研究計(jì)劃開(kāi)展以來(lái)，阿爾茨海默病神經(jīng)影像學(xué)計(jì)劃的參與者跨越了ADNI-1、ADNI-GO、ADNI-2、ADNI-3 等4 個(gè)階段，目前正處于ADNI-3 階段，每個(gè)階段都會(huì)有新的志愿者加入?yún)⑴c調(diào)查。由于ADNI-1計(jì)劃階段未進(jìn)行參與者日常認(rèn)知自我報(bào)告清單的評(píng)估，因此本文只納入了ADNI-GO、ADNI-2、ADNI-3 等3 個(gè)階段參與者數(shù)據(jù)，訪視期不限，參與者日常認(rèn)知自我報(bào)告清單和當(dāng)前診斷數(shù)據(jù)齊全即可作為有效數(shù)據(jù)，其中ADNI-GO 計(jì)劃階段的有效數(shù)據(jù)共有468 例，ADNI-2 計(jì)劃階段的有效數(shù)據(jù)共有4 486 例，ADNI-3 計(jì)劃階段的有效數(shù)據(jù)共有1 372 例。ADNI-GO 包含認(rèn)知正常者、早期輕度認(rèn)知障礙、輕度認(rèn)知障礙、阿爾茨海默病4 種病程數(shù)據(jù)；ADNI-2 包含認(rèn)知正常者、早期輕度認(rèn)知障礙、輕度認(rèn)知障礙、晚期輕度認(rèn)知障礙、阿爾茨海默病5 種病程數(shù)據(jù)；ADNI-3 包含認(rèn)知正常者、輕度認(rèn)知障礙、阿爾茨海默病3 種病程數(shù)據(jù)。

參與者日常認(rèn)知自我報(bào)告清單包括記憶、語(yǔ)言、定位、計(jì)劃、條理、專(zhuān)注6 類(lèi)，共40 個(gè)條目，各條目的計(jì)數(shù)資料編碼賦值結(jié)果見(jiàn)表1。

表1 阿爾茨海默病相關(guān)參與者日常認(rèn)知自我報(bào)告清單的條目賦值

3 BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型

3.1 BP 神經(jīng)網(wǎng)絡(luò)模型原理

BP 神經(jīng)網(wǎng)絡(luò)是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò)［11］，其基本思想是梯度下降法，利用梯度搜索技術(shù)，以期使網(wǎng)絡(luò)的實(shí)際輸出值和期望輸出值的誤差均方差達(dá)到最小。如圖1所示，BP 神經(jīng)網(wǎng)絡(luò)由輸入層、隱含層、輸出層3層構(gòu)成，包含信號(hào)的正向傳播和誤差的反向傳播2個(gè)過(guò)程［12］。正向傳播時(shí)，輸入信號(hào)通過(guò)隱含層作用于輸出節(jié)點(diǎn)，經(jīng)過(guò)非線性變換，產(chǎn)生輸出信號(hào)，若實(shí)際輸出與期望輸出不相符，則轉(zhuǎn)入誤差的反向傳播過(guò)程。誤差反傳是將輸出誤差通過(guò)隱含層向輸入層逐層反傳，并將誤差分?jǐn)偨o各層所有單元，以從各層獲得的誤差信號(hào)作為調(diào)整各單元權(quán)值的依據(jù)。通過(guò)調(diào)整輸入節(jié)點(diǎn)與隱含層節(jié)點(diǎn)的鏈接強(qiáng)度和隱含層節(jié)點(diǎn)與輸出節(jié)點(diǎn)的鏈接強(qiáng)度及閾值，使誤差沿梯度方向下降，經(jīng)過(guò)反復(fù)學(xué)習(xí)訓(xùn)練，確定與最小誤差相對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù)，訓(xùn)練即告停止［13］。

圖1 BP 神經(jīng)網(wǎng)絡(luò)

假設(shè)1 個(gè)BP 神經(jīng)網(wǎng)絡(luò)有R個(gè)節(jié)點(diǎn)，每一層的傳遞函數(shù)均選擇Sigmoid 函數(shù)。a1i為隱含層節(jié)點(diǎn)i的輸出；a2k為輸出層節(jié)點(diǎn)K的輸出；w1ij是節(jié)點(diǎn)i與節(jié)點(diǎn)j之間的權(quán)值；w2ki是節(jié)點(diǎn)i跟節(jié)點(diǎn)k之間的權(quán)值；b1i為隱含層節(jié)點(diǎn)i的閾值；b2i為輸出層節(jié)點(diǎn)k的閾值。

BP 神經(jīng)網(wǎng)絡(luò)的主要實(shí)現(xiàn)步驟如下：

第一步：輸入樣本的正向傳播，計(jì)算隱含層和輸出層各神經(jīng)元的輸出值。

隱含層的第i個(gè)神經(jīng)元的輸出值的計(jì)算公式為：

輸出層的第k個(gè)神經(jīng)元的輸出值的計(jì)算公式為：

第二步：輸出誤差的反向傳播。

誤差函數(shù)的計(jì)算公式為：

在輸出層，從第i個(gè)輸入直至第k個(gè)輸出的權(quán)值的計(jì)算公式為：

其中，公式（4）中的γ為學(xué)習(xí)系數(shù)。

隱含層權(quán)值校正后，從第j個(gè)輸入到第i個(gè)輸出的權(quán)值的計(jì)算公式為：

第三步：循環(huán)記憶訓(xùn)練。為了進(jìn)一步提高網(wǎng)絡(luò)的精度，在不存在較大輸出誤差的情況下，對(duì)輸入到BP 神經(jīng)網(wǎng)絡(luò)的樣本進(jìn)行循環(huán)記憶訓(xùn)練。

第四步：檢驗(yàn)終止。完成循環(huán)記憶訓(xùn)練后，檢查輸出誤差的大小，達(dá)到標(biāo)準(zhǔn)則終止循環(huán)過(guò)程，否則持續(xù)循環(huán)。

3.2 模型構(gòu)建

為了減少模型訓(xùn)練時(shí)間、提高收斂性能，在確定輸入樣本后，需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理［14］。本文采用最值進(jìn)行標(biāo)準(zhǔn)化，公式為：

在3 個(gè)計(jì)劃階段的樣本集中，分別隨機(jī)抽取70%的樣本作為訓(xùn)練集（其中ADNI-GO 的數(shù)據(jù)為328 條、ADNI-2 的數(shù)據(jù)為3 140 條、ADNI-3 的數(shù)據(jù)為960 條），剩余的30%樣本作為測(cè)試集（其中ADNI-GO 的數(shù)據(jù)為140 條、ADNI-2 的數(shù)據(jù)為1 346條、ADNI-3 的數(shù)據(jù)為412 條），可一定程度上評(píng)估模型的泛化能力。本文在訓(xùn)練集上使用網(wǎng)格搜索方法，設(shè)置十折交叉驗(yàn)證優(yōu)化參數(shù)評(píng)估函數(shù)，確定最佳模型，將最佳模型應(yīng)用到測(cè)試集上評(píng)估泛化能力。

4 模型應(yīng)用與分析

4.1 模型應(yīng)用

本文運(yùn)用了雙隱含層BP 神經(jīng)網(wǎng)絡(luò)，表2 匯總了3 個(gè)階段的訓(xùn)練中雙隱含層不同網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)組合對(duì)應(yīng)的模型準(zhǔn)確率，通過(guò)對(duì)比分析，確定模型最高準(zhǔn)確率對(duì)應(yīng)的最佳節(jié)點(diǎn)數(shù)組合。ADNI-GO 階段訓(xùn)練模型準(zhǔn)確率最高時(shí)隱含層節(jié)點(diǎn)數(shù)為（98，126），ADNI-2 階段訓(xùn)練模型準(zhǔn)確率最高時(shí)隱含層節(jié)點(diǎn)數(shù)為（224，216），ADNI-GO 階段訓(xùn)練模型準(zhǔn)確率最高時(shí)隱含層節(jié)點(diǎn)數(shù)為（170，36）。

表2 不同隱含層網(wǎng)絡(luò)結(jié)構(gòu)的部分訓(xùn)練結(jié)果

圖2 至圖7 是3 個(gè)獲取對(duì)應(yīng)的BP 神經(jīng)網(wǎng)絡(luò)模型計(jì)算的迭代次數(shù)與訓(xùn)練準(zhǔn)確率、測(cè)試準(zhǔn)確率之間的關(guān)系，以及迭代次數(shù)與訓(xùn)練丟失率、測(cè)試丟失率之間的關(guān)系。整體上，準(zhǔn)確率與迭代次數(shù)呈正比關(guān)系，丟失率與迭代次數(shù)呈反比關(guān)系。與ADNI-GO、ADNI-2 階段相比，ADNI-3 階段的準(zhǔn)確率和丟失率在訓(xùn)練集和測(cè)試集之間的差異最大。

圖2 ADNI-GO 階段迭代次數(shù)對(duì)準(zhǔn)確率的影響

圖3 ADNI-GO 階段迭代次數(shù)對(duì)丟失率的影響

圖4 ADNI-2 迭代次數(shù)對(duì)準(zhǔn)確率的影響

圖5 ADNI-2 階段迭代次數(shù)對(duì)丟失率的影響

圖6 ADNI-3 階段迭代次數(shù)對(duì)準(zhǔn)確率的影響

圖7 ADNI-3 階段迭代次數(shù)對(duì)丟失率的影響

4.2 分析

ADNI-GO 階段訓(xùn)練模型的準(zhǔn)確率最高，ADNI-2階段的次之，ADNI-3 階段的最低，而ADNI-GO 階段的樣本量最小。因此，模型的準(zhǔn)確率并不是由樣本量決定的。ADNI-3 階段只有認(rèn)知正常者、輕度認(rèn)知障礙、阿爾茨海默病3 種類(lèi)型的參與者，并沒(méi)有區(qū)分早期輕度認(rèn)知障礙或晚期輕度認(rèn)知障礙患者，可能由于輕度認(rèn)知障礙患者劃分不夠細(xì)致，導(dǎo)致ADNI-3 階段訓(xùn)練模型的預(yù)測(cè)性能較差。

表2 的對(duì)比分析結(jié)果顯示，模型的準(zhǔn)確率并不是嚴(yán)格隨著隱含層節(jié)點(diǎn)數(shù)的增加而提高。理論上來(lái)說(shuō)，隱含層的節(jié)點(diǎn)數(shù)越多，對(duì)信息重構(gòu)的損失越?。欢?jié)點(diǎn)數(shù)過(guò)少，在訓(xùn)練過(guò)程中可能丟失重要的特征信息。但是隱含層節(jié)點(diǎn)數(shù)過(guò)多，會(huì)導(dǎo)致模型的過(guò)擬合問(wèn)題。BP 神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力會(huì)隨著隱含層節(jié)點(diǎn)數(shù)的增加而增加，但學(xué)習(xí)能力變強(qiáng)一定程度上會(huì)導(dǎo)致模型將數(shù)據(jù)中的噪聲一并訓(xùn)練，噪聲可能將某些有效信息湮沒(méi)，反而降低測(cè)試準(zhǔn)確率。因此，要綜合考量訓(xùn)練模型和測(cè)試模型的性能確定BP 神經(jīng)網(wǎng)絡(luò)的參數(shù)。

圖2 至圖7 顯示，模型準(zhǔn)確率會(huì)隨著迭代次數(shù)的增加而提升，但到了一定迭代次數(shù)之后模型準(zhǔn)確率將停止提升。理論上認(rèn)為迭代次數(shù)越多學(xué)習(xí)的程度更高，但迭代次數(shù)過(guò)多會(huì)消耗大量的時(shí)間和存儲(chǔ)空間，反而降低模型性能。相比于ADNI-GO 和ADNI-2 階段，ADNI-3 階段的訓(xùn)練集和測(cè)試集的準(zhǔn)確率和丟失率的差異都較大，即訓(xùn)練準(zhǔn)確率最高，而測(cè)試準(zhǔn)確率最低，說(shuō)明該模型出現(xiàn)了過(guò)擬合及泛化能力低下的問(wèn)題。ADNI-3 階段的輕度認(rèn)知障礙患者并沒(méi)有區(qū)分早期輕度認(rèn)知障礙或晚期輕度認(rèn)知障礙患者，由于早期和晚期癥狀的延續(xù)性和存在相似性導(dǎo)致劃分不細(xì)致，因此可能分類(lèi)不靈敏。阿爾茨海默病相關(guān)患者的病程劃分越細(xì)致，越能在早期準(zhǔn)確地被識(shí)別出來(lái)。

5 結(jié)語(yǔ)

本文利用阿爾茨海默病相關(guān)患者的日常認(rèn)知自我報(bào)告清單，基于BP 神經(jīng)網(wǎng)絡(luò)模型構(gòu)建阿爾茨海默病不同病程的預(yù)測(cè)分類(lèi)器。實(shí)驗(yàn)結(jié)果顯示，ADNI-GO和ADNI-2計(jì)劃階段的訓(xùn)練模型均能達(dá)到90%的分類(lèi)準(zhǔn)確率，且具有精度高、泛化能力良好、穩(wěn)定性好、易操作等優(yōu)勢(shì)。因此，利用患者當(dāng)前日常認(rèn)知自我報(bào)告清單可以準(zhǔn)確預(yù)測(cè)分類(lèi)患者的病程階段，有利于患者盡快進(jìn)一步檢查或治療，具有一定的臨床價(jià)值。