曾安,高征
(廣東工業(yè)大學(xué)計(jì)算機(jī)學(xué)院,廣州 510006)
阿爾茨海默病(Alzheimer′s disease,AD)的早期診斷對(duì)于研發(fā)新型藥物和及時(shí)采取措施干預(yù)治療、減緩患者病情發(fā)展具有重要意義。近年來(lái),神經(jīng)影像技術(shù)在AD早期診斷方面取得了驚人的成績(jī)。其中以機(jī)器學(xué)習(xí)為代表的分析方法在使用MRI圖像[1]預(yù)測(cè)患者所處階段方面取得了良好的效果。而基于傳統(tǒng)的機(jī)器學(xué)習(xí)研究方法中,通常需要人為挑選出AD患者和正常受試者之間變化比較明顯的大腦區(qū)域,如海馬、杏仁核、顳葉等感興趣區(qū)域;然后利用機(jī)器學(xué)習(xí)方法進(jìn)行分析預(yù)測(cè),如支持向量機(jī)[2](support vector machine,SVM)、AdaBoost等[3]算法;這種研究AD的方法雖然取得了不錯(cuò)的效果,但仍存在一定的局限性:即從整體特征集中僅提取一部分特征子集,會(huì)丟失一些潛在的、至今尚未發(fā)現(xiàn)但對(duì)AD病情產(chǎn)生影響的特征信息。
以深度學(xué)習(xí)[4-5]為代表的分析方法可分為基于2D的卷積神經(jīng)網(wǎng)絡(luò)(CNN)識(shí)別方法和基于3D的CNN識(shí)別方法?;?D CNN的識(shí)別模型,如文獻(xiàn)[6]中選取一張穿過(guò)海馬體切片,并對(duì)應(yīng)訓(xùn)練CNN分類模型;以及文獻(xiàn)[7]針對(duì)三維MRI圖像,在三個(gè)維度上獲得多個(gè)二維切片,分別輸入到對(duì)應(yīng)的CNN網(wǎng)絡(luò)模型中訓(xùn)練并集成的方法。上述方法雖然能在AD的早期診斷中取得不錯(cuò)的效果,但對(duì)三維MRI圖像進(jìn)行切片處理,削弱了受試者大腦組織結(jié)構(gòu)的空間聯(lián)系,且訓(xùn)練多個(gè)2D CNN模型計(jì)算成本也相對(duì)較高。而基于3D CNN[8]的識(shí)別模型,如文獻(xiàn)[9]基于整個(gè)三維MRI圖像的3D-ResNet[10]的識(shí)別方法,以及文獻(xiàn)[11]基于感興趣區(qū)域的3D CNN識(shí)別方法?;?D CNN的識(shí)別方法雖然充分考慮了受試者腦組織結(jié)構(gòu)的空間聯(lián)系,但是其訓(xùn)練過(guò)程對(duì)硬件資源要求較高,且計(jì)算成本高。
針對(duì)上述方法在AD早期診斷識(shí)別中存在的問(wèn)題,本研究提出了一種融合注意力機(jī)制的阿爾茨海默癥識(shí)別模型。該模型更加適用于AD識(shí)別診斷,對(duì)硬件資源要求較低,且具有較高的性能優(yōu)勢(shì);引入直映式注意力機(jī)制,提高了模型的識(shí)別能力和穩(wěn)定性;利用TSVM優(yōu)化基分類器的設(shè)計(jì),進(jìn)一步提高了識(shí)別精度;模型不依賴領(lǐng)域知識(shí),無(wú)需人為挑選受試者大腦變化明顯的區(qū)域。
視覺(jué)注意力機(jī)制是人類視覺(jué)所特有的大腦信號(hào)處理機(jī)制。人類視覺(jué)通過(guò)快速掃描全局圖像,獲得需要重點(diǎn)關(guān)注的目標(biāo)區(qū)域,而后對(duì)該區(qū)域投入更多注意力資源,以獲取更多的目標(biāo)細(xì)節(jié)信息,從而抑制其他無(wú)用信息。
近年來(lái),隨著深度學(xué)習(xí)的發(fā)展和視覺(jué)系統(tǒng)注意力機(jī)制的研究。越來(lái)越多的科研人員傾向于在深度學(xué)習(xí)模型中添加注意力機(jī)制,用于優(yōu)化網(wǎng)絡(luò)模型的整體性能。雖然實(shí)現(xiàn)注意力機(jī)制的方式各不相同,但大多數(shù)研究人員傾向于使用掩碼的方式來(lái)形成注意力機(jī)制。如計(jì)算機(jī)視覺(jué)領(lǐng)域的軟注意力機(jī)制[12-14],是通過(guò)給網(wǎng)絡(luò)模型中的某些層所提取到的特征,采取一種合理的方式分配掩碼權(quán)重。在側(cè)枝網(wǎng)絡(luò)層中通過(guò)掩碼權(quán)重的大小來(lái)調(diào)節(jié)相應(yīng)主枝網(wǎng)絡(luò)層的注意力,見(jiàn)圖1。文獻(xiàn)[13]提出一種壓縮-激勵(lì)注意力機(jī)制,其在側(cè)枝網(wǎng)絡(luò)層中對(duì)通道域使用1*1的卷積來(lái)對(duì)主枝網(wǎng)絡(luò)層中的權(quán)重參數(shù)進(jìn)行調(diào)節(jié);文獻(xiàn)[14]提出一種基于殘差思想的注意力機(jī)制,其在側(cè)枝網(wǎng)絡(luò)中通過(guò)下采樣和上采樣的方式來(lái)調(diào)整相應(yīng)主枝網(wǎng)絡(luò)層的權(quán)重參數(shù)。本研究受深度學(xué)習(xí)與計(jì)算機(jī)視覺(jué)注意力機(jī)制相關(guān)工作的啟發(fā),提出一種直映式注意力機(jī)制。

圖1 深度學(xué)習(xí)中的注意力機(jī)制
集成學(xué)習(xí)[15]是使用一系列學(xué)習(xí)器進(jìn)行學(xué)習(xí),并使用某種規(guī)則把各個(gè)學(xué)習(xí)結(jié)果進(jìn)行整合,從而獲得比單一學(xué)習(xí)器更好的學(xué)習(xí)效果的一種機(jī)器學(xué)習(xí)方法。目前常見(jiàn)的集成學(xué)習(xí)方法可以總結(jié)為以下兩類:一類是串行集成方法,利用基礎(chǔ)模型之間的依賴,通過(guò)給錯(cuò)分樣本一個(gè)較大的權(quán)重來(lái)提升性能;另一類是并行集成方法,利用基礎(chǔ)模型的獨(dú)立性,通過(guò)平均能夠較大地降低誤差。本研究的集成分類方法屬于并行集成,每個(gè)基分類器是同質(zhì)的。
本研究的融合注意力機(jī)制的識(shí)別模型總體結(jié)構(gòu),見(jiàn)圖2;整體實(shí)驗(yàn)流程圖,見(jiàn)圖3。首先,對(duì)經(jīng)過(guò)預(yù)處理步驟得到的三維MRI圖像使用腦區(qū)模板標(biāo)簽(automated anatomical labeling,AAL)劃分受試者的大腦區(qū)域并對(duì)應(yīng)提取K個(gè)腦區(qū)的體素?cái)?shù)據(jù);然后,將不同受試者之間屬于同一腦區(qū)的體素?cái)?shù)據(jù)按照行向量的形式依次排列,對(duì)應(yīng)構(gòu)造各個(gè)腦區(qū)的所屬基分類器,每個(gè)基分類器主要由直映式注意力機(jī)制、特征選擇和分類算法構(gòu)成。

圖2 融合注意力機(jī)制的識(shí)別模型總體結(jié)構(gòu)

圖3 總體實(shí)驗(yàn)流程圖
直映式注意力機(jī)制其設(shè)計(jì)思想為:首先需要探究哪些特征是值得被關(guān)注的,然后通過(guò)合理的方式獲得注意力機(jī)制中的掩碼權(quán)重,最后將掩碼權(quán)重融合到被關(guān)注的特征數(shù)據(jù),從而達(dá)到特征增強(qiáng)的效果。
本研究通過(guò)計(jì)算特征與類別標(biāo)簽之間的相關(guān)系數(shù)來(lái)獲得注意力機(jī)制中值得被關(guān)注的重要特征數(shù)據(jù)。經(jīng)預(yù)處理提取出每個(gè)腦區(qū)所對(duì)應(yīng)的體素?cái)?shù)據(jù),可以采用式(1)所示的Pearson相關(guān)系數(shù)來(lái)計(jì)算體素特征與類別標(biāo)簽之間的線性相關(guān)程度;也可以采用Kendall等級(jí)相關(guān)系數(shù)來(lái)衡量體素特征與標(biāo)簽之間的非線性相關(guān)程度。
(1)
其中:Xij表示第i個(gè)腦區(qū)中的第j列體素向量,Yij表示所對(duì)應(yīng)的類別標(biāo)簽,E(XijYij)表示向量Xij與向量Yij乘積的期望,同理其它與之類似;而Cofij表示第i個(gè)腦區(qū)中的第j列體素向量對(duì)于類別標(biāo)簽的重要程度。使用式(1)計(jì)算出腦區(qū)中每一列體素?cái)?shù)據(jù)對(duì)于類別標(biāo)簽的重要程度。然后將特征與類別標(biāo)簽之間的相關(guān)系數(shù)通過(guò)激活函數(shù)映射為注意力機(jī)制中對(duì)特征所優(yōu)化的掩碼權(quán)重,其所對(duì)應(yīng)的激活函數(shù),見(jiàn)式(2)。
(2)
該激活函數(shù)基于sigmoid函數(shù),通過(guò)將其進(jìn)行適當(dāng)?shù)囊苿?dòng)和縮放后得到,絕對(duì)值操作則表明負(fù)相關(guān)性特征在注意力機(jī)制中同正相關(guān)性特征等價(jià)。該激活函數(shù)充分考慮了特征與標(biāo)簽之間的正相關(guān)性和負(fù)相關(guān)性對(duì)于分類的影響,且能夠?qū)⒆⒁饬C(jī)制中對(duì)特征所優(yōu)化的掩碼權(quán)重的取值范圍約束在[0,1)。其中Wij表示注意力機(jī)制中第i個(gè)腦區(qū)、第j列體素?cái)?shù)據(jù)所對(duì)應(yīng)的掩碼權(quán)重。
Att_Xij=(1+Wij)Xij
(3)
使用式(2)計(jì)算出腦區(qū)i中每一列體素?cái)?shù)據(jù)所對(duì)應(yīng)的掩碼權(quán)重。然后使用式(3)進(jìn)行注意力機(jī)制的融合。如果單純的將掩碼權(quán)重與特征數(shù)據(jù)做點(diǎn)乘操作,會(huì)降低本研究識(shí)別模型的性能。但根據(jù)文獻(xiàn)[14]所提出的一種基于殘差學(xué)習(xí)思想的注意力融合機(jī)制,本研究利用其思想進(jìn)行注意力的融合操作。其中Att_Xij表示融合注意力機(jī)制后的第i個(gè)腦區(qū)、第j列體素向量。
2.2.1特征選擇 在預(yù)處理過(guò)程中,由于沒(méi)有對(duì)三維MRI圖像進(jìn)行灰質(zhì)、白質(zhì)的分割,輸入到每個(gè)基分類器中的特征集將會(huì)存在大量的冗余特征。即使在每個(gè)基分類器中對(duì)輸入的特征集融合注意力操作,高維度的數(shù)據(jù)特征也較易影響識(shí)別結(jié)果。此外,按照AAL腦區(qū)模板來(lái)劃分受試者的三維MRI圖像,則每個(gè)腦區(qū)所包含的體素?cái)?shù)量都不盡相同,如:有的腦區(qū)僅包含幾百個(gè)體素?cái)?shù)據(jù),而有的腦區(qū)則含有上萬(wàn)個(gè)體素?cái)?shù)據(jù)。為了避免腦區(qū)與腦區(qū)之間體素特征數(shù)量上的差異對(duì)分類的影響,在構(gòu)造基分類器的流程中融合特征選擇算法進(jìn)行特征剔除。通過(guò)計(jì)算每個(gè)腦區(qū)中所對(duì)應(yīng)的體素特征數(shù)據(jù)與類別標(biāo)簽向量的相關(guān)系數(shù),比較相關(guān)系數(shù)絕對(duì)值的大小,篩選并保留與標(biāo)簽向量正相關(guān)性和負(fù)相關(guān)性相對(duì)較高的體素?cái)?shù)據(jù)。
2.2.2分類模型 基分類器中的分類模型可以使用隨機(jī)森林(random forest,RF)、支持向量機(jī)(support vector machine,SVM)、K最近鄰(K-nearest neighbor,KNN)等分類算法。本研究采用SVM分類算法進(jìn)行分類。SVM算法通過(guò)在訓(xùn)練數(shù)據(jù)的特征空間上找到一個(gè)間隔最大的分類超平面,從而保證分類精度。對(duì)于非線性分類問(wèn)題,SVM可通過(guò)核技巧將原始數(shù)據(jù)映射到新的特征空間,然后在新的特征空間里用線性分類學(xué)習(xí)方法從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)分類模型。常用的核函數(shù)有線性核函數(shù)、多項(xiàng)式核函數(shù)、高斯徑向基核函數(shù)和Sigmoid核函數(shù)等等。SVM算法的預(yù)測(cè)類別y與訓(xùn)練樣本集x之間的關(guān)系可以用式(4)表示,其中N為參與訓(xùn)練的數(shù)據(jù)樣本量,wn為SVM算法在訓(xùn)練階段給第n個(gè)樣本分配的權(quán)重,tn為訓(xùn)練階段中第n個(gè)樣本的標(biāo)簽,k(x,xn)為核函數(shù),b是門限參數(shù)。
(4)
本研究選擇投票法進(jìn)行基分類器的融合。通過(guò)訓(xùn)練集來(lái)訓(xùn)練每個(gè)腦區(qū)所對(duì)應(yīng)的基分類器,通過(guò)驗(yàn)證集來(lái)挑選出與AD疾病相關(guān)性較高的前k個(gè)腦區(qū),然后在測(cè)試集上使用投票法集成驗(yàn)證集所篩選出的k個(gè)腦區(qū),以此來(lái)評(píng)估本研究識(shí)別方法的最終性能。
在早期研究AD的識(shí)別診斷方法中,大多基于有監(jiān)督學(xué)習(xí)方法,即只使用有標(biāo)記的數(shù)據(jù)樣本來(lái)學(xué)習(xí)模型。而半監(jiān)督學(xué)習(xí)方法能夠在學(xué)習(xí)過(guò)程中充分使用未標(biāo)記數(shù)據(jù)和標(biāo)記數(shù)據(jù),以提高分類性能。在此,本研究利用直推式支持向量機(jī)[16](TSVM)對(duì)上述識(shí)別模型中的有監(jiān)督分類器進(jìn)行優(yōu)化。TSVM采用局部搜索的策略來(lái)進(jìn)行迭代求解,其核心思想為:為未標(biāo)記樣本找到合適的標(biāo)記指派,使得超平面劃分后的間隔最大化。該優(yōu)化目標(biāo)為利用AD和正常對(duì)照組(記為HC)來(lái)優(yōu)化具有認(rèn)知障礙(記為MCI)和AD二分類實(shí)驗(yàn)組;以及利用AD和HC來(lái)優(yōu)化MCI和HC二分類實(shí)驗(yàn)組。只需將圖2中的有監(jiān)督基分類器替換為基于TSVM的半監(jiān)督遷移學(xué)習(xí)分類器,其所對(duì)應(yīng)的流程見(jiàn)圖4。

圖4 基于TSVM的半監(jiān)督遷移學(xué)習(xí)基分類器流程圖
本研究的所有數(shù)據(jù)均來(lái)自于阿爾茨海默病神經(jīng)成像(ADNI)數(shù)據(jù)庫(kù)(adni.loni.usc.edu),該數(shù)據(jù)庫(kù)免費(fèi)為全世界的科研人員提供數(shù)據(jù)。
本研究從ADNI數(shù)據(jù)庫(kù)中下載了861名受試者的MRI圖像數(shù)據(jù),用于劃分訓(xùn)練集和測(cè)試集。受試者中AD人數(shù)為194人,HC人數(shù)為277人, MCI人數(shù)為390人。但上述MRI圖像數(shù)據(jù)中存在一個(gè)受試者不同時(shí)刻的多張MRI圖像數(shù)據(jù),為了避免實(shí)驗(yàn)過(guò)程中因其所引起的數(shù)據(jù)泄露,本研究選擇剔除同一受試者中不同時(shí)刻的多張MRI圖像,僅保留其中一張MRI圖像。剔除后的AD組101人,HC組172人,MCI組231人。剔除后得到的受試者詳細(xì)信息見(jiàn)表1。

表1 訓(xùn)練集和測(cè)試集被試詳細(xì)信息
本研究另從ADNI數(shù)據(jù)庫(kù)中下載了278名受試者的三維MRI圖像數(shù)據(jù)作為驗(yàn)證集,且驗(yàn)證集中的受試者ID均與上述中他人共享的數(shù)據(jù)集不同。在每次實(shí)驗(yàn)中,驗(yàn)證集中屬于AD、HC、MCI的受試者數(shù)量分別為100、100、78人。驗(yàn)證集的受試者詳細(xì)信息見(jiàn)表2。

表2 驗(yàn)證集被試詳細(xì)信息
Anatomical Automatic Labeling(AAL),由Montreal Neurological Institute (MNI)機(jī)構(gòu)提供的。其按照大腦某一區(qū)域所主導(dǎo)的特定功能進(jìn)行劃分,建立了大腦組織結(jié)構(gòu)和功能之間的關(guān)系,詳見(jiàn)文獻(xiàn)[17]。AAL腦區(qū)模板一共有116個(gè)區(qū)域,其中90個(gè)屬于大腦,26個(gè)屬于小腦結(jié)構(gòu)。其劃分信息存儲(chǔ)在一個(gè)三維nii圖像中,用0~116之間的灰度值來(lái)標(biāo)識(shí)不同的腦區(qū),相同灰度值的體素屬于同一腦區(qū),0代表其不在腦區(qū)區(qū)域中。
利用SPM12軟件的CAT12工具包(http://dbm.neuro.uni-jena.de/cat/)進(jìn)行圖像預(yù)處理。預(yù)處理主要包括去頭骨、配準(zhǔn)到MNI標(biāo)準(zhǔn)空間、圖像平滑,其處理過(guò)程所用的參數(shù)均使用CAT12工具包中的默認(rèn)參數(shù)。經(jīng)過(guò)SPM12軟件處理后,得到的所有圖像大小均為121×145×121,空間分辨率為1.5 mm。隨后對(duì)每個(gè)MRI圖像進(jìn)行灰度歸一化,使每個(gè)受試者的圖像體素值在0~1之間。
對(duì)于歸一化處理后的MRI圖像,使用相同形狀且相同空間分辨率的AAL腦區(qū)模板來(lái)分割每一個(gè)受試者的三維MRI圖像。其中每一個(gè)受試者的三維MRI圖像都將被劃分為116個(gè)感興趣區(qū)域(ROIs),即對(duì)應(yīng)116個(gè)腦區(qū)。但其中有26個(gè)腦區(qū)屬于小腦,而小腦區(qū)域不在研究范圍內(nèi),故將從每個(gè)受試者的三維MRI圖像中得到90個(gè)ROIs,對(duì)應(yīng)本研究方法中的90個(gè)基分類器。通過(guò)將不同受試者之間所屬同一腦區(qū)的體素?cái)?shù)據(jù)按照行向量的形式依次排列,從而獲得本研究方法中的90個(gè)基分類器所需的數(shù)據(jù)。預(yù)處理流程見(jiàn)圖5。

圖5 預(yù)處理流程
4.4.1實(shí)驗(yàn)環(huán)境及參數(shù)設(shè)置 本研究的圖像預(yù)處理步驟的實(shí)驗(yàn)硬件環(huán)境為CentOS7.4,64位操作系統(tǒng),92 G內(nèi)存,CPU為E5-2640 2.00 GH。經(jīng)預(yù)處理步驟后,本研究的實(shí)驗(yàn)硬件環(huán)境為Windows 7,64位操作系統(tǒng),8 GB內(nèi)存,CPU為Intel(R) Core(TM) i5-4460 3.20 GHz。本研究將AD的早期識(shí)別診斷分為三個(gè)不同的二分類問(wèn)題:AD vs HC、MCI vs HC、MCI vs AD。每個(gè)二分類實(shí)驗(yàn)都將按照第2節(jié)中的算法流程構(gòu)建本研究識(shí)別模型。其中,利用AAL腦區(qū)模板提取的腦區(qū)數(shù)量k為90;在基分類器中保留特征的數(shù)量為50;基于高斯徑向基的SVM分類算法中的參數(shù)gamma設(shè)置為1/n(n為訓(xùn)練集的樣本數(shù)量),懲罰系數(shù)C設(shè)置為1.0;在TSVM分類器中,折中參數(shù)Cl、Cu分別設(shè)置為1.5、0.001,懲罰系數(shù)C設(shè)置為0.5;驗(yàn)證集篩選出與AD疾病相關(guān)性較高的腦區(qū)數(shù)量k為5。每個(gè)二分類實(shí)驗(yàn)均采用5折交叉驗(yàn)證的方法對(duì)表1中提到的數(shù)據(jù)來(lái)劃分訓(xùn)練集和測(cè)試集,即每個(gè)二分類實(shí)驗(yàn)都會(huì)訓(xùn)練5次,5次實(shí)驗(yàn)的平均分類準(zhǔn)確率用于評(píng)估模型整體的性能。
4.4.2方法對(duì)比實(shí)驗(yàn) 在方法對(duì)比實(shí)驗(yàn)中,本研究模型與另外兩種AD早期診斷方法進(jìn)行比較,以此來(lái)說(shuō)明本研究模型的優(yōu)越性。詳細(xì)實(shí)驗(yàn)結(jié)果,見(jiàn)表3。

表3 “方法對(duì)比”-準(zhǔn)確率對(duì)比
表3中2D CNN代表文獻(xiàn)[6]所提出的使用單軸切片訓(xùn)練2D CNN并集成的診斷模型;2D CNN+Kendal代表文獻(xiàn)[18]中提出的基于體素的兩階段特征提取的阿爾茨海默癥識(shí)別方法;Kendall+Attention+Ensemble代表本研究識(shí)別模型,其在基分類器中融合了非線性直映式注意力機(jī)制、使用Kendall篩選并保留50個(gè)特征數(shù)據(jù)、使用基于高斯徑向基核技巧的SVM分類算法。Kendall+Attention+TSVM+Ensemble表示利用TSVM優(yōu)化本研究模型中的基分類器的對(duì)照組實(shí)驗(yàn)。
本研究模型與文獻(xiàn)[6]所提出的2D CNN模型相比:在三個(gè)二分類實(shí)驗(yàn)中的分類準(zhǔn)確率分別比2D CNN的實(shí)驗(yàn)結(jié)果提高了13%、27%、4%。本研究模型并未人為挑選感興趣區(qū)域,而是利用AAL腦模板對(duì)MRI圖像進(jìn)行空間劃分。雖然每個(gè)基分類器都只利用MRI圖像中的部分信息,但90個(gè)基分類器組合在一起利用了整個(gè)MRI圖像的信息;且本研究模型可以通過(guò)驗(yàn)證集的準(zhǔn)確率挑選出與AD疾病相關(guān)性較高的前k個(gè)腦區(qū);也可以使用優(yōu)化算法挑選出差異較大的k個(gè)腦區(qū),通過(guò)優(yōu)化腦區(qū)之間的組合問(wèn)題從而擺脫已有經(jīng)驗(yàn)的束縛。而文獻(xiàn)[6]則人為地選取一張經(jīng)過(guò)海馬體的切片訓(xùn)練CNN模型,并未充分利用受試者的三維MRI圖像信息,從而影響分類效果。
本研究模型與文獻(xiàn)[18]所提出的2D CNN+Kendall模型相比,在三個(gè)二分類實(shí)驗(yàn)中的分類準(zhǔn)確率分別提高了11%、11%、4%。文獻(xiàn)[18]在第一階段利用Kendall特征選擇算法提取出每個(gè)腦區(qū)的部分體素?cái)?shù)據(jù),并在第二階段將其重新組織成受試者的腦組織特征圖,輸入到卷積神經(jīng)網(wǎng)絡(luò)中;兩階段特征提取的識(shí)別方法在一定程度上削弱了受試者大腦組織結(jié)構(gòu)的空間聯(lián)系,也增加了訓(xùn)練CNN模型的難度,使得每一折實(shí)驗(yàn)均需要人工進(jìn)行精細(xì)化調(diào)參。而本研究模型將同一腦區(qū)中具有相同屬性價(jià)值的體素?cái)?shù)據(jù)組織在一起,考慮了同一腦區(qū)體素?cái)?shù)據(jù)的空間聯(lián)系以及不同腦區(qū)之間體素?cái)?shù)據(jù)的差異;且相較于文獻(xiàn)[18]更加能夠降低高維度的數(shù)據(jù)特征對(duì)識(shí)別結(jié)果的影響。
在利用TSVM優(yōu)化基分類器的實(shí)驗(yàn)中,通過(guò)有標(biāo)簽數(shù)據(jù)AD和HC訓(xùn)練出一個(gè)初始化SVM,并使用無(wú)標(biāo)簽數(shù)據(jù)MCI和HC(或MCI和AD)對(duì)超平面進(jìn)行反復(fù)迭代微調(diào)。最終使得MCI vs HC和MCI vs AD兩個(gè)二分類實(shí)驗(yàn)中的分類準(zhǔn)確率分別比之前提高了1%,在提高識(shí)別精度的同時(shí)也維持了模型穩(wěn)定性的優(yōu)勢(shì)。
4.4.3注意力融合對(duì)比實(shí)驗(yàn) 在方法對(duì)比實(shí)驗(yàn)組中,通過(guò)對(duì)比不同的AD識(shí)別模型來(lái)體現(xiàn)本研究模型的優(yōu)越性,但尚未說(shuō)明直映式注意力機(jī)制的作用。在注意力融合對(duì)比實(shí)驗(yàn)中,通過(guò)構(gòu)造基分類器的過(guò)程中是否融合直映式注意力機(jī)制來(lái)對(duì)比,其詳細(xì)實(shí)驗(yàn)結(jié)果見(jiàn)表4。

表4 “注意力融合”-準(zhǔn)確率對(duì)比
表4中Pearson+Attention+SVM表示每個(gè)基分類器中融合了線性直映式注意力機(jī)制、使用Pearson進(jìn)行特征選擇、使用基于高斯徑向基核技巧的SVM分類算法;而Pearson+SVM則表示沒(méi)有融合線性直映式注意力機(jī)制的對(duì)比實(shí)驗(yàn)。同理,Kendall+Attention+SVM表示每個(gè)基分類器中融合了非線性直映式的注意力機(jī)制,而Kendall+SVM則表示沒(méi)有融合非線性直映式注意力機(jī)制的對(duì)比實(shí)驗(yàn)。
由表4可知,在融合線性直映式注意力機(jī)制后,使得MCI vs AD二分類的準(zhǔn)確率提升了3%,且其它兩組二分類實(shí)驗(yàn)的標(biāo)準(zhǔn)差均變得略低一些。在融合非線性直映式注意力機(jī)制后,使得三組二分類實(shí)驗(yàn)的準(zhǔn)確率分別提升了1%、1%、4%,且三組二分類實(shí)驗(yàn)的標(biāo)準(zhǔn)差分別減少了1/4、1/3、1/2??傮w來(lái)看,本研究模型在構(gòu)造基分類器的過(guò)程中融合直映式注意力機(jī)制后,能夠增強(qiáng)腦區(qū)中對(duì)分類有幫助的相關(guān)特征,抑制腦區(qū)中對(duì)分類沒(méi)有幫助的無(wú)關(guān)特征或冗余特征,從而提高識(shí)別模型的精度以及穩(wěn)定性。
本研究針對(duì)阿爾茨海默癥的早期診斷識(shí)別問(wèn)題,提出一種融合注意力機(jī)制的識(shí)別模型,該模型對(duì)硬件資源要求較低且具有較高的性能優(yōu)勢(shì)。其在融合本研究所提出的直映式注意力機(jī)制后,識(shí)別模型在準(zhǔn)確率和穩(wěn)定性方面均有不同程度的提高;在使用TSVM優(yōu)化基分類器后再次提高了識(shí)別精度。對(duì)疾病的計(jì)算機(jī)輔助診斷具有一定的臨床應(yīng)用價(jià)值,但仍有不足。在今后的研究中,將繼續(xù)對(duì)構(gòu)建基分類器和集成學(xué)習(xí)融合方法進(jìn)行改進(jìn),以期望進(jìn)一步提高模型分類準(zhǔn)確率和穩(wěn)定性,并嘗試尋找與AD疾病相關(guān)的生物標(biāo)志物。