蔡麗娜,李曉陵,潘洋,王鵬,彭彩亮,韓勝旺,侯玉,王楊,高瑞雪
與正常衰老狀態相比,輕度認知障礙(mild cognitive impairment,MCI)以記憶加速衰退為主要特征,是阿爾茨海默病(Alzheimer's disease,AD)的早期表現[1]。流行病學研究表明,每年約有10%~12%的MCI 患者進展為AD,80%的患者在歷經6 年的隨訪后發展為AD[2]。AD 是一種進行性神經退行性疾病,以記憶功能下降、認知減退為主要臨床表現,確診時已發生不可逆的神經元壞死,當今尚無有效的治療方法。在全球范圍內,預計未來20 年AD 患者人數將增加一倍,已經被世界衛生組織認定為公共衛生重點疾病[3]。因此,尋找一種能夠有效診斷、預防和干預MCI 進展的方法,對提高患者生活質量和防止MCI發展為AD具有十分重要的意義。近年來,MRI影像組學的大力開發為解決上述問題提供了新的途徑。在早期階段,這種新方法被廣泛應用于腫瘤性病變研究[4],現在已被用于MCI的診斷、分類及進展預測[5]。
影像組學最早由Lambin 于2012 年提出[6],是一種基于醫學和計算機科學深度交叉融合的新方法。它通過圖像特征反映疾病的異質性,具有成本低、無創的特點。在傳統的臨床診斷中,醫生依靠圖像的視覺解釋,識別小病灶的能力有限。影像組學可以為疾病定性和定量分析提供更準確、更客觀的依據。MRI影像組學隸屬于影像組學,其分析過程需要一系列連續的步驟,包括MRI 圖像采集、圖像分割、圖像特征提取和建模[7]。
圖像采集是指獲取標準的MRI 圖像數據,是影像組學分析的基礎。與傳統圖像掃描相比,影像組學對于圖像采集的要求強調標準化。由于圖像特征分析的重復性和可比性受到設備、參數和臨床實踐等因素的影響,因此有必要制訂標準化的圖像采集和重建方案[8-9]。此外,為了避免因像素不一致、灰度不一致或分辨率不同而導致的偏差,主要采用重采樣和歸一化圖像預處理,以確保后續分析的可行性和可重復性[10-11]。目前MCI 研究中常用的序列包括T1、T2 液體衰減反轉恢復(fluid attenuated inversion recovery,FLAIR)序列和擴散張量成像(diffusion tensor image,DTI)序列[12]。采集完成后,收集圖像構成一個大型數據庫。用于MCI 的圖像主要來自當地醫療機構、公開數據庫和阿爾茨海默病神經影像學倡議(Alzheimer's Disease Neuroimaging Initiative,ADNI)數據庫[13]。
MRI影像組學的圖像分割方法主要有手動分割、半自動分割和多重分割[14-15]。手動分割依靠影像科醫生手動識別和注釋感興趣區(region of interest,ROI)。該方法具有精度高的優點,但耗時、效率低,不適用于大型數據庫[16-17]。近年來,在一系列計算機算法的輔助下,半自動和自動分割得到了更多的發展[18]。此外,還有許多開源軟件可用于分割,如ITK-SNAP、3D Slicer、MIM 和ImageJ 等[19]。這些新技術的開發和使用使得圖像分割更加高效[20]。研究表明,海馬和胼胝體萎縮發生在AD 早期[21-22]。由于海馬在認知功能中起著重要作用,且海馬體更為具體,能提供更為準確和穩健的信息,因此海馬是MCI影像組學研究中最常選擇的ROI[23]。此外,內嗅皮層、胼胝體、丘腦、一些自動解剖標記的大腦區域、甚至全腦等亦是MCI研究的ROI[24-25]。
特征提取是分割ROI 的下一步。選擇有用的信息來幫助表征正常和異常圖像。此步驟是影像組學的核心,以便根據最具辨別力的特征進行分類或預測。特征可以分為兩種類型:定性特征和對病變不可見特征的數學定量描述[26]。定性特征如位置、大小、形狀等。對病變不可見特征的數學定量描述大致可分為四種類型:(1)以統計學數值表示的形態學特征;(2)反映病變不同灰度等級分布的一階特征(直方圖特征),主要包括標準差、能量、熵、峰度、銳度、偏度、方差等;(3)二階特征描述病變異質性,解決像素或體素的空間關系,通常使用灰度共生矩陣和灰度游程矩陣;(4)高階特征,利用各種濾波器提取,如小波變換、拉普拉斯濾波器和明斯基函數等[27]。
然而,有幾個特征是不可取的。冗余和不相關的特征會影響模型的準確性和魯棒性。為了避免過度擬合和提高精度,在建模之前需要從大量提取的特征中選擇最重要、信息量最大的特征。這一步通常在各種機器學習方法中執行,例如相關或單變量回歸等方法,以及最小絕對收縮和選擇算子(absolute shrinkage and the selection operator,LASSO)算法等嵌入方法[28]。目前,MCI 相關MRI 影像組學分析中提取的圖像特征包括形狀、強度、紋理、梯度、小波等[29-31]。
影像組學最終目標是建立一個診斷、分類和預測的模型。建模涉及三個主要方面:特征選擇、建模方法和驗證。特征選擇是數據驅動的,為了實現整體模型的最佳效能,還應包括影像學以外的特征(如臨床記錄數據、治療期間獲得的數據或生物和/或遺傳數據);建模方法的選擇,確定最佳機器學習方法是實現穩定性和臨床相關性的關鍵步驟,因此在理想情況下,應使用多種機器學習方法,并應完整記錄實施狀態;驗證是完整分析不可或缺的組成部分,模型必須在內部進行驗證,理想情況下應該完成外部驗證。目前,影像組學研究中常用模型是基于機器學習算法的模型[32-33],如卷積神經網絡(convolutional neural networks,CNN)、支持向量機(support vector machines,SVM)、隨機森林(random forest,RF)等[34]。敏感度、特異度、準確度及受試者工作特征(receiver operating characteristic,ROC)曲線下面積(area under the curve,AUC)用于評價模型效能[35-36]。
MRI影像組學可以從標準圖像中挖掘定量圖像特征,提取數據并將其應用于臨床決策,從而提高MCI 診斷、分類和發展預測的準確性,在MCI等神經系統疾病中得以應用。
當腦組織有病變時,MR 圖像的紋理可能會相應改變。Leandrou 等[37]從正常對照(normal controls,NC)、MCI、進展為AD 的MCI (MCI converters,MCIc)和AD 受試者中提取紋理特征。結果發現內嗅皮質紋理特征差異有統計學意義。NC和MCI 的AUC 為0.710,MCI 和MCIc 的AUC 為0.730,MCI 和AD 的AUC 為0.764,研究表明內嗅皮質紋理特征可以對MCI 進行分類診斷。So 等[38]基于海馬體紋理對AD 和MCI 分類的準確度達到72.5%,MCI 和NC 分類的準確度達75%。Feng 等[39]應用杏仁核紋理特征分析發現AD 與遺忘型MCI (amnestic mild cognitive impairment,aMCI)的分類準確度達到0.81,AUC達到0.84;aMCI 與NC 的分類準確度達到0.75,AUC 達到0.80。由此可見MRI 的紋理分析可以定量描述組織特征,反映其生理和病理階段,揭示圖像中肉眼無法識別的信息,為MCI 的分類診斷提供了重要的影像學生物標志物。
機器學習或深度學習逐漸成為MCI 影像組學研究的熱點。Feng等[40]應用先進的3D-CNN評估其對提高MCI診斷準確性的貢獻,結果顯示對于NC、MCI和AD的診斷,2D-CNN、3D-CNN和3D-CNN-SVM 的 準 確 度 分 別 為82.57%±7.35%、89.76%±8.67%和95.74%±2.31%。這項研究表明3D-CNN-SVM 比其他深度學習方法能達到更高的準確度。此外,由于MRI 的安全性、無創性和無輻射性,3D-CNN-SVM 可作為MCI 的有效篩查方法。Liu 等[41]構建多任務深度CNN 模型,用于聯合學習和海馬分割。然后,構建一個3D 密集連接卷積網絡,用來學習基于海馬分割結果提取的3D 特征。最后,結合多任務CNN 模型和3D 密集連接卷積網絡模型的學習特征對疾病狀態進行分類。結果表明MCI 和NC 受試者的分類準確度為76.2%,AUC 為77.5%。以CNN 為代表的深度學習模型在MCI 診斷、分類方面具有良好的臨床應用前景。
將影像組學分析與臨床因素相結合可以顯著提高診斷、分類效率。Spasov 等[42]結合了結構MRI、人口統計學、神經心理學和APOE4 基因數據,提出了一種新穎的深度學習架構。對進展型MCI (progressive mild cognitive impairment,pMCI)和穩定型MCI (stable mild cognitive impairment,sMCI)的分類準確度為86.0%、敏感度為87.5%、特異度為85%。Luk 等[43]用綜合預測模型[包括紋理特征、APOE4 基因、簡易精神狀態檢查量表(mini-mental state examination,MMSE)得分、性別和海馬體積]診斷MCIc 和sMCI 受試者,準確度為76.2%。Kim等[44]發現在單一的MRI序列模型中,影像學模型診斷MCI 的AUC 為0.71;當T1 和T2 FLAIR 影 像 學 特 征 相 結 合 時AUC 為0.75;當年齡、性別、APOE4 基因與T1 和T2 FLAIR 影像組學模型相結合時預測結果最佳(AUC為0.79)。
臨床因素與MRI影像組學相結合,可以提高預測MCI發展為AD的準確性。Park等[45]從MCI發展為AD受試者的MRI中提取雙側海馬影像組學特征,開發了三個模型:(1)影像組學模型;(2)基于臨床概況的臨床模型;(3)基于影像組學和臨床概況的組合模型。結果發現在預測MCI 發展方面,影像組學模型的AUC 為0.674,臨床模型的AUC 為0.758,組合模型的AUC為0.823。此研究表明基于組合模型可以更好地幫助預測MCI 患者的狀態。有研究采用三維全腦紋理分析方法分析MCI 患者T1WI 的紋理特征,觀察比較了MCIc 和sMCI 的紋理變化。綜合預測模型(包括紋理特征、APOE4、MMSE 得分、性別和海馬體積)被用來預測MCI 患者發展至AD 的情況。結果發現綜合模型預測MCI患者轉為AD的AUC可達到0.95[46]。Shu等[47]從ADNI 數據庫中選擇了357 名MCI 患者。對于每個患者,磁共振T1WI 自動分割為白質、灰質和腦脊液,并從每個組織中提取影像組學特征,與APOE4 和神經心理學量表相結合構建模型。該模型在預測12個月內MCI進展為AD方面具有顯著的診斷效力,AUC 為0.814,敏感度為72.6%,特異度為79.8%。Logistic 回歸分析顯示,APOE4、臨床癡呆評分、AD 評估量表和影像組學特征是MCI進展為AD的獨立預測因素。
Shen 等[48]提出了一種基于深度學習的模型,用于預測一年內從MCI 到AD 的發展概率。這項研究使用了來自ADNI 數據庫的165 個樣本。首先,基于CNN 方法提取圖像特征,然后利用SVM分類器對這些特征進行分類。結果表明使用線性、多項式和徑向基函數核(radial basis function kernel,RBF kernel)的準確度分別達到91.0%、90.0%和92.3%。Lin等[49]基于CNN的深度學習方法,旨在利用MRI數據預測MCI到AD的進展。該方法的準確度為79.9%,AUC 為86.1%。這些研究表明基于深度學習的方法在預測MCI 到AD 發展方面有很大的潛力。Kang等[50]開發了一種基于多模態數據特征建立的深度學習模型。結果發現其在區分發展為AD 的MCI 準確度達到94.2%,敏感度為97.3%,特異度為92.9%,AUC為0.953。此外,單模態的分類精度比多模態的分類精度低20.9%。表明與單模態數據相比,多模態數據可以提供更多信息來區分發展為AD的MCI和NC。結果證實深度學習結合多模態融合數據進行特征提取可以提高分類和預測性能,有利于AD的早期干預。
綜上所述,MRI 影像組學作為一種新的定量分析方法,通過對高通量圖像數據信息的深入挖掘,可以量化MCI 的結構特征,從而獲得MCI的MRI圖像定量生物學指標,是對傳統MRI的重要補充。此外,MRI影像組學結合患者的臨床因素可以為MCI的診斷、分類和進展預測提供更準確的信息。
MRI 影像組學在MCI 的診斷、發展預測方面的應用是臨床中重點關注的部分,該方面的研究已有不少成果,但也存在不少問題:(1)其尚未應用于廣泛的臨床實踐,這需要通過進一步的臨床試驗進行廣泛驗證和優化。(2) MRI 影像組學分析的樣本量在預測模型中起著重要作用,目前雖然儲存了大量的醫學成像數據,然而,大多數已發表的文獻樣本量較少,缺乏大型和標準化的臨床數據,且這些數據分散在不同的中心,并使用不同的標準獲取。因此,未來的研究需要用獨立的機構或數據庫進行外部驗證,以驗證影像組學模型的真實性能。(3)由于不同的成像采集設備、技術參數、分割算法以及不同的重建算法,很難獲得一致的成像結果和可用于臨床的統一標準,為了實現影像組學特征的標準化和技術的可重復性,需要進行多中心試驗,并在整個工作流程中進行強化和標準化的質量控制。盡管MRI 影像組學的分析存在一些不足,但其作為一種先進的定量分析方法,在MCI 的診斷、發展預測方面具有巨大的潛力,隨著人工智能和醫療大數據時代的到來,MRI 影像組學將會得到更大的發展,為MCI 的精準醫療做出貢獻。
作者利益沖突聲明:全體作者均聲明無利益沖突。