齊國慶 ,吳東,胡博,王文*
隨著社會的不斷發展,阿爾茲海默病(Alzheimer's disease,AD)、精神分裂癥、抑郁癥等認知功能或情感障礙疾病的發病率逐年提高[1,2],給家庭和社會帶來了巨大的壓力。因此,早期識別大腦功能障礙相關疾病對于疾病的早期診斷和預防至關重要。
結構磁共振成像和功能磁共振成像(functional MRI,fMRI)是磁共振腦影像學的兩大分支。前者包括T1加權成像(T1 weighted imaging,T1WI),T2 加 權成像(T2 weighted imaging,T2WI),擴散張量成像等掃描序列,可以反映大腦的解剖結構,后者則包括血氧水平依賴成像(blood oxygen level dependent,BOLD)成像,動脈自旋標記成像等,主要可以反映大腦的功能活動、血流灌注等[3]。簡而言之,磁共振成像在顯示腦部的解剖結構以及功能狀態方面展現出了優良的性能,有助于研究者尋找大腦功能障礙相關疾病的客觀影像學生物標志物[4,5]。然而,之前的研究大多是基于組水平的研究,并不能做基于個體的診斷或預測,對于臨床指導意義有限。
機器學習(machine learning,ML)是人工智能的重要研究領域之一,其基本原理是根據訓練集提供的有限信息構建模型,進而對新輸入的樣本信息進行預測,預測所得結果越逼近真實結果,說明此模型的效能越高。在醫療領域,ML能夠利用多種復雜算法在龐大的臨床數據中提取有用的信息進行模型訓練,然后將其運用于相關疾病的早期診斷和精準診斷,有助于醫生減少臨床實踐中的誤診率和誤治率[6]。其中,由于神經精神疾病磁共振影像數據量龐大,且缺少依靠肉眼直接評估的異常影像特征,亟需借助ML的方法對其進行數據驅動分析。
因此,目前越來越多的研究將ML與神經精神疾病腦影像結合起來,希望可以借助ML的手段,挖掘相關影像的潛在信息,從而將其運用于個體診斷和預后評估,以便于更好地指導臨床。但多模態腦影像磁共振數據特征的多樣化以及ML模型選擇的多樣化也為研究的開展帶來了巨大的挑戰。本文通過歸納近期ML在磁共振腦影像學診斷中應用的相關文獻,探尋其優勢和局限性,為今后神經影像學科研與診斷方法的選擇提供新的思路。
常用的線性回歸模型主要包含適用于研究連續變量的一般線性模型,以及研究二分類或多分類變量的Logistic回歸模型。通過設置待預測指標為因變量,感興趣的影像指標為自變量,即可建立通過影像指標預測量表評分的線性模型。線性模型在腦磁共振影像方面的應用非常廣泛,如利用磁共振影像中腦體積[7]、腦功能指標(如低頻振幅、功能連接等)預測疾病狀態、認知水平,以及輕度認知功能障礙(mild cognitive impairment,MCI)向 AD的轉化時間等[8]。同時患者的臨床特征如血糖、血壓等亦可作為自變量輸入模型,達到影像特征與臨床指標的融合。目前,Shen等[9]結合基于靜息態BOLD信號的功能連接矩陣(functional connectivity matrix,FCM)與線性回歸模型,提出了一種新的基于連接組的預測模型(connectome-based prediction model,CPM)。此模型的輸入變量(自變量)為FCM中與目標量表評分最相關的功能連接的總和,輸出變量(因變量)為目標量表評分。目前,CPM方法已經成為fMRI影像與機器學習結合的熱點,在精神分裂癥[10]、抑郁癥[11]、焦慮癥[12]等疾病的診斷和預測,注意力[13]、智力[14]等認知能力的預測均有深入而細致的研究。
總的來說,線性模型較簡單,適用于研究影響因素與疾病發生的相關性。但其缺點在于,線性模型要求自變量與因變量之間必須呈線性關系,因此不適用于處理一些非線性關系的數據。而廣義線性模型可以加入非線性核來處理非線性數據,從而可以較好地解決這一問題。
K-最近鄰(K-nearest neighbor,KNN)算法是由Cover和Hart于1967年發表的一種分類學習算法[15]。它的基本原理是首先提取所有樣本的某個影像特征,對于給定樣本,如果與其最相鄰的K個樣本大多數屬于某一個類別,則該樣本也屬于這個類別[16]。KNN算法既往多出現于腫瘤的良惡性鑒別研究中,此類研究往往橫向對比多個機器學習算法對診斷效能的影響。但是在現有的腦功能障礙磁共振影像診斷的研究中應用并不多,且所研究疾病的類型也較為常見。例如利用T2WI來區分AD與健康受試者[17]、利用糖尿病患者的縱向隨訪數據以檢測其腦容量變化等[18]。在功能影像方面,Geng等[19]將KNN算法與fMRI中的功能連接、有效連接特征相結合,在抑郁癥患者的診斷方面取得了不錯的效果。同時,由于KNN算法主要依賴于輸入數據的相似性來進行分類,故在腦影像組織分割方面也展現出較好的效果[20]。
KNN主要適用于需選取復雜類別特征進行多分類的影像組學數據,但其缺點在于,KNN需要計算整個訓練空間的相似度,導致效率隨樣本數量的增加而降低。另外其分類效能很大程度上依賴于根據歐氏距離和曼哈頓距離計算所選取的K值,導致對K值的選擇要求高,即當樣本分布密度不平衡時,新樣本會自動歸類于樣本量大的類別而導致分類誤差增大。
支持向量機(support vector machine,SVM)是一種基于訓練數據集對同類數據進行分類的算法。1995年,SVM的概念由Cortes和Vapnik[21]兩位科學家率先提出,并證明該分類器擁有超強的非線性分類能力,也就是說它可以利用核函數將目標特征投射至高維空間,從而在此空間內將原本線性不可分的樣本數據轉變為線性可分。常用的核函數有多項式核函數、高斯核函數、Sigmoid核函數、線性組合核函數等,不同的核函數和參數選擇決定了分類器最終的泛化能力[22]。SVM目前已被成功地應用于神經精神疾病的診斷預測,并且關于SVM的優化應用研究也已得到廣泛開展。由于SVM易于實現,分類效果優越,且在小樣本數據中表現較好,故SVM是目前應用最為廣泛的機器學習算法,相關研究已涉及目前常見神經精神疾病,如青少年精神分裂癥[23]、抑郁癥[24]、帕金森病(Parkinson's disease,PD)[25]、亨廷頓病[26]等疾病的診斷。
總而言之,SVM主要適用于非線性、多變量的分類影像數據,且在小樣本數據上表現良好。但是SVM分類效能與核函數參數密切相關,導致核函數選擇的困難。
隨機森林(random forest,RF)是由Breiman等[27]于2001年提出的一種以決策樹為基礎的集成學習算法。決策樹的基本原理是所有樣本特征均可視為樹根,之后形成一套分類規則,并將所有可能發生的結局的概率分布用樹形圖來表達,因此這類模型被稱為決策樹[28]。RF通過集成一組隨機的決策樹進行建模,其核心思想是在原始樣本中進行隨機有放回地抽取,得到k組容量一致的樣本集,從而分別構建k個決策樹,最后通過投票法得到分類結果[29]。RF最大的優點是能夠處理高維度非線性的特征,泛化效能強,特別適用于解決腦影像多模態融合、高維度特征降維的問題。例如,Alessia等[30]綜述了2007—2017年12篇關于AD神經影像數據分類的ML算法,基于多模態影像數據,應用RF算法從MCI中預測AD具有最高的準確性。另外,RF算法不僅可以被運用于特征融合與降維,也可以被運用于大腦結構影像的組織分割。而RF算法診斷研究所涉及的疾病也較為廣泛,包括AD[30]、注意缺陷與多動障礙[31]等。
綜上所述,RF主要適用于高維非線性、多模態、特征缺失以及不平衡的影像數據。同時,RF內部參數設置簡單,易于調整,即使使用默認的參數,也可以達到良好的結果。但RF在解決回歸問題時不能夠做出超越訓練集數據范圍的預測,可能導致具有某些特定噪聲的數據在進行模型訓練時出現過擬合。
深度學習(deep learning,DL)最大的優勢在于其可以基于自身多層次的網絡結構,從海量圖像數據中自動提取特征用于分類,并且展現出極佳的圖像分類性能[32]。早在20世紀80年代,Geoffrey Hinton就提出了深度學習算法的雛形——反向傳播算法,但是由于計算機算力的限制,當時并沒有得到廣泛應用。近10年來,由于計算機硬件(尤其是顯卡)與軟件相關技術的飛速發展,DL在各個行業都掀起了一股人工智能的熱潮。在醫學影像方面,深度學習在腦膠質瘤分型[33]、前列腺腫瘤良惡性鑒別[34]等方面均有不俗的表現,有的已經轉化為較為成熟的商業產品。但是,DL平臺搭建過程較為復雜,且模型選擇以及內部參數調整較為復雜。同時,由于腦功能障礙疾病涉及的影像數量多、模態多、特征復雜,往往需要研究人員根據現有數據集量身定制數據分析與模型訓練方案,使得研究難度進一步增加。因此,近5年來才有相關的研究陸續被報道出來,如精神分裂癥[35]、PD[36]、AD[37]的診斷,以及正常腦組織的分割、腫瘤組織自動檢測與分割等。雖然這些研究取得了較好的結果,但其缺點在于,DL更加依賴于大數據支撐,這對于一些樣本量較小的數據來說并不適用。同時,DL可解釋性較差,研究者難以控制模型內部的運行,也難以對得出的結果進行解釋,限制了模型的改進以及推廣應用。
足夠的樣本量是保證機器學習模型效能的重要因素,當研究者自身數據過少時,可以借助一些公共的數據庫,如阿爾茨海默病神經成像數據庫(Alzheimer's Disease Neuroimaging Initiative,ADNI),人類連接組計劃(Human Connectome Project,HCP)等。可以通過公共數據庫的大量數據進行模型訓練,然后用自身數據集作為驗證(反之亦然),此種方法已成為較為常見的研究手段。另外,還可以借助一些數據擴增[38]的方法,如旋轉、隨機裁剪、直方圖均衡化等,將訓練集擴充數倍,然后觀察模型的訓練效果。此外,在模型訓練時,采取交叉驗證的方法也可以從一定程度上克服樣本量小的問題。該方法較為簡單,即將數據分為N份,每次用N-1份作為訓練集訓練模型,用剩下的1份作為測試集檢驗模型效能。同時,在深度學習的應用過程中,還可以借助近年來較為新潮的遷移學習技術來克服樣本量較小的問題。該技術借助較為簡單的微調方法可以將樣本量較大的數據集上訓練得到的模型權重,作為樣本量較小的數據集模型訓練的初始權重。例如,已有研究表明,運用海量自然圖像(ImageNet)來預訓練深度學習模型,相比于直接訓練,在腦膠質瘤診斷和分型上效果更佳[33]。
樣本量不均衡時,會導致模型在預測時更傾向于將結果預測為數據量較多的那一組,從而造成偏倚。當整體樣本數量較多時(如A組>B組),可以從A組隨機抽取與B組數量相當的樣本進行模型訓練,重復N次以后,再觀察模型的穩定性。另外,還可以使用插值法增加B組樣本的數量,其代表方法即為 SMOTE算法[39]。
當樣本來自不同的中心,或者同一中心的不同機型時,會不可避免地引入誤差,造成偏倚。首先,研究者在數據預處理階段應當采取一致的預處理方法,尤其是依托于各個中心進行預處理時,應當預先進行培訓。同時,還可以對所有數據統一進行歸一化,包括對參考圖像的全局或局部均值和標準偏差進行重采樣,或通過調整直方圖對像素大小進行重采樣。另外,可以通過一些影像質量檢測軟件(如MRQy等)剔除質量差的圖像,從而降低誤差與偏倚。
近些年來,機器學習的方法在各種疾病中區分正常對照組和患者時,具有較好的表現,表明存在相關疾病可識別的MRI影像模式。同時,MRI影像學新序列的提出,為我們提供了研究腦功能障礙相關疾病的新途徑和新思路。本文總結了近年來最為常用的5種機器學習方法及其在腦功能障礙磁共振影像診斷中的應用,希望可以為初步涉及這一領域的研究者提供一些指導。
總的來說,機器學習領域沒有最好的方法,只有最適合的方法。而從具體的研究來看,目前線性回歸模型由于模型簡單,無法擬合較為復雜的數據分布,故已不被用作研究的主體,而是在橫向對比不同模型時用作驗證,或者是在探索影像—臨床、影像—行為的相關關系時用到。SVM由于分類效能強,比較適用于小樣本數據,故目前已被廣泛運用于各個方面的研究。因此,研究者在使用SVM為主體研究方法時,要特別注意研究的創新性。DL和基于線性模型的CPM方法,目前是腦功能障礙磁共振影像應用的熱點,預計無論是在疾病種類上的創新,還是在模型優化上的創新,都會有相關的研究持續報道。以KNN與RF為主體的研究與前兩者相比較少,這可能是由于KNN和RF模型的知名度沒有上述幾個模型高,在既往研究也多作為探索不同模型效能的一個研究分支。我們將本文中涉及的模型,及其優缺點、參數選擇整理成表,方便讀者學習與使用(表1)。
表1 常見機器學習方法的可調參數及優缺點Tab.1 Adjustable parameters,advantages and disadvantages of common machine learning methods
目前,隨著標準化影像學數據庫的建立以及ML算法聯合多模態影像數據研究的逐步深入,對于腦功能障礙相關疾病客觀影像指標的探索正在如火如荼地開展,相關的研究也有助于使這類疾病的早期診斷率得到飛躍式的提升。
作者利益沖突聲明:全部作者均聲明無利益沖突。