華北理工大學臨床醫學院 李博文 李娟
近十年來,人工智能技術快速發展,在醫療領域的應用也逐漸深入。本文具體對機器學習在抑郁癥的輔助診斷方面的相關研究進展進行綜述,總結了機器學習在抑郁癥輔助診斷領域的常用算法及一般研究流程,并對機器學習應用于抑郁癥存在的優勢與不足進行探討,以期為后續研究提供借鑒。
通過運用以機器學習為代表的人工智能技術,進行抑郁癥的輔助診斷,促進抑郁癥的早發現和早治療,具有十分重要的現實意義。本文就機器學習在抑郁癥輔助診斷方面的相關研究進展進行綜述,期望為機器學習在該領域的研究提供借鑒。
美國計算機科學家約翰·麥卡錫提出了“人工智能”的概念,希望能夠通過計算機對人類的智慧進行模擬。機器學習作為人工智能的重要研究應用領域之一,于20世紀50 年代初奠定基礎,并不斷發展,在20 世紀80 年代發展為獨立的科學領域。現如今,隨著計算機科學與技術的進步與發展,網絡和移動的計算系統收集和傳輸大量數據的能力迅速增長,各種機器學習技術層出不窮,迎來井噴式發展。
機器學習作為一門專注于計算機如何從數據中學習的科學學科,位于計算機科學、統計學和各種其他學科的交叉點,通過數學推理和學習算法可以在海量的數據中挖掘有意義的規律,可以利用學習到的“經驗”來改善計算機系統性能,更強調實際目標的具體應用[1]。目前,機器學習也逐漸被運用到抑郁癥的輔助診斷中。
隨著社會的發展,數據體量的增長,對流程優化、資源分配有了更高的要求。機器學習算法能夠快速進行數據處理,自動化做出一些決策,極大程度上減少了人力資源浪費以及人工干預的風險和錯誤,提高了效率和準確性,因此,越來越多的領域將研究與機器學習算法相結合,激發更多的創造力與可能性。
根據學習方法不同將機器學習算法分為傳統方法(TA)和深度學習(DL)方法。深度學習與機器學習的關系如圖1 所示。

圖1 深度學習與機器學習的關系Fig.1 Relationship between deep learning and machine learning
傳統學習算法可以從訓練數據中學習并做出智能決策,因此加入大量的特征工程(FE)來處理原始數據集得到更結構化、更少噪音訓練數據集是相當重要的,也是使用TA 方法進行研究的一大難點。這種方法的優點是最小計算負擔與訓練時間,且因為模型內部細節和工作知識完整,也被稱為“白盒”,分析診斷結果有著高度的可解釋性[2]。
深度學習算法由分層結構算法組成,可以模擬生物神經元工作,進行自動化特征提取,讓機器能夠像人一樣具有分析學習能力。DL 由淺層和深層架構組成,這些結構復雜、多層、隱藏、相互連接,也被稱為“黑箱”。優點是能夠處理原始的、嘈雜的、非結構化的高位數據集,限制是在可解釋性方面較差,計算負擔沉重。傳統機器學習與深度學習的比較如表1 所示。

表1 傳統機器學習與深度學習的比較Tab.1 Comparison between traditional machine learning and deep learning
TA 使用的算法一般有:最小二乘支持向量機(LSSVM)、不同核支持向量機(SVM、CK-SVM)、基于判別分析的分類器(線性判別分析(LDA)和二次判別分析(QDA))、集成架構(Bagging、RusBoost(RB)、GentleBoost(GB)和隨機森林(RF))、概率模型(樸素貝葉斯(NB)和邏輯回歸(LR))、K-最近鄰(KNN)及其變體,基于樹的算法(決策樹(DT)、J 48、復雜樹),以及其他(高斯混合模型(GMM)、貝葉斯網絡)。其中SVM 和KNN 是大多數研究中性能最高的分類器,在各種性能指標方面實現了優異的分類結果(約99%)。
DL 使用的算法一般有:卷積神經網絡(CNN)、長短期記憶(LSTM)、CNN 和LSTM 的組合、自編碼器(Autoencoder)、多層感知器(MLP)、人工神經網絡(ANN)、徑向基函數網絡(RBFN)、ConvNet。CNN 是研究文章中使用最多的架構,許多研究將基于CNN 的時空特征與不同的特征提取方法相結合,很少有研究將深度神經網絡用于抑郁癥診斷。由于DL 的“黑盒”特性,迫切需要具有可解釋性的處理問題的DL 方法模型。
機器學習常使用準確率(Accuracy)、精確率(Precision)、召回率(Recall)、F1 值、ROC 曲線、AUC 值等評價指標衡量抑郁癥檢測算法性能,對算法分類能力進行評估。
伴隨研究的深入,越來越多的研究表明,腦結構、腦功能的異常可能與抑郁癥的發生有關。隨著醫學影像技術的不斷進步,目前有關抑郁癥的腦影像研究主要分為三個方面,分別是腦結構、腦功能及腦代謝影像研究。
近年來,關于抑郁癥患者的腦功能影像研究發展迅速,而機器學習同抑郁癥患者的腦代謝和腦結構影像的研究相對較少。
腦功能影像研究則主要集中于額葉、顳葉、杏仁核、扣帶回等處的功能障礙,作為對腦功能影像進行研究的最主要工具,功能性磁共振成像(fMRI)被廣泛應用。并根據實驗方案的不同,分為靜息態fMRI 和任務態fMRI。
其中,在與靜息態fMRI 結合方面,Zeng 等基于區域的靜息狀態功能連接,運用了支持向量機(線性核)模型對重度抑郁癥進行識別,準確度達94.3%。從而表明與疾病相關的靜息狀態網絡改變可能引發重度抑郁癥中一部分情緒復雜性和認知障礙。此外,杏仁核、前扣帶皮層、海馬旁回和海馬體在分類中表現出很高的判別力,可能在抑郁癥的病理生理學中發揮重要作用。Dai 等使用多站點rs-fMRI 數據增加樣本大小,并從使用SVMRFE-CV 選擇的136 個重要特征訓練的LinearSVM 模型中獲得最好結果,揭示了FC 和NA 特征的組合使用對于MDD 和HC 的分類是有效的,可作為MDD 中改變腦功能連接網絡的參考。
在與任務態fMRI 結合方面,Hahn 等運用單高斯過程分類,并集成高斯過程分類和決策樹-支持向量機(線性核)進行比較,在3 項與抑郁癥相關的功能性MRI 任務期間,整合與情緒和情感處理相關的數據,大大提高了分類的準確性,準確率達83%。Rosa 等運用高斯圖模型與支持向量機模型,基于情緒面孔腦激活區進行分析[3]。結果顯示,分類準確度可達85%,在抑郁癥患者中,發現有穩定的紋狀體、皮層及扣帶回腦網絡連接異常。
2.2.1 腦電圖(EEG)
腦電數據有著非侵入、成本低、效率高的優點,能夠實時反饋患者的大腦活動,幫助醫生更好地了解患者病情與治療效果。將EEG 數據與合適的算法模型結合使用,是一種前景廣泛、結果可靠的抑郁癥輔助診斷方法。
已知最早使用EEG 數據輔助診斷抑郁癥的研究始于1972 年,Stern 等使用EEG 數據來識別抑郁癥患者與非抑郁癥患者的差異。隨著計算機技術的飛速發展,EEG數據輔助診斷抑郁癥研究有了更多的算法模型。
Wu D 等使用了深度神經網絡(DNN)對EEG 數據進行訓練和測試,其中數據集包括64 名抑郁障礙患者和64 名健康受試者的EEG 數據。在訓練階段,使用了10 次10 折交叉驗證的方法進行模型訓練和參數調整。研究結果表明,使用深度學習方法對EEG 數據進行分析可以有效地預測抑郁癥患者的癥狀嚴重程度,準確率高達85%。
Acharya 提出了一種使用深度卷積神經網絡進行自動化EEG 篩查抑郁癥的方法。該方法基于265 名患者的數據集,可以在高達96.30%的準確性和92.50%的敏感性下對抑郁癥進行篩查。目前在該領域中,該研究的準確度已經達到非常高的水平。
以上足以見得算法與EEG 數據結合在輔助診斷抑郁癥方面的優越性,值得注意的是,這些模型的準確率受到許多因素的影響,如實驗數據、模型設計、超參數選擇等。因此,在具體應用時需要根據實際情況進行選擇和調整。
2.2.2 基于組學分析技術診斷相關生物標志物
目前,臨床缺乏客觀的生物標志物幫助輔助診斷抑郁癥,進行治療及預后評價。但仍然可以窺得基于組學分析技術在研究抑郁癥的遺傳因素、基礎生物學機制、蛋白質標志物、代謝過程方面,為抑郁癥的早期診斷、個體化治療和藥物研發等方面提供支持,具有巨大潛力。
行為數據,如表情、聲音和文本等,相對于腦電,MRI 等生理信號采集成本較低,數據易于獲取,較其他數據更容易解釋,模型準確率也較高。
目前,已有研究者引入卷積神經網絡算法進行患者抑郁狀態的檢測。Zhu 等提出了一種基于深度卷積神經網絡模型從視頻數據中預測貝克抑郁量表II(BDI-II)值的方法,相比其他基于視覺的方法,該模型可以對患者的面部動力學特征進行很好的刻畫,顯著提高抑郁癥的預測性能。Zhou 等在回歸網絡中引入了記憶注意力機制去深度判別抑郁表示,利用卷積神經網絡算法,對面部特征的提取進一步優化,通過在基準數據集上對方法進行經驗評估,結果表明其方法優于當下幾種最先進的方法[4]。
近年來,通過患者的語音特征進行抑郁癥的輔助診斷的研究越來越多,有研究發現,單調、遲鈍、停頓、低沉和語言輸出減少等特征與抑郁癥患者的語言關聯密切。也有研究以聲音抖動和聲門頻譜斜率為特征,選取10 名高風險的近期自殺患者,10 名嚴重抑郁癥患者和10名非抑郁癥對照組建立模型,其準確率高達90%。
除此之外,社交媒體上發布的文本數據也可提供有關抑郁癥的線索。劉豪等基于領域情感詞典與字詞特征融合,提出了一種進行中文抑郁癥文本分類的方法,并應用于BERT 模型,準確率達到了97.59%。Yang 等通過抑郁癥相關問題分類的支持向量機(SVM)框架和Doc2Vec 和文本卷積神經網絡的框架,對受訪者是否有抑郁傾向進行分類,建立了一個易于分析抑郁傾向的文本分類模型。
利用人工智能強大的數據處理能力,用機器學習算法模型輔助醫師完成診療,可以避免因認知偏差而導致的臨床錯誤,提高診斷率,有助于為抑郁癥患者提供更加有效的個性化治療方案。
并且在心理咨詢中,當人們面對人工智能咨詢時,相較于人類咨詢師,所產生的懷疑及顧慮更少,更易對人工智能坦誠相告,可避免患者因病恥感而不愿及時就醫的問題,有助于促進抑郁癥的早發現和早治療。
當下的研究所采用的樣本數據多以小樣本為主,缺乏大規模大樣本的深入研究,機器學習模型預測的準確與否同所采用的數據質量密切相關,且算法模型的建立需要以標簽數據為基礎,同時還需要較多富有經驗的專業醫師進行大量的數據標注工作。
此外,將機器學習應用于抑郁癥也對倫理道德問題提出了重大挑戰,包括對于患者數據進行收集、共享的倫理問題以及患者數據隱私保護的問題等。
近年來,抑郁癥的全球發病率增長迅速,而我國目前精神衛生方面的醫生數量難以滿足日益增長的看病需求,對抑郁癥患者進行及時的干預治療存在著較大難度。若是能夠利用以機器學習為代表的人工智能技術進行抑郁癥的輔助診斷,則可以在一定程度上提高醫生的診斷效率,節約我國的醫療資源,并緩解精神衛生方面的醫療資源稀缺情況。