駱睿鵬,鄒任玲,孟令鵬,談宏偉,劉巨濤,徐瀾菲,胡秀枋,曹 立
(1 上海理工大學健康科學與工程學院,上海 200093; 2 上海交通大學醫學院附屬第六人民醫院神經內科,上海 200233)
據世界衛生組織不完全統計,全球約有超過3.5億的不同程度抑郁癥患者,僅中國統計出的抑郁癥患者已超過3 000 萬,在近20年的時間抑郁癥患者約增加了120 倍。 然而,對抑郁癥的病理機制的認識、尤其量化的評估或精神健康的指標以及有效的精神障礙早診早治方法仍然缺乏,這成為抑郁癥患者痊愈的主要難題。
由于抑郁癥的發病隱蔽性高和大眾對抑郁癥不夠重視,仍有不少的抑郁癥患者尚未得到有效治療。目前,對抑郁癥的診斷主要依賴于臨床醫生的觀察、問診以及問卷量表調查,這種方法存在一定的主觀性和不確定性,易導致誤診、漏診、前后診斷不一致,延誤患者最佳治療時期。 因此,現階段研究者嘗試運用神經成像技術如腦電(Electroencephalogram,EEG)、核磁共振、腦磁圖、正電子發射斷層顯像等來實現對抑郁癥的客觀評價和診斷。 其中,EEG 具有一定的優勢,如設備價格低、操作簡單方便、時間分辨率高等。 隨著人工智能的發展,采用機器學習方法結合EEG 信號特征用于識別抑郁癥的分類研究越來越受到重視。
基于機器學習對抑郁癥患者和正常人的腦電信號進行識別已經有一定的研究基礎。 如Cai 等學者[1]利用86 名抑郁癥患者和92 名正常人的腦電數據,提取得到了一部分特征,在KNN 模型上達到了86.98%的準確率。 Hosseinifard 等研究者[2]利用45名抑郁癥患者45 名正常人的腦電數據提取4 個不同波段的功率譜和4 種非線性特征等特征,利用邏輯回歸分類器達到90%的準確率。 郭雨[3]利用142名抑郁癥患者和72 名健康人的靜息態腦電數據,在6 種不同的機器學習算法模型上最好效果均達到了80%以上的準確率。 然而,以上這些研究只考慮到腦電信號的時域或頻域或動力學方面等單一特征對識別的影響,而有大量研究表明抑郁癥患者和正常人之間的不同腦部區域存在不同的活動性,因此需要從多方位地引入各種特征對抑郁癥識別進行相應的研究。 本文擬通過將機器學習和腦電信號應用到抑郁癥診斷中,一方面可以篩查出大量潛在患者并對其進行及時有效治療,另一方面可以更客觀準確地識別抑郁癥,提高醫生的工作效率,減輕工作壓力。 實現基于EEG 信號的抑郁癥患者識別將為抑郁癥診斷提供一種新的輔助工具,具有極大的研究價值。
本研究使用的數據集選用蘭州大學可穿戴計算重點實驗室公開的用于精神障礙分析的抑郁癥研究數據集[4],經蘭州大學第二附屬醫院倫理委員會批準,并獲得所有受試者的書面知情同意。 該數據集包含24 名抑郁癥患者和29 名健康對照者所采集的腦電數據,采用128 導聯進行腦電數據采集的頭皮電極位置如圖1 所示,使用HCGSN (HydroCel Geodesic SensorNet)系統采集腦電數據和NetStation軟件記錄腦電數據,整個采集過程的采樣頻率設置為250 Hz,分別采集了受試者閉眼靜息態和睜眼刺激態下的腦電數據(刺激態腦電實驗范式是采用中國化面孔情緒圖片作為刺激材料,以此誘發注意力任務下的EEG 信號。 根據情緒效價的不同,共包含恐懼、悲傷、快樂和中性4 種不同類型的面孔情緒圖片)。 抑郁癥和健康對照組的年齡分布以及PHQ-9評分情況統計如圖2 所示。 由圖2 可知,抑郁癥患者滿足如下條件:

圖1 128 導聯頭皮電極位置定位圖Fig. 1 Positioning map of 128-lead scalp electrodes

圖2 抑郁癥和健康對照組的年齡分布及PHQ-9 評分情況Fig. 2 Age distribution of experimental subjects and PHQ-9 score statistics
(1)男女比例均衡且年齡范圍在16 ~56 歲分布;
(2)在接受被試前均符合DSM 的抑郁癥診斷標準,且經過PHQ-9 評分問卷的調查;
(3)在接受被試前兩周以內未服用任何精神類藥品,排除了有嚴重身體疾病或不良傾向的患者。
健康對照組滿足如下:
(1)男女比例均衡且年齡范圍在18 ~55 歲分布;
(2)排除了患有精神疾病病史以及有精神障礙家族史的人。
由于EEG 信號在采集過程中抗干擾能力較差,會受到各種干擾信號和偽跡的影響。 因此采用Matlab 2019b EEGLAB 工具箱和Python 中MNE 軟件包對從采集設備獲取到的原始腦電數據進行預處理工作,主要步驟如下:
(1)導入連續的腦電數據;
(2)電極定位后選擇適用的電極通道;
(3)降低采樣率用以提高運行速度;
(4)使用1~45 Hz 的帶通濾波器以及50 Hz 的陷波濾波器來消除電源電路中的50 Hz 工頻交流電等其他干擾信號;
(5)查看腦電時域波形圖中是否存在壞通道,若存在則需要對壞導進行插補;
(6)將連續的腦電數據分段為多段epoch;
(7)使用ICA 算法手動校正由眼電、眨眼、心電、肌肉活動等產生的生理性偽跡成分和其他非生理性偽跡影響的數據部分以得到較為純凈的腦電數據;
(8)手動去除漂移較大的腦電數據段;
(9)對預處理后的腦電數據進行保存。
本節通過提取抑郁癥患者和健康對照組不同狀態下的腦電信號的線性特征和非線性特征,使用隨機森林[5]、邏輯回歸、K 近鄰[6]、支持向量機[7]四種機器學習算法模型進行分類識別,通過比較單一類型特征和多種類型特征、靜息態和刺激態、不同情緒刺激態情況下的抑郁癥病癥識別效果,對抑郁癥病癥情況進行分析,并通過調整模型參數獲得最優識別模型,具體技術實現路線如圖3 所示。

圖3 技術實現總流程圖Fig. 3 General flowchart of technology realization
大腦皮層根據不同的位置一般被劃分為額葉、顳葉、頂葉和枕葉,每一塊區域都能夠反映出人體的不同反應活動。 其中,額葉區域與注意力、記憶、個性和情感等高級認知活動有關[8],有研究者們認為額葉病變主要導致精神障礙,常表現為注意力喪失、冷漠、思維反應力和創造力都顯著下降,這也是抑郁癥患者的一部分病癥體現。 楊勇等研究人員通過分析抑郁癥患者的腦區能量占比發現,與大腦皮層中央區域和枕葉區域相比,重癥抑郁癥患者在經過治療后的額葉區域能量占比表達更為強烈。
由抑郁癥引起的腦電信號異常特征中,經典的以明確的α節律為主,在額葉區域具有較高的振幅,并且同樣也會經常采集到δ 節律,有研究表明,與α節律的異常相比,β、δ、θ節律的變化更為明顯,不同頻帶信號的功率譜或大腦不同區域的數據通道之間的不對稱性也會顯示出不同。 這些腦電信號特征可用于確定抑郁癥的發作情況并評估治療的有效性,特別是對于長期輕度抑郁癥患者。 醫學上根據腦電成分的波動特征將腦電信號分為5 種節律信號,詳見表1。不同的EEG 節律頻段對應不同的人體狀態,各種EEG 節律頻段都可在大腦皮層的不同區域出現,但往往在不同的生理狀態下最明顯的大腦區域有所不同。

表1 腦電信號各節律頻段及特點Tab. 1 Frequency bands and characteristics of each rhythm of EEG signal
以上這些頻段節律信號可以從不同情緒狀態中獲得,在不同情緒狀態下,腦電信號的頻率和振幅都會發生相應的變化。 本研究采用的線性特征主要由腦電信號的峰峰值平均幅度、中位振幅、最大振幅、最小振幅以及α、β、δ、θ四種腦電波節律信號組成[9]。
由于腦電信號的非線性、不規律性以及非平穩性的特點,傳統的線性特征只是在時域和頻域上反映EEG 的某方面特征,引入非線性動力學方法能夠更加全面地對EEG 的特征進行分析。 其中,熵作為非線性特征,是可以用來表征一個系統的復雜性和不規則性。 本研究采用的非線性特征主要由奇異值分解熵、譜熵、排列熵組成[9]。
奇異值分解熵是一種通過奇異譜和信息熵相結合的分析方法,其基本思想是通過對系統的時域信號序列進行相空間重構和奇異值分解,獲取其內在復雜性特征。 在信號的奇異譜分析基礎上,計算奇異譜的信息,即奇異值分解熵,則可定量描述時間序列的復雜狀態特征。 譜熵是用來表示輸入信號能量在功率譜劃分下的不確定性,若信號組成成分較為復雜時,信號對應的功率譜越分散,對應的功率譜線會增多,得到的譜熵值就會變大,因此譜熵是對信號在頻域上能量分布的復雜程度的定量描述。 排列熵是一種能夠檢測信號突變的復雜程度的平均熵參數,其值越大就表示所對應的信號越復雜,計算過程簡單并且具有很好的抗干擾能力和魯棒性,能將無法定量描述的復雜系統簡潔地描述出來。
在本次實驗中,分類器采用了機器學習中的隨機森林、邏輯回歸、K 最近鄰、支持向量機四種算法模型進行構建,主要對以下幾種組合情況進行討論:
(1)線性特征和非線性特征在單獨及組合構成特征數據集下的識別效果對比;
(2)靜息態和刺激狀態下的腦電信號進行識別效果對比;
(3)恐懼、悲傷、快樂三種不同情緒刺激下的腦電信號進行識別效果對比。
為了研究不同類型特征對抑郁癥患者和正常人的腦電信號分類的影響,首先分別對線性特征和非線性特征這2 類單一類型的特征進行抑郁癥識別。
線性特征下的抑郁癥識別結果見表2。 由表2可以看出,基于刺激態特征數據集和調優后的隨機森林算法組合構建的抑郁癥識別分類模型具有最高的分類準確率,達到91%。 另外,在悲傷情緒刺激態和靜息態下,模型的識別準確率最高達到了70%以上。
非線性特征下的抑郁癥識別分類結果見表3。由表3 可以看出,整體的識別準確率都不是很高,只有基于快樂狀態特征數據集和調優后的隨機森林算法組合構建的抑郁癥識別分類模型的準確率能達到60%以上。

表3 非線性特征下的抑郁癥識別準確率Tab. 3 Accuracy of depression recognition under nonlinear features%
考慮到單一類型的特征表征抑郁癥病癥信息缺乏片面性,為了充分考慮特征之間的互補性,于是將2 種不同類型的腦電特征進行組合作為判斷抑郁癥的特征數據集,這樣就能夠盡可能地涵蓋抑郁癥人群和健康人群中關于大腦活動模式的變化。
在上述實驗的基礎上,分別將線性特征數據集和非線性特征數據集進行特征組合后再對抑郁癥進行識別分類,識別分類結果見表4。 表4 中,在恐懼狀態、悲傷狀態兩種特征數據集下的抑郁癥識別準確率能達到70%以上,在靜息態和刺激態兩種特征數據集下的抑郁癥識別準確率能達到60%以上。

表4 組合特征下的抑郁癥識別準確率Tab. 4 Accuracy of depression recognition with combined features%
分析以上2 組單一類型特征下的抑郁癥識別結果,可以看到線性特征下的分類識別準確率要普遍高于非線性特征,這在一定程度上表明了抑郁癥患者對于頻段線性特征信息要更具敏感性,腦電信號的線性特征能更有效地表征出抑郁癥患者的腦內活動變化。 分析單一類型特征和多種類型特征下的抑郁癥識別分類效果,發現相比較于單一非線性特征的分類結果,多特征組合后的識別效果有了一定的提升,說明這2 類單一類型特征均包含表征抑郁癥病癥的有效信息,并且采用多種類型特征組合對于識別抑郁癥有一定的輔助作用。
為了研究不同類型特征對抑郁癥患者和正常人的腦電信號分類的影響,在上述對比分析基礎上,為了進一步探究抑郁癥患者和正常人對于靜息態和刺激狀態下的識別效果,于是在保證同一類型特征的基礎上分別對靜息態和刺激態進行識別分類,靜息態識別結果如圖4 所示,可以看出,靜息態下的識別準確率最高能達到70%以上。 刺激態識別結果如圖5 所示,可以看出,刺激態下的識別準確率最高能達到90%以上。

圖4 靜息態腦電信號下的抑郁癥識別分類結果Fig. 4 Classification results of depression recognition under resting state EEG signal

圖5 刺激態腦電信號下的抑郁癥識別分類結果Fig. 5 Classification results of depression recognition under stimulated state EEG signals
從上述對比結果可以看出,抑郁癥患者在刺激下相較于靜息態下能表征出更顯著的特征,因此在抑郁癥臨床早期診斷可以對就診人進行適當性的刺激以誘發出與抑郁癥狀態相關的大腦區域的不同模式。
為了進一步分析出刺激態下抑郁癥患者對哪種情緒刺激更敏感[10],于是針對采集腦電實驗范式中的不同類型情緒狀態下的抑郁癥識別效果進行分析。
恐懼情緒刺激下的抑郁癥識別分類結果如圖6所示。 圖6 中,從恐懼情緒狀態下的抑郁癥識別分類結果中可以看出,非線性特征對于該情緒狀態下的抑郁癥表征比較顯著,最高準確率能達到70%以上,并且在進行多特征組合下,非線性特征能有效提高線性特征下的恐懼狀態下的抑郁癥識別分類結果。 悲傷情緒刺激下的抑郁癥識別分類結果如圖7所示。 圖7 中,從悲傷情緒狀態下的抑郁癥識別分類結果中可以看出,線性特征對于該情緒狀態下的抑郁癥表征比較顯著,最高準確率能達到80%以上,而特征組合的方式能有效提高非線性特征在悲傷狀態下的抑郁癥識別效果。 快樂情緒刺激下的抑郁癥識別分類結果如圖8 所示。 圖8 中,從快樂情緒狀態下的抑郁癥識別分類結果中可以看出,不論是非線性特征、還是線性特征對于該情緒狀態下的抑郁癥表征都不太顯著,對于抑郁癥識別最高準確率才達到60%左右。

圖6 恐懼情緒刺激下的抑郁癥識別分類結果Fig. 6 Classification results of depression recognition under fearful emotion

圖7 悲傷情緒刺激下的抑郁癥識別分類結果Fig. 7 Classification results of depression recognition under sad emotion

圖8 快樂情緒刺激下的抑郁癥識別分類結果Fig. 8 Classification results of depression recognition under happy emotion
通過對以上3 種情緒狀態下的抑郁癥識別結果分析,能夠表明抑郁癥患者對于悲觀情緒下的刺激感知非常顯著,對于樂觀情緒下的刺激感知比較遲鈍。 該結果還充分體現了臨床抑郁癥患者普遍的悲觀消極情緒嚴重的情形。
本文研究提取了腦電信號的線性和非線性特征,使用機器學習方法對抑郁癥患者進行綜合分析,通過對單特征、多特征的識別對比分析,非線性特征不一定能有效提高對抑郁癥病癥的識別準確率,而線性特征在表達抑郁癥患者和正常人的區別中有一定的優勢,造成這種現象的原因可能是抑郁癥患者的癥狀與大腦皮層的異常活動產生的特定頻段電信號有關。 通過構建最優特征矩陣和調整最優參數得到了基于刺激態線性特征和隨機森林算法抑郁癥識別模型,其準確率達到最高91%,從而驗證了機器學習方法進行抑郁癥輔助診斷的適用性,能更好地識別抑郁癥,可對后續抑郁癥的早發現早干預早治療提供一定的參考價值。 本文還創新性地對靜息態和刺激態兩種不同腦電狀態下的數據集進行了對比分析,實驗結果表明抑郁癥患者對于外界刺激較為敏感,進而產生了不同于靜息態下的腦電波成分。同時,還針對刺激態下的恐懼、悲傷、快樂三種情緒狀態抑郁癥識別準確率進行對比分析,結果顯示抑郁癥患者對于正性情緒的腦部反饋和認知出現異常,而對負性情緒產生了認知偏向,腦區活躍程度更大,更容易對負性情緒進行加工,這進一步驗證了抑郁癥患者存在對于正性情緒的選擇性抑制,表現出難以被激活的現象,這為抑郁癥的發病機制提供了電生理證據,也為后續針對抑郁癥患者進行治療采用非物理性的情感認知治療手段提供了一定的可行性驗證。