李丹陽 張晶晶
(新疆師范大學,新疆 烏魯木齊830054)
精神障礙(mental disorder)是由多種原因所引起的嚴重程度不同的腦功能失調或者紊亂的精神疾病,并伴有不同的臨床癥狀(張勁松,2012)。其特征為認知、情緒、行為等方面發生改變,這些改變使得患者感到痛苦、功能受損或增加患者死亡、殘疾等的危險性(張理義,&耿德勤,2018)。精神障礙可分為“器質性”精神障礙(如腦炎、慢性臟器衰竭所致的精神障礙)和“功能性障礙”,而功能性障礙又分為精神病性障礙(如精神分裂癥)和輕性精神障礙(如焦慮、抑郁癥、應激所致的精神障礙)。目前,我國約有精神病性障礙1600 萬和3000 萬抑郁癥患者,而精神障礙的識別率、治療率較低是我國的精神衛生事業的巨大挑戰之一(郝偉,&于欣,2013)。
傳統精神障礙的主要診斷一般是采用結構性訪談和家族史追溯等方式,臨床心理醫師在診斷病患時常常會面臨溝通困境,例如患者故意隱瞞真實近況而不能實現問卷及訪談的信效度,而醫生在依據檢查形成癥狀學判斷時也有一定的主觀色彩,使得在不同的醫療環境背景下,診斷結果的一致性較低。
許多學者為此試圖運用神經影像學技術探索可以使精神疾病診斷標準客觀化和準確化的生物標記物,而在多種神經影像技術中,腦電圖(EEG)由于其低成本和毫秒級時間分辨率得到了很多研究者的青睞(Miseon Shim,2016)。低成本可以使基于EEG 的輔助診斷投入臨床應用成為可能,而高時間分辨率則能幫助研究者更好的監測到各類精神障礙心理機制的動態過程。
在精神障礙的神經影像學研究中,機器學習由于圖像處理方面的突出優勢而逐漸成為有力工具?;跈C器學習和神經影像的計算機輔助診斷研究也成為領域熱點(張家寧,2017)。我們期望通過EEG 的數據結合機器學習算法建立精神障礙的分類模型來輔助或完成臨床診斷,進而提高精神類疾病的整體診斷效率、降低醫療成本、提高醫療資源的普惠性。
機器學習(machine learning)是一門涉及多領域的交叉學科,它是人工智能的核心,涉及到算法的選擇、分類器的構建。計算機程序基于經驗E 學習任務T,完成任務的表現記為性能P,如果其習得性能P 隨著經驗E 的增大而不斷增長,則稱為機器學習(Tom Mitchell,1997)。廣義上說,機器學習即無需進行明確的編程而讓計算機具有學習的能力。
機器學習有多種類型,可以根據:(1)其用來訓練算法的訓練數據是否包含標簽,分為監督學習(多用于分類和回歸問題)、非監督學習(如可視化算法和異常檢測)和半監督學習(如圖片存儲標記服務);(2)是否可以動態漸進學習,分為在線學習和離線學習;(3)是否只是通過簡單地比較新的數據點和已知的數據點,或者在訓練數據中進行模式識別,以建立一個預測模型,分為基于實例學習和基于模型學習;(4)根據是否需要人工提取特征,分為傳統淺層學習(支持向量機、K 近鄰等)和深度學習(卷積神經網絡、循環神經網絡等)(Géron,2017)。
機器學習較傳統方法的優勢表現在以下幾點:(1)對于需要進行大量傳統編程調整或需要有復雜規則才能解決的問題,機器學習算法通常可以簡化代碼、提高效率。(2)當環境波動時,機器學習算法可以適應新數據,而無需人工進行繁瑣的修正維護。(3)使用機器學習方法可以挖掘大量數據,發現原本數據中并不顯著但重要的規律,有時可能會發現新穎的關聯和趨勢,有助于對問題本身更好的理解。
20 世紀80 年代至今,機器學習達到了一個繁榮時期,由于這一時期物聯網大數據以及硬件GPU 的出現,使得機器學習開始爆炸式發展,也由于其本身較傳統方法的優勢,成為了一門獨立熱門學科并被應用到數據標記類別、推薦系統、信息檢索與排序、醫療決策支持等各個領域。
精神障礙患者疾病意識的不足、早期篩查方法的缺乏及傳統診斷方式的固有缺陷導致患者在被診斷時大多已發展至重性障礙。為改善現狀,近年來機器學習被逐漸應用到多種精神障礙的預測、識別、輔助診斷和治療決策中。
抑郁癥(Depression),也稱抑郁障礙(Depressive disorder)(American Psychiatric Association,2013),其主要特征為持久而顯著的情緒低沉,具有慢性、反復發作、遷延不愈、自殺率高的特點。大約有8%的男性和15%的女性在他們的一生中會患上抑郁障礙,嚴重影響生活質量,且其中有近15%的人選擇了自殺(Gold,Machado Vieira,& Pavlatou,2015)。
據世界衛生組織(World Health Organization,WHO)預測,到2020 年,抑郁癥將代替癌癥成為世界第二大疾病。因此,對抑郁癥患者的診斷精度的提升需求迫在眉睫。
結合機器學習算法及EEG 數據建立抑郁癥輔助診斷模型的基本原理為采集抑郁癥患者及健康對照組的EEG 數據,將進行預處理和歸一化后的數據按一定比例分為訓練集和測試集,訓練集數據用于對機器學習算法進行訓練,測試集數據則用于對模型進行性能評估,并在驗證評估過程中對模型進行不斷優化。其思路框架如圖。

基于EEG 的機器學習抑郁癥預測模型思路框圖
劉巖、李幼軍和陳萌(2017)對重度抑郁患者及健康對照組的EEG 進行特征提取,并建立支持向量機和線性分類模型,其分類準確度最高達到90.0%;該團隊又基于僅進行濾波降噪處理的腦電信號建立深度學習卷積神經網絡分類模型,分類準確度達96.7%,由此得到基于深度學習卷積神經網絡的抑郁癥分類效果比需要進行特征提取的傳統機器學習模型更好。
Bailey 等(2019)研究顯示利用支持向量機基于抑郁癥患者治療一周時的靜息腦電信號EEG 的PSD、wPLI、theta cordance值的特征,可以預測患者對rTMS 治療是否應答,從而指導無應答患者盡早選擇其他適合的治療方法,避免其盲目接受無效、延誤治療時期且昂貴的rTMS 治療。
Hasanzadeh 等(2019)研究顯示利用K 近鄰基于抑郁癥患者治療前的靜息腦電信號EEG 的非線性特征可以預測其對rTMS 治療是否應答,其基于Beta 頻率的能量譜特征的分類精度達到91.3%,高于Bailey 團隊,并省去了患者為期一周的rTMS 高額治療費用。
注意缺陷多動障礙(attention deficit and hyperactivity disorder)是最具危害性的兒童青少年精神障礙之一,發病率在學齡兒童的3%~8%,近半數起病于4 歲以前,男孩多于女孩(張家寧,2017)。注意缺陷多動障礙患者多表現為明顯的注意力不集中,注意持續時間短暫,活動過度和沖動,并常伴有學習困難或品行障礙,ADHD 患者與品行障礙的同病率高達30%~58%。遺傳、生物化學因素、神經解剖和神經生理、發育異常、心理社會因素等都為本病的發病相關因素。(張理義,&耿德勤,2018)。
研究表明,ADHD 患者中65%的病例持續到成年期(Faraone SV,Biederman J,&Mick E,2006),而成年ADHD 患者的臨床癥狀又易與精神分裂或人格障礙等精神疾病產生混淆,使得傳統診斷方法下,成年ADHD 的誤診率偏高。
在多動癥患者感覺和認知處理缺陷的背景下,有大量證據表明患者事件相關電位(ERP)發生了改變。Andreas Mueller(2010)采用支持向量機分類方法,用年齡和性別匹配的兩組成人(74 名ADHD 患者,74 名對照組)進行視覺雙刺激GO/NOGO任務。利用獨立成分分析方法(ICA)將ERP 數據分解為獨立成分。特征選擇算法定義了一組獨立的成分特征,這些特征被輸入到支持向量機中,采用10 倍交叉驗證方法,其分類準確率達92%。該研究首次嘗試使用支持向量機對成人ADHD 進行分類,并證實基于ERP 數據非線性特征的分類模型在臨床診斷中的可行性。
高度考試焦慮在各級學生中的比例都超過20%(陳睿,劉瀟楠,周仁來,2011),在一些地區的初中生中這一比例甚至高達35%(陳祉妍,2002)。
考試焦慮對個體的身心健康有著嚴重危害。首先,在面臨重要考試的時候,考試焦慮者會體會到一種強烈的擔憂和情緒反應,包括心慌、緊張的情緒體驗及一系列生理反應,如出現與植物性神經活動失調相關的身體反應癥狀(如心跳加快、出冷汗、呼吸急促、顫抖等),并且由此影響個體的生理健康,影響內分泌,降低免疫功能,增加感染性疾病、胃部不適及睡眠障礙等軀體疾病(閆慧,盧莉,2014)。
高度的考試焦慮往往與抑郁情緒相聯系(陳睿等,2011),而抑郁癥發病得越早,越可能影響至終生,且復發率和自殺率越高(王瑋文,謝希,邵楓,2008)。因此,對考試焦慮進行早期的準確診斷十分必要。
章文佩、沈群倫(2019)使用ERPs 技術采集并分析高、低考試焦慮者在情緒Stroop 中對考試相關威脅詞與中性詞下的ERP成分(P1,P2,N2,P3 和LPP),結合7 種常見的機器學習算法對個體考試焦慮程度進行進一步的診斷。結果表明相較6 種淺層學習算法,深度學習算法中的卷積神經網絡(CNN)對考試焦慮診斷的分類效果最好,其準確率達86.5%。
精神分裂癥是一種病因不明、臨床分類眾多且多發病于青壯年的重性精神障礙,患病率約為1%,患者表現出思維方式和行為舉止怪異、感知覺扭曲、認知失調等癥狀并且常伴有情感遲鈍、社會退縮等特征(Carpenter & Buchanan,1994)。精神分裂癥可在發病后持續發展。個別患者的進展可能有顯著差異。早期發現精神分裂癥的發病和發展階段,對于及時有效地預防或減輕疾病的進一步惡化具有重要意義。
最近,越來越多的研究人員嘗試使用腦電生物標記的機器學習方法來區分精神分裂癥患者和健康對照組。其中一些研究使用了傳感器水平的腦電生物標志物。比如ERP 的振幅和潛伏期作為分類的特征。Neuhaus(2011)使用視覺和聽覺異常范式誘發了被試N100 和P300 的振幅/潛伏期來區分40 個精神分裂癥患者和40 個健康對照組,得到了72.4%的分類準確率。2013年,Neuhaus 改變實驗任務,使用視覺目標鎖定范式誘發的ERP成分作為數據源,將分類準確率提高至79%。
Miseon(2016)使用從聽覺oddball 任務誘發的ERP 信號中提取的傳感器級和源級特征來對精神分裂癥患者和健康對照組進行分類。研究人員記錄了34 名精神分裂癥患者和34 名健康對照組的腦電圖信號,同時要求他們注意奇怪的音調。結果表明,當源級特征與傳感器級特征一起使用時,與僅使用傳感器級特征時相比,具有更高的分類準確率,為88.24%。
阿爾茲海默癥(Alzheminer's disease,AD)是一種原發性退行性腦病變疾病,多起病于老年期,臨床上以智能損害為主(郝偉,&于欣,2013)。它的特點是下降至少兩個認知域(例如失去記憶、注意、語言、執行功能),嚴重到影響患者的社會或職業功能。隨著社會老齡化的發展,全球范圍內該病的發病率呈逐年上升的趨勢。預計在2050 年,AD 患者的數量預計將從4440 萬增加到1 億3550 萬(宋昕,洪羽蓉,&胡秋瑩,2015)。
AD 已經與心腦血管疾病、腫瘤、腦卒共同成為老年人的四大殺手,嚴重的危害老年人的身體健康和老年生活質量。提高AD 的早期診斷率,可以避免病患錯失最佳的治療時期,及時選取合適的治療緩解癥狀病情的惡化。
Lucas R. Trambaiolli 等(2011)開發了定量腦電圖(qEEG)的處理方法,并結合支持向量機建立了AD 分類模型,用以區分AD 患者與健康對照組。該研究記錄了19 名正常受試者(14 名女性/5 名男性,平均年齡71.6 歲)和16 名可能有輕度至中度癥狀的AD 患者(14 名女性/2 名男性,平均年齡73.4 歲)的腦電圖進行模型的建立,最終得到87%的高分類準確率。
Sonja Simpraga 等(2017)利用接受東莨菪堿(scopolamine)治療的受試者的EEG 數據,建立了由14 個腦電圖生物標志物組成的鼠毒堿乙酰膽堿受體拮抗劑(mAChR)指數。研究得出mAChR 指數比單一腦電圖生物標志物具有更高的分類性能。該研究將mAChR 指數結合機器學習算法建立了AD 診斷模型,獲得了92%的分類準確率。這一研究證實可以通過整合多個腦電圖生物標記物的方式提高疾病或藥物干預的模型識別準確率。
基于EEG 技術的機器學習在精神障礙的計算機輔助診斷研究目前仍存在一定的局限性。
4.1 樣本量不足。樣本量不足是現階段精神障礙診斷領域機器學習研究面臨的一大問題(Bailey,2018)。樣本量不足的主要原因包括數據提取成本高、樣本的特殊性和數據共享困難。精神障礙患者受到臨床癥狀和藥物副作用的影響,在采集數據時需要耗費更多的人力和物力,采集難度大,因此與精神障礙有關的腦神經科學研究樣本量通常較小。
4.2 樣本及特征代表性有限。對精神障礙如自閉癥、精神分裂癥等亞類型的樣本選擇偏歧會導致樣本類內差異過大而影響分類模型的效能。而利用機器學習選擇不同的生物標志物作為預測特征,其預測準確度會存在差別。我們應在同時考慮準確度和成本情況不斷尋找最佳的預測特征來構建精神障礙診斷分類模型。
不可否認的是,近年來機器學習在精神障礙智能診斷及預測研究中進步巨大,并有很大的研究空間。
未來,多個研究機構可以建立能夠保障被試隱私和數據安全的協議,規范數據入組標準,在不違背倫理的情況下實現多中心數據共享,增大樣本量,以解決當前與精神障礙有關的腦神經科學研究樣本量通常較小的問題。研究者在需要利用降維和特征選擇的方法保留有用的大數據特征,從而提高特征的有效性。研究者更可以在獲得大樣本數據的基礎上,嘗試使用更高分類能力的深度學習算法進行建模,以期提高機器學習算法診斷模型的準確率和泛化能力。
據國務院發布的《全國精神衛生工作規劃(2015-2020年)》,目前我國精神衛生服務資源十分短缺且分布不均,全國僅有精神衛生專業機構1650 家,精神科醫師2 萬余名。我們期待當EEG 技術、精神診斷與機器學習算法各領域的合作日趨成熟后,在醫療資源有絕對優勢的地區訓練、驗證精神障礙的計算機輔助診斷模型,而后在欠發達地區投入使用,以期平衡我國精神障礙診治水平的地域差異性,促進醫療資源共享,推動精神衛生事業全面均衡發展。