韋博軒,張冀聰
1. 北京航空航天大學 a. 生物與醫學工程學院;b. 北京市生物醫學工程高精尖創新中心;c. 北京市大數據精準醫療高精尖創新中心,北京 100191;2. 北京航空航天大學 合肥創新研究院,安徽 合肥 230012
癲癇是一種由于神經細胞異常過度放電而導致的慢性腦部疾病,具有反復發作的特征[1]。癲癇患者常伴有無法控制的運動、意識喪失及暫時性混亂等癥狀,嚴重影響日常生活及工作,甚至威脅到患者的生命[2]。據癲癇基金會和世界衛生組織調查顯示[3],目前全世界約有6500 萬人被診斷患有癲癇,240 萬人被發現有癲癇癥狀。
頭皮腦電圖(Electroencephalogram,EEG)和腦磁圖(Magnetoencephalogram,MEG)是臨床上用于記錄腦部相關活動的無創信號采集手段[4],具有優異的時間分辨率(EEG和MEG 信號均來自相同的神經生理過程,但MEG 信號失真較少,且較EEG 信號而言具有更高的空間分辨率[5]),在癲癇的診斷、治療、療效評估及機理研究領域發揮著重要的作用[4-7]。大量研究顯示,近80%的癲癇患者在癲癇間隙期會伴有神經元的異常放電,在EEG 及MEG 中的波形表現主要有棘波、尖波、棘慢及尖慢復合波等[8-9]。臨床上,通常選擇提取癲癇發作間期的癇樣棘波和尖波,并通過定量分析獲取癲癇相關的病理信息。此外,基于EEG 及MEG 的源定位方法在癲癇患者的術前評估及預后中起到關鍵性的作用[10],而在這之中,棘波和尖波的檢測是源定位的第一步。
目前臨床上,視覺檢測和手動注釋被看作是棘波和尖波檢測的“金標準”,然而大量繁瑣而冗余的工作給專業人員帶來沉重的負擔,且其檢測的準確性過度依賴于檢查者的主觀判斷,因此,設計實現用于EEG 及MEG 信號解釋的自動化系統意義重大。
本文關注的是EEG 和MEG 信號中棘波和尖波的自動檢測,需要注意以下三點:首先,雖然臨床中對棘波和尖波的定義有所不同,但在棘波和尖波的自動識別領域,將二者統稱為癲癇瞬變現象或統稱為棘波,因此下文將以棘波代指棘波和尖波的集合;其次,兩類信號均具有多通道特性,因此棘波檢測可在單通道或多通道上進行;最后,棘波被認為是信號的異常段,因此大多數異常檢測技術均可用于EEG 及MGE 信號中棘波的檢測,盡管該領域的大部分工作都致力于EEG 棘波檢測,但經過一些修改后,同樣可以擴展應用于MEG 棘波檢測中。
本文結構如下,第一節主要描述EEG 及MEG 信號中棘波的波形特征;第二節介紹通過設計特征工程實現棘波檢測的相關算法;第三節討論當前工作的結果并展望棘波檢測算法的未來發展方向。
由于EEG 和MEG 信號均來自相同的神經生理過程,因此本文以10~20 系統記錄的EEG 為例簡要介紹棘波特征。棘波是大腦皮層神經細胞異常放電在EEG 信號中引起的波形變化,表現為由皮質表面定向引起的表面負偏斜,上升支和下降支陡峭,整體形狀如同荊棘的尖刺,是EEG 信號中癇樣放電的典型特征之一。棘波的周期通常為20~70 ms,突出于背景信號,幅度大于20 μV,為背景信號的1.5 倍以上[11-13]。
受棘波上述特性及檢測方式等因素的影響,自動棘波檢測面臨以下挑戰:① 由于人與人之間存在的個體化差異,導致棘波的表現形式各異,很難通過簡單的一致性方法自動檢測EEG 及MEG 信號中存在的棘波;② 由于信號測量過程中不可避免地存在心跳、眼動、肌肉運動等因素造成的偽差,對棘波自動檢測的準確率影響較大;③ 相對于完全放電的棘波,不完全放電的棘波波形特征不夠明顯,進一步提高了自動檢測的困難。
1972 年,Stevens 等[14]首次嘗試從長時程的EEG 信號中提取癇樣棘波,開啟了學界對棘波自動檢測的研究。自此之后,依據癇樣棘波的特性,產生了諸多不同角度的棘波檢測算法,包括基于形態學[15-17]、信號相關性[18-21]、子帶分解[22-23]以及特征工程相關[24-31]等方向。由于篇幅有限,本文僅對基于機器學習的相關方法進行介紹。傳統基于機器學習的棘波檢測算法通常分為以下三步,首先是對EEG/MEG信號的預處理,以此來提高信號的信噪比,為棘波的自動檢測提供高質量的純凈信號;其次是根據棘波的特點,人工設計特征工程,降低信號維度的同時,突出棘波與背景信號的差異;最后是根據得到的特征,進行EEG/MEG 信號中棘波與背景信號的二分類,實現EEG/MEG 信號中棘波信號的檢出。除此之外,近年來發展迅猛的深度學習,作為機器學習中的一類方法,巧妙的結合的了傳統機器學習算法中特征提取與分類兩個步驟,為基于機器學習的EEG/MEG 信號棘波檢測算法提供了新的思路。本文分別從傳統機器學習算法及深度學習算法兩個方面回顧了近10 年來機器學習相關的棘波檢測算法。
基于傳統機器學習算法的棘波檢測檢測模型中,濾波算法被用于信號預處理,以實現干擾信號濾除、信號某部分細節的增強或是趨勢消除,棘波檢測算法中較為簡單的一類正是利用了濾波器可增強信號某部分細節的能力,例如Oikonomou 等[24]提出一種基于卡爾曼濾波的方法,在預處理階段增強EEG 信號的信噪比,從而提高棘波的檢出率。由于神經細胞外EEG采集時環境、設備等因素的影響,信號中不可避免的混雜了來自多個噪聲源的噪聲,Azami 等[25]基于這一情況,分別使用了基于分形維數、平滑非線性能量算子及標準差的方法構建了三種不同的模型用于檢測含噪信號中的棘波。
特征提取通過將原始信號轉化為一組具有明顯物理意義或統計意義的屬性,實現了對信號降維的同時突出分類目標間的差異,因此有學者根據棘波與背景信號的差異,設計特征工程,提高傳統機器學習算法的棘波檢測準確率。例如Keshri 等[26]基于確定有限狀態自動機(Deterministic Finite Automata,DFA)提出了一種名為DFAspike 的棘波檢測模型。該模型通過掃描EEG 信號的振幅、斜率及周期,將其轉換為{-1, 0, 1}組成的符號序列,并根據一段時間內序列變化的方向及劇烈程度控制狀態轉換,最終識別棘波的開始、終止時刻及平均出現頻率。文中,作者采用了13 種狀態生成的轉換圖來描述EEG 信號的可能情況,并最終在植入式電極測得的大鼠EEG 信號中達到了99.13%的棘波檢出率。Fürbass 等[27]根據重癥監護腦電圖術語(Critical Care EEG Terminology,CCET)提出了一種計算多通道EEG 信號的節律和周期模式的方法,以此來實現EEG 信號棘波的檢出。
機器學習是一類由數據驅動的建模方法,旨在通過數據樣本的學習,挖掘EEG 及MEG 信號中棘波與背景信號的差異信息,自動生成二者的分類模型。Khalid 等[21]開發了一種用于檢測癲癇患者MEG 信號棘波的分類模型。該模型中,作者以共空間模式(Common Spatial Patterns,CSPs)技術提取MEG 信號特征,并利用線性判別分析(Linear Discriminant Analysis,LDA)算法構建分類器,實現對棘波及背景信號的二分類,并在20 例癲癇患者的MEG 信號中取得了91.03%的靈敏度和94.21%的特異性。Anh-Dao 等[28]提出了包含預處理、特征提取、分類以及專家系統在內的四個模塊構成的棘波檢測模型。模型中,作者在預處理階段提出六個用于描述棘波形態的特征,將特征兩兩組合后利用三類感知器輸出結果并進行融合決策,初步對輸入特征所屬的信號進行二分類,即非棘波和疑似棘波;接著利用連續小波變化提取上一步分類結果中疑似棘波的特征,并輸入構建的人工神經網絡進行進一步細分,確定該段信號是否輸入棘波;最后利用EEG 信號的空間及時間背景信息構建專家系統,對神經網絡輸出的棘波進行最終判定。經實驗驗證,該方法在17 位癲癇患者的頭皮EEG 數據集上獲得了94.5%的準確率。
自2006 年以來,隨著深度學習技術持續升溫,深度神經網絡(Deep Neural Network,DNN)已成為當下諸多領域研究的熱點,并在圖像識別、語音識別等領域獲得矚目的成果[29-32]。此外,最近的腦電圖及腦磁圖的研究也在某種程度上使用了深度學習。例如,卷積神經元網絡(Convolutional Neural Network,CNN)是第一個應用于腦電圖癲癇發作預測的深度學習模型[33];文獻[34-36]在腦電數據上使用另一種稱為深度置信網絡(Deep Belief Network,DBN)的深度學習模型分別用于癲癇、不同睡眠狀態以及情緒識別的臨界頻帶相關的異常。除此之外,其他深度學習模型也被用于探索復雜的任務,如發現大腦結構[37];使用包括CNN、線性支持向量機和卷積自動編碼器在內的三種深度模型學習腦電波的特征[38];使用多通道DBN 分類腦電圖數據[39]。
深度學習在EEG 及MEG 棘波檢測算法中的應用還在初步階段,未見大量報道。例如Johansen 等[40]基于CNN 建立了一種棘波檢測模型。模型中,作者利用高通濾波器+陷波器的組合實現數據的預處理,并利用共同平均算法消除數據中存在的偽跡,之后以Relu 為激活函數,最小化二項式交叉熵為損失函數構建了深度為5 層的1 維卷積神經網絡,最后使用留一法在五名癲癇患者的腦電數據集中進行交叉驗證,取得了94.7%的準確率。Van 等[41]將DBN 由生成模型改為判別模型,并以此建立了EEG 信號的棘波檢測模型。模型中,作者設計特征工程,提取7 個用于描述信號周期、振幅、坡度及面積的時域特征,并利用小波變換分別從EEG 信號的Theta、Alpha、Beta 頻段中提取280 個時頻域特征構建特征向量,作為DBN 模型的輸入。經實驗驗證,模型在具有19例癲癇患者的數據集上取得了95.97%的準確率。雖然利用深度學習進行棘波檢測的相關研究還很少,但上述種種算法的成功應用也為基于機器學習的EEG 及MEG 信號棘波檢測驗證了可能性并提出了進一步發展的方向。
本文概述了近10 年來圍繞特征工程進行的一些癇樣棘波檢測方法。不難看出,雖然大部分算法均在研究人員自己的數據庫中取得了良好的效果,但是由于數據標準、采集環境、樣本分布等因素的差異,算法間仍難以實現綜合的評估和比較。另一方面,由于各個數據集樣本量的限制,大多數算法均選擇將單個患者采得的信號按時間窗分段,然后隨機抽取其中的部分段形成訓練集,在該部分數據中分析總結波幅、周期等具有物理意義或統計學意義的特征,并將設計形成的棘波檢測模型放在另一部分樣本形成的測試集上驗證算法效果,雖然大部分算法都在測試集上獲得了較高的準確率,但是由于訓練集和測試集數據中人群分布的局限以及背景數據的重復,算法的魯棒性及穩定性未能得到充分驗證。因此,建立具有統一標準的大規模癇樣棘波公開數據集,并依托其生成一套人群內及跨人群的評估方案以精確衡量算法效率和魯棒性,是當下實現可靠的自動棘波檢測系統的迫切需求。
此外,相比于傳統“預處理-特征分析-分類”三步彼此獨立的方法,基于深度學習的棘波檢測算法獨具特色:① DNN 作為一種數據驅動的建模方法,其無監督與有監督學習結合的學習模式,克服了傳統方法孤立對待特征分析與學習的缺點,能夠自適應地學習數據特征;② 其具有的多層非線性映射結構能夠表征特征之間的交互及層次結構,從而發現底層特征之間的深層聯系;③ DNN 的多層網絡結構在面對海量EEG 及MEG 數據時具有比傳統模型更強的表達能力,且能夠避免傳統模型構建特征工程時對數據包含信息的損傷。然而,相比于人工設計的特征工程,深度學習算法中特征可解釋性差的弊端嚴重限制了該類方法在棘波檢測領域中的發展和應用。因此,綜合不同種類方法的特點,形成機理模型與數據驅動模型相結合的棘波檢測模型,將會是下一步的發展趨勢。