王 婷,石 藍,黃 瑋,張子辰
(江蘇信息職業技術學院,江蘇 無錫 214000)
癲癇是一種常見的神經系統疾病。目前,被癲癇疾病影響的人數全球超過5 000萬人[1]。頭皮電極獲得的腦電圖(EEG)、磁共振成像和計算機斷層掃描等影像技術結合使用,是癲癇診斷的常規方式[2]。在傳統的癲癇檢測中,醫學專家觀察腦電圖是否包含癲癇特征波,這種方法不僅耗時,而且高度主觀依賴經驗。腦電圖中存在的大量噪聲可能會干擾專家的判斷。設計腦電的可穿戴式檢測芯片的算法,可以自動檢測患者的癲癇發作情況,從而高效地協助醫生進行診斷。
在癲癇信號特征提取階段,為了達到良好的特征區分和數據降維效果,國內外已經進行了多種提取方式的探索。基于經驗模態分解的變分模態分解主要思想是將信號分解為圍繞各中心頻率附近變化的窄帶變分模態分量,通過尋找約束變分模型的最優解來自適應獲取變分模態函數(VMF)。發作期腦電的不確定度會明顯降低,出現了許多與熵(En)有關的腦電特征提取研究方法,主要包括近似熵、樣本熵、模糊熵[3-4]。精細復合多尺度散布熵是在散布熵的基礎上對信號進行多尺度量化得到的,避免了原始散布熵因僅在單一尺度上處理信號而出現的復雜性導致特征提取不完全等問題[5]。
雖然已有許多特征提取方法和分類方法運用于癲癇檢測中,但大多是針對癲癇發作期腦電與正常腦電的二分類。而對于癲癇患者不發作時進行的檢測也是有必要的,即發作間期的檢測。發作期間的腦電圖通常也可見異常的癲癇樣放電。因此,本文主要研究正常時期、發作間期與癲癇發作期3類腦電信號的檢測。發作間期的腦電圖部分由慢波化組成,若基本節律中混有較多的慢波,則形成不規則的腦電圖。針對發作間期的背景節律性特點,本文提出一種基于變分模態分解的癲癇檢測算法。EEG信號經VMD分解后獲得變化中心頻率的VMF,對VMF進行能量分離,加強慢波、棘波等特征,再二次提取其均值、方差和RCMDE 3種特征,并利用隨機森林對其進行分類,完成了正常腦電信號、發作間期與癲癇發作期的3分類。通過與文獻方法對比,本研究驗證了該方法提取EEG信號的有效性。
圖1為本文提出的基于變分模態分解的癲癇腦電信號檢測算法的流程圖。本方法包括如下4個步驟:(1)對腦電信號數據集進行VMD分解,分解為有不同中心頻率和帶限的固有模式函數多個子模態;(2)對子模態進行能量分離,增強信號瞬態沖擊成分;(3)經過能量分離后的信號二次特征提取其均值、方差和RCMDE;(4)將提取的特征輸入隨機森林進行分類。
圖1 癲癇檢測流程
變分模態分解是自適應、完全非遞歸的數據處理方法。它是根據當前數據來確定信號序列的模態分解個數,可以自適應對每種模態的最佳中心頻率和有限帶寬進行變化,有效地對固有模態分量進行分解。它的核心思想是構建和求解變分問題。由于EEG測試時間以及被測樣本的不同,各頻帶段中心頻率也會發生小范圍的改變,VMD并不是固定的中心頻率,而是將EEG信號分解成在中心頻率附近的變分模態分量,不斷迭代的中心頻率可以良好表達這種神經活動的輕微變化。VMD 算法中懲罰因子可以保證高斯噪聲環境下信號重構的準確性,其值過大會引起模態重疊,較小會引入噪聲,默認將其設定為2 000。分解模態個數K對序列分解和預測精度都有較大影響,若K值過大會造成過分解,產生無用分量,高頻模式過多,增加計算復雜度。若 K 值過小,序列將不會完全分解,使部分帶限信號分解不出來造成原信號信息的丟失,進而影響分析結果。腦電信號的癲癇異常信息大多在25 Hz以下,根據中心頻率觀察法選取分解模態個數K=4。對數據集A010、D010、E010前1 000個數據進行VMD分解,癲癇信號特征波主要集中出現在子頻帶 VMF2~VMF4內。故在后續的特征提取工作中,僅分析 VMF2~VMF4頻帶內的腦電信號。
Teager能量算子是一個非線性算子,可以對被測信號相鄰的3個采樣點進行計算,具備優良的時間分辨率,計算過程簡單快速,能夠增大癲癇波特征頻率的倍數。對正常腦電信號數據集中的A010、癲癇發作間期D010 以及癲癇發作期E010 經VMD分解后,將VMF2~VMF4 頻帶信號進行Teager 非線性能量算子計算后,正常腦電信號的Teager能量較為平緩,在0~700 μA范圍內波動。癲癇發作間期,腦電信號的間歇性突增最高達7 000 μA。癲癇發作期時,能量在棘波處波動非常劇烈,可達2×105μA。經過Teager能量分離后,3種EEG信號的特征更加明顯,其中每組信號的四頻帶信號最為敏感,所以只選取正常EEG、發作間期EEG、發作期EEG的四頻帶的能量作為后續二次特征提取。
根據以上分析,信號經能量分離后的四頻帶能量包含腦電信息的重要組成部分,接下來將對四頻帶能量進行二次特征提取,分別提取均值、方差與精細復合多尺度散布熵。RCMDE用來表征TEOV4時間序列的復雜性,人腦非致癇區域的神經活動相對致癇區域更活躍,通過RCMDE可以更好地觀測EEG的規則性和組織性,計算 RCMDE 需要對4個參數分別設置:類別個數c,嵌入維度m,時間延遲d以及尺度因子τ。類別個數c若過大會導致具有較大差異的兩個量被歸為同一類,過小則導致具有較小差異的兩個量被歸為不同類,此處將c值設為 6。對于嵌入維度m,為了保證統計可靠性,將m值設為 3。時間延遲d一般取 1,本文尺度因子τ設為 10,即每個數據段提取10個尺度上的 RCMDE 值。利用RCMDE計算能量算子結果如圖2所示。
圖2 不同EEG的RCMDE
患者在癲癇發作期間產生的棘波和尖波等波形具有節律性,在0~10時間尺度上,正常EEG的RCMDE都要大于癲癇患者EEG的RCMDE,發作間期的腦電信號幅值變化最小。在腦電圖中的潛在的腦電模式未知的情況下,相關的時間尺度也是未知的。通過RCMDE將腦電信號擴展到10個時間尺度,有利于在時間尺度未知時提供特殊的觀察視角。有可能某一時間尺度上,正常腦電信號的熵值與癲癇信號的熵值接近,但在其他時間尺度則會有明顯差別。RCMDE可以增加癲癇判斷容錯率,進一步利于構建后續腦電信號分類模型。
隨機森林算法(Random Forest,RF)基本單元是決策樹。每棵樹都可以視為單個分類器,分類輸出由所有決策樹投票。RF通過自助抽樣和隨機子空間,能夠對多維度、多特征的數據進行快速分析以及提高分類性能,將提取的三維特征作為隨機森林輸入,首先假設N為訓練集中的事例數,則從訓練集中隨機抽取N個樣本,有放回在每個樣本過程和獲取的N個訓練樣本中。從m個特征變量中隨機等概率抽取d個子變量,這些子變量組成此節點的分裂特征變量子集,然后利用基尼系數值最小原則選擇一個最優的分裂特征變量繼續對該節點分裂,建立多個決策樹組合為隨機森林。針對測試的數據集,每個決策樹都會得到一個分類結果,對這些結果進行投票表決,得票數最多的分類結果為最終決策。
實驗數據來自德國Born癲癇腦電研究室。此數據集中共包含標號從 A~E的 5個子數據集,每個子數據集均包括100個腦電信號。每個腦電信號的長度為 23.6 s,采樣頻率為 173.6 Hz。
由于EEG是非線性和非穩態的信號,傳統的頻域分析方法只能揭示EEG信號的整體特征。而癲癇的特征波可能會在瞬間出現。為了捕捉腦電信號的瞬時行為,本研究通過使用VMD將原始EEG信號分解為4個數量的子模態。子模態中的癲癇特征信息此時仍然受背景噪聲的干擾,沖擊成分不明顯,采用能量分離對癲癇特征起到增強的作用。為了減少運算,本研究選擇最敏感的能量分布TEOV4作為后續提取特征。在TEOV4中提取均值、方差和RCMDE3類數據特征作為后續隨機森林的分類特征。隨機森林的分類性能與決策樹的數量有關,當樹的數量少于100棵時,誤差會迅速減少,而當樹的數量大于250棵時,誤差會保持溫和的浮動。因此,在接下來的實驗中,隨機森林的決策樹數量被設定為250棵。
在腦電信號數據集中,隨機抽取70%的腦電信號作為訓練集,30%作為測試集,隨機森林中包含250棵決策樹。表1顯示了分類器的準確度 (ACC)、靈敏度 (SEN)和特異性 (SPE)3個評價指標。
表1 與其他算法結果對比
本文針對正常EEG、發作間期EEG、發作期EEG進行三分類,而表中兩種算法是針對發病與非發病的二分類研究。Acharya 等[6]采用熵等23個特征進行腦電分類獲得87.93%準確度,Bhattacharyya 等[7]基于可調Q小波變換提取多元模糊熵方法對腦電信號處理獲得了84.67%準確率。實驗結果表明,本文算法在ACC、SEN、SPE都在一定程度有所提升,證明該方法對于腦電信號分析具有可行性。
由于用癲癇腦電記錄進行人工診斷是一種低效的方式,本文提出了一種基于變分模態分解的癲癇腦電信號可穿戴芯片的檢測算法。應用能量分離,對VMD分解后的信號序列進行特征信息增強,從中提取均值、方差和RCMDE 3種特征,并通過隨機森林進行自動預測,分類了正常時期、發作間期與癲癇發作期3類腦電信號。實驗結果顯示本文所提出的方法分類準確度90.78%,可以輔助臨床醫生進行診斷,具備潛在臨床應用價值。