沈瀟童,畢 卉,王蘇弘,李文杰,鄒 凌
1.常州大學 信息科學與工程學院,江蘇 常州213164
2.常州市生物醫學信息技術重點實驗室,江蘇 常州213164
3.常州市第一人民醫院,江蘇 常州213003
抑郁癥(Depressive Disorder)是一種常見的精神疾病,其特征是對自身喜歡的活動失去興趣,并伴有至少兩周無法進行日常活動的行為。近年來青少年抑郁越來越引起社會和家庭的關注[1]。通過計算機輔助技術對抑郁癥患者和健康人進行分類診斷,有助于降低臨床診斷的誤診率,幫助患者及早得到正確的治療。
目前,腦電在抑郁癥的研究領域已經有了很多重要發現。中國科學院大學的蓋淑萍等人提取了靜息態下的腦電信號的小波包節點功率譜熵特征,發現其能夠作為鑒別抑郁癥的有效量化指標[2]。Zhu 等根據靜息狀態功能磁共振成像研究重度抑郁癥患者自發性腦部活動的變化,發現了雙側正中前額葉皮質、楔前葉、角回、右側海馬旁回、右側顳極自發腦區活動的改變[3]。Dharmadhikari 等人在靜息態θ 波段發現了前額葉區域的不對稱性,證明前額葉的θ 不對稱是一種潛在性的生物標志[4]。此外,Esther 在對成年人抑郁患者的研究中發現,靜息狀態下抑郁患者產生的心理傷害在腦電δ 波段的左額葉和右額葉存在聯系[5]。Lee 等在研究中發現,高α 波段(10~12 Hz)功率能夠對抑郁組和正常組進行區分,受試者工作曲線值達到了70%[6]。Mumtaz等使用靜息態腦電數據,提取額葉α 不對稱和信號頻段功率作為特征,發現在頂區、中心區域、顳區、枕區抑郁患者的右半腦特征比左半腦的特征顯著[7]。Bachmann 等通過靜息態腦電圖(Electroencephalogram,EEG)對中年女性抑郁患者進行了分類研究,并通過對單導聯電極Pz的特征提取和分類研究,提出單導聯檢測抑郁的可行性[8]。
對于導聯的選擇,本質是對導聯相應的信號提取的特征進行選擇的過程。Wang等人利用共空間模式算法(Common Spatial Pattern,CSP),通過空間模式向量和導聯的最大系數的關系對電極進行優化選擇[9]。Arvaneh等在此基礎上提出了稀疏共空間模式(Sparse Common Spatial Pattern,SCSP)算法,其是在分類精度約束下對最小信道數進行優化,對去除噪聲和不相關信道后的結果進行電極優化選擇[10]。此外,Li等使用主成分分析法對每個被試的電極對應的數據集進行計算,然后根據不同的任務刺激的發生率進行導聯的選擇[11]。
機器學習在腦電分類學習中有著廣泛的運用,利用決策樹和SVM對靜息狀態腦電信號的波段功率進行分類的精度達到了80%[12],基于此分類方法能夠對單導聯抑郁癥患者和正常人的分類提供有效的支持。Alaa 等人使用了極限學習機(Extreme Learning Machine,ELM)算法對抑郁患者和健康人的腦電信號進行分類,達到了92%的分類精度[13]。Xia 團隊使用靜息態的腦電數據,使用小波變換、短時傅里葉變換、經驗模式分解提取特征,使用邏輯回歸算法進行分類,發現小波變換提取的特征精度最高達到了87.5%[14]。
基于EGI 公司64 導腦電采集系統,本文首先采集了16名抑郁患者和16名健康人的靜息狀態下的腦電信號。然后,通過對全導聯的特征提取和特征分析,確定特征顯著的腦區,并確定最佳導聯,同時使用遺傳算法進行整體導聯的選擇。最后,對單導聯和多導聯提取特征進行分類,并對時域和頻域算法的運行效率進行分析。
頻譜不對稱分析法是利用功率譜密度計算單個導聯信號能量比率的算法。它通過計算α 頻段附近高頻段和低頻段相對性差異來描述腦電信號的頻譜不對稱性[15]。
計算方法分成三部分,參數如圖1所示[8]。

圖1 頻域波段分布
(1)計算高低頻段邊界F1n、F2n、F3n、F4n

其中,n 代表人數(n ∈[1,32]),m 代表導聯數(m ∈[1,64]),F1、F2 代表低頻段,F3、F4 代表高頻段,smn為功率譜密度,Slmn和Shmn分別為高低功率譜密度,fcn為α 波段的功率最大值。
這里F1、F2 的確定在靠近θ 波段處,兩者頻帶寬度相差4 Hz,F3、F4 頻段的確定在靠近傳統意義上的β 段處,兩者頻帶寬度相差24 Hz。
(2)計算高低頻率功率譜密度總和

(3)計算選擇高低頻段的SASI值(即為SASI的特征)

去趨勢波動分析算法最早運用于DNA 序列的檢測[16],現在逐漸運用于腦電信號分析領域,其能夠直接計算時域上信號的特點[17]。為了進行DFA 的均方根系數計算,將4分鐘的EEG信號分成均等的段數,每段20 s,使用DFA算法進行處理。計算流程通常分為三個步驟。
(1)計算擬合序列
對于一個時間序列的信號,定義序列x(i),i 為每段的長度,區間為[1,N];通過求離散序列的積分,得到一個新的時間序列。如式(8)所示。

(2)計算均方根系數F(n)
在確定擬合前后的序列后,通過式(9)計算出結果F(n)。

(3)計算F(n)和n 的關系
同時取對數ln F(n)~ln n,得到兩者之間的斜率α,α 即為提取的時域特征。
目前,遺傳算法(Genetic Algorithm,GA)廣泛被運用于求最優解問題和特征選擇中。以染色體X 為例,X={0,1,0,1,1,0,0,0,0,0},染色體X 由10個基因以二進制形式組成,1 位表示特征選中,0 位表示特征未選中。在特征選擇中,將基因的數量類比為特征的數量。
遺傳算法流程分為五部分,分別為初始化、適應度函數、選擇、交叉、變異。具體算法偽代碼如下所示。
步驟1 初始化參數X、Z、N、Tmax、CN、TC ,設置X 為初始化染色體群體,Z 為最佳的染色體,N 為最優選擇染色體數,Tmax為一代的最大數量,CN 為交叉的總數,TC 為交叉次數的兩倍;
步驟2 估計染色體的適應度函數F(X);
步驟3 For t=1 to Tmax
For i=1 to CN
使用輪盤選擇方法選擇兩對父母染色體
通過兩對父母染色體交叉產生兩個子代
Next i
For j=1 to TC
根據突變率進行變異
Next j
估計產生子代的適應度
添加新產生的子代到當前種群X 中
對種群進行排序,選擇最優的N 條染色體
如果種群中有更好的染色體,更新Z
Next t
所有被試均在常州市第一人民醫院經臨床確診,共篩選出患有抑郁病癥的青少年16例,健康青少年16例,年齡范圍(16.31±1.25),抑郁組和對照組之間的年齡無統計學意義(p >0.05)。所有被試實驗前均使用漢密頓抑郁量表(Hamilton Depression Rating Scales,HADS)進行檢測[18],抑郁組分數高于對照組。
兩組的青少年實驗研究已經通過常州市第一人民醫院倫理委員會批準。所有受試者或其監護人均簽署了知情同意書,自愿參加本實驗。
采用EGI公司64導聯腦電采集系統,如圖2所示(腦電采集系統帽以61、62號導聯為前端,靠近眼部;以35、39、37 號導聯為后端,靠近耳部),采樣頻率為500 Hz,電極阻抗設定在80 kΩ以下,利用Net Station軟件實時采集。使用EEGLAB(版本號v14.1.2)工具箱預處理原始腦電信號,參考電極使用平均參考。

圖2 64導聯腦電采集系統
采集的靜息態的數據分為閉眼數據和睜眼數據,閉眼條件下被試受到的外部視覺刺激較少,采集的信號受到噪聲干擾較小,提升了信號的質量,減少了對特征提取的干擾。因此,實驗采集了4分鐘閉眼狀態下的腦電數據,被試坐在安靜的房間內,盡量保證頭部不會大幅度移動,在數據采集過程保持清醒,范式流程圖如圖3所示。

圖3 范式流程圖
將采集的數據直接通過Net Station 軟件轉換成Matlab可讀取的格式,在EEGLAB工具箱下對信號進行處理,具體步驟包括:低通和高通濾波(0.5~40 Hz)[8,15]、人工的偽跡檢測和壞導聯替換、參考點轉換,然后使用獨立成分分析(Independent Component Analysis,ICA)去除眼動以及其他噪聲。最后選擇干凈的3 分鐘內的數據,作為特征提取的數據段。
其中,由于β 頻段包含對抑郁評估有用的電生理信息,而θ 頻段是穩定不受疾病影響的頻段[19],SASI 算法就是通過計算出這兩個實際頻段的功率,得到頻段間功率的差異率。而波段的邊界頻率是專門為每個個體選擇的,并與腦電信號α 頻段的最大功率相關。理論上所選擇的計算頻帶接近傳統的β(13~30 Hz)和θ(4~8 Hz)頻段,但當最大的功率值落在較高或者較低的α 頻段(8~13 Hz),那么最高和最低的實際頻率的數值存在偏移。為了保證范圍,將濾波的頻段定為0.5~40 Hz[15]。
首先,本文對抑郁癥患者的腦區進行相關電生理機制的查詢,發現在抑郁癥患者的腦電信號生理機制研究中,抑郁癥患者相比于正常人在頂葉、枕葉的區域有較多的改變[20],不對稱的現象較為常見,這些改變與患者年齡和抑郁癥程度有關[21]。
然后,根據SASI 和DFA 算法,提取了全部32 位被試64 導聯的時頻特征。根據式(7)計算SASI 的值如圖4 所示,抑郁組的整體特征呈現正性相關,對照組則呈負性相關。根據式(9)計算的DFA 的值如圖5 所示,發現抑郁組的特征上升趨勢比對照組快,52~61導聯的數值存在波動,能夠發現31~34導聯存在一個明顯的下降趨勢,而SASI的值在31~34更趨于穩定。

圖4 SASI各導聯均值折線圖

圖5 DFA各導聯均值折線圖
再根據抑郁患者在頂區和枕區發現的DFA和SASI特征,對各個導聯進行結果統計,并和已發現的頂區(P區)和枕區(O 區)進行生理特性結合,分別對抑郁組和對照組頂區和枕區的導聯提取的SASI和DFA的特征進行t 檢驗,根據兩種特征t 檢驗結果,發現Pz 導聯和Oz導聯具有較高的統計學意義(P <0.05),如表1所示。而進一步比較發現Pz 導聯比Oz 導聯在統計學上更具有差異性,最終選擇Pz導聯進行特征分類。

表1 兩導聯t檢驗結果
針對提取32 位被試的64 導聯的時頻特征,分別構建了SAIS 和DFA 的32×64 維度的特征矩陣,利用遺傳算法對每個人每個導聯的特征進行選擇、交叉、變異,最終將得到的子代的特征對應的導聯標簽號選出。選取的導聯的編號如表2所示。

表2 兩特征選取的導聯
如表2所示,SASI提取了總共34導聯的特征(P <0.05),DFA提取了26導聯的特征(P <0.05)。然后,將兩者同時選中的導聯作為兩者的分類導聯,如圖6 所示,以此減少了導聯數量,提升了特征質量,便于后續的分類。

圖6 導聯選擇結果
Pz導聯提取的特征作為分類的特征集,構建了單導聯的特征值矩陣,利用SVM建立了分類模型,使用留一法進行交叉驗證和分類(參數:訓練數據X ,標簽Y ,核函數Gaussian,懲罰系數1,預期標準化true,核尺度5.8,類別[0;1],折數32)。分類結果如表3 所示。使用SVM分類器對Pz導聯特征分類的結果來看,SASI分類的精度都達到了85%,DFA的分類精度達到了86%。

表3 SVM單導聯分類結果 %
根據遺傳算法選取的每一導聯對應的特征,使用SVM對其進行分類,分類結果如表4所示。

表4 SVM多導聯分類結果 %
為了能夠更好地為腦機接口技術提供范例,本文基于Matlab 2016a 平臺的Matlab 語言進行計算,統計了SASI 和DFA 算法的運行和時間,便于后續BCI 技術的參考。本文對于SASI 和DFA 的實時性進行了分析,分別統計了一分鐘內10 s為間隔下,計算64導聯的算法需要運行的時間(機器配置:Intel?i5-4590CPU,32 GB 內存,NVIDIA GeForce GTS 450 顯卡)。DFA 算法計算時間如圖7所示,SASI算法計算時間如圖8所示。

圖7 DFA算法耗時

圖8 SASI算法耗時
從多導聯選擇的角度分析,遺傳算法對SASI 方法選取了34導聯,DFA方法選取了29導聯,通過兩者所選取導聯的交叉比較分析,將3,4,12,19,20,26,27,30,33,34,45,48,58,62,共計14 個導聯進行分類(橙色標記),如圖4所示。圖4中時頻特征選擇的導聯在左側較多,前額葉、額葉部分均有涉及,頂區包括了34 號的Pz以及附近的33 號導聯,這些區域對后續抑郁癥的研究具有參考意義。
經過特征和導聯分類結果來看,多導聯的分類精度比單導聯的分類精度提升36%左右,DFA算法提升得更加顯著,達到了90.6%,經過遺傳算法提取的導聯進行特征分類能對分類準確率進行改善。
從特征的性質來看,本文提取的DFA 特征是直接從時域的角度進行計算,將均方根系數與每個時間段的關系α 作為特征,α 的值在[0.5,1]代表了序列具有相關性,即大波動后可能出現大波動,小波動后可能出現小波動[17]。因此α 作為特征進行分類過程中能夠更好地對抑郁癥和正常人的時間序列進行評估。SASI計算了最高α 波段功率附近高低頻段的頻譜差異率作為特征,其正性和負性從頻域上表征了抑郁癥和正常人的特點[15],但是部分患者存在特異性,其頻域的特征表現與正常人一致,這就導致在分類過程中產生了識別率的差異。而DFA 計算的是時間序列的相關性,相對的分類準確率能得到提升。
從算法優缺點看,SASI 提取的特征更容易從表面區分出抑郁癥患者和正常人,但是準確程度仍有待提高,DFA 提取的特征更能體現抑郁患者時域特征的變化,患者和正常人的波動趨勢更為明顯,減少了分類過程的容錯率。從算法執行時間看,SASI 的運算效率最快。在圖5中,64導聯進行頻域特征計算所需要的時間在0.3 s 左右,但是DFA 的運算效率不高,從圖4 可以看出,隨著所選取的數據段的增加,所消耗的時間呈近似于指數量級的增加,消耗的時間甚至需要16 min以上。
從單導聯和多導聯的區域來看,多導聯選出的導聯在前額葉、額葉、中心區域、頂區、顳區,如圖6 所示,而單導聯只反映了一個頂區的特性,多導聯能較為宏觀地包括整個腦區的生理特性[21]。因此多導聯提取的特征質量更高,分類效果更好。
綜上,多導聯分類的結果相較于單導聯更令人滿意,對于區分抑郁癥患者更有幫助。SASI 算法更適合用于抑郁癥的實時反饋階段以及人機交互部分,而DFA算法則需要對選取的時間窗口進行界定,從單導聯的角度進行BCI 技術在抑郁癥上的應用,這與DFA 相較于SASI更高的分類準確率一致。
本研究發現多導聯的分類結果提升顯著,多導聯的結果略優于單導聯,但實際分類過程中,由于電極帽佩戴及偏移等因素的影響,單導聯檢測存在一定的偏差,多導聯能從數據整體性差異的角度給出一個大腦全局的屬性特征,具有一定的穩定性。未來的研究將繼續對特征進行優化,改善算法運行效率,提升分類精度,為后續BCI和抑郁癥的研究做出貢獻。