張 茜, 耿曉中, 岳夢哲, 汪林恩, 戶唯新
(1.吉林化工學院信息與控制工程學院, 吉林 吉林 132022;2.長春工程學院計算機技術與工程學院, 吉林 長春 130012)
腦機接口(Brain-Computer Interface,BCI)是一種將大腦與外部驅動設備直接通信的創新技術[1-2]。在BCI系統中,常見特征提取方法有獨立分量分析、自回歸模型、經驗模態分解、功率譜密度及共空間模式[3]。常用分類方法包括線性判別分析、Adaboost、神經網絡及支持向量機[3]。
目前,學者們提出了很多有用的識別方法改善腦機接口的分類精度,例如馬麗英等[4]提出基于局部均值分解(LMD)、共空間模式(CSP)及隨機森林的EEG分類方法,通過LMD算法將EEG分解成N個乘積函數(PF)分量,最佳頻段的PF分量會被CSP進行特征選擇,最后輸入隨機森林中進行分類,該方法側重提取差異性明顯的特征而忽視了其他有效特征。馮建奎[5]提出一種基于共空間模式算法(Common Spatial Patterns,CSP)和梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)的運動想象腦電模式識別方法,首先利用CSP獲取EEG特征,其次通過Lasso算法選擇明顯的特征向量,最后利用梯度提升決策樹進行識別分類,但該方法的分類準確率不高。李麗君[6]提出基于運動想象的EEG特征提取及分類算法,首先利用CSP對腦電信號進行特征提取,其次將提取的特征輸入決策樹支持向量機中分類。劉寶等[7]提出基于PSO-CSP-SVM的EEG特征提取及分類方法,首先通過粒子群優化算法獲取EEG最佳時頻段,其次使用一對多CSP進行特征提取,最后利用支持向量機對提取的特征進行分類,但該方法得到的分類準確率穩定性不高。綜上所述,為解決上文分類準確率不高等問題,本文提出一種基于CSP與決策樹支持向量機法相融合的腦電信號分類方法,該方法能夠有效地提高腦電信號的分類準確率。
共空間模式算法(Common Spatial Patterns,CSP)是用于腦電信號分類和特征提取的常用技術,多被應用于腦機接口系統中[8-9]。CSP算法旨在通過選擇投影矩陣,將腦電信號投影到一個新的空間,使得在新空間中不同類別的腦電信號的方差差異最大化,從而增強不同類別腦電信號的可分性,具體步驟如下。
(1)設每次實驗運動想象數據為Ej,對左手和右手兩類運動想象數據分別計算對應的協方差矩陣,分別用CK和CL表示,可得到標準的混合空間協方差:
(1)
C=CK+CL
(2)

(2)根據奇異值知識C可以表示如下:
C=AλA′
(3)
其中:矩陣A代表總協方差的特征向量,它表示數據特征的主要方向;而矩陣λ是一個對角矩陣,其中包含非零特征值,這些特征值按照遞減的順序排列在對角線上,反映了特征的重要性;在此基礎上,引入白化矩陣P:
(4)
(3)協方差矩陣可變換如下:
SK=PCKP′
(5)
SL=PCLP′
(6)
(4)因為SK和SL有公共特征向量,設:
(7)
其中:I為單位矩陣;D為特征向量,可以表示為D=[D1,D2,…,DN]。
(5)求出投影矩陣W,原始腦電信號經過空域濾波器的投影獲取新的矩陣及特征向量:
(8)
其中:j=1,…,2n;Zj表示投影后得到的新矩陣;fj表示特征向量。
支持向量機(Support Vector Machine,SVM)是一種基于監督學習的二分類模型,該模型在具有復雜決策邊界的數據集上的表現非常出色[10]。SVM的核心思想是找到一個最優的超平面,可以有效地分開不同類別的數據點,同時最大化邊界(即兩個類別之間的最小距離)。zi∈{-1,1}表示分類標簽,判別函數表示如下:
zi[(v·xi)+y]-1≥0,i=1,2,…,n
(9)
最優問題采用Lagrange乘子方法求解,則最佳決策函數如下:
(10)
其中:N為支持向量的個數,αi為Lagrange乘子。
將松弛項ξi≥0添加到公式(10)中,則可變形如下:
zi(v·xi+y)-1-ξi≤0,i=1,…,n
(11)
利用二次規劃使目標函數最小化,即
(12)
公式(12)中的C表示懲罰因子,將最小化后的目標函數通過非線性知識轉換為求線性問題,從而求得最優分類面,最優分類界面函數表達如下:
(13)
公式(13)中,K(xi,x)為內核函數,內核函數必須滿足Mercer定理的要求。支持向量機選擇的內核函數不同,會導致得到的分類效果不同。多項式核函數、徑向基核函數以及線性核函數常常被當作支持向量機的內核函數,徑向基核函數如下:
K(xi,x)=exp(-η‖xi-x‖2)
(14)
核函數η及懲罰因子C是干擾支持向量機分類性能的兩個關鍵參數。
決策樹法(Decision Tree)是一種常見的機器學習算法,主要用于分類和回歸任務,它是一種基于樹狀結構的模型,通過對數據的特征進行逐步劃分,最終生成一個可以用于決策的樹形結構[11]。決策樹的基本思想是從根節點開始,通過一系列的分支節點對數據進行分類或預測。一個分支節點對應一個特征,分支的不同路徑代表該特征的不同取值,而每一個葉節點則代表一個分類標簽或回歸值。在構建決策樹的過程中,算法會根據相應準則選擇最佳的特征和分割點,使得數據在每個分支中盡可能地純凈(即同類別的樣本盡量聚集在一起)。信息增益(ID3)是決策樹用于衡量特征貢獻程度的算法。設一個集合為D,則第i類樣本占該集合的比例為pi(i=1,2,…,n),信息熵E(D)表示如下:
(15)
假設m是離散屬性b的結果,通過屬性b切分后,集合形成m個節點,第m個節點標記為Dm,則屬性m劃分集合D得到的信息增益G(D,b)如下:
(16)
其中,G(D,b)越大,代表劃分屬性的效果越好。
基于決策樹的SVM多類分類方法被認為是目前解決多類識別問題的最優方法。支持向量機算法實際上是基于多個決策樹分類器的集成。在每個決策樹給出其分類結果后,采用簡單投票法決定最終的輸出結果。可對四類問題(左手、右手、舌頭和腳)進行分類,決策樹支持向量機算法結構如圖1所示。

圖1 決策樹支持向量機算法結構Fig.1 Algorithm structure of DTSVM
算法流程如下:①首先,對原始的訓練特征集D執行有放回的隨機選取,得到子數據集,標記為b;②考慮到子數據集b含m個特性,每當決策樹的節點需要劃分時,就從這些特性中隨機選擇m個作為可能要劃分的屬性;③從所選的m個屬性中,計算每一個屬性的信息增益,并選擇增益最高的屬性進行劃分;④繼續按以上方法劃分每個節點,直到決策樹能夠正確分類訓練數據集D中的樣本,或者所有的屬性已經被使用;⑤反復執行以上流程,構建一系列的決策樹,最終組合成支持向量機模型。
實驗采用的數據來自BCI Competition Ⅲ中的Datasets Ⅲa數據集。實驗步驟如下:被測試人員坐在椅子上且保持安靜和放松狀態,t=2 s時,會給出一個警示鈴聲,并且電腦大屏上會顯現一個符號“+”,表示實驗開始,t=3 s時,大屏上會隨機顯現向左、向右、向上或向下的箭頭,被測試者按照箭頭指示的方向依次進行運動想象(左手、右手、舌頭或腳),直到t=7 s時,“+”符號在大屏上消失。本次實驗共安排了3名被測試者,共進行240次實驗。實驗采集導聯為60個電極,250 Hz采樣,電極位置如圖2所示。

圖2 電極位置Fig.2 Position of electrodes
本文實驗在Windows 11.0系統的MATLAB 2021a軟件平臺上進行,利用EEGLAB軟件工具包對已有競賽數據集進行腦電信號的分析。
圖3為原測試運動想象信號(截取6~10.5 ms時間段的信號)。

圖3 原測試運動想象信號Fig.3 Original test signal
通過CSP特征提取方法處理腦電信號數據,并將數據在二維空間中進行可視化以展示不同類別(左手和右手)之間的差異。橫坐標和縱坐標分別表示CSP特征空間中的兩個維度,原始腦電測試信號被CSP特征提取后轉變為二維特征問題,CSP特征提取圖如圖4所示。

圖4 CSP特征提取圖Fig.4 CSP feature extraction diagram
線性判別分析法(LDA)和自適應增強分類法(Adaboost)是腦電信號分類常用的方法[12]。線性判別分析是一種基于監督學習的降維方法,核心思想是分類間隔最大化,也就是將數據通過投影映射到低維樣本上,相同的類樣本靠近,不同的則遠離。Adaboost算法屬于集成算法的一種,弱弱則強是其主要思想。
在本實驗中,從240次實驗中的每一類(左手、右手、舌頭和腳)中共選取90次作為測試樣本,剩余的150次實驗作為訓練樣本。決策樹的數量對支持向量機的分類結果有影響,為了提高腦電信號的分類準確率,查看不同數目決策樹下的分類準確率,決策樹與分類準確率關系圖如圖5所示。

圖5 決策樹與分類準確率關系圖Fig.5 Relationship diagram between decision tree and classification accuracy
從圖5中能夠看出,當決策樹數量為50棵及更多時,EEG的分類準確率可以達到最優,由于腦電信號處理過程還受到算法運算耗時等因素的影響,所以最終選用決策樹為50棵,后續實驗也都采用這個結果。
在預處理及特征提取條件不變的情況下,同時對測試樣本進行LDA、Adaboost及DTSVM分類法分類。分類準確率的計算如下:
Accuracy=分類正確的實驗次數/總實驗次數
(17)
對被測試者K3b、K6b、L1b分別進行DTSVM與LDA、Adaboost的分類,其分類準確率結果如表1所示。

表1 不同分類方法的分類準確率結果
通過對本文方法與LDA及Adaboost分類法進行對比,從三種分類法的分類精度結果能夠看出,基于決策樹支持向量機法優于線性判別分析法和自適應增強分類法,并且其準確率最高時可達到90%以上。
針對腦電信號采集易受干擾導致EEG分類準確率不高的問題,提出一種基于CSP與DTSVM的運動想象腦電信號分類方法。首先利用CSP算法對運動想象的EEG特征值進行特征提取,其次利用決策樹支持向量機法對四類運動想象(左手、右手、舌頭和腳)特征值進行分類。實驗結果表明:CSP與決策樹支持向量機法融合后的分類準確率最高可達92.52%,結果優于傳統單一分類算法,為更進一步研究腦電信號處理算法的多種融合提供了可能。