馬也+姜光萍



摘 要:針對P300腦電信號信噪比低,分類困難的特點,本文研究了一種基于獨立分量分析和支持向量機相結合的腦電信號處理方法。首先對P300腦電信號進行疊加平均,根據ICA算法的要求,對疊加平均的信號進行去均值及白化處理。然后使用快速定點的FastICA算法提取P300腦電信號的特征向量,最后送入支持向量機進行分類。采用國際BCI 競賽III中的DataSetII數據進行驗證,算法的最高分類正確率達90.12%。本算法原理簡單,能有效提取P300腦電信號的特征,對P300腦電信號特征提取及分類的任務提供參考方法。
關鍵詞:P300腦電信號;特征提取;獨立分量分析;支持向量機
DOI:10.16640/j.cnki.37-1222/t.2017.10.180
0 引 言
近年來隨著世界人口的不斷增多和老齡化加劇的現象,肌肉萎縮性側索硬化癥,癱瘓,老年癡呆癥等患者的基數也相應增長,給社會及病人家屬帶來了沉重的負擔。而近年來出現的涉及神經科學、認知科學、計算機科學、控制工程、醫學等多學科、多領域的腦機接口方式應運而生[1]。腦機接口(brain computer interface,BCI)是建立一種大腦與計算機或其他裝置聯系的技術,該聯系可以不通過通常的大腦輸出通路(大腦的外周神經和肌肉組織)[2]。這種人機交互形式可以代替語言和肢體動作,使得恢復和增強人類身體與心理機能、思維意念控制變成為可能。因此在軍事目標搜索[3]、飛行模擬器控制[4]、汽車駕駛[5]、新型游戲娛樂[6]以及幫助運動或感覺機能出現問題的殘障人士重新恢復信息通信功能[7]等方面均有應用并有巨大潛能。
腦機接口系統的性能主要由腦電信號處理模塊決定。腦電信號處理模塊的核心由特征提取和分類識別兩部分組成。常見的腦電信號特征提取方法很多,針對不同的腦電信號有不同的方法。例如時域分析方法有功率譜分析及快速傅里葉變換(FFT)等,適用于P300、N400等潛伏期與波形恒定,與刺激有嚴格鎖時關系的誘發腦電信號;頻域分析方法有自回歸模型及數字濾波器等,適用于頻率特征明顯的運動想象腦電信號;時頻域分析方法有小波變換,適用于時頻特性隨時間不斷改變的腦電信號。上述方法實時性較好,使用較為廣泛,但不能直接表達EEG各導聯之間的關系。空間域特征提取方法有共空間模式法(CSP)、獨立分量分析法(ICA)等,該類方法可以利用各導聯腦電信號之間的空間分布及相關性信息,一般用于多通道的腦電信號特征提取。 [8-10]
在分類識別方面,BCI中使用的分類方法主要有人工神經網絡、支持向量機、K均值聚類、遺傳算法等等。支持向量機方法在腦電信號分類中有廣泛的應用,在隨機性強,非線性的分類識別問題中有較強適應性及較高分類正確率。
1 實驗數據介紹
1.1 事件相關電位P300
事件相關電位(Event-Related Potential, ERP)是人們經歷某種刺激事件時,大腦在信息加工中所誘發出來的一系列腦電活動在頭皮上引起的電位變化,是一種由心理或語言因素參與的特殊的誘發電位,1965年由Sutton首次報道。從頭皮記錄到ERP有兩個特征,首先它的潛伏期與刺激之間有嚴格的鎖時關系,其次它有特定的波形和電位分布。ERP的構成分外源性和內源性兩部分,外源性成分包括P100, N100, P200波,潛伏期短,受刺激物理特性的影響較大;內源性成分包括N200, P300波,受心理因素影響較大,和人的注意、記憶等認知過程相關。
其中P300是應用最廣泛的內源性事件相關電位,因其潛伏期多在300ms左右,又是正相波,因而得名,故又稱P300。目前的研究結果表明,P300是聯合皮層活動的結果,與復雜的多層次心理活動(認知過程)有關,是感覺、知覺、記憶、等心理過程的變化反映,是人對客觀事物的反應過程。因此,P300是一個不需要靠外部行為判斷受試者認知過程的客觀指標,也可以說是判斷大腦高級功能的一個客觀指標。
1.2 實驗數據選取
實驗數據取自國際BCI 競賽III中的DataSetII數據。This dataset represents a complete record of P300 evoked potentials recorded with BCI2000 using a paradigm described by Donchin et al., 2000, and originally by Farwell and Donchin,1988[11]. In these experiments, a user focused on one out of 36 different characters. The objective in this contest is to predict the correct character in each of the provided character selection epochs.
The user was presented with a 6 by 6 matrix of characters (see Figure 1). The users task was to focus attention on characters in a word that was prescribed by the investigator (i.e., one character at a time) All rows and columns of this matrix were successively and randomly intensified at a rate of 5.7Hz. Two out of 12 intensifications of rows or columns contained the desired character (i.e., one particular row and one particular column). The responses evoked by these infrequent stimuli (i.e., the 2 out of 12 stimuli that did contain the desired character) are different from those evoked by the stimuli that did not contain the desired character and they are similar to the P300 responses previously reported.
We collected signals (bandpass filtered from 0.1一60Hz and digitized at 240Hz)from two subjects in five sessions each. Each session consisted of a number of runs. In each run, the subject focusedattention on a series of characters. For each character epoch in the run, user display was as follows: the matrix was displayed for a 2.5 s period, and during this time each character had the same intensity (i.e., the matrix was blank).Subsequently, each row and column in the matrix was randomly intensified for 100ms(i.e., resulting in 12 different stimuli一6 rows and 6 columns). After intensification of arow/column, the matrix was blank for 75ms. Row/column intensifications were block randomized in blocks of 12. The sets of 12 intensifications were repeated 15 times for each character epoch (i.e., any specific row/column was intensified 15 times and thus there were 180 total intensifications for each character epoch). Each character epoch was followed by a 2.5 s period, and during this time the matrix was blank. This period informed the user that this character was completed and to focus on the next character in thewordthat was displayed on the top of the screen (the currentcharacter was shown in parentheses).
2 P300腦電信號特征提取
2.1 獨立成分分析原理
ICA的基本思想是將多道觀察信號按照統計獨立的原則通過優化算法分解為若干獨立成分,實現信號的增強和分析。設為N個相互獨立的信號源,為M個觀測信號,其中,。將它們表示為向量的形式,得,。X中的各分量是由S中各獨立源經過線圖疊而成的,即
上式用矩陣形式可表示為
式中,X為階常系數混合矩陣;A為未知的系數。要求在A和S未知的前提下,尋找一解混矩陣W,使得
式中,且Y的各分量相互獨立,即Y是對源信號S的良好的估計,也可以說S在Y中得到了分離。
ICA算法的研究可分為基于信息論準則的迭代估計方法和基于統計學的代數方法兩大類,從原理上來說,它們都是利用了源信號的獨立性和非高斯性。基于信息論的方法研究中,各國學者從最大嫡、最小互信息、最大似然和負嫡最大化等角度提出了一系列估計算法。如FastICA算法,Infomax算法,最大似然估計算法等。基于統計學的方法主要有二階累積量、四階累積量等高階累積量方法。本文使用的是基于負熵最大的FastICA算法。它以負嫡最大作為一個搜尋方向,可以實現順序地提取獨立源。其中負熵的定義為
式中是與Y有相同協方差的高斯隨機變量,H()為隨機變量的微分商。
快速ICA學習規則是找一個方向以便具有最大非高斯性。因此FastICA算法的迭代公式為
其中是W的新值。
2.2 基于FastICA的腦電信號特征提取
由于P300腦電信號波幅只有2~10,而自發腦電信號的波幅約為10~100,它淹沒于自發腦電信號中,二者構成小信號和大噪聲的關系,因此,首先要對P300信號進行疊加平均。本文首先選取每次刺激后1s的腦電信號數據進行15次疊加平均,效果見圖4。為方便顯示效果,只顯示Cz導聯的結果,后續均為Cz導聯。可以看出包含P300的腦電信號在300ms附近有一個正的波峰。
在絕大多數ICA算法中,都假設源信號s的均值為零,因此,為了使實際的盲源分離問題能夠符合ICA數學模型,在對觀測信號x運用ICA方法之前,通常先對其進行如下的去均值預處理。
去均值過程只是為了簡化ICA算法,由去均值后的向量Y估計出分離矩陣w后,還需將均值向量WE[x]加回到信源估計值中去。對疊加平均后的信號進行去均值效果見圖5。
為進一步簡化ICA算法,對信號進行白化處理。所謂白化即對觀測信號向量x施加一個線性變換,使得新向量Z的各個分量間互不相關,同時Z的協方差矩陣為單位陣,此時稱新向量z為空間白色或簡稱為白色。對去均值的信號進行白化處理后的效果見圖6。
FastICA算法中的期望必須用它們的估計值代替,當然最好的估計是相應的樣本平均。理想情況下,所有的有效數據都應該參與計算,但這會降低計算速度。所以通常用一部分樣本的平均來估計,樣本數目的多少對最后估計的精確度有很大影響。迭代中的樣本點應該分別選取,假如收斂不理想的話,可以增加樣本的數量。因此實驗樣本中選擇了每個字符的15次疊加平均后的腦電信號,對其進行FastICA處理,提取特征值,并送入支持向量機進行分類。
3 腦電信號分類
3.1 支持向量機原理
定義為間隔(margin),其中為決策面沿方向到與其最近的訓練樣本的距離,每類至少有一個。距離決策面最近的訓練實例為支持向量(support vector)。則支持向量機為計算使間隔最大化的分類決策面,使得原空間線性不可分的數據在變換得到的高位空間中線性可分。在一次分類仿真中,這6個導聯的P300信號較為突出的FZ, CZ, PZ, OZ,C3, C4。可根據需要選擇相應導聯的腦電信號作為FastICA算法的輸入。從中隨機選取100組腦電信號作為訓練數據,剩下的80組信號作為測試數據,檢測分類效果是否有效。
本文使用的支持向量機核函數為徑向基核函數(Radial Basis Function,RBF):
若核函數滿足Mercer條件,則核函數可對應相應變換空間中的點積。其中是一個控制半徑的正數。將(10)展開得:
其中、、皆滿足Mercer條件。
3.2 分類結果
為綜合考慮實驗效果,測試了不同導聯數對分類正確率的影響。每次測試都進行10回,以便求平均分類正確率。分類結果見表1。
可以看出,隨著使用導聯數的增加,平均分類正確率也有所增加。增加到7個導聯時,平均分類正確率最高,可達90.12%。但超過7個導聯后,平均分類正確率又出現下降趨勢。可見,數據量的增多雖然可以提高平均分類正確率,但是一味的增加也會使得FastICA在迭代時收斂效果不理想。
本文使用的方法可以有效的對P300腦電信號進行特征提取和分類,分類正確率較為理想,為P300腦電信號處理的研究提供研究參考。
4 結論
本文針對P300事件相關電位腦電信號信噪比低,隨機性強的特點,先對腦電信號進行疊加平均、去均值、白化的預處理,其次利用FastICA算法提取腦電信號的特征向量,最后將得到的腦電信號特征向量經支持向量機分類,最高平均分類正確率可達90.12%,因此可以有效進行P300腦電信號的特征提取及分類。本文使用的使用的算法原理簡單,較高的腦電信號分類正確率可增強腦機接口的運行穩定性,為實時在線腦機接口系統的研究提供研究思路,使腦機接口能更廣泛的用于軍事、游戲、醫療等領域。
參考文獻:
[1]Rajesh P.N.Rao.Brain-Computer Interfacing:an introduction[M].China Machine Press,2016.
[2]Schalk G,Dennis J,Thilo H,et al.BCI2000: A general-purpose brain-computer interface(BCI) system [J].IEEE Transactions on Biomedical Engineering,2004,51(06):1034-1043.
[3]Robbin A.Miranda,William D.Casebeerb,Amy M.Heinz,et al. DARPA-funded efforts in the development of novel brain-computer interface technologies[J].Journal of Neuroscience Methods,2015,244:52-57.
[4]邢麗超.腦-機接口的研究現狀[J].科技創新與應用,2015(06): 24-24.
[5]關偉,楊柳,江世雄,張文義.腦電在交通駕駛行為中的應用研究綜述[J].交通運輸系統工程與信息,2016,16(03):35-44.
[6]王斐,張育中,寧廷會,聞時光.腦-機接口研究進展[J].智能系統學報,2011,6(03):189-199.
[7]李波,劉洋,周宗潭.嵌入式腦機接口系統的軟件設計與實現[J]. 計算機仿真,2007,24(07):292-295
[8]賈花萍,趙俊龍.腦電信號分析方法與腦機接口技術[M].北京:科學出版社,2016.
[9]段鎖林,尚允坤,潘禮正.多類運動想象腦電信號特征提取與分類[J].計算機測量與控制,2016,24(02):283-287.
[10]韓敏,孫卓然.基于小波變換和AdaBoost極限學習機的癲癰腦電信號分類[J].計算機測量與控制,2015,35(09):2701-2709.
[11]Donchin E,Spencer K M,Wijesinghe R.The mental prosthesis:Assessing the speed of a P300-based brain-computer interface[J].IEEE Transactions on Rehabilitation Engineering,2000,8(02):174-179.