賈花萍
(渭南師范學院 計算機科學系,陜西 渭南 714000)
隨著科學技術的不斷進步、人們對大腦功能認識的不斷深入以及高性能PC的問世,近20年以來一個新的研究領域——“腦—計算機接口(BCI)”(簡稱腦機接口)正在蓬勃發展。腦機接口是基于腦電信號而不依賴于腦的正常輸出通路(即外周神經和肌肉)的,通過對大腦思維過程EEG信號的監控與分析,理解人的意圖,直接將大腦信息傳達到外部世界,可以實現多種形式的應用。其適用人群比較廣泛,理論上只要大腦能夠正常思維的人,都可通過腦機接口技術與外界交流,所以對那些高位截癱或腦干損傷的完全閉鎖患者,具有非常廣闊的實用前景[1-3]。
EEG數據是Purdue大學的Keim和Aunon[5]所采集的實驗數據。受試者坐在隔音房間內,房間內光線暗淡,用無聲電扇保持通風。受試者頭戴電極帽,根據標準10/20電極系統,由 C3,C4,P3,P4,O1和O2等6個部位記錄 6個通道的EEG信號,經過Grass 7P511型放大器放大、通頻帶為0.1~100 Hz的濾波器濾波,采樣頻率為250 Hz的12位A/D轉換器將數據存儲于計算機中。電極安放位置模型如圖1所示。

圖1 電極安放位置模型
由置于被試者左眼上方和下方的2個電極記錄眼動信號作為第7通道信號。共提供7個受試者的數據。每個受試者進行多次不同的思維作業實驗,每次思維作業采集的數據長度為10 s。5種思維活動為:1)放松狀態,受試者盡可能放松,不進行任何思維活動;2)打信件腹稿,受試者想象給某位親人或朋友寫一封信;3)心算乘法,受試者想象進行比較復雜的乘法運算;4)想象在黑板上寫數字,受試者想象將數字寫在黑板上;5)想象幾何圖形旋轉,受試者想象將一個三維圖形繞某個軸旋轉。每種思維任務前半秒的波形如圖2所示。
這里采用一種時域回歸方法去除原始EEG信號中包含的眨眼偽差噪聲。針對不同的導聯,眼電信號乘以一個相應的加權系數進行幅值調整,然后從EEG信號中減去調整后的眼電幅度部分,從而去除較大眼電。這里采用0.1、0.05和0.025等3種加權系數分別處理C3C4、P3P4和O1O2中包含的眼電噪聲。

圖2 每種思維任務前半秒的波形
將AR模型應用到EEG分析中的基本思想是,假設可以用AR過程近似真實EEG信號。基于這一假設,根據實際EEG信號,選取合適的階次、參數,使得AR模型所對應的AR過程盡可能逼近EEG信號。這里采用AR參數模型法是考慮到EEG信號是典型非平穩隨機信號,假設x(t)的采樣序列為x[n],則序列x[n]的AR模型為:

式中,p為模型階次;ak為AR模型參數;u[n]為激勵白噪聲。
本文的研究對象是被試者2,其每種思維作業重復5次,每次持續10 s,每個通道每次試驗記錄2 500個采樣數據。在MATLAB 7.0中編程繪制出被試者2的5種思維任務重復一次的波形,包含和不包含眼電2種情況,如圖3所示。

圖3 被試者2的5種思維任務重復一次的波形
對EEG數據預處理后采取分段和不分段2種情況比較分類結果。首先對于預處理后的EEG數據用矩形窗進行分段,窗口長度為1 s(250個采樣點),下一段與上一段重疊0.5 s,數據長度為10 s,可分為19段。對每一段數據建立一個AR模型。模型如下:

式中,aic是通道為 C 的第 i個 AR 系數,C={C3,C4,P3,P4,O1,O2},P 為 AR 模型的階數。
大量試驗表明,對于本文的數據,取6階模型階數較好,每一個EEG段由36個特征量(6通道×6階)表示,運用Burg算法對每段的數據進行AR參數估計,得到長度為6×6=36的系數序列,這 36 個系數(6 導×6 階)構成一個特征向量(a1,C3,a1,C4,a1,P3,a1,P4,a1,O1,a1,O2,a2,C3,a2,C4,…,a6,O1,a6,O2)作為一個樣本。網絡輸入層神經元數目取決于樣本的長度,為36。被試者2完成了一組實驗,在每一組實驗中,進行5種思維活動,每種思維活動重復5次,每次持續10 s。特征樣本集的構成也和思維作業的分類種類有關,若要劃分為5類,則樣本集有5×19×5=475個樣本,每個樣本對應一列,因此每個樣本集為36(行)×475(列)的矩陣。為測試分類的準確度,把樣本集分為2部分,前一部分為訓練樣本,后一部分為測試樣本。將被試者2的5種思維活動重復的前4次作為訓練樣本,最后一次作為測試樣本,所以訓練樣本共有19×5×4=380個,測試樣本共有 19×5×1=95 個。
EEG數據未分段的情況下,用6階AR模型,Burg算法對每個通道的EEG數據進行AR參數估計,得到長度為36的系數序列, 構成一個特征向量(a1,C3,a1,C4,a1,P3,a1,P4,a1,O1,a1,O2,a2,C3,a2,C4,…,a6,O1,a6,O2)作為一個樣本。 網絡輸入層神經元數目取決于樣本的長度為36。因此每個樣本集為36(行)×25(列)的矩陣。
BP(Error Back Propagation Network)神經網絡是目前應用最為廣泛的神經網絡之一,是一種多層網絡的逆推學習算法?;舅枷隱7]是:學習過程由信號的正向傳輸與誤差的反向傳播2個過程組成。正向傳播時,輸入樣本從輸入層傳入,經中間層(隱層)逐層處理后傳向輸出層。若輸出層的實際輸出與期望輸出不符,則轉向誤差的反向傳播階段。誤差的反向傳播是將輸出誤差以某種形式通過隱層向輸入層逐層反傳,并將誤差分攤給各層的所有單元,從而獲得各層單元的誤差信號,將此誤差信號作為修正各單元權值的依據。

圖4 BP網絡結構
由輸入層,輸出層和中間層(隱層)組成,其結構如圖4所示。
對EEG數據分段或不分段,只是數據樣本的數目不一樣,故在這兩種情況下,網絡輸入層神經元數目為36。輸出層神經元的個數取log2m。m為類別模式。1989年Robert Hecht-Nielsen證明對于任何閉區間內的一個連續函數都可用隱層的BP網絡逼近。這里采取3層BP網絡,開始先放入較少的神經元,學習一定次數,若不成功則再增加隱層單元的數目,直到達到比較合理的隱層單元數目為止。結合經驗公式,隱層神經元的個數應為7~16。編寫Matlab程序選取隱含層神經元的最佳數為s。網絡隱含層的神經元傳遞函數采用S型正切函數tansig,輸出層神經元傳遞函數采用S型對數函數logsig,這是因為函數的輸出位于區間[0,1]中,正好滿足網絡輸出要求。
網絡經訓練后才能實際應用。用init.m函數對網絡進行初始化,以消除前面訓練的影響。訓練結束后,用仿真函數a=sim(net,p)對網絡進行仿真。分別對未分段和分段后兩種情況的分類結果進行比較,對5種思維狀態的前2種、前3種、前4種、5種分別用BP算法進行分類,在MATLAB7.0中進行程序測試,分類結果如圖5所示。

圖5 BP算法分類正確率比較
本文主要采用AR模型提取信號分段前后特征作為神經網絡輸入,用BP算法對2~5種思維狀態的EEG信號進行分類,從實驗結果可以看出:1)未對 EEG進行分段提取特征的分類正確率明顯高于進行分段后提取特征的分類正確率。2)隨思維作業增加分類準確度降低,2種思維作業情況下,分類準確度較高;而在3種以上思維作業情況下,其分類準確度要相對低些,說明隨著思維任務的增加,其分類的準確度會有所下降。3)考慮多導電極的信息存在相關性。后續研究中,在數據預處理方面,應考慮多導電極存在的相關性并予以去除或減小。由于其他一些因素,如受試者之間的個體差異等影響,會在一定程度上影響分類精度。因此,后續研究工作中應考慮到用神經網絡集成方法進行EEG信號分類,進一步提高分類精度。
[1]Moore Melody M.Real-world applications for brain-computer interface technology[J].IEEE Transactions On Neural Systems Rehabilitation Engineering,2003,11(2):162-165.
[2]Gerwin Schalk,McFarland Dennis J,Thilo Hinterberger.BCI2000:a general-purpose brain-computer interface(BCI)system[J].IEEE Transactions On Biomedical Engineering,2004,51(6):1034-1043.
[3]Robert Leeb,Gert Pfurtscheller.Walking through a virtual city by thought[C]//Proceedings of the 26th Annual International Conference of the IEEE EMBS.San Francisco,CA,USA,2004:1-5.
[4]Keirn Zachary A.Software and data[DB/OL].2008.http://www.cs.colostate.edu/eeg/eegSoftware.html#keirndata.
[5]Keim Z A,Aunon J I.A new mode of communication between man and hissurroundings[J].IEEE Transactions on Biomedical Engineering,1990(37):1209-1212.
[6]劉海龍,王玨,鄭崇勛.基于非線性參數的思維任務分類[J].西安交通大學學報,2005,39(8):900-903.
[7]朱大奇,史慧.人工神經網絡原理及應用[M].北京:科學出版社,2006:33-34.