摘 要:文章針對BCI Competition 2003的Data set IIb競賽數據,取得了一個很高的字符分類識別準確率,文章突出在數據預處理階段中,通過很多次程序驗證比較不同頻帶域的測試準確率,得出了一個最佳的頻帶范圍,用于原始數據的濾波過程。
關鍵詞:腦機接口;P300;預處理;特征提取;分類算法
1 引言
腦機接口(BCI)是一個系統,允許用戶與環境的溝通,只有通過大腦活動,而無需使用肌肉輸出通道。它涉及了神經科學,信號檢測,信號處理,模式識別等多種領域。要建立大腦和外界設備之間的聯系,首先要測量大腦活動,然后進行處理分析信號數據,再進行機器學習(訓練分類模型)實行分類,進而實現用戶的意圖。P300電位是當視覺受到外界特殊刺激時腦電信號出現一個波峰,其峰值大約出現在相關事件發生后的300ms。其優勢特點是被試驗之前不需要進行訓練即可成功誘發出來。因此P300電位是腦-機接口常用的一種信號。文中所用數據是BCI Competition 2003的Data set IIb離線數據集。大致處理過程可以描述為:原始信號數據→預處理→特征選擇與提取→選擇并訓練分類模型→分類結果→測試分類算法效果→根據效果調整分類模型→得出理想的分類結果。
2 處理數據的算法步驟
2.1 單次樣本提取:因為P300電位一般出現在刺激后的300ms左右,所以通過分類精度驗證后,本文截取從每次閃爍開始后100ms到700ms長度的數據作為一個單次樣本,這樣將訓練集的前30個Trial的數據組成一個30×12×15×144×64維的原始特征空間。
2.2 數據預處理:由于采集到的原始數據中一般會含有眼電,肌肉以及外界干擾等因素(如測量儀器或環境干擾等)的噪音信號,以及P300電位的低頻特性,所以需要對原始數據進行預處理,本文主要涉及數據精度的轉化以及低通濾波。論文突出在打破了前人已有經驗的限制,將P300電位的頻帶范圍更加精確化,更是體現了P300電位的低頻特征,文章選擇采用Matlab自帶的信號處理工具箱設計了一個合適的濾波器,以帶通替代低通設計了10階Butterworth(IIR)帶通濾波器,帶寬為0.05Hz~7.5Hz。不同頻帶域對應的實驗準確率如表1。其中10階可以通俗理解為過濾次數,一般來說過濾次數越多濾波效果就越好,但是同時也加重了程序運行負擔,因此選擇適當的濾波階數也是很關鍵的一步。
表1
2.3 特征選擇與提取:首先對電極進行篩選,因為并不是所有電極都能明顯體現P300特征,所以需要把那些P300特征比較明顯的電極篩選出來。通過多次準確率比較論文選擇了22個導聯(用Ne表示)作為特征電極,對應編號為:11,13,14,18,19,20,34,47,51-64。比較準確率時采用隨機增加通道,能提高準確率的通道保留,反之舍棄的方法。其次,為了提高訓練模型的速度,需要對特征空間進行降維處理,本文嘗試過兩種降維方式,一是將相鄰6個采樣點的平均值作為一個特征點,二是每隔6個采樣點取一個特征點,事實證明后者的程序簡單而且準確率并高于前者,所以采用后者的方法將預處理后的數據降維。再關于試驗重復次數求平均,至此每個Trial只剩24個特征點(用Ne表示)。并將其特征電極與特征點結合考慮作為每個Trial的特征向量。這樣將得到前30個訓練數據的特征空間為(30·12)×(Ne·Nt)即為360×528維的特征空間。
2.4 規范化特征空間:就是將特征空間向量投射到特定的小范圍內,如-1.0~1.0或0.0~1.0。文章采用向量單位化的方法將其投射到0.0~1.0范圍內。規范化可以消除數值型屬性因為大小不一而帶來的特征分類偏差。這個過程對于提高腦機接口信息傳遞效率很重要。
2.5 訓練分類模型:將特征提取得到的已知目標字符的數據作為訓練集,利用C-SVC(C-支持向量分類)選擇線性核函數u'*v對其進行訓練,其中樣本特征是屬于二分類樣本集,分別用-1和1標記兩種樣本類別。
3 分類結果
將訓練出的分類器應用于等量的未知目標字符的測試數據集,推斷出所選擇的字符。并計算分類準確率:Accuracy=■×100%。論文通過上述算法得到的最高準確率達90.00%。相應不同重復次數文章分別測試了對應準確率,見圖1。
圖1
4 結束語
文中選擇了22個通道數據進行處理得到了很好的分類效果,但是否這22個特征電極就適用任何群體的實驗數據,本文并未明確給出。但至少文中所用的通道及其篩選方法可以為相關研究者提供參考。論文關于P300電位的低頻特性到底低到什么程度也只是對文中所用數據作了驗證,是不是普遍結論還有待這方面的研究者進一步探討。總之本文所用的處理算法對提高整個BCI系統的總體數據傳輸率起了積極作用。
參考文獻
[1]程明,高上凱,張琳.基于腦電信號的腦-計算機接口[J].北京生物醫學工程,2000,19(2):113-118.
[2]楊立才,李佰敏,李光林,等.腦-機接口技術綜述[J].電子學報,2005.
[3]Lin Zhonglin,Zhang Changshui.Enhancing classification by perceptual characteristic for the P300 speller paradigm [A].In :Proceedings of the 2nd International IEEE EMBS Conference on Neural Engineering,Arlington : IEEE EMBS,2005,574 -576.
作者簡介:林亞靜(1985,11-),女,漢,陜西西安人,研究方向:信息理論與應用,碩士學歷。