概率校準方法的腦電信號分類算法研究

2023-05-20 08:22:23丁勝吳全玉孫健潘玲佼陶為戈

赤峰學院學報·自然科學版 2023年4期

丁勝　吳全玉　孫健　潘玲佼　陶為戈

摘要：腦機接口技術是很多學科融合的前沿研究方向，腦電信號分類的準確率是限制腦機接口系統實現的難題之一。針對腦電信號分類準確性問題，采用兩種概率校準方法Platt Scaling和Isotonic Regression。首先對預處理后的運動想象腦電數據利用功率譜密度提取腦電頻域特征，使用主成分分析算法進行特征降維。其次選擇邏輯回歸和支持向量機構建分類預測模型，使用上述兩種概率校準方法進行模型校準。最后，選用ROC曲線下的面積AUC、Brier得分和可靠性曲線評估校準模型的性能，并且繪制交叉驗證學習曲線，觀察模型在不同數據量下的擬合效果，以及模型的泛化能力。在BCI競賽IV Datasets 2a腦電數據集上進行實驗驗證，結果表明，概率校準的方法能夠對模型預測輸出結果進行有效校準。

關鍵詞：運動想象；概率校準；功率譜密度；邏輯回歸；支持向量機

中圖分類號：TP18；TP301.6? 文獻標識碼：A? 文章編號：1673-260X（2023）04-0011-05

1 引言

腦機接口（Brain-Computer Interface，BCI）是一種不利用外周神經和肌肉，由大腦完成控制命令輸出的與外界進行通訊的新方式[1，2]，已在神經康復、生物醫學及生活娛樂等領域被廣泛研究。運動想象（Motor Imagery， MI）是BCI中的一個重要實驗范式，這是一種特殊的心理表象類型[3，4]，人進行運動想象，通過BCI可以實現單獨操縱設備[5]。然而腦電信號（Electroencephalogram，EEG）具有復雜，時變，非線性等特點[6]，使得挖掘到有效地腦電信號存在很大的困難，因此，研究如何利用算法對腦電信號進行準確分類顯得非常重要[7]。

經典的機器學習算法發展時間長，且具有成熟的數學理論基礎，常被用于運動想象腦電信號的分類。許多研究學者對腦電信號分類算法進行一些改進。Shi等[8]采用改進的松鼠搜索算法優化支持向量機的參數，提高了模型的分類精度。Miao等[9]在樸素貝葉斯（Naive Bayesian，NB）基礎上提出加權樸素貝葉斯（Weighted NB，WNB），對多個時頻特征進行加權，得到不錯的分類結果。

然而許多分類算法的預測輸出值并不是真正的概率輸出，即具有一定的偏差[10]，在實際應用場景中可能會導致一些嚴重的后果。例如支持向量機（Support Vector Machines，SVM）算法，先尋找讓邊際最大的決策邊界，然后計算測試樣本點到決策邊界的距離來判定該樣本屬于哪一類，但是大部分樣本點都徘徊在決策邊界附近，模型很容易做出錯誤的判斷，只有離決策邊界較遠的樣本才有很高的置信度，所以說SVM是一個“極度不自信”的算法。即使是NB這種真正的概率算法，也會存在有偏的預測。NB產生的分數通常太過極端[11]，概率分布存在兩邊高，中間低的現象。因此NB模型無法產生準確的概率估計[12]，是一個“過分自信”的算法。特別當測試樣本的特征之間并不是條件獨立時，樸素貝葉斯分類器輸出的概率估計也是存在偏差的。

概率校準的方法可以將有偏差的概率輸出結果進行校準。概率校準是指尋找一個校準函數，將初始預測映射為更加精確的后驗概率[13]。使用概率校準的方法不僅將非概率分類器的輸出轉化為概率類型，而且也對概率分類器的結果進一步提升[14]。目前比較可靠的兩個概率校準方法為Platt Scaling[15]和Isotonic Regression[16]。

本文選擇支持向量機和邏輯回歸（Logistic Regression，LR）作為預測模型，引入上述兩種概率校準的方法，將模型在第四屆BCI競賽2a數據集上進行驗證，結果顯示，概率校準后的模型比原始模型有更好的表現。

2 數據集和方法

2.1 數據集

試驗數據來源于2008年第四屆國際BCI競賽Datasets 2a數據集[17]。該數據集一共記錄了9名受試者（A01，A02，A03，A04，A05，A06，A07，A08，A09）關于左手、右手、雙腳和舌頭四種不同的運動想象任務，每名受試者在不同的日期記錄兩次實驗。本文只對左右手兩類任務進行分類，每個受試者的數據由兩個部分組成，一部分用于訓練，另一部分用于測試，每個部分都包含了144次試驗，每次試驗持續7.5秒。所有數據均是通過分布在頭部的25個Ag/AgCl電極記錄的，采樣頻率為250Hz，并對采集EEG信號進行0.5Hz-100Hz帶通濾波。具體細節參考https：//www.bbci.de/competition/iv/。

2.2 預處理

為了更有效地提取腦電信號特征，先對原始腦電數據進行預處理。本文選用Python語言，在集成開發環境PyCharm中進行編程，利用MNE工具箱對腦電信號預處理，受試者A03原始的腦電信號如圖1所示。該數據集包含3個眼電偽跡的通道，刪除這三個無用通道。與MI有關的頻率主要集中在α節律（8～13Hz）和β節律（14～30Hz）[18]，因此對腦電信號進行8-30Hz的帶通濾波。濾波后不僅方便選擇后續工作所需要的有效頻段，而且可以減輕高頻干擾與工頻噪聲[19]。腦電信號中摻雜著各種生理偽跡[20]，調用MNE工具箱中內置的獨立成分分析（Independent Component Analysis，ICA）算法進行去噪處理。

2.3 特征提取與降維

2.3.1 特征提取

對預處理后的腦電信號使用功率譜密度（Power Spectral Density，PSD）提取反映受試者意圖的頻域信號特征，受試者A03的腦電數據經帶通濾波后的功率譜密度如圖2所示。計算對應頻率段的曲線下面積作為腦電信號在該頻段的能量值。對每名受試者的22個通道分別計算Alpha（8-13Hz），Beta1（14-20Hz），Beta2（21-28Hz）三個頻段的腦電信號功率，共提取66維腦電特征。

2.3.2 特征降維

提取到的腦電特征包含許多冗余信息，會影響分類模型的識別準確率，使用主成分分析（Principal Component Analysis，PCA）算法降維。PCA通過矩陣分解將高維特征數據壓縮到少量特征上，并且信息量不會損失太多，形成新的含有大量有效信息的低維特征矩陣。

2.4 模參型數

精細調參可以提高分類器的準確率，使用學習曲線和網格搜索的方法確定SVM和LR模型的參數。SVM的核函數設為‘linear，選擇L2正則化防止模型過擬合，懲罰項系數C設為0.8，最大迭代次數max_iter為-1。LR模型選用L2正則化，C設為0.78，設置‘lbfgds作為目標損失函數的迭代優化算法。

2.5 概率校準

2.5.1 Platt Scaling

Platt Scaling是一種參數化校準方法，模型校準的過程實際上是在確定最優參數（a，b）。將分類器的預測輸出值通過Sigmoid函數進行轉換，將分類器的原始預測輸出值映射為較為準確的概率值，其范圍為（0，1）。假設輸入樣本為xi，分類器的預測輸出值為f（xi），則分類器最終輸出概率的計算公式為：

參數（a，b）通過極大似然估計的方法可求得：

其中，pi為校準后的概率，yi為輸入樣本的真實類別，pi用式（3）表示：

在實際應用中，為了防止分類器過度擬合，經常會使用下式給樣本正類y+和負類y-賦值：

其中，N+和N-分別是正負樣本的數量。

2.5.2 Isotonic Regression

Isotonic Regression是一種非參數校準的方法，假設分類器預測輸出值為yi，輸入樣本的標簽為Yi，則模型定義為：

其中，F為分類器預測輸出值yi和樣本真實值Yi之間擬合的單調遞增的函數，？著i為誤差。若給定數據集set（yi，Yi），則F可以通過式（7）求解：

式（6）的一種求解算法是PAV（Pool Adiacent Violators）[21]，通過不斷更新違反函數單調性的局部區間，找到最終滿足單調性的區間。

3 評估方法與結果分析

3.1 評估方法

模型的評估是非常重要的一步，為了評估概率校準后模型的效果，本文采用了三種指標：布里爾分數（Brier Score），可靠性曲線（Reliability Curve），ROC曲線下面積AUC來評估概率校正后模型的效果。

3.1.1 布里爾分數

布里爾分數是一項衡量概率校準表現的標準指標，其計算方法為樣本真實值與概率預測之間的均方誤差。具體表達式如下：

其中，N是樣本數量，fi是分類器預測輸出值，yi是樣本的真實標簽。式（8）的范圍從0到1，衡量概率預測值和真實值的差異，布里爾分數越小，模型的預測精度越高。

3.1.2 可靠性曲線

可靠性曲線，又稱為概率校準曲線（Probability Calibration Curve），它是一種可視化的評估方法，可以直觀地看出模型在進行二分類任務時，其概率輸出與理論最優分類器預測的偏差程度，可以幫助我們了解模型的置信度。如果模型具有很好的置信度，那么可靠性曲線應該接近45度對角線。而如果模型的置信度有問題，可靠性曲線可能會出現明顯的偏差。

3.1.3 AUC

ROC（Receiver Operating Characteristic）曲線，又稱為感受性曲線，ROC曲線是一種以真陽性率為縱坐標，以假陽性率為橫坐標的二維曲線。模型的預測效果可以通過ROC曲線下面積AUC來進行評估，AUC值越大則模型的預測效果越好。通常，AUC值被用來衡量二分類模型的分類效果，其取值范圍在0到1之間。當AUC值越接近1時，模型的分類效果越好。

3.2 結果分析

表1展示了9名受試者采集的腦電信號在原始模型和概率校正后模型下的分類準確率。為了敘述方便，下文以‘模型+Platt、‘模型+Isotonic的方式命名校準后的模型。SVM、SVM+Platt、SVM+Isotonic、LR、LR+Platt和LR+Isotonic在9名受試者腦電數據上的平均準確率分別為70.96%、73.74%、72.18%、72.28%、74.78%和73.94%?？梢钥闯鼋浉怕市实姆诸惼鞯臏蚀_率比原始分類器的準確率有所提高，且Platt概率校準方法在該數據集上比Isotonic概率校準方法更有優勢。

由于篇幅限制，本文只展示受試者A03的概率校準模型的可靠性曲線圖。如圖3所示，明顯看到經過概率校準的模型SVM+Platt、SVM+Isotonic、LR+Platt和LR+Isotonic都比未校準的模型更靠近對角線，模型效果更好。支持向量機模型的布里爾分數為0.140，經概率校準后SVM+Platt和SVM+Isotonic的布里爾分數分別為0.124，0.126；邏輯回歸模型的布里爾分數為0.130，經概率校準后LR+Platt和LR+Isotonic的布里爾分數分別為0.119， 0.120。校準的模型布里爾分數降低，說明模型的概率預測輸出與樣本真實標簽更接近，模型變得更加穩定可靠。

圖4展示了應用本文采用的概率校準方法后，SVM+Platt的AUC比原始SVM模型的AUC提高0.03，達到0.93；SVM+Isotonic的AUC略微遜色達到0.92。對于原始LR模型，模型本身效果就比較好，AUC為0.92；概率校準后，LR+Platt的AUC有所上升，達到0.93，而LR+Isotonic的AUC則與LR的AUC持平。

4 討論

本文對第四屆BCI競賽2a腦電數據集進行解碼，利用概率校準方法對模型的預測輸出進行再學習，模型準確率上升，達到實驗預期。概率校準并不是對所有的數據集都起作用，如表1中，受試者A07的腦電數據，經過兩種概率校準方法校準后，模型的準確率反而下降；對于受試者A09，經Platt方法校準，模型的準確率升高，經Isotonic方法校準，模型的準確率下降或持平。SVM+Platt、SVM+Isotonic、LR+Platt和LR+Isotonic四種校準模型在9名受試者的腦電數據上進行建模，平均準確率比原始模型分別提高2.78%，1.22%，2.50%，1.66%。通過調研文獻資料發現，Platt校準方法在數據量較少時會有更好的效果，因為Isotonic校準方法非常容易過擬合，當有足夠多的數據時，Isotonic方法會更有效。

通過繪制交叉驗證學習曲線觀察6種模型在受試者A03數據集上的表現情況。由于訓練數據集和測試數據集分別有144個，數據量偏少，選擇將兩組數據組合在一起，總共288個數據樣本，建立模型后，以每次訓練的不同的樣本數量為橫坐標，訓練分數和測試分數為縱坐標來繪制學習曲線，如圖5所示。從圖上可以看出，支持向量機和邏輯回歸模型在訓練數據量較小時都存在嚴重的過擬合現象，隨著樣本量的增大，模型過擬合的情況會得到緩解；概率校準后，有效地減輕了模型的過擬合情況。兩種概率校準后的模型測試準確率均高于原始模型的表現，達到85%以上，且經Platt方法校準的模型表現略勝一籌，說明Platt方法在數據集較少時的表現確實好于Isotonic方法。從圖上可以預見，采集更多的腦電數據用于訓練，兩種方法校準后模型的準確率會進一步提高。

本文的不足之處：第一，只提取腦電信號頻域特征，有效信息量過少，接下來工作會從時域、頻域、空域三種不同的角度提取腦電信號特征，然后進行特征融合，利用啟發式算法選擇特征。第二，經典單一分類器的表現效果或許不如多模型融合以及神經網絡模型，后續工作會進行驗證。

5 結束語

腦機接口技術改變了人們與外界的信息交互方式，在未來許多領域必定會大放異彩，腦電信號的解碼至關重要。本文對運動想象腦電信號使用PSD方法提取頻域特征，利用PCA技術降低特征維數，選擇SVM和LR兩種算法建立腦電信號分類預測模型，選用Platt、Isotonic兩種概率校準方法對模型有偏的輸出結果進行校準，兩種方法在本文數據集中多名受試者的腦電數據上均達到不錯的效果，且隨著數據量的增加，模型過擬合情況得到緩解，分類準確率也能進一步提高。

——————————

參考文獻：

〔1〕Kamhi S， Zhang S， Ait Amou M， et al. Multi-Classification of Motor Imagery EEG Signals Using Bayesian Optimization-Based Average Ensemble Approach[J]. Applied Sciences， 2022， 12（12）： 5807.

〔2〕許冬萍，陳峰.基于改進小波變換和模糊熵的腦電信息研究[J].計算機仿真，2019，36（10）：227-232.

〔3〕Yang Y J， Jeon E J， Kim J S， et al. Characterization of kinesthetic motor imagery compared with visual motor imageries[J]. Scientific Reports， 2021， 11（01）： 1-11.

〔4〕田貴鑫，陳俊杰，丁鵬，等.腦機接口中運動想象的執行與能力的評估和提高方法[J].生物醫學工程學雜志，2021，38（03）：434-446.

〔5〕劉拓，葉陽陽，王坤，等.運動想象腦電信號分類算法的研究進展[J].生物醫學工程學雜志，2021， 38（05）：995-1002.

〔6〕Li C， Chen M， Zhang L. A Domain Adaptation-Based Method for Classification of Motor Imagery EEG[J]. Mathematics， 2022， 10（09）： 1588.

〔7〕魯杰，楊曉棟，彭靖宇，等.基于LSTM的運動想象腦電信號分類方法[J].電子設計工程，2021，29（04）：88-92.

〔8〕Shi M， Wang C， Li X Z， et al. EEG signal classification based on SVM with improved squirrel search algorithm[J]. Biomedical Engineering/Biomedizinische? Technik， 2021， 66（02）： 137-152.

〔9〕Miao M， Zeng H， Wang A， et al. Discriminative spatial-frequency-temporal feature extraction and classification of motor imagery EEG： An sparse regression and Weighted Na？觙ve Bayesian Classifier-based approach[J]. Journal of neuroscience methods， 2017， 278： 13-24.

〔10〕Niculescu-Mizil A， Caruana R. Predicting good probabilities with supervised learning[C]//Proceedings of the 22nd international conference on Machine learning. 2005： 625-632.

〔11〕Zadrozny B， Elkan C. Transforming classifier scores into accurate multiclass probability estimates[C]//Proceedings of the eighth ACM SIGKDD international conference on Knowledge discovery and data mining. 2002： 694-699.

〔12〕Zhong W， Kwok J T. Accurate probability calibration for multiple classifiers[C]//Twenty-Third International Joint Conference on Artificial Intelligence. 2013.

〔13〕范雙龍，趙志強，余紅梅，等.基于概率校準的彌漫性大B細胞淋巴瘤患者死亡風險預測[J].中國衛生統計，2021，38（05）：670-674.

〔14〕肖瑤，謝貴才，朱兵.淺談分類問題中的概率校準[J].中國統計，2018，66（05）：35-37.

〔15〕Platt J. Probabilistic outputs for support vector machines and comparisons to regularized likelihood methods[J]. Advances in large margin classifiers， 1999， 10（03）： 61-74.

〔16〕Qin J， Garcia T P， Ma Y， et al. Combining isotonic regression and EM algorithm to predict genetic risk under monotonicity constraint[J]. The annals of applied statistics， 2014， 8（02）： 1182.

〔17〕Naeem M， Brunner C， Leeb R， et al. Seperability of four-class motor imagery data using independent components analysis[J]. Journal of neural engineering， 2006， 3（03）： 208-216.

〔18〕Tang Z， Li C， Sun S. Single-trial EEG classification of motor imagery using deep convolutional neural networks[J]. Optik， 2017， 130： 11-18.

〔19〕Daud S S， Sudirman R. Butterworth bandpass and stationary wavelet transform filter comparison for electroencephalography signal[C]//2015 6th international conference on intelligent systems， modelling and simulation. IEEE， 2015： 123-126.

〔20〕吳全玉，張文強，潘玲佼，等.一種結合自適應噪聲完備經驗模態分解和盲反卷積去除腦電中眼電偽跡的新方法[J].數據采集與處理，2020，35（04）：720-729.

〔21〕Ayer M， Brunk H D， Ewing G M， et al. An empirical distribution function for sampling with incomplete information[J]. The annals of mathematical statistics， 1955： 641-647.

收稿日期：2023-02-11

通訊作者：吳全玉（1977-），男，漢族，安徽碭山人，副教授，碩士研究生導師。研究方向：嵌入式康復系統開發、醫學信號處理和血流動力學仿真。

基金項目：國家自然科學基金青年項目（62001196）；江蘇省重點研發計劃（SBE2020648）；常州市社會發展項目（CE20225045）

赤峰學院學報·自然科學版2023年4期

赤峰學院學報·自然科學版的其它文章: 化工設計課程群的探索實踐; 家庭作業努力的性別差異元分析; 基于“RBL+TBL”模式的農業院校分子生物學實驗課程改革探究; 基于智慧課堂的線上線下混合式教學改革與實踐; 高校計算機專業教師繼續教育存在的問題及實施策略探索; 醫學生物學課程試卷分析及教學思考