李 彤,王永宗,張藝耀,彭 宏,朱玲玲,趙永岐
近年來,腦電(electroencephalogram, EEG)以其低偽裝性及較高時間分辨率在情緒識別領域中脫穎而出。研究[1]表明,EEG高頻成分可以反映人的情緒和認知狀態,其中γ和β頻帶比低頻頻帶能更好地區分情緒狀態的轉換[2]。Jie et al[3]通過非線性特征樣本熵實現了高低喚醒度和高低愉悅度的情緒識別。Duan et al[4]在情緒識別中采用微分熵進行機器分類學習,分類正確率最高為84.22%,可見微分熵作為非線性EEG特征具有較高的分類效率。但龐大的數據量和導聯數目的增加,不利于情緒的快速識別。針對此問題,該研究應用校正后的Fisher分數(F-score)算法,篩選與典型情緒密切相關的線性和非線性的EEG特征和最優導聯集合,為實現情緒的快速識別提供可能。
1.1篩選刺激圖片和被試者通過預實驗,從北京師范大學周仁來教授提供的中國化的情緒圖片系統[5]中篩選出60張情緒圖片,其中輕松情緒圖片15張,圖片效價評分(6.72±0.49)、喚醒度評分(3.77±0.97);沮喪情緒圖片15張,圖片效價評分(2.88±0.62)、喚醒度評分(4.97±0.69);愉悅情緒圖片15張,圖片效價評分(7.26±0.44)、喚醒度評分(5.80±0.66);恐懼情緒圖片15張,圖片效價評分(2.44±1.04)、喚醒度評分(6.54±0.60)。

圖1 實驗流程圖
被試為30名在校男性學生,母語為中文,年齡21~27(22.9±1.63)歲,右利手,視力正常或矯正視力正常,無色盲色弱癥狀,無任何腦神經損傷和精神疾病病史及家族史,近期無服用對神經系統有影響或損害作用的藥物。
1.2情緒誘導利用E-Prime 2.0軟件設計情緒誘導文件。四類情緒圖片根據喚醒度評分由低到高播放,依次誘導被試產生輕松、沮喪、愉悅、恐懼情緒。為使情緒誘導更加顯著,本實驗設計以同一類型情緒圖片連續呈現的方式誘導情緒產生,從而獲得更高的情緒識別效果。如圖1所示:睜眼盯住屏幕“+”60 s采集靜息腦電信號。每張圖片呈現6 s,每兩張圖片間隔2 s并要求被試緊盯屏幕“+”,直至15張圖片全部播放完畢,按鍵結束,最后完成情緒狀態自我評估表(self-assessment manikin, SAM)。直至四類情緒圖片全部播放完畢。SAM評分表內容包括效價和喚醒度兩組評分。其中,效價代表被試觀看情緒圖片后的沮喪-愉悅程度,1~9評分,效價得分越高,愉悅程度越高;喚醒度代表被試觀看圖片后的平靜-興奮程度,1~9評分,喚醒度得分越高,興奮程度越高。評價每類情緒誘導有效方法是,選擇每類情緒圖片的有效評分數量達到此類型情緒圖片數量一半以上時的被試EEG數據。四類情緒圖片播放流程完全相同。
1.3腦電數據采集及預處理實驗在電磁屏蔽實驗室進行,室內隔音良好。確保被試雙眼距呈現圖片的屏幕100 cm,視角為7.85°~8.73°。使用Neuroscan SynAmps 2的64導腦電設備采集并記錄實驗過程中被試產生的EEG信號,按照國際10-20標準安放,電阻控制在5 kΩ以下。EEG數據預處理前,有6名被試情緒誘導無效予以排除,共采用24名被試EEG信號數據。借助MATLAB軟件對EEG信號進行分析,包括去除工頻干擾,降采樣率到128 Hz,帶通濾波濾取1~45 Hz的腦電信號,使用獨立成分分析方法去除偽跡,截取0.5~5.5 s有效數據段。
1.4EEG信號頻域特征提取利用小波包變換[6]將原始信號分解成β、γ頻帶。
1.5時頻域非線性特征提取



1.6基于F-score的特征選擇方法F-score是一種區分類內、類間的可分性評價指標,其本質是選取類內差異小,類間差異大的有效特征[7]。其值越大,則認為一定程度上特征對情緒的分辨能力越強。為了使F-score適用于多分類問題,對公式進行了修改。計算公式如下。
1.6.1F-score算法

去除測量水平眼電的兩個導聯和一個無對稱存在的導聯,64導聯信號剩下61導聯信號,由于每個腦電導聯對應m個特征,故提取的特征數目為61×m維特征。
1.6.2校正后的F-score算法 一般認為,F-score的值越大,標準差越小,則對四種情緒的分類具有越好的特性。但存在標準差極小,平均值較小但反而F-score值極大的極端情況出現,為避免上述假陽性結果的出現,故將F-score值乘以其均值、除以其最小標準差。從而設計出公式:
這樣,對于四分類問題而言,公式計算的結果越大,表明分類性能越好。
1.7SVM分類識別支持向量機(support vector machine, SVM)是由Vapnik等提出的有監督的學習模型,應用于分類、模式識別和回歸分析領域。在解決二分類線性問題的效果較好,但對于非線性問題,常常通過核函數定義的非線性變換將原特征空間中的非線性問題轉化為高維空間中的線性問題,并在高維空間中求分類超平面[8],從而得到較好的分類準確率。
利用F-Score特征提取方法聯合SVM方法,選取最優的特征集合。選取徑向基核函數將輸入測試樣本映射到高維空間中,獲得最優SVM模型。輸入排序靠前的每導聯k個F-score值均值,根據已獲得最優SVM模型進行類別判斷,輸出此特征集合的分類準確率。如果分類準確率提高大于0.2%,認為導聯的加入對分類有突出的效果,則將該導聯加入到有效導聯集合中,最后從分類率排序靠前的特征中篩選有效導聯[7]。為了降低計算的復雜性,對訓練集和測試集的數據進行歸一化操作。基于F-score和SVM的導聯篩選方法見圖2。

圖2 基于F-score算法和SVM相結合的導聯篩選流程圖
1.8統計學處理使用Excel建立數據庫,SPSS 18.0軟件比較F-score算法和校正后的F-score算法,統計學方法使用兩獨立樣本t檢驗,P<0.05為差異有統計學意義。
2.1根據F-score算法篩選EEG信號四類組合特征應用F-score算法與校正后的F-score算法篩選出每個導聯的4個特征組合:β頻帶、γ頻帶、信息熵、微分熵。F-score方法與校正后的F-score算法兩種算法差異無統計學意義(t=0.383,P=0.706)。F-score值越大,標準差越小,則相應特征對四類情緒兩兩之間就越具有較好的分類效果,校正后的F-score算法沒有改變情緒分類率趨勢,同時避免了假陽性結果的出現,為得到最優的導聯集合奠定基礎。見圖3。

圖3 F-score方法與校正后的F-score算法的四分類率比較
2.2根據F-score算法篩選通道數目和分類準確率的折中點校正后的F-score算法對情緒四分類正確率折線見圖4,四類典型情緒的分類率隨導聯數目的增加而增大,當導聯數目達到了13個時,分類率達到了89.648 4%,而全部61導EEG信號分類效果也僅僅達到了90.722 7%,可見,根據校正后的F-score算法得出對情緒四分類正確率貢獻突出的前13個導聯亦基本達到了情緒分類準確率和通道數目的折中點。

圖4 校正后的F-score算法計算分類率
2.3根據校正后的F-score算法篩選與情緒密切相關的最少導聯利用校正后的F-score算法計算得到的5個導聯(FT7、T7、FC4、TP10、O1),情緒二分類率折線圖顯示情緒效價最高達到了94.824 2%。見圖5。

圖5 校正后的F-score算法的二分類率比較
如圖5所示,5個導聯和6個導聯二分類率分別達到了85.74%和87.19%,故根據校正后的F-score算法計算得到的導聯排序靠前的5個導聯分別是FT7、T7、FC4、TP10、O1,6個導聯分別是FT7、T7、FC4、TP10、O1、FP1,導聯分布見圖6 。

圖6 經校正后的F-score算法篩選的最少導聯分布圖
A:5導聯:FT7、T7、FC4、TP10、O1;B:6導聯:FT7、T7、FC4、TP10、O1、FP1
人類腦電變化與情緒的變化之間存在一定的聯系,通過對EEG的分析,可以判斷人類的情緒狀態。人們在情緒識別研究中希望對EEG數據進行實時分析并得到快速反饋。這需要在現有的基礎上找到一組與情緒變化密切相關的EEG特征組合。Bahardwaj et al[9]使用EEG信號的θ、α、β頻帶3個腦電特征,篩選出3個(FP1、P3、O1)導聯,并使用SVM和線性判別分析(linear discriminant analysis, LDA)兩種分類器識別7種情緒狀態,有效分類率分別為74.13%和66.50%。Lee et al[10]使用自適應神經模糊推理系統(ANFIS)識別積極情緒和消極情緒,分類準確率為78.45%。Zheng et al[11]采用微分熵特征,SVM分類器的前提下,設計了4種導聯組合,導聯個數分別為4、6、9、12個。當采用12個電極時情緒識別精度最高為86.65%,比全導(62個電極)的識別精度83.99%還要好。該研究利用校正后的F-score算法篩選腦電信號高頻成分中的β、γ頻帶以及非線性特征微分熵和信息熵特征共4個特征組合。篩選到的非線性特征一定程度上反映了腦電信號的內在規律,即大腦神經元的非線性動力學特性。亦篩選出對情緒四分類正確率貢獻突出的13個導聯,已基本達到了情緒分類準確率和通道數目的折中點,高達89.65%。
研究[12]表明,篩選導聯數目為5個(FP1、T7、PO4、Pz、FP2)時,情緒四分類率達到了52.32%;導聯個數到6個(FT7、FT8、T7、T8、TP7、TP8)時,情緒二分類準確率達到了85.03%[11]。一般認為,情緒分類率達到80%基本達到情緒的高效識別。本研究首次篩選出排序靠前的5個(FT7、T7、FC4、TP10、O1)導聯,二分類準確率達到了85.74%,四分類率也高達到81.152 3%;而篩選導聯數目為6個(FT7、T7、FC4、TP10、O1、FP1)時,二分類率高達87.19%,四分類率也達到83.691 4%。實現以上少數導聯的高分類率不僅在特征選擇方面具有創新性,而且通過加大被試量,嚴格篩選被試,避免個體差異對情緒識別造成的影響,從而為利用少數導聯實現EEG信號快速實時分析提供可能。篩選到的少數導聯分布并不集中,可能與情緒產生過程中大腦不同部位共同參與有關[13]。從生理學角度上說講,枕葉的O1導聯可能與被試觀看情緒圖片過程中的視覺誘發有關。前額葉的FP1導聯可能和情緒調節或者更高級功能活動有關。而導聯左右腦分布大致均勻,可能與大腦左右半球的情緒識別差異分工有關。
F-score算法用于評估每個特征的分辨能力,是一種簡單有效的特征選擇方法,許多研究結合SVM分類算法已被廣泛應用于各個領域的分類問題中[14-15]。比較F-score算法與校正后的F-score算法,雖然兩種算法差異無統計學意義(t=0.383,P=0.706),但為避免假陽性結果的存在,故選擇校正后的F-score算法作為尋找最優導聯集合方法。
利用校正后的F-score算法篩選獲得的EEG信號特征組合和篩選出排序靠前的5個導聯,在情緒分類識別方面,取得了較高的分類準確率,有望為情緒識別提供參考指標。