陸苗,鄒俊忠,張見,肖姝源,衛作臣
(華東理工大學,上海 200237)
情感識別的關鍵是從腦電信號中提取有效的情感特征,提高分類準確率。腦電信號是一種非平穩非線性隨機信號,分析這類信號的基本方法有時域、頻域和時頻分析,由于信號的時域和頻域之間相互關聯,因此,時頻分析方法會更準確。經驗模態(EMD)分解是一種自適應信號時頻分析方法,在處理腦電信號這一類非平穩非線性隨機信號上具有明顯的優勢。
目前,EMD算法在國內外腦電信號處理研究中的應用非常廣泛。季忠利將EMD算法應用到腦電信號病理研究中,得到腦信號各個頻帶的強度值,準確判定了腦電信號節律特征[1]。沈學麗將HHT和小波包變換結合起來,應用到睡眠腦電信號分期研究中[2],細化了睡眠分期的過程。李淑芳等人從癲癇腦電中提取IMF分量的能量值、幅值和波動指作為特征[3],提高了癲癇腦電的識別正確率。李陽等人用希爾伯特-黃變換提取了不同節律的能量作為特征,在運動想象腦電信號的識別中取得了良好的效果[4]。Ranjit等學者將EMD分解應用到眼電信號的變化研究中,計算眼電信號的各個IMF分量的希爾伯特加權頻率,作為脊柱損傷者眼電信號的特征,并同健康者的眼電變化進行了對比研究[5]。
另外,分析國內外學者的研究成果發現,EMD方法在運動想象腦電、病理腦電信號以及眼電信號的特征提取研究中應用的比較多,但是在情感腦電中的應用還顯得不足,因此,將EMD用于情感識別的研究很有必要。
研究對象為年齡在23到25歲的華東理工大學研究生,要求每個被試者均身心健康、無心臟病、腦損傷和精神類疾病病史,被試者可自愿選擇是否參與試驗。
采集信號之前需要注意:準備環境安靜的實驗場所,防止腦電信號中混入過多外界干擾;被試者要保證良好的精神狀態,不能劇烈運動或飲用含有咖啡因的飲料;提前告知被試者實驗方法和目的;實驗前要將頭皮洗凈,避免過多的頭皮阻抗給采集帶來干擾。首先讓被試者處于安靜閉眼的狀態下采集一組信號,作為對照組,然后通過音樂播放器對20個音樂片段進行播放,前10個片段誘發被試者的愉悅情緒,后10個片段誘發被試者的悲傷情緒,每段音樂播放完畢后,有120 s的過渡時間使之平靜,并讓被試者填寫情感狀態自我評估表,120 s后播放器自動播放下一段音樂。信號的采樣頻率為128 Hz,數據長度為50 min,將采集的腦電信號數據存儲為matlab能夠識別的格式。
EMD分解的基礎是采集到的數據自身的局部特性,具有很強的自適應性。
對信號進行EMD分解后將獲得若干個頻率范圍不同的由高頻到低頻排列的IMF函數序列,這些IMF函數必須滿足下面兩個條件:
a. 在采樣信號的整個過程內,信號的局部極值點的數目和過零點數目相等或最多相差1;
b. 任意時刻,由局部極大值構成的上包絡線和由局部極小值構成的下包絡線關于時間軸局部對稱。
EMD分解的過程描述如下:
(1) 找到原始信號x(t)的全部局部最大值和局部最小值,用插值算法獲得上下包絡線,然后求得上下包絡線的均值m,定義h=x(t)-m。
(2) 判定h(t) 是否滿足IMF分解終止條件,若不滿足,則令x(t)=h,執行第一步;若滿足,執行下一步。
(3) 令ci(t)=h,表示分解得到的第i個IMF分量,并令ri(t)=ri-ci。
(4) 判斷是否滿足IMF分解終止條件,如果滿足就進行下一步;如不滿足,則令x(t)=ri,回到第一步,i=i+1 。
(5) 分解終止,最終原始信號被分解成n個固有模態分量c1,c2,…,cn和一個殘差rn,即:

(1)
由EMD分解原理和步驟可知,上下包絡線是通過對信號的局部極大值和局部極小值進行三次樣條插值擬合曲線得到的,然后根據上下包絡線求平均。那么在端點處就會出現一個問題,我們不能保證數據在端點處恰好是極大值點或極小值點,那么在進行三次樣條插值的時候很有可能產生擬合誤差,這種缺陷叫做“端點效應”。以周期諧波函數X為例,假設:
X=sin(2πt)+cos(4πt)+0.8cos(10πt)
(2)
X為三個正余弦函數疊加而成,頻率分別為1、2和5 Hz,周期為1 s。圖1為此信號EMD分解求取的上下包絡線和均值,從圖中可以看出信號在左端點處并沒有被確定為極值點,因此,當用三次樣條插值進行數據擬合時,信號的上包絡線和實際的曲線產生了明顯的誤差,由于每一次的迭代會用到上一步獲得的均值,那么每次均值的誤差被積累到下一次,這樣的逐次誤差積累給信號的分解會造成極大影響,嚴重的可能使信號分解失去意義。
因此,需要消除這一缺陷或者減少端點效應對信號分解的影響。在傳統的EMD分解算法中,通常使用三次樣條插值算法對信號的極大值點和極小值點進行擬合,但是在端點處,三次樣條插值算法的平滑性不足,會造成過沖現象,那么可以考慮使用平滑度更高的冪函數插值,使用分段冪函數插值算法能夠對端點處進行平滑處理,從而抑制端點效應的影響。圖2為傳統EMD方法的分解結果,圖3為改進的EMD方法的分解結果,對比圖2和圖3可以看出,改進后的EMD方法的分解結果更加精細。

圖1 端點效應實例圖

圖2 傳統EMD分解效果

圖3 改進EMD分解效果
為驗證改進后的EMD算法具有更高的精度,這里引入相關系數來描述實際分解結果與理想分解結果的相似程度,定義信號x(n)和y(n)的相關系數為:
(3)
當x(n)=y(n),即兩個信號完全相等時,ρxy=l;當x(n)和y(n)完全不相關時,ρxy=0;當x(n)和y(n)之間有某種關系時,|ρxy|的數值在0和1之間表示兩者的相關程度。表1為原始的EMD算法和改進算法求得的IMF分量與理想IMF分量的相關系數。
從表1中可以看出,對傳統EMD算法改進之后,相關系數的數值得到明顯的提高,說明通過改進的EMD算法的分解結果更加精確。

表1 原始算法與改進算法的相關系數
根據EMD分解流程,對實驗采集到的三類情感腦電信號進行n階分解,獲得n個IMF分量和殘余項。這里對腦電信號樣本數據進行8階EMD分解,圖4所示從左到右分別為平靜、悲傷、愉悅三種情感狀態腦電信號的前4階IMF分量。
從圖4中可以看出,不同類別的腦電信號含有的頻率成分不同,且所含頻率的高低和階數成正比,從幅度上看,同階的IMF分量的幅度的差異很大,平靜時第三階IMF分量幅值較大,悲傷時第二階和第三階IMF分量的幅值較大,愉悅時各個分量幅值基本相同,可以考慮將IMF能量或與IMF能量相關的量作為腦電信號的情感特征。

圖4 三種情感腦電信號EMD分解
“熵”的概念最早出現在熱力學研究中,也叫做“熱熵”,用來表示一個系統中分子狀態的均勻狀況,分子狀態越均勻,熵值越高,當系統中分子分布最均勻時,熵值達到最大。“信息熵”是香農于1948年提出的一個抽象概念,用來描述信源的不確定度,這些概念成功解決了對信息的量化度量的問題。信息熵表征的是某一信息出現的概率,它與熱熵互為負量,當信息廣為傳播時,說明信息出現的概率高,反映的是信息的價值。


(4)
腦電信號處理過程為:首先對原始腦電信號進行預處理,去除眼電心電等偽跡,然后對信號進行經驗模態分解,得到IMF分量,根據能量熵的概念計算 IMF能量熵,從中選取特征向量,通過分類器對三種情感狀態的信號樣本進行分類實驗,最后得到分類結果。
對平靜、悲傷、愉悅三類情感信號進行分類實驗,從每一類信號中選出數據長度為500的共120個樣本,再隨機選出30個作為標準樣本,最后從剩下的樣本中選出45個測試樣本。
實驗中,分別使用傳統EMD算法和改進EMD算法對樣本數據進行8階EMD分解,結合能量熵獲得腦電信號的情感特征,表2為利用傳統EMD算法進行實驗的平均分類準確率,表3為利用改進EMD算法進行實驗的平均分類準確率。
分析表2和表3的結果,發現改進EMD算法后,不管是對標準樣本還是測試樣本,平局分類準確率提高了15%左右,結果表明改進的EMD算法應用到特征提取中能有效地提高分類準確率。

表2 傳統EMD算法平均分類準確率

表3 改進EMD算法平均分類準確率
表4所示為樣本分類結果。

表4 基于IMF能量熵得到的分類結果
從表中可以看出,基于IMF能量熵的情感識別中,對愉悅情感的識別效果最好,對平靜的識別效果稍顯不足,總體平均識別率達到80%以上,說明IMF能量熵用于腦電信號情感識別是有效的。
本研究對腦電信號情感識別的特征提取進行了研究,針對傳統EMD分解中存在的端點效應,選擇了分段冪函數插值代替三次樣條插值,提升了EMD算法的分解精度,將其應用到腦電信號特征提取中取得了較好的效果。
除了IMF能量熵,從信號的IMF分量中還可以提取IMF能量矩、IMF近似熵、IMF幅值等作為特征,結合改進的EMD分解能否取得更好的識別效果仍有待研究。