朱曉軍,呂士欽,王延菲,余雪麗
(太原理工大學a.計算機科學與技術學院;b.數學學院,太原 030024)
腦電信號(Electroencephalograph,EEG)是腦神經細胞傳導信息時在大腦皮層或頭皮表面的總體電位反映[1],自1932年 Dietch[2]首先采用傅立葉變換對腦電信號進行分析之后,在該領域相繼產生了時域分析、頻域分析和時頻分析等方法。時域分析方法主要基于信號的幅值、方差、均值等參數,而頻域分析方法主要基于各頻段功率、相干等,時頻分析則綜合考慮了時間域和頻率域兩個方面的特性,來闡述EEG信號的頻率隨著時間變化的關系。近幾年來,隨著信號處理技術和計算機技術的發展,神經網絡分析、混沌分析[3]、非線性時間序列分析[4]等新方法被應用到了EEG的信號處理中,但是這些方法還在探索研究中,還不成熟,有的使用起來過于復雜,衡量的指標具有一定的不確定性。
2005年,Jonathan S.Smith在處理腦電信號時,提出了一種新的時頻分析方法——局域均值分解[5](Local mean decomposition,LMD),并且取得了一定的成功。該方法從提出到至今,經過幾年的發展,取得很大進展。但是該方法在應用時會存在端點效應問題[6],使得信號產生畸變,分解過程中可能會造成信號兩端端點發散,導致信號在重構時丟失部分原有的特征。鑒于此,為了降低這種端點效應的影響,提高腦電信號的特征提取效果,本文提出了一種基于相似波形加權匹配的端點延拓算法。該算法主要利用在一段波形中相似子波會反復出現這一特點,提取與端點處波段相似的子波,求得其加權平均波,并利用得到的平均波對原始信號的左右端點進行延拓。該方法綜合考慮了信號的內在規律及其在端點處的變化趨勢,使得延拓出的波形在端點處更加符合原始信號的自然發展趨勢。仿真實驗的結果表明,與傳統的LMD方法分解相比,該算法能夠有效抑制傳統LMD的端點效應的影響,使得分解得到的分量特征更加明顯。
腦電信號幅度非常微弱,頻率范圍一般為0.5~50Hz,頭皮腦電信號只有50μV左右,超過±100μV的就可以看作是噪聲,而且腦電信號作為一種非平穩信號,其統計量是隨時間變化的,在對腦電信號處理的過程中會需要提取出信號的時域、頻域的局部特征信息。腦電信號含有多種頻率成分,按頻率的高低可以分為δ波(0.5~3.5Hz)、θ波(4~7Hz)、α波(8~13Hz)、β波(14~30Hz)、γ波(30 Hz以上),這些成分在生理學和病理學上具有特定意義。α,β波屬于快波,成年人清醒閉眼時,會出現明顯的α波,睜開眼時α波減少,β波會增加。δ,θ波是慢波,成年人疲勞困倦時,其成分會增加。
LMD方法可以自適應地將一個復雜多分量的腦電信號從高頻到低頻逐級分解,得到一系列有物理意義的乘積函數(Product function,PF)的組合,這些PF函數是單分量信號,包含了原腦電信號的頻幅信息。LMD的分解步驟具體如下[7-8]幾點。
1)找出信號x(t)中所有的局部極值點ni,利用ni分別計算出局部均值mi及局部包絡值ai,計算公式分別如下:

其中,i=1,2,….
2)用滑動平均法對mi和ai分別進行平滑處理,得到局部均值曲線m11(t)和局部包絡曲線a11(t)。
3)從原始信號中分離出m11(t),再用所得結果除以a11(t),得到調頻信號s11(t),即:

判斷所得s11(t)是否為純調頻信號,如果不是,則將s11(t)作為新的原始信號重復步驟1)~3),循環n次,直到s1n(t)為純調頻信號,即它的包絡估計函數a1(n+1)(t)=1。
4)將以上迭代過程中產生的所有包絡估計函數作乘積,得到包絡信號a1(t),即:

5)將式(4)得到的包絡信號a1(t)與純調頻信號s1n(t)作乘積,便可得到原始信號的第一個F分量:

6)從原始信號中將F1(t)分離出來,得到信號u1(t),將u1(t)作為新的原始信號重復步驟1)~5),循環k次,直至uk(t)為一個單調函數。至此,原始信號x(t)被分解成為一系列F分量和一個單調函數uk(t)之和,即:

可以明顯看出,LMD分解是完備的,沒有造成原始信號的信息丟失。
在實際的腦電信號中,對于端點以外的信號波動趨勢無法得到精準的衡量,端點附近的包絡估計函數的值只能由已知的數據來進行預測,這樣勢必會存在一定大小的誤差。因此,局域均值分解方法也存在端點效應的問題。為了有效抑制LMD的端點飛翼,筆者提出了一種相似波形加權平均的方法對信號的端點進行延拓,該方法綜合考慮了信號的內在規律及其在端點處的發展趨勢,通過仿真實驗來驗證了該方法是非常有效的。
LMD方法與EMD(經驗模態分解)方法類似,在分解過程都會存在著端點效應,因此都需要對信號的端點處進行處理。針對EMD方法的端點效應已經提出了很多改進的辦法,如:三次樣條插值法[9]、神經網絡延拓法、極值點延拓法[10]等,這些方法都取得了一定的效果,但也存在著不足,如:鏡像延拓法在處理短數據時效果較差[11];極值點延拓法只考慮了信號邊緣處的變化趨勢,沒有考慮到信號的內在規律[12]等。根據EMD改進辦法的經驗與不足,結合LMD產生端點效應的原因,筆者提出一種相似波形加權平均的端點延拓法來改善其端點效應的影響。
在詳細描述算法之前,先作如下假設,設s1(t),s2(t)為時間軸上長度均為l的兩個信號。取s1(t)上坐標為(t1,s1(t1))的點p1,s2(t)上坐標為(t2,s2(t2))的點p2,且滿足條件t1≠t2,但s1(t1)=s2(t2)。不妨假設t1<t2,將信號s1(t)沿時間軸t向右平移(t2-t1)個單位,使得p1與p2兩點重合,則信號s1(t)與信號s2(t)針對點p1(或點p2)的波形匹配度m可以定義為:

由上式可以看出,信號s1(t)與s2(t)的匹配度越高,m的值就越小。
根據信號分析理論可知,相似的波形在信號中會反復出現,因此可以根據這一規律,先找到這些與端點處波形相似的子波,然后對其進行加權求平均得到一個平均波,再用該平均波對信號的端點進行延拓。下面以左端點為例,詳細介紹本文提出的算法,設原始信號為x(t):
1)以信號的左端點x(t0)為起點,向右取x(t)的部分曲線段,設該曲線段為w(t),其中w(t)需包含且僅包含一個極值點(極大值或極小值均可)和一個過零點。
2)設曲線段w(t)的右端點是一個過零點,將其記為x(tn)。取w(t)的中間點x(tm),其中tm=(t0+tn)/2。以x(tm)為參考點,沿著時間軸t向右平移子波w(t),當出現信號x(t)上某一點x(ti)與x(tm)重合時,取以點x(ti)為中點且與w(t)等長度的子波,記為wi(t)。計算出wi(t)與w(t)的波形匹配度mi,并存儲該波形匹配度mi與wi(t)的前一小段數據波(取此段波形長度為0.1l),將這些長度為0.1l的左鄰數據波依次記為v1(t),v2(t),…,vk(t),最后得到一個如下的數據對集合:

3)若集合[V,m]為空,說明原始信號波形極不規則,不宜采用此方法,則不對其延拓,轉5)。
4)若集合[V,m]不為空,則按求得的所有波形匹配度的值由小到大進行排序,得到[V',m'],取出[V',m']的前n個數據對,其中n=。計算出這n個數據對中所有子波的加權平均值,得到一個平均波vp,然后用vp對信號的x(t)的左端點進行延拓。
5)延拓結束。
同理對信號x(t)的右端點進行延拓。
為了驗證該延拓算法在腦電信號處理中的有效性,筆者采用了來自美國加州理工學院的一組公開腦電(EEG)信號數據作為對象進行仿真實驗,并且將結果和傳統的LMD分解方法的分解結果做比較。該數據集的受試人為8名癲癇病人,其中4名男性4名女性,平均年齡30.87±15.27(最小的為6歲,最大的為51歲),無其他生理或心理疾病。實驗中,采用國際10~20電極系統,導聯數為64,抽樣頻率為102.4Hz,參考電極置耳垂,數據采樣時間為3min(癲癇發作前1min和發作后的2min),我們取C4導聯處的腦電數據進行分析,帶通濾波范圍為1~50Hz,原始腦電信號波形如圖1所示。

圖1 原始EEG信號
由圖1可以看出,原始EEG信號波形復雜,加大了直接通過腦電圖對監測對象的大腦生理及病理狀態進行診斷的難度。
對本文的腦電數據直接進行傳統的LMD分解,結果如圖2所示。

圖2 傳統的LMD分解的結果
圖2中,原始腦電信號被分解成7個PF分量和一個殘余量。在此過程中,原始腦電信號經過56次迭代得到第一個分量PF1,將PF1從原信號分離出來,再經過62次迭代得到第二個分量PF2,以此類推,不斷進行分離,不斷迭代,直到得到殘余分量Res為止。由于端點效應的存在,可以看出,PF7和殘余量Res的幅值在邊緣出現了明顯的發散現象,這說明分解受到了端點效應的影響。
用筆者提出的方法對原始腦電信號先端點延拓后再進行LMD分解,得到的分解結果如圖3所示。

圖3 端點延拓后的LMD分解結果
在圖3中,對原始腦電信號經過端點延拓后的LMD分解,得到6個PF分量和一個殘余分量。我們設置的迭代終止條件為1-δ≤a1n(t)≤1+δ,其中δ=0.001,經過24次迭代得到第一個分量PF1,把PF1從原腦電信號中分離出來,再經過28次迭代得到第二個分量PF2,不斷分離,不斷迭代,直到能夠得到殘余分量Res為止。可以看到,該殘余量接近零,從而也說明應用該方法,端點效應得到了抑制。
將通過傳統LMD和延拓端點的LMD分解得到的PF分量和原始的腦電信號做相關性分析,得各相關系數如下表1所示。

表1 兩種LMD方法分解相關度比較
由上表可以看出,對于兩種LMD分解,得到殘余量Res和原信號的相關度都比較小,可以視為偽分量,應予以去除。端點延拓算法得到的相關系數值則更低,說明其和原始信號的相關程度更低,因而說明分解的更加徹底,特征信息更加突出。
針對采用LMD方法處理腦電信號的時候,在分解過程中會產生的端點效應問題,筆者提出了一種基于相似波形加權平均的延拓算法,該算法綜合考慮了腦電信號的內在規律及其在端點處的變化趨勢,使最終獲得的端點處數據更符合原數據自然走向,同時給出了波形匹配度的概念。利用該方法編制的LMD分解程序對腦電信號進行仿真,并且和傳統的不做延拓的LMD分解結果作了比較,仿真結果表明利用該方法延拓分解得到的PF分量在端點處不會發生明顯發散,大大降低端點效應的影響,對分解得到的PF分量和原信號做相關性分析,發現改進后的方法得到的PF分量特征更加明顯。
[1]張小鵬,范影樂,楊勇.基于奇異譜熵的腦電意識任務識別方法的研究[J].計算機工程與科學,2006,31(12):117-120.
[2]Pablo Valenti,Enrique Cazamajou,Marcelo Scarpettini,et al.Automatic detection of interictal spikes using data mining models[J].Journal of Neuroscience Methods,2006,150(1):105-110.
[3]謝景新,程春田,周桂紅,等.基于經驗模式分解與混沌分析的直接多步預測模型[J].自動化學報,2008,34(6):684-689.
[4]楊晉輝,酈萌.安全苛求軟件的安全性混沌分析[J].計算機工程與應用,2005,21:1-3.
[5]Park Cheolsoo,Looney David,Van Hulle Marc M.The complex local mean decomposition [J].Neurocomputing,2011,74(6):867-875.
[6]趙娜.HHT經驗模式分解的周期延拓方法[J].計算機仿真,2008,25(12):346-350.
[7]Chen Baojia,Chen Xuefeng,He Zhengjia.Mechanical Fault Diagnosis Based on Local Mean Decomposition Method[J].International conference on measuring technology and mechatronics automation,2009,1:681-684.
[8]Wang Yanxue,He Zhengjia,Zi Yanyang.A Comparative Study on the Local Mean Decomposition and Empirical Mode Decomposition and Their Applications to Rotating Machinery Health Diagnosis[J].Journal of vibration and acoustics-transactions of the asme,2009,132(2):10-21.
[9]樊志平,張歌凌.EMD中包絡算法改進的研究與分析[J].計算機仿真,2010,27(6):126-129.
[10]林麗,周霆,余輪.EMD算法中邊界效應處理技術[J].計算機工程,2009,35(23):265-268.
[11]寧靜,諸昌鈐,高品賢,等.EMD分解中端點數據的延長方法問題研究[J].計算機工程與應用,2011,47(3):125-128.
[12]許寶杰,張建民,徐小力,等.抑制EMD端點效應方法的研究[J].北京理工大學學報,2006,26(3):196-200.