王旭文
(南京郵電大學 通信與信息工程學院,江蘇 南京 210003)
?
基于多變量符號轉移熵的心電信號研究
王旭文
(南京郵電大學 通信與信息工程學院,江蘇 南京 210003)
復雜度理論已成為研究生理電信號的熱點,而符號轉移熵是一種反映系統混亂程度的非線性指標。文章在原有多變量轉移熵的基礎上提出了多變量符號轉移熵,對傳統時間序列靜態劃分方法做出了改進,即將時間序列使用動態自適應分割的方式進行符號化。應用該算法對正常人和冠心病患者的心電信號進行分析,在實驗中選取最佳的導聯對,結果表明該算法能夠顯著區分正常人和冠心病患者,對原始心電時間序列疊加上高斯噪聲后依然可靠有效。
生理電信號;多變量符號轉移熵;動態自適應分割
人體最重要的生理信號就是電信號,電信號會隨著時間的變化而產生瞬時的變化,這是因為人體的生理狀態和病理狀態是不同的。符號轉移熵作為一個生理電信號特征,在生理電活動信號的特征提取與分析中發揮了越來越重要的作用[1]。
從臨床醫學方面來說,心電信號是心臟電活動體表的綜合反映,因此,臨床心電圖檢驗對于檢測和診斷心臟疾病有著十分重要的意義,并且對生命信息科學也有著十分重要的研究價值。
本文首先提出多變量符號轉移熵算法,該算法主要用來分析心電信號的多變量符號轉移熵值,采用自適應動態化方法劃分時間序列[2]。然后通過正常人與冠心病患者的心電數據對比,傳統算法與所提算法對比,以及疊加與不疊加高斯噪聲對比,表明所提算法具有良好性能[3]。
1.1 多變量轉移熵

1.2 原始序列符號化
符號動力學是研究符號動力系統的一種復雜抽象的數學理論。在符號動力學系統中,系統的狀態可以表示成有限個抽象符號的無窮序列。
符號時間序列分析方法是指把原始的時間序列轉化成由若干個符號組成的時間序列,然后進行分析的一種“粗略”方法[4]。在把原始時間序列符號化的進程中,時間序列會不可避免地失去一部分細節信息。盡管失去了一部分的細節信息,原始時間序列的動力學特征還是保存了下來。在計算中使用符號化后的符號序列來代替原始的時間序列,會極大地提高計算數值的速度。
對原始時間序列進行符號化分析的過程中,最關鍵的是采取什么樣的方式來對原始時間序列的值劃分相應的符號區域,然后把原始時間序列轉化成符號序列,有些符號動力學分析方法首先采用靜態范圍來劃分符號區域,然后再進行符號的轉化。

1.3 改進的多變量符號轉移熵
在過去的20年,許多傳統的算法都可以用來估計時間序列的復雜性,如維度和Lyapunov指數等。這些算法雖然都能夠正確地估計復雜性,但是它們通常都需要很長的數據集來統計結果,不便于在臨床上研究和應用。
使用動態自適應的方法來劃分原始時間序列能夠更精確地捕捉時間序列中的動力學特征。動態自適應劃分方法如下:
對于一個N點的時間序列u:u={u(i):1≤i≤N}。對于時間序列u(i),在時間序列中嵌入m維相空間:
X(i)=[u(i),u(i+L),…,u(i+(m-1)L)]
(1)
其中m是嵌入維數,L是時間延遲。當時間延遲L選取為1時,m維向量的個數是N-m+1。對于任意一個m維向量,基本尺度BS是通過m維向量相鄰兩點之間差值的均方根計算的:
(2)

(3)


圖1 序列符號化示意圖
改進的多變量符號轉移熵是指原始時間序列使用動態自適應進行劃分,然后對符號化后的序列,利用多變量符號轉移熵進行分析[6]。
2.1 實驗數據
使用從醫院臨床診斷中采集得到的正常人與冠心病患者的原始心電信號的時間序列。該庫中記錄了包括12個導聯信號(Ⅰ,Ⅱ,Ⅲ,aVR,aVL,aVF,V1,V2,V3,V4,V5,V6)的多參數腦電數據,該信號的記錄長度均大于1 min,采樣周期為512 Hz。
從正常人的心電數據和冠心病患者的心電數據中分別隨機選取20個人的心電數據。選用的數據是分別從正常人心電和冠心病患者心電數據中取aVL、aVF、I 3個導聯信號,即在已知I的條件下,計算aVL→aVF的多變量符號轉移熵(由實驗證實,aVL、aVF、I導聯具有較好的區分度,故選擇aVL、aVF、I導聯作為研究對象)。將這兩組數據分別記為樣本“正常”及樣本“冠心”。
2.2 實驗方法
首先讀取各組原始數據中有效的心電時間序列,對原始心電數據進行符號化處理,然后對符號化后的時間序列計算其多變量符號轉移熵值,對計算出來的結果使用SPSS統計分析軟件進行顯著性查驗來驗證該算法的有效性[7]。
2.3 實驗結果與分析
從“正?!迸c“冠心”樣本中對每個個體的腦電信號序列每隔一個周期取一個點,取出全部的心電時間序列。對已經取出的心電時間序列,取長度為L=160的原始心電時間序列來計算心電數據的多變量符號熵。
對每個時間原始序列作符號化處理,計算每組時間序列長度為160的多變量符號轉移熵值,并把計算的每個個體中的各個多變量符號轉移熵值取平均作為這個個體最終的符號轉移熵值。最后對這20個正常人和20個冠心病患者的多變量符號轉移熵值進行平均,得到轉移熵值。結果如圖2所示。

圖2 不同導聯組下多變量符號轉移熵值比較
由圖2知正常人和冠心病患者在不同的導聯組下心電信號的多變量符號轉移熵的結果比較(橫軸坐標表示的含義是:1—Ⅲ-> aVR |I, 2—aVL ->aVF|I, 3—V1-> V2|I, 4—V3-> V4|I, 5—V5-> V6|I)。在5組導聯信號中,計算正常人與冠心病患者心電信號的多變量符號轉移熵中導聯aVL和導聯aVF在導聯I條件下多變量符號轉移熵值的差值最大,由此可見信號區分度最好,所以取aVL和aVF以及I導聯組數據作為分析對象。
對正常人與冠心病患者的心電信號的多變量符號轉移熵值進行基本研究后,根據平均值與方差繪制成圖,如圖3所示。

圖3 正常人和冠心病患者多變量符號轉移熵比較
使用SPSS統計分析軟件對提出的算法的準確性及有效性進行進一步驗證,將計算結果進行獨立T檢驗分析[8]。結果如表1所示。
表1 正常人和冠心病患者改進多變量符號
轉移熵顯著性差異

Leven方差相等性檢驗均值相等的t檢驗F顯著性tdfSig.(雙側)平均差假設方差相等1.6110.2123.163380.0034.5834假設方差不等3.16336.5600.0034.5834
由表1可知,t=3.163,Sig=0.003<0.05, 這說明正常人與冠心病患者心電信號的多變量符號轉移熵的差異性非常顯著,該算法可以有效地區分正常人與冠心病患者。
對樣本“正?!焙汀肮谛摹钡男碾姅祿捎脗鹘y符號化計算的多變量符號轉移熵和改進的多變量符號轉移熵比較,分析對比結果如圖4所示。

圖4 傳統與改進多變量符號轉移熵值比較
圖4表明無論是正常人還是冠心病患者,改進算法的熵值均大于傳統算法的熵值,而且可以有效區分正常人和冠心病患者,說明改進的多變量符號轉移熵在心電信號上優于傳統的多變量符號轉移熵。
對原始的心電時間序列疊加上高斯白噪聲后[9],使用改進多變量符號轉移熵算法計算正常人及冠心病患者心電信號的多變量符號轉移熵值,與未疊加高斯噪聲的多變量符號轉移熵值對比,結果如圖5所示。

圖5 改進多變量符號轉移熵算法健壯性分析
由圖5可知,疊加上高斯白噪聲后正常人及冠心病患者的多變量符號轉移熵值并沒有太大的變化,這說明改進的多變量符號轉移熵算法穩健性高。
本文提出的多變量符號轉移熵算法,目的是為了計算電信號原始時間序列的多變量符號轉移熵值,來區分正常人及患者。應用多變量符號轉移熵在心電信號上,能實現預想的效果,對心電信號的研究及臨床輔助診斷都有很大的幫助。
但是,該算法還有很多的不足和改進空間。一方面,多變量符號轉移熵可以應用在更廣泛的生理信號領域,比如腦電信號;另一方面,理論研究還需要與實際臨床醫學疾病的診斷和醫治進行更為密切的結合,進一步提高算法和研究的實際應用價值及可操作性。
[1] 王俊. ECG 信號的非線性特性研究[D].南京:南京大學, 2005.
[2] WESSEL N, ZIEHMANN C, KURTHS J, et al. Short-term forecasting of life-threatening cardiac arrhythmias based on symbolic dynamics and finite-time growth rates[J]. Physical Review E Statistical Physics Plasmas Fluids & Related Interdisciplinary Topics, 2000, 61(1):733-741.
[3] 宋愛玲, 黃曉林, 司峻峰,等. 符號動力學在心率變異性分析中的參數選擇[J]. 物理學報,2011,60(2):120-127.
[4] 曹雪虹,張宗橙.信息論與編碼[M].北京:清華大學出版社,2004.
[5] 井曉茹.基于符號轉移熵和平均能量耗散的睡眠分期分析[D].南京:南京郵電大學,2012.
[6] FERNANDO L D S.EEG and MEG:relevance to neuroscience[J]. Neuron, 2013, 80(5):1112-1128.
[7] FEIGE B, VODERHOLZER U, RIEMANN D, et al. Independent sleep EEG slow-wave and spindle band dynamics associated with 4 weeks of continuous application of short-half-life hypnotics in healthy subjects[J]. Scandinavian Journal of Public Health, 1999, 110(11):1965-1974.
[8] 陳志云, 袁華萍, 李敬紅,等. 動態心電圖學在現代診療中的進展[J]. 中國醫學文摘:內科學, 2004(1):100-101.
[9] 陳天華, 韓力群, 鄭彧. 心電信號噪聲的數字濾波研究[J]. 微計算機信息, 2008,24(18):252-254.
王旭文(1992 -),女,碩士,主要研究方向:通信與信號處理。
Research on physiological signals based on multivariable symbols transition entropy
Wang Xuwen
(College of Communication & Information Engineering, Nanjing University of Posts & Telecommunications, Nanjing 210003, China)
Using complexity theory to study the physiological signals has become a hot spot.The symbolic transfer entropy is a nonlinear system indicator to reflect the degree of chaos, which can be used as a characteristic of physiological signals.The paper adopts multivariable symbols transition entropy based on the multivariable transfer entropy,to improve traditional time series static partition method using dynamic adaptive segmentation.Using this algorithm to analysis the ECG of people both normal and coronary heart disease patients. In the experiment by selecting the best lead pair to determine the improved algorithm can significantly distinguish between normal subjects and patients with coronary heart disease.And the original sequence is superimposed on the gauss noise result that the algorithm is still reliable and effective.
physiological signals ; multivariable symbols transition entropy;dynamic adaptive segmentation
TN911.23
A
10.19358/j.issn.1674- 7720.2016.23.017
王旭文. 基于多變量符號轉移熵的心電信號研究[J].微型機與應用,2016,35(23):59-61,68.
2016-08-04)