


摘? 要:動態心電圖,即使用動態心電圖儀監控患者日常生活的24小時或者更長的時間中的心率活動情況所得到的波形圖。動態心電圖在臨床上已由單導、雙導發展為十二導聯全記錄。為了準確預測不同心電圖的心電信息,研究并提出了一種利用改進深度學習網絡,對十二導聯心電信號進行心律失常的自動診斷,考慮到心電信號前后的相關性,提出利用LSTM網絡結合CNN深度學習框架,并融合批歸一化提高模型計算效率和準確性,最終達到很好的效果。
關鍵詞:心電圖;心律失常;長短期記憶;深度學習
Abstract:Dynamic electrocardiogram (Holter),that is,the waveform chart obtained by monitoring the heart rate activity of patients in 24 hours or more in their daily life by using dynamic electrocardiograph. Dynamic electrocardiogram (Holter) has been developed from single lead and double lead to 12-lead full recording. In order to accurately predict the ECG information of different electrocardiograms,an improved deep learning network is proposed to automatically diagnose arrhythmia of 12-lead ECG signals. Considering the correlation between ECG signals,LSTM network combined with CNN deep learning framework is proposed,and batch normalization is integrated to improve the calculation efficiency and accuracy of the model,and finally achieve good results.
Keywords:electrocardiogram;arrhythmia;long-term and short-term memory;deep learning
0? 引? 言
心臟內部的活動會產生的一系列活動在體表會形成不同的電位差,這些電位差被稱為電信號。心電圖儀則是通過將正負兩電極置于人體的任何兩點,再與心電圖儀連接,描記出此人的心電圖(ECG)。
目前國際上通用的動態十二導聯心電圖是對傳統的心電圖進行改進的方法,通過將電極分別置于人體的十二個部位來獲得人體心率活動的情況,描述十二個部位的代號分別為:Ⅰ、Ⅱ、Ⅲ、avR、avL、avF、V1、V2、V3、V4、V5、V6。
醫學上,心電圖的作用在于醫生可以通過它來判斷患者的心臟是否存在病灶。與大多數時間序列類似,手動分析ECG信號的主要問題在于:從業人員難以檢測和分類信號中不同的波形和形態,在診斷過程中既耗時又可能產生差錯[1]。
因此,研究人員想到了利用計算機來對心電圖進行分析、預測,由此判斷患者心臟是否存在病灶。
在以往文獻中多數研究者采用了機器學習的方法對心電圖進行分析[2,3],常規的方法包括支持向量機[4]、決策樹[5]和CNN[6]、LSTM[7]等,同時他們在分析前,采用了小波變換[8]、圖形識別[9]、模板匹配[10]、能量閾值[11]等方法,但這些方法依舊存在缺陷,尚不成熟。
基于北京郵電大學信息網絡中心進行的深度學習實驗課題,本文提出了一種基于十二導聯心電圖的心率失常快速分類方法,筆者為了實現更快捷準確的進行心率判斷,根據心電圖自身的前后依賴特性,以及考慮到數據量大小以及神經網絡的深度,在容易出現過擬合和梯度消失的問題上,將卷積神經網絡和循環神經網絡結合,并引入批歸一化(Batch Normalization,BN)算法,用于解決以上問題。分類器是基于循環神經網絡(RNN)以及卷積神經網絡(CNN)所設計。將十二導聯心電圖的數據作為分類器的輸入,將數據通過LSTM與池化處理,并在原有的基礎上增加了批歸一化層,以診斷結果為輸出,加快模型擬合速度并且提高了模型準確率,使準確率達到99.55%。
1? 方法
1.1? 數據預處理
在信號采集的過程中,由于外界等各種原因,采集到的信號會伴隨有噪音,這些噪音的存在會對最后實驗的結果準確性造成影響,因此為了提高ECG信號的信噪比,進而提高實驗的準確性,在數據輸入神經網絡之前,應先對其進行降噪處理,本文采用小波降噪的方法。如圖1所示,小波降噪后的信號保留了原有信號中的有用數據,在一定程度上消除了部分噪音。
1.2? 長短期記憶人工神經網絡
長短期記憶人工神經網絡(LSTM)是循環神經網絡的變體,是為了解決RNN中存在的長期依賴而設計出的人工神經網絡。與經典RNN有所不同的是,LSTM突破性的引入了門機制和記憶單元,為由于梯度消失和梯度爆炸問題導致的常規RNN網絡在長期依賴問題中的困境提供了解決方法。
LSTM由遺忘門(forget gates)、輸入門(input gates)和輸出門(output gates)三種門結構保存歷史信息,相關公式為:
其中,ft是遺忘門t時刻的狀態值,it是輸入門t時刻的狀態值,W和b分別為對應的權值和偏置,σ為參數,xt是t時刻輸入的數據,Ct是t時刻記憶單元的值, 表示輸入門t時刻記憶單元的候選信息,ot是輸出門t時刻的狀態值,ht是t時刻LSTM的輸出狀態值,其中記憶單元的狀態值是由輸入門和遺忘門共同調節。
1.3? 最大池化
池化(Pooling)是卷積神經網絡中一個重要的部分,用于提取大量高緯度輸入數據的關鍵部分,來縮小模型大小,提高計算速度,同時提高被提取特征的魯棒性。其中最大池化(Max Pooling)為最常見的一種池化操作,將輸入數據根據設定的卷積核劃分為等大的幾個區域,輸出每個區域的最大值,并將這些最大值重新組合成為一個新的數據,池化層(Pooling Layer)可以不斷減小數據大小,在深度學習中有效控制數據量和計算量,從而防止模型過擬合,如圖2所示,為一次簡單的最大池化操作示例,其中使用的為2×2卷積核,每一不同顏色的區域為每次不同的卷積操作區域。
1.4? 批歸一化
批歸一化是谷歌公司在2015年提出的一個深度神經網絡訓練的技巧,把數據分成小批進行隨機梯度下降,并且在每一批數據前向傳遞時,對其進行歸一化處理[13]。該算法不僅加快了深度神經網絡模型收斂的速度,而且在一定程度上緩解了神經網絡中數據分布分散的問題,使得模型更加穩定,提高網絡泛化能力。該算法還可以作為神經網絡中的一層放在激活函數之前,流程主要為:對每一批次的訓練數據計算獲得其均值和方差,并歸一化,最后對處理過的數據進行尺度變換和偏移,使其適應神經網絡。
2? 模型構建
本文使用的是LSTM網絡和CNN結合并引入BN算法的方式,將十二導聯心電圖輸入數據,看作多通道一維數據,因此本文使用的是一維卷積層和一維池化層提取心電信號。
構建模型如圖3所示,輸入層的輸入維度為5 000× 12,由卷積層捕捉數據的大量局部關聯信息,并且使用批歸一化提高計算速度并提高模型魯棒性;由長短期記憶層提取時序特征,并將這兩個特征融合到全連接層,最后通過Softmax層的激活函數進行輸出,加入批歸一層提高計算效率,并降低過擬合可能性。
3? 實驗結果與分析
3.1? 實驗平臺及評價指標
實驗平臺的硬件配置為2.4 GHz Intel Core i5,圖形卡為Intel Iris Plus Graphics 655(顯存1 536 MB),內存32 GB,操作系統為MacOS 10.14.6,模型基于Python語言的Keras框架實現。
在心電圖判斷模型中,一般使用準確率、特異性和靈敏度為指標對模型進行判斷。混淆矩陣就是分別統計模型的歸錯部分和歸對部分的觀測值的個數,將結果反映在一張表格中,混淆矩陣的每一列代表了預測的類別,每一列的總數表示了預測為該類的數目,每一行代表著對應數據的真實類別,每一行的總數表示對應數據為該類的數目。
準確率(Acc)表示對于給定的測試集,模型準確分類的概率;特異性(Spe)表示負例被模型準確預測的概率;靈敏度(Sen)表示正例被模型正確分類的概率。
3.2? 結果分析
圖4中的混淆矩陣表示本文所用模型的判斷結果。
其中這18類分別為竇性心律、竇性心動過緩、竇性心動過速、T波改變、電軸左偏、電軸右偏、竇性心律不齊、右束支傳導阻滯、室性早搏、完全性右束支傳導阻滯、左心室高電壓、房性早搏、ST-T改變、ST段改變、一度房室傳導阻滯、不完全性右束支傳導阻滯、心房顫動、快速心室率。
可以注意到,由于數據樣本數量的不平衡,模型對0、1、11、12的識別能力較好,這幾種類別分別代表竇性心律、竇性心動過緩、房性早搏和ST-T改變。
表2總結了本文所提出的方法和其他文獻中已有的判斷方法的結果,從表中可看出,本文提出方法的數據預測能力更占優勢。
4? 結? 論
傳統學習方法分析心電信息主要分為特征提取以及分類兩部分,其中分類一般采用傳統機器學習方法或者傳統CNN模型,前者為線性方法,容易造成特征的缺失,后者手段單一,并且容易學習效率和準確率都無法達到預期效果,本文采用LSTM與CNN結合,并創造性地引入BN算法的方式,既提高了計算速度,又克服了傳統方法的缺陷,并且模型本身已有特征提取功能,并且很好地提取了數據上下文信息,最終達到的測試結果的準確率為99.55%,特異性為99.81%,靈敏度為98.66%。
本文提出的方法同時具有推廣性和現實價值,適用范圍廣。在之后的研究中,深度學習網絡結構的優化以及與醫療相關知識的學習都需要進一步優化,如在LSTM基礎上添加Attention機制,解決輸入序列較長時最終難以獲得合理的向量表示的問題。
參考文獻:
[1] ANNAM J R,SURAMPUDI B R. AAMI Based ECG Heart-Beat Time-Series Clustering Using Unsupervised ELM and Decision Rule [C]//International Conference on Information Technology.IEEE,2017.
[2] ESMAILI A,KACHUEE M,SHABANY M. Nonlinear Cuffless Blood Pressure Estimation of Healthy Subjects Using Pulse Transit Time and Arrival Time [J].IEEE Transactions on Instrumentation and Measurement,2017,66(12):3299-3308.
[3] DASTJERDI A E,KACHUEE M,SHABANY M. Non-invasive blood pressure estimation using phonocardiogram [C]//IEEE International Symposium on Circuits & Systems.IEEE,2017.
[4] 王金海,史夢穎,張興華.基于EMD和ApEn特征提取的心律失常分類研究 [J].儀器儀表學報,2016,37(S1):168-173.
[5] PECCHIA L,MELILLO P,SANSONE M,et al. Discrimination Power of Short-Term Heart Rate Variability Measures for CHF Assessment [J].IEEE Transactions on Information Technology in Biomedicine,2012,15(1):40-46.
[6] ACHARYA U R,OH S L,HAGIWARA Y,et al. A deep convolutional neural network model to classify heartbeats [J].Computers in Biology and Medicine,2017,89(16):389-396.
[7] KIRANYAZ S,INCE T,HAMILA R,et al. Convolutional Neural Networks for patient-specific ECG classification [C]//Proceedings of the 37th Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC).Milan,Italy:IEEE,2015.
[8] STOJANOVIC R,KARADAGLIC D,MIRKOVI? M,et al. A FPGA system for QRS complex detection based on Integer Wavelet Transform [J].Measurement ence Review,2011,11(4):131-138.
[9] CHRISTOV I,GóMEZ-HERRERO G,KRASTEVA V,et al. Comparative study of morphological and time-frequency ECG descriptors for heartbeat classification [J].Medical Engineering & Physics,2006,28(9):876-887.
[10] NAKAI Y,IZUMI S,NAKANO M,et al. Noise tolerant QRS detection using template matching with short-term autocorrelation [C]//Proceedings of the 36th Annual International Conference of the IEEE Engineering in Medicine and Biology Society.Chicago:IEEE,2014:250-255.
[11] CHOUHAN V S,MEHTA S S. Detection of QRS Complexes in 12-lead ECG using Adaptive Quantized Threshold [J].International Journal of Computer Ence & Network Security,2008(1):155-163.
[13] IOFFE S,SZEGEDY C. Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shift [J/OL].arXiv:1502.03167 [cs.LG].(2015-02-11).https://arxiv.org/abs/1502.03167.
[14] 吳浪,曾超.EMD分解與IIR濾波器在心電信號預處理的應用研究 [J].福建電腦,2015,31(6):97-98.
[15] HANNUN A Y,RAJPURKAR P,HAGHPANAHI M,et al. Cardiologist-level arrhythmia detection and classification in ambulatory electrocardiograms using a deep neural network [J].Nature Medicine,2019,25(1):65-69.
[16] 張異凡,黃亦翔,汪開正,等.用于心律失常識別的LSTM和CNN并行組合模型 [J].哈爾濱工業大學學報,2019,51(10):76-82.
作者簡介:余天效(1996—),女,漢族,湖北襄陽人,碩士研究生,研究方向:機器學習。