劉 健 徐 偉 錢 煒
(江蘇科技大學電子信息工程學院 鎮江 212003)
心血管疾病嚴重威脅人類生命健康,其病死率超過其他疾病躍居第一,成為世界最重大的醫學課題之一[1]。受不健康的生活方式影響,以及人口老齡化趨勢不斷提高,中國罹患心血管疾病的人數不斷增加。加強心血管疾病防治工作,及時發現并有效治療變得越來越重要。心電圖是目前檢測心臟疾病最有效的手段,反映了心臟各部位的生理狀況。經過100 多年的發展,目前已累積了海量的ECG 信號數據。如何從大量的ECG 信號中有效學習到具有識別度的特征,提高ECG 信號分類的準確性,成為心電信號分類檢測系統研究的重要課題。由于心電信號是微弱的生物信號,且受個體差異性影響,不同個體的同類信號也有明顯差別,因此,通過人為識別很難正確區分信號。在此基礎上,國內外學者研究了多種方法,通過提取心電信號中具有表征性的特征,對信號進行分類識別。這些方法主要有模糊推斷法、統計法、線性分類法、神經網絡法、支持向量機等[2~6]。但是這些方法需要人為設計特征提取器,不但要求設計者具備豐富的經驗知識,而且會對方法有效性造成較大影響。
近年來,隨著人工智能的火熱發展,深度學習理論被應用于各類領域中。深度學習提供了自動學習深層特征的方法,避免了人為設計對分類效果的影響。目前,應用在心電信號分類識別中的深度學習方法有卷積神經網絡(CNN)、自動降噪編碼器(SDAEs)、CNN 與長短期記憶網絡(LSTM)相結合等[7~10],對信號分類都取得了良好的成果。
本文用受限玻爾茲曼機[11](Restricted Boltzmann Machines,RBM)堆疊構成深度置信網絡(Deep Belief Networks,DBN),利用RBM 的自動學習能力逐步提取信號的深層次特征,對四類心電信號進行分類識別。
圖1為DBN網絡結構圖。從圖中可以看出,一個DBN 網絡由多個RBM 堆疊而成,RBM 是DBN 網絡模型中的基本組成單元。圖中ω為RBM 層間的權值。RBM 訓練時,通過逐層貪婪方法訓練[12],獲得每層RBM 的最優參數。最后用有監督的全局算法,從頂層開始微調整個DBN 網絡的權值參數,使其收斂至全局最優。

圖1 DBN網絡結構圖
DBN模型的具體訓練步驟如下:
1)最底層的原始數據作為輸入向量輸入首層RBM,完成無監督訓練;
2)首層RBM 訓練后提取的特征向量,作為輸入向量,訓練下一層RBM;
3)重復步驟1)和2),直到每層RBM 都訓練完成,獲得頂層RBM的輸出特征,此時得到每層RBM的局部最優參數;
4)利用全局算法(如誤差反向傳播算法),自上而下對每層RBM 進行有監督的微調,逐層調整RBM的權值參數,使其收斂至全局最優。
DBN 模型以RBM 為基本組成模塊,解決了傳統方法中的梯度彌散和陷入局部最優的問題。
圖2 為RBM 結構圖,v表示可見層,h 表示隱藏層,層間全連接,層內無連接。對于一個給定的狀態(v,h),RBM的能量函數定義為

圖2 RBM模型結構圖

其中θ={Wij,bi,cj}代表RBM 模型中的參數,bi和cj為各層偏置,Wij表示層間的權值矩陣。(v,h)的聯合概率分布為

這里Z(θ)是歸一化因子。
當確定了可見層狀態,則隱藏層中神經元的激活狀態概率為

其中σ(x)=1/(1+e-x),為sigmod函數。
同理:

基于深度置信網絡的心電信號分類具體流程圖如圖3。

圖3 實驗流程圖
需要分類的心電信號傳輸至深度置信網絡,通過各層RBM 的訓練尋找參數θ的最優值,并自動提取信號的深層次特征,將提取到的特征送入分類器中實現分類。為了提高分類效果,對整體網絡進行權值微調,用微調后的網絡實現最終分類。
2.2.1 網絡預訓練
RBM訓練時,給定訓練樣本S={v1,v2,…,vns},ns為訓練樣本的數目,對數似然估計表示為

由函數lnx的嚴格單調性可知,最大化Lθ,S等價于最大化lnLθ,S:

采用梯度上升法[13],通過迭代的方式逐步逼近lnLθ,S的最大值,迭代公式為

其中η為學習率。從公式中可以看出,最重要的是是梯度的計算。其對各參數偏導為

為了保證算法的時效性,通常采用對比散度[14](Contrastive Divergence,CD)的快速學習算法訓練RBM。訓練后各參數梯度為

ε為學習率,·recon為一步重構后的模型分布。求出梯度后對各參數更新,調整參數θ。
參數更新準則為

公式中ξ為動量學習率。
為了確定合適參數,用模擬退火算法[15]對學習率和網絡結構參數進行尋優,以隱藏層節點數、訓練的學習率預測得到的誤差作為目標函數對模型進行訓練。
2.2.2 網絡權值微調
DBN 網絡中,RBM 只充當特征提取器,提取信號的深層次特征。在信號分類時,需要用分類器進行分類。本文選用Softmax 分類器,將RBM 提取的特征送至分類器中,結合類別標簽,利用假設函數計算出特征屬于每個類別的概率,完成分類任務[16]。其結構如圖4所示。

圖4 Softmax分類器結構圖
為了提高網絡分類性能,采用反向傳播法自上而下對網絡權值進行微調,最小化代價函數[17]:

函數1{y(i)=j} 的功能是:若表達式y(i)=j為真,則1{y(i)=j} 取1,否則取0。函數項為歸一化概率,使各類概率和為1,λ>0。
本文采用MIT-BIH(Massachusetts Institute of Technology and Beth Israel Hospital Arrhythmia Database)數據庫作為研究的心電信號數據來源。該數據庫包含48 條雙導聯的心電信號記錄,其中23 條記錄可作為常規臨床代表性數據,另外25 條記錄包含了多種罕見的重要臨床記錄。本文則對其中的正常心拍、室性早搏、房性早搏和起搏心電信號進行分類,信號波形如圖5 所示。選取其中具有代表性的22條記錄構成數據集,一共30721個心拍樣本。訓練集共20480 個樣本,測試集共10241 個樣本。四類心拍樣本分布如表1所示。

表1 心拍類型分布

圖5 四類心電信號心電圖
對DBN 網絡參數進行尋優時,退火模擬算法以預測相對誤差為目標函數進行尋優。從圖6 中可以看出,當迭代次數為13 時,誤差由0.1085 下降到0.0824;當迭代次數為15時,誤差下降到0.0337,此后誤差不再變化。

圖6 模擬退火算法參數尋優圖
此時DBN初始化參數如表2。

表2 DBN初始化參數
DBN 訓練時,逐層訓練RBM,學習信號的深層次特征。
圖7為DBN特征提取圖,縱向從上到下為四類心電信號特征,橫向1、2、3、4分別代表N、V、A、P四種信號。從圖中可以看出,第一層RBM 提取的特征中,四類信號的特征有所區別,但不太明顯。因為首層RBM提取的是信號的淺層特征。隨著RBM層數的增加,所提取到的不同信號深層次特征區別越大,說明信號的深層次特征更具有代表性,能讓分類效果更加明顯。

圖7 DBN特征提取圖
本文用混淆矩陣對心電信號分類結果進行統計,使用敏感度(Sensitivity,Se)、正檢測率(Positivie Predictivity,Pp)、特異性(Specificity,Sp)和整體精度(Overall Accuracy,OA)四個統計參數對心拍分類結果進行評價,定義如下:

這里TP 為真陽性,表示指定樣本被正確分類的數目;TN 為真陰性,表示非指定樣本被預測為非指定樣本的數目;FP 為假陽性,表示非指定樣本被預測為指定樣本的數目;FN為假陰性,表示指定樣本被預測為非指定樣本的數目。
由混淆矩陣可以看出,5808 個正常節律心拍正確識別5764 個,1432 個室性早搏心拍正確識別1402個,658個房性早搏心拍正確識別641個,2343個起搏心拍正確識別2308 個,整體分類準確率為98.8%。
表4 為心拍分類統計結果,從敏感度、正檢率、特異性三個不同的角度出發,都反映了算法對疾病的識別效果。三者的值越高代表分類準確率越高。由表4 可以看出,起搏心拍的敏感度、正檢率和特異性都在99%以上,其他三種心拍的統計結果基本也都在98%以上,說明本文提出的方法具有較好的分類效果。

表4 心拍分類統計結果
權值微調階段是為了提高網絡的分類性能。為了說明權值微調的有效性,將網絡微調前后的統計結果進行對比。
對比表3 和表5 可以看出,微調后各類信號樣本的識別個數都有所增加,微調前整體分類準確率為97.8%,說明了權值微調對網絡分類性能有所提高。

表3 分類結果混淆矩陣

表5 DBN權值微調前分類結果混淆矩陣
表6為微調前心拍分類統計結果。對比表4和表6,微調后各類信號的統計參數基本都有所提高。其中信號特異性變化不大,變化最大的是房性早搏的敏感度,提升了1.2%。對比結果進一步說明權值微調提高了網絡的總體分類性能。

表6 權值微調前心拍分類統計結果
為了進一步體現本文方法的性能,將本文方法與傳統的心電信號分類方法和基于深度學習的心電信號分類方法進行對比,對比結果如表7。

表7 心拍分類算法對比
由分類方法精度對比可知,對比其他幾種分類方法,本文方法的整體精度最高。對比結果表明,深度置信網絡應用在心電信號的分類問題中,有良好的分類效果。
本文中構建了三層深度置信網絡,選取MIT-BIH 數據庫中4 種常見的心電信號共22 條記錄號進行分類識別。利用深度置信網絡的無監督的深層次特征自動學習能力,提取心電信號的深層次特征,對信號進行分類識別。在構建網絡結構時對網絡初始參數進行尋優,降低了隨機設置參數對網絡性能的影響,最終對4 類心電信號的識別準確率達到98.8%。對比常用的心電信號分類算法,深度置信網絡的分類準確率更高,在未來的心電疾病診斷中會有較好的應用前景。