基于堆疊分類器的心電異常監測模型設計

2021-03-18 13:45:58

計算機應用 2021年3期

（1.大連大學信息工程學院，遼寧大連 116622；2.大連大學物理科學與技術學院，遼寧大連 116622；3.周口師范學院網絡工程學院，河南周口 466001）

0 引言

心電圖（ElectroCardioGraph，ECG）記錄的數據包含關于心臟活動節奏屬性等重要數據。心電圖包括5 種基本波P、Q、R、S、T，有時也包括U 波。P 波代表心房去極化；T 波代表心室的復極；T 波跟隨著每一個QRS 復合物，通常情況下它與QRS 波有一個穩定的間隔［1］。心律失常是心率或節律的不規則性，在某些情況下，可在受試者的日常生活中偶爾發生。為了捕獲這些不常見的事件，通常使用動態心電圖設備來記錄長期的心電圖數據［2］。心電圖波形檢查有助于各種異常的診斷，是研究心臟病最重要和常用的手段之一。

目前心電監測的方法主要包含以下幾種：人工監測、基于機器學習的監測［3］和基于深度學習的監測［4］。由于人工觀測心電圖的步驟繁瑣，且需要大量的先驗知識做積累，而且很容易忽略心電圖中微小的波動變化從而導致判定出錯。

近年來學者們主要使用機器學習和深度學習的方法來進行心電圖的監測。深度學習方法在圖像檢測的問題上已經取得了較好的效果。Al Rahhal等［5］使用深度神經網絡動態神經網絡（Dynamic Neural Network，DNN）使用堆疊降噪自動編碼器（Stack Denoising AutoEncoder，SDAE）從原始的兩導聯心電圖數據中進行適當的特征表示。Zubair 等［6］使用蜂窩神經網絡（Cellular Neural Network，CNN）對從MIT-BIH［7］數據庫獲得的44 個心電圖信號進行記錄，提取了R 峰的心電圖節拍模式，用于3 層CNN 的訓練，能92.70%準確地將心電圖的搏動分為各自的類別。Kiranyaz 等［8］研究了僅用R 峰波的3 層CNN 心電監護系統。Acharya 等［9］使用9 層的CNN 算法可以對5 種不同的心電心跳類型進行分類，通過對有噪聲的MITBIH數據庫中的數據進行去噪和數據擴增處理，使得5種數據平衡化后檢測的識別率達到92.50%，對數據不平衡的原始數據集進行判定時識別率下降到了89.3%。該方法能減少患者的等待時間，減輕心內科醫生的工作量，降低醫院心電信號處理的成本。Luo 等［10］提出基于時頻表示和特定于患者的心跳分類，通過使用具有1 024 個神經元的一維編碼器和一個softmax 形成的DNN 模型使得心電圖識別識別率達到94.39%，其DNN 模型所需計算量較大，相同數據集下訓練時間約1 h。Mathews 等［11］開發了一個基于CNN 的分類系統，它能自動從兩導聯ECG 數據中學習合適的特征表示，從而消除了手工制作特征的需要，但框架沒有涉及任何QRS 波檢測。在Acharya 等［12］的工作中，由11 層卷積神經網絡處理分段ECG，使用短時程ECG 數據得到最大精度93.18%。Sun 等［13］利用8 682例多導睡眠儀數據集，構建了一個由卷積網絡和長短時記憶網絡組成的5 個深度神經網絡，利用心電圖和呼吸信號訓練深層網絡模型。

深層網絡是“黑匣子”，研究人員不能完全了解深層網絡的內部結構。本文算法相較于深度學習模型在調整超參數更改模型設計時更加簡單。另一方面，醫療數據相對較少很難滿足龐大的深層網絡的需要。本文提出將合成少數過采樣技術（Synthetic Minority Over-sampling TEchnique，SMOTE）對稀缺的心電異常數據做了數據平衡化處理［14］，解決了醫療數據稀缺并且數據的種類不平衡問題，實驗的結果證明平衡化后的數據可大幅減輕數據過擬合問題，提高分類器的性能。

1 模型設計

1.1 系統架構

本文堆疊分類器（Stacking Classifier）系統架構如圖1 所示，通過小波變換得到每個心拍含有的25 個特征系數，從特征提取以后的心拍中隨機取出其中的80%作為算法模型的訓練集，其余的20%數據作為測試集，再通過SMOTE 算法把原始的不平衡數據進行數據擴增以達到每種病例數量持平的效果。

圖1 Stacking Classifier系統架構Fig.1 Architecture of Stacking Classifier system

1.2 心電監測分類模型

堆疊分類器是一種集合學習技術，它是通過元分類器組合多個分類模型［15］。首先，通過完整的訓練集來訓練各個分類模型，再通過集合各個分類模型的輸出而得來的元特征來擬合元分類器。元分類器可以根據預測類標簽或來自集合的概率進行訓練。

算法模型把訓練集的數據分別送入不同的分類模型分類器中，通過多個不同分類器獲得不同的預測結果，再通過元分類器迭代多個預測模型的分類結果，獲得最終的預測結果，過程如圖2所示。

首先把訓練集分成N等份：train1，train2，…，trainN，然后構造一個初級機器學習器，它是由K最近鄰（K-Nearest Neighbors，KNN）分類器、RandomForest 和極端梯度提升（eXtreme Gradient BOOSTing，XGBOOST）分類器三種基模型構成的，依次使用train1，train2，…，trainN作為驗證集，其余N-1份作為訓練集，交叉驗證進行模型訓練；再在測試集上進行預測。這樣會得到在訓練集上由KNN 模型訓練出來的N份預測值和在測試集上的1 份預測值B1。將這N份縱向重疊合并起來得到A1。RandomForest 和XGBOOST 模型部分也運用類似的方法。

3個基模型訓練完畢后，將3個模型在訓練集上的預測值作為分別作為3 個“特征”A1、A2、A3，然后再通過邏輯回歸（Logistic Regression，LR）模型進行訓練，建立LR 模型，這個LR模型就是次級分類器。使用訓練好的LR模型，用3個基模型在測試集上得到的預測值構建的3個特征值（B1，B2，B3），當沒有概率時直接使用初級分類的輸出作為初級分類器的輸入，把初級分類器的結果均質化以后作為次級分類器的輸入已達到疊加器的效果，進行預測可以綜合各種機器學習算法分類器的優勢迭代出相對較好的結果。

圖2 Stacking Classifier計算過程Fig.2 Stacking Classifier computation process

1.3 樣本擴展

類別不平衡問題（class-imbalance）是指在訓練分類器中所使用的訓練集的類別分布不均，數據集中存在某一類樣本，其數量遠多于或遠少于其他類樣本，從而導致一些機器學習模型失效的問題。心電數據就是一個典型的類別不平衡問題，正常的心拍數量遠遠多于異常心拍的數量，從而容易造成最終的分類結果不理想。為了解決該問題，本文采用SMOTE算法對數據集非平衡樣本進行了擴充，該算法思想是在少數類樣本之間進行插值來產生額外的樣本，自提出以來受到學術界和工業界的一致認同［16］。對心電數據及堆疊模型而言，比起簡單地將少數類別樣本復制添加到樣本集中等方式，該算法能夠避免模型學到的信息過分特別，不夠泛化，從而避免模型產生過擬合問題。

SMOTE 算法的描述如算法1 所示，算法可以獲得新的少數類樣本，通過對每個少數類樣本a，從它的最近鄰中隨機選一個樣本b，通過在a、b之間的連線上隨機選一點作為新合成的少數類樣本。SMOTE算法的描述如圖3所示，（少量的數據樣本）圖表示少數類樣本中的xi到少數類樣本集中所有樣本的距離，（生成新的樣本）圖為根據采樣比例倍率，從xi的K近鄰中隨機選擇若干個樣本，分別與原樣本通過算法中的公式構建新樣本。

算法1SMOTE算法。

輸入：數據集中的每個樣本a；

輸出：產生出的屬于少數樣本類中的新樣本c；

算法描述：

1）通過歐氏距離，計算每個樣本的K近鄰樣本b，得到K鄰近值；

2）根據樣本不平衡比例設置采樣倍率C，從少數樣本K近鄰中隨機選取b；

3）根據下式生成新的樣本c。

c=a+rand(0，1)*|a-b|

圖3 SMOTE計算原理Fig.3 Calculation principle of SMOTE

2 實驗結果與分析

2.1 實驗環境與數據集

本文使用的是MIT-BIH 心律失常數據庫［17］，該數據庫是麻省理工大學（MIT）結合國際標準并通過專家標注解釋的心電數據庫，是目前學術界心電監測領域最權威的心電數據庫。

MIT-BIH心律失常數據庫包含48個30 min長度雙通道動態心電圖記錄片段，其中包含了十幾種心律失常類型，總計超過十萬多個心拍，當然其中大部分都是正常的心拍，異常心拍的種類包括房性早搏、室性早搏、束支阻滯、房顫等多類異常心拍。

算法被部署在具有雙個E52620 CPU、1080TI 顯卡的塔式工作站上，在深度學習模型中使用sklearn 平臺架構和Python-3.7 實現本文算法。把整體的心拍通過交叉驗證的方式分成N份，隨機抽取其中的N-1 份作為訓練集，剩下的1 份作為驗證集得以應用到訓練模型中來，使得本就稀有的醫療心拍數據得到充分的發揮，采用這樣的方式就可以使得模型的訓練精度得到了加強。這種交叉驗證的方式不僅提高了訓練結果的可信度，同時充分使用了所有的樣本數據。

為驗證分類效果，對實驗結果計算多種評價指標值，包括召回率（Recall）又稱敏感性（Sensitivity）、精確率（Precision）以及F1系數。

2.2 結果對比與分析

基于以上的模型和訓練，將本文算法應用于公開數據集MIT-BIH 上進行了分類效果的測試。選取經典機器學習算法支持向量機（Support Vector Machine，SVM）、邏輯回歸、隨機森林和主流的集成學習算法極端梯度提升（XGBOOST）、梯度提升決策樹（Gradient Boosting Decision Tree，GBDT），在同一個原始數據集上做分析比較，發現不同的機器學習算法在數據集上的表現不同，結果見表2、3。

表2 原始數據集上不同算法準確率比較結果Tab.2 Accuracy comparison results of different algorithms on the original dataset

表3 原始數據集實驗結果比較Tab.3 Comparison of experimental results on the original dataset

從表2 中可以看出，隨機森林（RandomForest）和StackingClassifier 算法在訓練集上的準確率都達到了100%，相較于邏輯回歸算法、支持向量機（SVM）、極端梯度提升（XGBOOST）、梯度提升決策樹（GBDT）表現要好很多；但就在測試集上的驗證的準確率而言，隨機森林算法的準確率明顯高于StackingClassifier 算法，模型的精確率低于隨機森林模型，StackingClassifier 算法在數據類型不平衡的情況下出現了過擬合問題。

從表3 中看出，在數據集中原始樣本數（未經擴充的數據樣本數）不均衡的情況下，StackingClassifier 的召回率和F1 值低于隨機森林算法，出現了嚴重的過擬合現象，在訓練集上達到效果100%的情況下，F1 值只能達到65%。實驗訓練時間128 s，優于相同數據集下深度模型訓練時間［11］。

基于上面的實驗結果，本文通過SMOTE 數據擴增算法得到類型趨于平衡的數據，然后用同樣的算法再進行實驗，實驗結果的比較見表4、5。

從表4 中看出，在通過SMOTE 算法進行數據擴增以后，隨機森林算法、邏輯回歸算法、SVM 算法、XGBOOST 算法、GBDT 算法分類性能都獲得了巨大的提升，特別是StackingClassifier 算法在測試集上的效果得到了顯著的提升，在測試集可以達到86%的準確率。

從表5 中可以看出，StackingClassifier 算法在數據擴增以后的測試集上的召回率和F1值也得到了顯著的提升，均達到了86%，其他的機器學習算法的表現也都有了顯著的提高，表明對于不均衡的醫療數據而言，通過SMOTE 算法來消除數據不均衡的問題有利于精確度的提高。

表4 擴增數據集上不同算法準確率比較結果Tab.4 Accuracy comparison results of different algorithms on the expanded dataset

表5 擴增后數據集評價指標對比Tab.4 Comparison of evaluation indexes on the expanded dataset

3 結語

為了對監測的心電異常分類，本文提出了一種通過StackingClassifier 疊加分類器的算法模型，把多種機器學習算法的優勢相結合，通過疊加分類器的方式集成起來，彌補了單個機器學習算法學習的局限性，提高了心電分類的準確性。通過SMOTE 算法擴充了數據集樣本量，改善了數據非平衡性。接下來的工作可以結合深度學習的殘差網絡的算法對模型的精度進行進一步的提升。