薛淵元,李朵,宋江玲,張瑞
(西北大學醫學大數據研究中心,陜西 西安 710127)
心肌梗死(Myocardial Infarction,MI),簡稱心梗,是由冠狀動脈急性或持續性缺血缺氧引起的一種常見的心律失常疾病[1].臨床表現為持續性胸痛、呼吸急促、大汗、乏力和發熱等,嚴重者可伴有心力衰竭、昏厥和休克等癥狀.心肌梗死發作后,如果未能在90分鐘內得到及時有效的治療,患者心臟的冠狀動脈出現血栓堵死現象,心肌細胞將會因缺血發生大面積壞死,從而引發不可逆性的損傷,嚴重者可能會導致心室顫動、房室傳導阻滯、心室游離壁破裂和心源性休克等并發癥,甚至死亡.因此,對于心肌梗死的及時、準確診斷是至關重要的.
心電圖(Electrocardiogram,ECG)是反映人體心臟電信號變化的連續曲線,可以表征人體心臟的綜合狀態,是臨床上診斷心肌梗死的首要篩查手段[2].心肌梗死在心電圖上(MI-ECG)的特異性表現主要有:①ST-T改變,即ST段異常抬高或壓低;②出現T波高尖、低平、雙相變化和倒置等異常T波;③出現病理性Q波,Q波表現為“寬而深”,即Q波時限大于等于0.04s,Q波幅值大于同導聯R波的1/4(如圖1(b)所示)[3-4].鑒于心電圖采集便捷、操作簡單、具有可連續監測等特點,以MI-ECG為數據源,采用機器學習方法挖掘MI-ECG中的特異性特征并據此實現MI-ECG的自動判讀,顯然對于心肌梗死的及時確診具有重要的臨床意義和現實價值.

圖1 心電信號示例
關于MI-ECG自動判讀的研究主要聚焦于如何刻畫心肌梗死發作時在心電信號中的特異性表現.在時域分析方面,文獻[5]針對心肌梗死心電信號中ST段特異性變化,提取了ST-T段偏斜度對心肌梗死心電進行識別.文獻[6]提取了T波時限、T波偏斜度等刻畫T波異常的特征,并結合SVM算法實現心肌梗死和正常心電信號的分類.文獻[7]通過提取QRS波群的面積、偏斜度等特征用以描述心肌梗死發作時Q波的異常表現.此外,文獻[8]利用多項式擬合法對心電信號進行擬合,并以擬合曲線的多項式系數作為特征,結合J48決策樹、隨機森林、Kstar和樸素貝葉斯等分類算法區分正常和心肌梗死心電信號.在信號復雜度分析方面,文獻[9]利用平穩小波變換對II、III和avF導聯心電信號進行分解,并提取了樣本熵、對數能量熵和歸一化子帶能量等刻畫信號復雜度的特征,用于實現心肌梗死心電的自動判讀.文獻[10]提取了信號能量、Shannon熵和Renyi熵等特征,結合統計學離群點剔除法提出兩級SVM分類算法,對心肌梗死心電信號進行有效判讀.
由于心肌梗死發作時在心電信號中的異常表現復雜多樣且具有明顯的個體異質性,因此設計一種多特征融合方法,顯然是提高MI-ECG自動判讀準確率的有效途徑.基于此,本文提出一種新的基于融合特征的心肌梗死心電自動判讀方法.首先,對原始MI-ECG信號進行去噪預處理;其次,對去噪后的心電信號進行QRS波群和T波的特征波定位;在此基礎上,進一步針對心肌梗死發作時MI-ECG信號的三種異常表現,分別提取特征并進行特征級融合;最后,結合輕量梯度提升算法完成MI-ECG的自動判讀,并在PTB數據庫上驗證所提方法的有效性.
心電信號在采集過程中易受到噪聲干擾,主要包括基線漂移、工頻干擾和肌電干擾[11].其中基線漂移是人體呼吸、電極片移動等所引起的低頻噪聲,頻率小于1Hz;工頻干擾是由電力系統引起的一種干擾,頻率為50/60Hz;肌電干擾是由于人體肌肉顫動所引起的噪聲,頻率為5-2000Hz.
本文采用小波變換和軟閾值法對原始心電信號進行去噪[12],選取coif5函數為基小波,并設置分解層數為9.圖2展示了一條時長為8s的心電信號片段去噪前后對比.

圖2 心電信號去噪效果
QRS波群是心電圖中最主要的波群之一,其中病理性Q波的出現、ST-T段和T波異常是心肌梗死發作時典型表現.而Q波和S波的定位依賴于R波的定位,因此,本小節聚焦于QRS波群、T波及其起止點的準確定位算法.
給定去噪后的心電信號為X={X(1),X(2),···,X(N)},其中 N 為樣本點數,采樣率為fs.
2.2.1 QRS波群定位
利用文獻 [13]的波形檢測方法對 QRS波群峰值點進行檢測,得到 R峰序列 R={R(1),R(2),···,R(m)},S 峰序列 S={S(1),S(2),···,S(m)},以及 Q 峰序列 Q={Q(1),Q(2),···,Q(m)}.
計算RR間期序列,記為

其中RR(i)=R(i+1)-R(i).
2.2.2 T波定位
T波異常變化是診斷心肌梗死發作最顯著的指征,而刻畫T波異常的特征分類性能好壞在一定程度上依賴于T峰和T波終點的定位是否準確.基于此,本小節提出一種新的T峰和T波起點/終點的準確定位算法,具體過程可總結為如下算法(T波定位算法):
步驟1:T波峰值點定位
首先,以R峰為基點,向后進行搜索區間為WT=[Rv+0.15×fs,Rv+0.15×fs+50]的加窗搜索,其中Rv為R峰位置點,fs為采樣率,以此獲得預選T波段序列.
其次,計算預選T波段的黎曼和分別為ST0i:

其中,k為所述心電片段中劃分的子區間數,這里取樣本點個數,ΔXTj為預選T波段對應的心電片段序列第j個子區間的長度,FTj為其對應的幅值.若ST0i>0,則T波為正向波;若ST0i<0,則T波為倒置波.
最后,以R峰為起點,向后進行窗寬為v1的加窗處理,通過極大(小)值法,得到T峰的位置,其中v1=2/3*RR,得到的正向T峰序列記為

倒置 T 峰序列記為 T2={T2(1),T2(2),···,T2(m)}.
步驟2:T波起點/終點定位
首先,以 T峰為起始點,向心電信號采樣方向相同的方向 (向后)進行窗寬為 v2的加窗處理,在每一個窗內通過求導法,得到候選的 T波終點,其中 v2=150ms,得到的候選正向 T波終點序列記作 T1e0={T1e0(i)}和候選倒置 T波終點記作 T2e0={T2e0(i)},其中 i=1,2,···,m.
其次,判斷候選T波終點是否存在誤檢,并對誤檢T波終點進行修正.計算候選T波終點與T峰之間的水平距離,記作d={di|di=Te0(i)-T(i)},其中i=1,2,···,m.
若di<THR,其中THR為誤檢的閾值,根據T波時長特點得到,單位為位置點數,則說明候選T波終點存在誤檢.那么以T(i)為起始點,向后進行二次加窗處理,在每一個窗內通過求導法檢測拐點,記作kij,j=1,2,···,K,K 為檢測到的拐點個數,并計算其對應的幅值.計算二次加窗得到的拐點與T峰之間的水平距離為dij=kij-T(i),其中j=1,2,···,K,如果T波為正向波(倒置波),則將窗內dij>THR,且幅值最小(大)的拐點作為第i個T波終點修正后的位置點.
若di≥THR,則以候選T波終點為最終的T波終點.
最后,重復執行上述步驟,直至得到最終的T波終點序列,記作

其中 i=1,2,···,m.
利用上述方法,向心電信號采樣方向相反的方向進行加窗,準確定位T波起點位置.
在臨床中,心肌梗死發作時在心電圖上主要表現為Q波、ST-T段和T波異常.基于此,本小節從非線性和時域角度提取5個特征并將其融合,以此更全面地刻畫心肌梗死發作時的3個典型異常表現.
大斑病、小斑病是玉米種植中最為常見的兩種病害,主要病害部位是葉鞘和苞葉,在病情嚴重的時候,果穗也會被波及,最初病斑呈現水浸狀,之后會逐漸變成青灰色,接著會呈現褐色,直至玉米植株枯死。針對這種病害,可以選擇抗病性強的玉米品種,及時消除越冬病菌,減少發病幾率。
2.3.1 特征提取
心率變異性(heart rate variability,HRV)是指竇性心律周期性改變現象,是評價心臟自主神經功能的一種定量指標[14].計算RR間期的標準差作為刻畫心肌梗死心電信號心率變異性的特征:

其中,RR={RR(i),i=1,2,···,m-1},RR(i)=R(i+1)-R(i).
T波高聳或低平通常出現在 MI-ECG中,當 T波幅值小于同導聯 R波幅值的1/10,稱之為T波低平;當以R波為主的肢體導聯T波幅值大于0.6mV,胸導聯大于1.0 mV時,稱之為T波高聳.因此,提取TR幅值比用于刻畫T波幅值異常,其表達式為:

其中,i=1,2,···,m,fT和fR分別是T波幅值和R波的幅值.
取TR幅值比的均值作為特征,記作MDTR.
T波倒置是心肌梗死最典型的特征之一,可通過計算R波和T波的幅值的乘積得到,記為

若FT<0,則表示T波方向與R波方向相反,即存在T波倒置,將其記為1;反之,記為0.

進而,不受心率變異影響的QT間期離散度可表示為

其中,QTcd(i)=QTcmax(i)-QTcmin(i),QTcmax為校正QT間期最大值,QTcmin為校正QT間期最小值.
取QT間期離散度的均值作為特征,記作MDQT.樣本熵是由文獻[6]提出的一種反映時間序列復雜度的方法[16].
對于給定的樣本點數為N的時間序列x,其樣本熵計算方法如下:
從給定的時間序列中提取N-m個長度為m的子序列,記作




綜合上述特征,稱

為本文所提取的MI-ECG融合特征.
2.3.2 MI-ECG 自動判讀方法
對于預處理后的MI-ECG數據,基于上述所提出的方法進行特征提取,并結合輕量梯度提升算法(Light Gradient Boosting Machine,LingtGBM)[17]完成MI-ECG的自動判讀.具體流程如圖3所示.

圖3 MI-ECG自動判讀算法流程圖
本文使用的心電信號均來源于德國國家計量研究所PTB診斷數據庫[18],該數據庫共包含來自290位受試者的549條記錄,每條記錄包含常規12導聯和3個Frank導聯,采樣率為1000Hz,分辨率為16bit.其中心肌梗死患者148例(368條記錄),健康受試者52例(80條記錄).本小節選取80條健康受試者心電記錄和160條心肌梗死心電記錄進行數值實驗,所有實驗通過Matlab 2020b和Python 3.7進行實現.
數值實驗中,隨機選取70%的數據作為訓練集,其余30%作為測試集.為了降低隨機劃分所導致的訓練集和測試集中不同類數據點的不均衡,實驗執行10次,并取10次實驗的平均結果作為最終分類性能的度量.
3.2.1 T波定位結果分析
在T波檢測過程中,以R峰為起點,向后進行窗寬為v1=*RR,檢測窗內極大(小)值點,并將其作為T波峰的位置點,結果如圖4所示,分別展示了正常和T波倒置、低平、高聳等不同異常T波的檢測結果.在T波終點修正過程中,結合T波時長特點[19],設置窗寬v2=150(即0.15s),閾值THR=80(即0.08s).修正后T波終點位置如圖4中寶藍色星形所示.


圖4 T波檢測結果
3.2.2 MI-ECG 融合特征的性能分析
圖5展示了本文所提取的心率變異性指標 SDNN、TR幅值比、T波倒置指標、QT間期離散度、樣本熵以及融合所有特征的ROC曲線,從圖中可以看出,融合特征在MI-ECG的自動判讀中性能表現更為良好,優于從單一角度考慮的特征.

圖5 不同特征的ROC曲線
3.2.3 MI-ECG 自動判讀的結果分析
本文采用準確率Acc、敏感性Sen和特異性Spe作為評估算法性能的度量指標,分別表示如下:

其中,TP(true positive)為真陽性,表示實際為心肌梗死心電且被正確檢測為心肌梗死心電;TN(true negative)為真陰性,表示實際為正常心電且被正確檢測為正常心電;FP(false positive)為假陽性,表示實際為正常心電但被錯誤檢測為心肌梗死心電;FN(false negative)為假陰性,表示實際為心肌梗死心電但被錯誤檢測為正常心電.
表1展示了本文方法與已有方法在PTB診斷數據庫中實現MI-ECG自動判讀的性能比較.從表中可以看出,本文所提方法平均準確率、敏感性和特異性優于其他已有方法,分別為97.74%,98.32%和96.40%.

表1 本文方法與已有方法性能對比
本文提出了一種新的基于融合特征的 MI-ECG自動判讀方法.首先,利用小波變換和軟閾值法對原始心電信號進行去噪處理;其次,對去噪后的信號進行QRS波群和T波的定位,進而計算RR間期、R波幅值和 T波幅值;然后,提取心率變異性指標SDNN、TR幅值比、QT間期離散度、T波倒置指標和樣本熵等特征并將其融合;最后,結合 PTB診斷數據庫中心肌梗死心電數據,利用輕量梯度提升算法實現MI-ECG的自動判讀.數值實驗結果表明,本文所提方法在MI-ECG自動判讀中具有可行性且性能表現良好,能夠為輔助醫生快速完成心肌梗死臨床診斷提供有效指導,從而提高心肌梗死的診斷效率和準確率.