摘 要:為強化心電信號漸變特征、提高時序信號分類精度,基于Bi-LSTM提出了一種融合漸變數據特征的自適應算法IGF+Bi-LSTM(self-adaptive Bi-LSTM based on integrating gradient features)。該算法在一定范圍內自適應選取相似程度最高的漸變數據特征,通過數據融合強化漸變特征在網絡隱空間的交互,拓展Bi-LSTM信息傳遞模式;針對時序信號間存在周期性不匹配和強度不一致的問題,提出一種基于差分的改進的B式距離,以刻畫數據和不同標簽數據全體間的差異度S并自適應調整IGF+Bi-LSTM中的融合系數。實驗表明,該算法在ECG數據集上的分類精度達到98.7%,F1值為98.7%,證明了IGF+Bi-LSTM算法的有效性和實用性。
關鍵詞:Bi-LSTM; 漸變特征; 數據融合; 改進B式距離; 心電信號
中圖分類號:TP183
文獻標志碼:A
文章編號:1001-3695(2023)07-030-2117-07
doi:10.19734/j.issn.1001-3695.2022.10.0637
Application of IGF+Bi-LSTM algorithm in ECG classification
Song Chaoyang, Liu Zhen, Shi Manman, Zhang Jingxiang?
(School of Science, Jiangnan University, Wuxi Jiangsu 214122, China)
Abstract:In order to strengthen the gradual features of ECG signals and improve the classification accuracy of time series signals, this paper proposed an adaptive algorithm IGF+Bi-LSTM based on Bi-LSTM which integrated the features of gradual data. The algorithm adaptively selected the features of gradual data with the highest degree of similarity within a certain range. Through data fusion, it enhanced the interaction of gradual features in the network hidden space and expanded the Bi-LSTM information transmission mode. Moreover, this paper proposed an improved B-distance based on difference to solve the problem of periodic mismatch and strength inconsistency between time series signals, which not only characterized the difference degree S between the target data and different label data, but also adaptively adjusted the fusion coefficient in IGF+Bi-LSTM. The experiment shows that the classification accuracy of IGF+Bi-LSTM algorithm on ECG dataset is 98.7% and the F1 value is 98.7%, it proves the effectiveness and practicability.
Key words:Bi-LSTM; gradient feature; data fusion; improved B-distance; electrocardiogram signal
0 引言
心房顫動(atrial fibrillation,AFib)是一種常見的心血管疾病,也是冠心病的前兆表現,其主要醫學診斷的依據是心電圖(electrocardiogram,ECG)。由于ECG信號具有較強的時序性,若不充分提取漸變特征就會影響分類精度,如何改善這一問題一直是研究熱點。隨著機器學習的快速發展,深度學習算法在醫學圖像處理和模式識別中被廣泛應用,尤其是雙向長短記憶網絡Bi-LSTM作為有效處理時序數據的深度學習算法,越來越受到研究人員的關注,許多成果對疾病的早期診斷和后期治療至關重要。Bi-LSTM通過挖掘雙向的數據信息強化整個網絡對數據集的學習程度,基于Bi-LSTM優勢,許多研究者將其應用在處理時序數據相關的問題上。孫中宇等人[1]在文本分類上利用閉環Bi-LSTM豐富每一層網絡結構的隱狀態,并通過殘差連接和增強稀疏表示策略來優化網絡,實驗使用8層Bi-LSTM得到最高精度97%;Shahid等人[2]以新冠病例數量為研究對象,利用Bi-LSTM預測未來短期病例數量,得到最高的r2值為99.97%;王莉軍等人[3]針對中醫的文言文獻構建了基于Bi-LSTM-CRF的分詞模型,分詞結果的準確性達到90.1%。
ECG信號是一類具有典型動態變化特征的時序數據,如何提取關鍵特征是提高ECG信號分類精度的研究重點,許多研究者基于Bi-LSTM融入了不同機制以獲得在ECG信號上更好的分類性能。Saadatnejad等人[4]構造了由小波變換和多個LSTM的新結構,ECG信號的分類精度達到98.3%;Hou等人[5]基于長短時記憶網絡、自動編碼器和支持向量機,在無先驗知識的情況下提取ECG信號深層特征,其平均分類精度達到99.45%;Zhang等人[6]引入注意力機制來自動加權未標記心跳間的差異性,有效提高了ECG信號的分類精度;Wang等人[7]通過堆疊去噪自動編碼器和Bi-LSTM提高了冠狀動脈疾病的分類精度;Yildirim[8]采用小波層生成ECG信號序列,基于深度Bi-LSTM網絡的小波序列模型分類精度達99.39%;Yildirim等人[9]還進一步采用基于卷積自動編碼器的非線性壓縮結構來縮小心律失常的信號大小,在降低了計算復雜度的同時,ECG信號的分類精度仍超過99.0%;Lyu等人[10]基于殘差卷積神經網絡和注意力機制挖掘疾病間關聯信息,實現多導聯ECG信號的多任務組Bi-LSTM分類,實驗得到的分類精度和F1值都超過90%;Varalakshmi等人[11]提出了一種基于特征提取和分類的混合模型,通過比較得出Bi-LSTM+隨機森林+PCA的混合模型在ECG信號分類上準確率達到最高的98.3%;Cao等人[12]從全局混合多尺度卷積神經網絡的視角提出了GH-MS-CNN模型,該模型實現了自動聚合全局空間中不同類型的多尺度信號特征,提升了ECG信號整體分類性能;Geweid等人[13]提出基于雙支持向量機的混合新方法,檢測AFib的分類精度達到99.27%。
上述研究方法雖然取得了較好效果,但仍存在一定的局限性。一方面,ECG信號的時序特征隨時間會產生一定變化,現有模型忽略了時序數據的漸變特征對模型的影響,也缺乏漸變數據特征的自適應性選擇和提取策略,使得模型泛化能力不足;另一方面,ECG信號存在周期性不匹配和強度不一致的問題,現有模型缺乏處理這類數據間差異性的方法。針對這些問題,本文提出一種融合漸變數據特征的自適應Bi-LSTM算法IGF+Bi-LSTM,該算法在給定區間中自適應尋找與目標數據最相似的漸變數據特征,通過目標數據和不同標簽數據間的差異度S,自適應選擇滿足融合系數要求的漸變數據特征進行數據融合,在提取特征的同時也兼顧到漸變信息對算法分類的影響。本文工作的主要貢獻為:a)在Bi-LSTM的基礎上增加了自適應漸變特征的數據融合策略,充分提取了時序數據漸變特征,強化了網絡隱空間的交互作用,拓寬了Bi-LSTM的應用場景和適用數據類型,提升了模型的泛化能力;b)提出了利用差分改進的B式距離——S距離,以衡量數據和不同標簽數據全體間的差異度,解決時序數據存在周期不匹配和強度不一致的情況,并依據差異度定義了特征數據的融合系數,增強了數據集的可分性并提升了模型的魯棒性;c)特異性提取了每一個ECG信號的漸變特征和融合系數,不僅提高了ECG信號的利用率,還拓展了ECG信號分類問題的研究思路。
1 LSTM amp; Bi-LSTM
1.1 LSTM
LSTM解決了RNN會因梯度消失或爆炸而導致網絡在訓練過程中無法更新權重的問題,通過設計遺忘、輸入和輸出三重門控結構來控制長短期記憶的保留和丟棄,達到學習時序數據上長短距離關聯信息的目的。LSTM單元的結構如圖1所示,其中,ft、it和ot分別代表遺忘門、輸入門和輸出門,是輸入門的臨時狀態,xt表示t時刻的輸入,ht表示t時刻神經元的狀態,yt表示神經網絡在t時刻的輸出。LSTM單元的更新方式如下所示。
當輸入門決定哪些信息會被保留后,LSTM單元就將當前時刻的輸入xt和上一時刻的狀態ht-1存入臨時狀態中,結合臨時狀態和上一時刻狀態ct-1,LSTM單元就可以得到當前時刻隱藏層的狀態ct和ht,再將它們輸出傳遞給下一個LSTM單元,這就完成了當前時刻LSTM單元的向前計算。之后,網絡中的偏置項和參數矩陣通過反向傳播算法(back propa-gation through time,BPTT)進行計算更新。
1.2 基于梯度下降的參數更新
在分類問題上,常使用交叉熵損失函數來衡量預測輸出和實際輸出之間的誤差,其定義如式(7)所示。
由于參數共享,在梯度更新時需要將所有時刻的同參數的誤差累加,再乘以學習率η來計算參數的改變量。定義M代表LSTM單元中任意一個參數矩陣,則LSTM單元各個參數的更新方式可以統一表示為
以LSTM單元的輸出門為例,設t為最后一個時間點,則δht=0,同時有
計算當前時刻參數矩陣的誤差如式(11)~(13)所示。
LSTM單元中其余參數矩陣的誤差可以同理得到。當前時刻的LSTM單元更新結束后再向前一時刻和下一層傳遞誤差,如式(14)和(15)所示。
依據傳播的誤差大小就可以從最后一個時間點t開始沿著時間軸向前傳遞完成整個LSTM的參數更新。
1.3 Bi-LSTM
在LSTM中已經實現傳遞過去的數據信息,但是在某些實際的應用場景中,還需要傳遞“未來”的數據,通過提取雙向信息以增強整個網絡對數據集的學習程度,Bi-LSTM正是為了滿足這樣的需求而產生的。簡單來說,Bi-LSTM就是前向LSTM和后向LSTM的疊加,兩個方向的LSTM的狀態參數各自獨立,這使得網絡可以同時從前向和后向兩個方向來分析時序數據,提高數據利用率和預測準確率。Bi-LSTM的結構如圖2所示,其中,帶*的狀態參數屬于后向LSTM。
用函數lstm(x,h,c)代表LSTM單元的更新過程,整合后Bi-LSTM的傳遞方式可以簡化成
2 融合漸變數據特征的分類方法
2.1 IGF+Bi-LSTM算法框架
Bi-LSTM雖然擁有一長一短兩個信息傳遞模式可以從兩個方向挖掘數據信息,但直接應用到時序數據仍會忽略其中動態的漸變特征,直接用于處理ECG信號則會導致部分有用信息的流失、隱藏或遺漏,進而影響信號的分類精度。
考慮到ECG信號自身有較強的時序性,并兼具一定的周期性和傳遞性,同時現有ECG信號的研究對漸變信息提取不足,本文提出一種融合漸變數據特征的自適應Bi-LSTM算法IGF+Bi-LSTM,在特征提取的基礎上進一步增強模型對漸變特征的學習。算法首先在給定距離D的基礎上自適應尋找與目標數據相似程度最高的漸變數據特征,將相對當前時刻t再往前推D個時刻的所有輸入數據與當前時刻的輸入數據xt做差得到t,將差絕對值的最小值所對應的數據t-d作為當前時刻的輸入xt相似程度最高的漸變數據特征,融合得到的x**t就作為Bi-LSTM新的輸入,融合方式如式(18)所示。
沿著時間軸完成所有時刻數據的融合更新后,就得到一組融合了漸變特征的全新時序數據。融合漸變數據特征的策略為隱藏特征提供了更大的交互空間,也為IGF+Bi-LSTM進一步挖掘深層數據信息創造了條件。以前向LSTM為例,IGF+Bi-LSTM的更新方式如式(19)~(24)所示。
特別地,當D=0時IGF+Bi-LSTM就退化成傳統的Bi-LSTM。以D=10時的IGF+Bi-LSTM為例,IGF10+Bi-LSTM的網絡結構和融合方式如圖3所示。整合后IGF+Bi-LSTM的傳遞方式可以簡化成
2.2 改進B式距離——S距離
本文在構造IGF+Bi-LSTM算法后仍面臨兩個問題:a)模型在計算融合新值時需要一個適用于ECG信號的融合系數選擇策略;b)由于患者個體差異,ECG信號間自身強度存在差異,甚至患者間的ECG信號間也有較大的不同,另外ECG信號在采集過程中存在周期性不匹配的情況,這都會影響ECG信號分類精度,數據集需要提高可分性。
為解決這些問題,本文提出一種基于差分的改進的B式距離——S距離,用于度量目標信號與不同標簽信號全體間的差異,并將各個信號的差異度S作為IGF+Bi-LSTM融合過程中的融合系數a,避免了因為使用統一的融合系數而影響模型泛化能力。原始B式距離的計算如式(27)所示,改進后的S距離計算方式如式(28)所示。
B式距離是生態學中一種常用測度,主要用于衡量不同物種組成的差異度,其中k是物種數,y表示物種多度,i和j表示相比較的兩個樣地的編號;S距離主要用于描述目標信號和不同標簽信號全體間的差異度,其中m為與當前輸入信號x相異的標簽集信號總個數,n為信號長度,xki代表第k個信號在第i個時刻的信號大小,yij代表與指定信號不同標簽全體Y中第j個信號在第i個時刻的信號大小。S距離的優勢在于,不僅針對性地解決了ECG信號因結構和變化特點而不易度量的問題,還可以將差異度取值控制在0~1。S距離越接近1說明目標信號和不同標簽信號的全體距離差異度越小,信號間相似程度越大,可分性就越低;反之,S距離越接近0,說明目標信號和不同標簽信號的全體差異度越大,信號間相似程度就越小,可分性就越高。從分類的角度上說,可分性越低的信號間就需要放大自身特征,因此將S距離作為ECG信號的融合系數可以達到提高數據集的可分性的目的。
以編號A00001~A00010的ECG信號為例,計算出每個信號和不同標簽信號全體之間差異度S如表1所示。以編號A00001和編號A00002的同標簽ECG信號為例,給出這兩個信號差分前后的對比,如圖4所示。
如圖4所示,差分前這兩個標簽相同的原始信號沒有明顯重合的部分,信號強度差異也很大;差分后信號只保留自身強度隨時間的變化量,相同標簽的信號間因自身強度不同帶來的差異得到顯著改善,因此用差分后的信號計算差異度S也更科學合理。基于上述分析,差異度S的優勢可以總結為以下三個方面:a)在引入差分后,削減了不同ECG信號間因自身強度存在差異對分類帶來的影響,分類只需考慮信號本身隨時間的變化量;b)差異度S保留了B式距離的優勢,同時可以將計算出的數值控制在0~1,將其作為IGF+Bi-LSTM的融合系數可以較好地控制每個信號的融合程度;c)每一個ECG信號都可以計算出一個獨立的差異度S,拓展了B式距離只能計算兩個不同標簽數據集間差異度的定義方式,每個ECG信號融合漸變數據特征的過程更具特異性,對數據集的可分性也有積極的影響。
3 實驗與分析
本文共設置三組遞進的對比實驗:a)在原始數據上IGF+Bi-LSTM的消融實驗,驗證算法的有效性;b)在特征數據上對比IGF+Bi-LSTM與基準模型Bi-LSTM及其他現有模型的分類效果,進一步驗證IGF+Bi-LSTM算法在時序信號分類上的優勢,同時通過加噪數據實驗驗證模型的魯棒性;c)對比固定融合系數的情形,驗證差異度S的實用性和合理性,找到IGF+Bi-LSTM最優超參數D并解釋其變化意義。
3.1 數據預處理
3.1.1 數據集整合
本文實驗數據集選用PhysioNet挑戰賽提供的短期ECG信號集[14],以下簡稱數據集。數據集包含四個標簽共8 528條采樣頻率為300 Hz的ECG信號,其中正常心律(normal)的數據5 154條、心房顫動(AFib)的數據771條、其他心律(other)的數據2 557條和無法識別(~)的數據46條,記錄時長主要集中在30 s左右,即信號長度主要在9 000左右。
數據集整合過程如下:首先剔除標簽為其他心率和無法識別的信號,只留下標簽為正常心律和心房顫動的信號;為確保預數據集中的信號長度統一,刪除長度不足9 000的信號,同時分割信號長度大于9 000的信號并刪除多余部分。由于正常心律和心房顫動的信號數量差距較大,所以將數據集中的心房顫動信號重復6次并亂序處理,以保證兩個標簽下的信號數量一致,最終得到9 856個信號,按比例分割訓練集和測試集后的數據集如表2所示。
3.1.2 數據集去噪
在信號收集的過程中常存在儀器產生的白噪聲和環境噪聲,為了提高模型分類精度,本文采用閾值去噪的方法進一步處理整合后的數據集,步驟如下:首先對信號進行三層小波分解并提取相應的小波系數;然后使用MATLAB中的ddencmp函數生成該信號的自適應默認閾值;接著使用wdencmp函數對信號每一層的小波系數進行軟閾值處理,并重構得到去噪后的信號;最后遍歷數據集中的每一個信號完成整個數據集的去噪工作。
3.1.3 特征提取和標準化
信號的頻譜圖由不同頻率下隨時間變化的信號強度組成,從中提取的瞬時頻率和譜熵這兩個特征訓練可以提升網絡的性能[15]。生成信號的頻譜圖后利用時間窗上的短時傅里葉變換就可以計算得到時頻矩中的瞬時頻率,計算方式如式(29)所示。
其中:P(t,f)為功率譜,代表信號xt的頻率分量。時頻矩中的譜熵計算方式如式(30)所示。
由于瞬時頻率和譜熵的數值相差了一個數量級,為了減小特征之間的數值差異對網絡訓練帶來的影響,加速模型分類精度和損失率的訓練速度,接著標準化處理提取后的瞬時頻率和譜熵這兩個特征。以編號A00001的正常信號和編號A00004的心房顫動信號兩個不同標簽的信號為例,整個數據集預處理流程如圖5所示。
3.1.4 評價標準
為了評價算法的性能,對模型分類結果作如下說明:true positive(TP)表示正常心律被模型識別為正常心律,算法分類正確;true negative(TN)表示心房顫動被模型識別為心房顫動,算法分類正確;1 positive(FP)表示心房顫動被模型識別為正常心律,算法分類錯誤;1 negative(FN)表示正常心律被模型識別為心房顫動,算法分類錯誤。這些分類結果可以構成算法的混淆矩陣如圖6所示。
本文選取正確率accuracy(Acc)、靈敏度sensitivity(Sen)、特異性specificity(Spe)和綜合指標F1-score來評估模型分類性能。指標計算方式如下所示。
3.2 實驗1 原始數據上的消融實驗
為驗證模型有效性,本文設計了一個消融實驗,使用LSTM、Bi-LSTM作為基準模型與IGF+Bi-LSTM進行對比,其中IGF+Bi-LSTM中的超參數D分別給定1、2、5和10。實驗1通過對比模型的分類結果、分類指標和指標變化趨勢來研究融合漸變數據特征的策略對模型分類性能的影響。實驗1模型超參數如表3所示,實驗1模型訓練過程如圖7所示。
如圖7所示,模型的分類精度和損失率在原始數據上變化幅度較小,經過多輪訓練,分類精度最高的IGF5+Bi-LSTM也只達到了73%,其余模型的分類精度都在60%左右。
與LSTM相比,Bi-LSTM的分類精度高出8.7%,且四個IGF+Bi-LSTM的分類精度均高出LSTM,其中IGF1+Bi-LSTM高出最少的3.7%,IGF5+Bi-LSTM高出最多的17.7%;對比Bi-LSTM和IGF+Bi-LSTM,雖然Bi-LSTM的分類精度比IGF1+Bi-LSTM、IGF2+Bi-LSTM和IGF10+Bi-LSTM都要高,但是仍比IGF5+Bi-LSTM低9%。計算測試集上的混淆矩陣如圖8所示,模型指標對比如圖9所示。
由圖8可知,在混淆矩陣中Bi-LSTM和四個IGF+Bi-LSTM的分類精度均高于LSTM,除了IGF5+Bi-LSTM的分類精度達到了最高的75.4%,其余模型的分類精度都在60%左右。在信號的識別數量上,IGF5+Bi-LSTM識別了最多的427個正常信號,占正常信號總數的87.2%,同時IGF10+Bi-LSTM識別了最多的379個心房顫動信號,占心房顫動信號總數的77.4%。
分析識別數量的變化可知,整體心房顫動識別數量從LSTM的183個上升到Bi-LSTM的196個、IGF1+Bi-LSTM的207個、IGF2+Bi-LSTM的302個、IGF5+Bi-LSTM的312個和IGF10+Bi-LSTM的379個,相較于LSTM識別的數量分別提升了7.1%、13.1%、65.0%、70.5%和107.1%,四個IGF+Bi-LSTM相對于Bi-LSTM分別提升了5.6%、54.1%、59.2%和93.4%;錯誤識別心房顫動的數量則從LSTM的307個下降到Bi-LSTM的294個、IGF1+Bi-LSTM的283個、IGF2+Bi-LSTM的188個、IGF5+Bi-LSTM的178個和IGF10+Bi-LSTM的111個,相較于LSTM錯誤識別的數量分別下降了4.2%、7.8%、38.7%、42.0%和63.8%,四個IGF+Bi-LSTM相較于Bi-LSTM分別下降了3.7%、36.1%、39.5%和62.2%。
如圖9所示,IGF5+Bi-LSTM在Acc、Sen和F1上分別取得了最高的75.4%、87.1%和78%,IGF10+Bi-LSTM在Spe上取得了最高的77.3%。綜合上述分析,可以認為IGF+Bi-LSTM在時序信號上的識別能力要優于基準模型LSTM和Bi-LSTM,主要體現在:a)IGF5+Bi-LSTM在消融實驗中表現出了最高的分類精度,且四個IGF+Bi-LSTM在識別心房顫動信號的數量上相較LSTM和Bi-LSTM有明顯的提升;b)隨著IGF+Bi-LSTM中給定超參數D的變大,模型在特征空間的交互能力也相應增強,Spe也隨著不斷升高,其余指標相較基準模型LSTM和Bi-LSTM也有明顯的提升。
3.3 實驗2 特征數據上的對比實驗
為了進一步驗證IGF+Bi-LSTM的有效性,本文在特征數據上分析了IGF+Bi-LSTM和基準模型Bi-LSTM的分類性能,其中IGF+Bi-LSTM的超參數D保持與實驗1一致;接著對比了Rahul等人[15]提出的模型,證明IGF+Bi-LSTM在時序信號分類上的優勢;最后通過加噪實驗證明了IGF+Bi-LSTM的魯棒性。實驗2模型的超參數如表4所示,模型的訓練過程如圖10所示。
如圖10所示,特征提取后模型的分類精度和損失率都快速收斂,Bi-LSTM和四個IGF+Bi-LSTM的分類精度都在97%以上,其中IGF5+Bi-LSTM的分類精度達到了最高的99.3%,特征提取后各模型的分類性能都得到提升。
對比Bi-LSTM和IGF+Bi-LSTM,四個IGF+Bi-LSTM的分類精度仍高于基準模型Bi-LSTM,分別高出0.3%、1.5%、2.2%和0.4%,計算測試集的混淆矩陣如圖11所示,模型指標對比如圖12所示。
由圖11可知,所有模型的分類精度都在92%以上,其中IGF5+Bi-LSTM的分類精度達到了最高的96.8%。對比原始數據的結果,在特征數據上Bi-LSTM和四個IGF+Bi-LSTM分別將分類精度提高了32%、36.6%、35.6%、21.4%和34.0%。在已經取得較好分類結果的情況下,四個IGF+Bi-LSTM的分類精度還要分別高出Bi-LSTM2.8%、3.0%、4.8%和3.5%,不僅證明了在特征數據上融合漸變特征的策略仍然奏效,還對分類結果有更好的提升。
在信號的識別數量上,IGF2+Bi-LSTM識別了最多的476個正常信號,占所有正常信號的97.2%;同時IGF5+Bi-LSTM識別了最多的487個心房顫動信號,占所有正常信號的99.4%。在正常信號的識別數量上,從Bi-LSTM的420個上升到IGF1+Bi-LSTM的455個、IGF2+Bi-LSTM的476個、IGF5+Bi-LSTM的462個以及IGF10+Bi-LSTM的469個,四個IGF+Bi-LSTM相較于Bi-LSTM識別的數量分別提升了8.3%、13.3%、10.0%和11.7%;錯誤識別的數量則從Bi-LSTM的70個下降到IGF1+Bi-LSTM的35個、IGF2+Bi-LSTM的14個、IGF5+Bi-LSTM的28個以及IGF10+Bi-LSTM的21個,相較于Bi-LSTM錯誤識別的數量分別下降了50%、80%、60%和70%。
如圖12所示,IGF5+Bi-LSTM在Acc、Spe和F1上分別達到了最高的96.8%、99.4%和96.8%,IGF2+Bi-LSTM在Sen上取得了最高的97.1%。同時在四個IGF+Bi-LSTM上除了Spe外,Acc、Sen和F1均高于基準模型Bi-LSTM,且隨著給定距離D的增加,這三個指標的差值呈上升趨勢。
進一步對比文獻[15]提出的模型,該模型預處理采用了兩級中值濾波器和最小二乘濾波器,并同樣提取了瞬時頻率和譜熵這兩個特征,實驗得到的模型指標如表5所示。由表5可知,所選的兩個IGF+Bi-LSTM在分類精度和F1值上均高于基準模型Bi-LSTM和文獻[15]的模型。以分類精度為例,IGF2+Bi-LSTM和IGF5+Bi-LSTM分別高出文獻[15]的模型0.5%和2.3%。
最后在信號上添加均值為0、方差為1的高斯噪聲再次實驗,Bi-LSTM和IGF5+Bi-LSTM在加噪前后的分類指標如表6所示。
在加噪后,基準模型Bi-LSTM的分類精度下降了1.6%,而IGF+Bi-LSTM的分類精度只下降了1%,且從指標的絕對變化量來看,IGF5+Bi-LSTM受影響程度明顯要小于Bi-LSTM,可以認為IGF5+Bi-LSTM有更強的抗干擾能力和更好的魯棒性。綜合上述分析,IGF+Bi-LSTM的優勢可總結為:a)IGF5+Bi-LSTM在特征數據上的實驗得到了最高的分類精度,且所選四個IGF+Bi-LSTM在不降低心房顫動信號識別能力的基礎上,在正常信號的數量上較基準模型Bi-LSTM還有明顯的提升;b)隨著IGF+Bi-LSTM模型中給定超參數D的變大,模型在隱空間融合漸變特征的能力也相應增強,指標Acc、Sen和F1整體呈上升趨勢;c)IGF2+Bi-LSTM和IGF5+Bi-LSTM在分類精度和F1值上均高于對比模型,表現出提取漸變數據特征這一策略在時序信號分類問題上的優勢;d)在加噪實驗中,IGF+Bi-LSTM表現出了更強的抗干擾能力,指標受影響程度明顯小于基準模型Bi-LSTM,有更強的魯棒性。
3.4 實驗3 超參數尋優
對于超參數D,實驗3選取10組值進行對比實驗,分別實驗計算分類指標,尋找ECG信號上的最適超參數D;同時為了驗證差異度S的合理性,分別固定融合系數為0.2和0.3,對比特異性計算每一信號的差異度S作為融合系數的策略。不同超參數下的指標對比如表7所示,指標變化如圖13所示,分類精度的置信區間如圖14所示。
橫向對比融合系數a可知,當a=0.2時,Sen在D=8時取到最大值97.2%,Spe在D=4時取到最大值96.5%,F1在D=5時取到最大值95.6%,Acc的均值在D=5時取到最大值93.5%且方差在D=5時取到最小值0.3;當a=0.3時,Sen在D=4時取到最大值99.7%,Spe在D=6時取到最大值99.3%,F1在D=4時取到最大值97.9%,Acc的均值在D=4時取到最大值97.3%且方差在D=1和3時取到最小值0.2;當特異性選取每一信號的差異度S為融合系數時,Sen在D=4時取到最大值99.5%,Spe在D=5時取到最大值99.3%,F1在D=5時取到最大值98.7%,Acc的均值在D=5時取到最大值98.2%且方差在D=4時取到最小值0.2。此外,在指標變化圖中可以明顯看出特異性選取信號的融合系數時的指標變化幅度要明顯小于固定融合系數的情形,證明了差異度S的有效性。對比三種情形下分類精度的置信區間還可以發現,使用差異度S作為特異性融合系數的策略更容易得到高分類精度的結果。
縱向對比實驗結果可知,每一組指標的最大值大多是將差異度S作為融合系數時取到的,且這一優勢在指標的均值上更加明顯。同時,將信號的差異度S作為融合系數得到的分類精度方差都小于固定融合系數時的方差,再次證明了將差異度S作為IGF+Bi-LSTM融合系數的合理性。
進一步研究算法結果可以發現,算法效果不僅受D取值的影響,還與ECG信號的周期性存在相關關系,在D=5時IGF5+Bi-LSTM恰好將前后各一個周期相近位置的信息傳遞到當前時刻。在數據預處理中,將所有ECG信號的長度統一分割為9 000(記錄時長為30 s),將特征提取后的所有信號長度變為255,考慮到正常人每分鐘的心跳約為60~100次,按照平均每分鐘約80次的心跳計算,特征提取后的信號上心跳的周期約為6.3個單位,當前時刻所在的1個單位與模型得出的5個單位相加恰為6個單位,這與心跳周期吻合。所以D=5的意義可以理解為模型恰好同時將前后各一個心跳周期的漸變信息傳遞了過來。
4 結束語
本文基于Bi-LSTM提出一種融合漸變數據特征的自適應算法IGF+Bi-LSTM,在ECG數據集上的實驗表明,相較基準模型和現有算法,IGF+Bi-LSTM分類精度更高,泛化性和魯棒性更好;同時利用差分改進的S距離可以較好地度量目標信號和不同標簽信號全體間的差異度,將其作為IGF+Bi-LSTM的融合系數也十分有效。實驗得到D=5時模型分類效果最好,分類精度達到98.7%,F1值為98.7%,此時IGF+Bi-LSTM的輸入端恰好融合了前后各一個心跳周期的漸變信息,證明了模型的有效性和實用性。
后續工作將在IGF+Bi-LSTM的基礎上探索如何根據不同D值增減的情況提出一個自適應的參數選取策略,進一步提高時序信號的分類精度,為輔助醫療提供更可靠的技術支持。
參考文獻:
[1]孫中宇,龔紅仿,狄俊珂.基于防退化策略的多通道閉環BiLSTM在文本分類中的應用研究[J].計算機應用研究,2021,38(6):1780-1784.(Sun Zhongyu, Gong Hongfang, Di Junke. Multi-channel closed-loop BiLSTM with anti-degradation strategy for text classification[J].Application Research of Computers,2021,38(6):1780-1784.)
[2]Shahid F, Zameer A, Muneeb M. Predictions for COVID-19 with deep learning models of LSTM, GRU and Bi-LSTM[J].Chaos, Solitons amp; Fractals,2020,140:110212.
[3]王莉軍,周越,桂婕,等.基于BiLSTM-CRF的中醫文言文文獻分詞模型研究[J].計算機應用研究,2020,37(11):3359-3362,3367.(Wang Lijun, Zhou Yue, Gui Jie, et al. Chinese medicine lite-rature word segmentation based on BiLSTM-CRF[J].Application Research of Computers,2020,37(11):3359-3362,3367.)
[4]Saadatnejad S, Oveisi M, Hashemi M. LSTM-based ECG classification for continuous monitoring on personal wearable devices[J].IEEE Journal of Biomedical and Health Informatics,2020,24(2):515-523.
[5]Hou Borui, Yang Jianyong, Wang Pu, et al. LSTM-based auto-encoder model for ECG arrhythmias classification[J].IEEE Trans on Instrumentation and Measurement,2020,69(4):1232-1240.
[6]Zhang Yue, Li Jie. Application of heartbeat-attention mechanism for detection of myocardial infarction using 12-lead ECG records[J].Applied Sciences,2019,9(16):3328.
[7]Wang E K, Zhang Xun, Pan Leyun. Automatic classification of CAD ECG signals with SDAE and bidirectional long short-term network[J].IEEE Access,2019,7:182873-182880.
[8]Yildirim O. A novel wavelet sequence based on deep bidirectional LSTM network model for ECG signal classification[J].Computers in Biology and Medicine,2018,96(5):189-202.
[9]Yildirim O, Baloglu U B, Tan Rusan, et al. A new approach for arrhythmia classification using deep coded features and LSTM networks[J].Computer Methods and Programs in Biomedicine,2019,176(7):121-133.
[10]Lyu Qiujie, Chen H Y, Zhong Weibin, et al. A multi-task group Bi-LSTM networks application on electrocardiogram classification[J].IEEE Journal of Translational Engineering in Health and Medicine,2019,8:1900111.
[11]Varalakshmi P, Sankaran A P. An improved hybrid AI model for prediction of arrhythmia using ECG signals[J].Biomedical Signal Processing and Control,2023,80(2):104248.
[12]Cao Xincheng, Yao Bin, Chen Binqiang. Atrial fibrillation detection using an improved multi-scale decomposition enhanced residual convolutional neural network[J].IEEE Access,2019,7:89152-89161.
[13]Geweid G G N, Chen J D Z. Automatic classification of atrial fibrillation from short single-lead ECG recordings using a hybrid approach of dual support vector machine[J].Expert Systems with Applications,2022,198(7):116848.
[14]Clifford G D, Liu Chengyu, Moody B, et al. AF classification from a short single lead ECG recording: the PhysioNet/computing in cardio-logy challenge 2017[C]//Proc of Computing in Cardiology.Pisca-taway,NJ:IEEE Press,2017:1-4.
[15]Rahul J, Sharma L D. Artificial intelligence-based approach for atrial fibrillation detection using normalised and short-duration time-frequency ECG[J].Biomedical Signal Processing and Control,2022,71(1):103270.