












關鍵詞:心沖擊信號;Shapelet;小波變換;人工神經網絡
中圖分類號:TP389.1 文獻標志碼:A
0 引言(Introduction)
隨著健康意識的提升和醫療技術的不斷進步,人們開始更加關注自身的心血管健康狀況。因此,心率和心動周期作為評估心血管系統健康狀況的關鍵指標,受到了廣泛關注。傳統心率檢測方法的采集設備需要將傳感器電極直接與人體相連接,這種方式可能會給患者的日常生活帶來不適和不便。心沖信號是一種非侵入性的生理信號,其優勢在于采集設備不需要與人體直接接觸。這一特點使得BCG能夠實現長期的、家庭式的無接觸健康監測,進而有效地預測和評估心血管疾病的風險[1]。
近年來,基于BCG信號進行無接觸的心動周期檢測已經得到了廣泛的研究。ALVARADO-SERRANO等[2]首先檢測BCG信號的前4個心跳來定義初始參數,其次學習這些參數來識別下一個心跳。HAI等[3]將BCG信號片段表述為圖像,饋送到門控循環單元(GRU)網絡中進行特征提取,從而實現心動周期檢測。王炬等[4]根據BCG波形中的極大值點截取BCG子序列進行模板匹配。上述算法對模板波形的質量要求較高,一旦出現模板錯誤,將會在很大程度上降低后續心動周期檢測的精度。為了提高心動周期檢測的精度,完善無接觸健康監測技術,本文提取了BCG信號的Shapelet特征和小波特征,與傳統的時域特征相比,Shapelet更具有魯棒性,而小波特征則可以反映信號的各種細節。將兩種特征相融合,命名為Shapelet-WT特征,通過該復雜特征完善心動周期的識別檢測。
1 特征提取(Feature extraction)
1.1 信號的采集與預處理
本實驗使用基于微彎曲光纖維傳感器的BCG信號采集坐墊采集BCG信號(采樣率為500 Hz),它利用微彎管的形變促使接收器收到的光強發生改變,基于這種方法制作的傳感器靈敏度高、成本低、傳輸的信號比較穩定[5]?;谖澢饫w維傳感器的BCG信號采集坐墊如圖1所示。同步采集ECG信號(采樣率為500 Hz),采集的每段信號數據均含有時間戳,這種方式解決了兩種不同信號同步難的問題。BCG信號在采集過程中極易受到外界噪聲(呼吸、體動、電路自身噪聲等干擾信號)的干擾,從而影響后續算法檢測的精度,為了突出BCG信號中的有效信息,需要對BCG信號進行預處理,降低噪聲的影響。本研究使用了截止頻率為0.4~10 Hz的二階巴特沃斯帶通濾波器濾除BCG信號中包含的呼吸信號和高頻噪聲。BCG原始信號如圖2所示,經過帶通濾波器濾波后的BCG信號如圖3所示。
1.2 小波變換提取特征
小波變換[6](Wavelet Transform,WT)是一種新的變換分析技術,它針對短時傅里葉變換局部化的思路做了改良和繼承,同時解決了窗口大小不隨時間改變而改變等缺陷,能夠提供一個隨頻率改變的時頻窗口,是進行信號時頻分析和處理的理想工具。本文利用小波變換把BCG信號在不同頻率中的特征提取出來,對信號進行頻帶分析,將最后一級的近似信號和每一級的細節信號作為模型訓練所需的特征。BCG信號f(t)的二進小波分解可表示如下:
其中:A 是近似信號,為低頻成分;D 是細節信號,為高頻成分;x(i)代表第i 個節點的BCG信號,低頻和高頻成分分別由α近似系數及β 細節系數構成。上述過程迭代地應用于每個級別的低頻成分,直到達到指定級別。多尺度分解的信號頻帶分布如圖4所示,研究人員選擇第五層的近似信號和各層的細節信號作為特征構建特征向量。
1.3Shapelet特征提取
Shapelet[7]算法是一種時間序列分析工具,它的準確性和可解釋性使其在時域分析領域備受矚目。Shapelet作為時間序列的子序列,是該序列中最具特色的部分,將其作為特征能夠有效地區分兩類時間序列的差異。使用時間序列到Shapelet的距離作為特征的分類算法,大幅提高了分類識別的靈敏度,并增強了算法的可解釋性。
研究人員提取了BCG信號中10種不同長度的Shapelet,在清除冗余和相關性不高的Shapelet后,得到了精簡后的Shapelet共43個,不同長度的Shapelet如圖5所示。精簡后的Shapelet解決了其形式的局限性,同時保持了多樣性,降低了算法的復雜度和縮短了學習時間。通過Shapelet變換[8]將Shapelet與BCG子序列之間的距離作為特征值,將BCG子序列變換到基于Shapelet的特征空間中,目的是縮減子序列的長度,但同時也保留了子序列中包含檢測心動周期的關鍵信息,圖6為某BCG子序列和其映射到同一空間的Shapelet,兩個時間序列的最佳匹配距離即所需要的特征值。
2 ANN網絡模型的搭建(Construction of ANN )
2.1 網絡結構
人工神經網絡(ANN)[9]是在生物學的基礎上,將大腦對外界刺激的反應進行理解和抽象,模仿大腦神經網絡結構和功能而建立的數學模型。該模型同時具備并行處理和分布式處理能力,并且結構簡單,網絡參數多,計算量大,能夠承受多隱層網絡的規模。
本文使用的ANN具有5層結構,如圖7所示。第一層是輸入層,第二層、第三層、第四層是隱藏層,第五層是輸出層。輸入層接收小波變換和Shapelet算法提取的特征數據。隱藏層是神經網絡中的內部處理層,這些神經元在網絡內部形成一個中間層,多個隱藏層能夠在各個層次上對輸入特征進行多級抽象,從而更有效地對不同數據進行線性劃分。本研究設置了3個隱藏層防止隱藏層過多導致的過擬合和訓練困難問題。Dropout層[10]放在隱藏層中用于解決模型的過擬合問題。
2.2 激活函數和損失函數的選擇
在訓練神經網絡時,超參數的調整是必不可少的。深度學習神經網絡中常用的超參數有梯度下降優化器、損失函數和激活函數。激活函數經常用于解決非線性問題,它可以幫助神經網絡學習復雜的數據模型。Sigmoid、Tanh和ReLu是常用的激活函數。Sigmoid函數和Tanh函數可能會遇到梯度消失的問題,而ReLu[11]函數的輸出范圍從0到無窮大,解決了梯度消失的問題,并且其收斂速度比Sigmoid函數和Tanh函數的收斂速度更快。所以,研究人員在隱藏層使用ReLu函數,在輸出層使用Sigmoid函數。
2.3 優化器和學習率
優化器是在深度學習反向傳播過程中,計算網絡的權重和偏差導數,以完成網絡參數的更新,指導損失函數能夠以適當的幅度朝著正確的方向更新,使得損失函數值不斷逼近全局最小。本文使用的優化器Adam是一種隨機優化算法,與傳統隨機梯度下降算法不同的是,它更善于處理稀疏梯度和非平穩目標,初始化學習率并且根據訓練數據迭代及時更新神經網絡權重,通過自適應地調整學習率改進梯度下降問題。
2.4 隱藏層神經元的數量設置
神經網絡的輸入層和輸出層的節點設置相對簡單。輸入層的神經元數量取決于輸入數據的變量數量,輸出層神經元的數量可以設置為1,但是如何設置每層隱藏層的神經元數量相對復雜。如果隱藏層的神經元數量過少,會導致模型欠擬合,如果隱藏層的神經元數量過多,不僅會導致數據中的有限信息無法訓練每一個神經元而使模型過擬合,同時會導致訓練時間過長。從表1中可以清楚地看出,當神經元數量過少時,測試集準確率過低;當神經元數量過多時,模型出現了過擬合。因此,在本次實驗中隱藏層的數量設置為10×10×2。
3 實驗與分析(Experiments and analysis)
3.1 數據集的獲取與劃分
在本次實驗中,同步采集了5位健康受試者的BCG信號和ECG信號用于驗證本文提出的算法,其中有3名女性和2名男性,年齡在23~27歲,每位受試者數據長度約為5 min。通過同步采集的ECG信號將BCG信號劃分為若干個子序列,其中包含完整心動周期片段(HB)和非心動周期片段(NHB),片段長度r 設置為450(每個時間序列為0.9 s)。由ECG信號標注的BCG信號如圖8所示,圖8中上方波形為BCG信號,下方波形為ECG信號。
在數據集標注完成后,對其進行分割,將數據集劃分為訓練集和測試集(圖9),其中80%的數據用于訓練,20%的數據用于測試。訓練集用于訓練模型和更新模型參數,測試集用于評估模型并測試模型的最終性能,驗證集用于觀察模型的訓練效果。
3.2 評價指標
評價指標可以反映模型的泛化能力,評估不同模型的性能,還可以用于模型優化。對于分類模型,混淆矩陣可以直觀地計算出模型的準確性(AC)、F1分數、敏感性(SE)等指標?;煜仃嚨亩x如公式(8)所示,其中TP是正確檢測的HB的數量,FP是未檢測到的NHB的數量,TN是正確檢測到NHB的數量,FN是錯過的HB的數量。AC反映了正確預測的樣本的百分比,由公式(9)定義。SE是指檢測到的正確HB的數量與所有HB的數量之比,如公式(10)所定義。F1分數又稱平衡F 分數(Balanced Score),它被定義為精確率和召回率的調和平均數,如公式(11)中所定義,其中r 為召回率。
3.3 實驗結果
本次實驗的計算機配置如下:11th Gen Intel(R) Core(TM) i7-11700 @ 2.50 GHz 2.50 GHz,RAM 為16 GB,仿真環境為Python3.7。圖10和圖11分別為模型訓練過程中訓練集和驗證集隨著迭代次數的增加,其損失值和準確率的變化曲線。在前10次迭代中,隨著驗證集和訓練集的損失值迅速下降,準確率則快速攀升,當迭代次數達到30次時,模型性能趨于穩定,最終確定迭代次數為30次。
為了驗證提取的Shapelet-WT特征更具魯棒性,本研究也提取了BCG信號的時域特征,將時域特征與小波特征進行融合并命名為TD-WT特征,具體提取的時域特征如表2所示。模型使用不同特征進行心動周期檢測的實驗結果如表3所示,將輸入到ANN中的TD-WT特征和Shapelet-WT特征進行比較,驗證模型在不同特征下每位測試者心動周期的檢測性能。通過添加每位測試者的混淆矩陣計算總體的AC、SE和F1分數,與TD-WT特征相比,使用Shapelet-WT特征顯著提高了模型的整體性能,其中準確率高達98.35%,同時對于敏感性的大幅提升也反映了Shapelet-WT特征的顯著性。
采用與文中相同的數據集及劃分策略,研究人員對支持向量機(SVM)、隨機森林(RF)、K-最近鄰(KNN)、Logistic回歸以及本文所提算法進行了性能對比。由圖12可以看出,基于Shapelet-WT特征的ANN分類器在各個指標上都明顯優于傳統的分類器,預測的心動周期與實際心動周期高度重合證明了其在心動周期檢測中的優越性。總體而言,本文提出的檢測算法可以準確地檢測到絕大多數的心動周期,并且對于受到體動等噪聲影響的BCG信號,也獲得了很好的心動周期檢測精度,驗證了該算法的魯棒性。
4 結論(Conclusion)
本文提出了一種基于復雜特征的心動周期檢測算法,提取BCG信號的Shapelet特征和小波變換多尺度特征,并在此基礎上使用人工神經網絡深度學習模型智能化地檢測心動周期。其中,Shapelet特征主要用于彌補普通的時域特征無法很好地區分時間序列差異的缺陷,提取的小波特征則可以進一步完善遺漏的細節特征,同時提取了信號的時域特征用于對比驗證。為了更加準確地檢測心動周期,本研究摒棄了傳統的分類器,采用ANN神經網絡。實驗結果表明,本文提取的復雜特征比傳統特征更具魯棒性,與傳統算法相比,本文提出的算法顯著提升了心動周期的識別準確率,具有優秀的檢測效果,可以用于長期的家庭式健康監測。
作者簡介:
朱永梁(1998-),男,碩士生。研究領域:BCG信號處理。
朱耀東(1970-),男,博士,教授。研究領域:智能計算機與健康物聯網。
唐敏(1999-),女,碩士生。研究領域:智能健康機器人。
胡蝶(1998-),女,碩士生。研究領域:情緒識別。