李帆 程云章 邊俊杰



摘 要:為通過光電容積脈搏波信號獲取動脈血壓參數,并將其作為判斷個人健康狀況的依據,基于Tensorflow框架訓練LSTM網絡模型與傳統RNN模型,使用625 000條光電容積脈搏波數據序列通過忘記、選擇記憶、輸出階段得出符合生理規律的血壓參數,將兩種模型放在125 000條樣本的測試集中進行有效性驗證。實驗結果表明,訓練后的LSTM模型對血壓的預測比傳統RNN模型更準確,LSTM預測評價指標MAE、RMSE、STD和R2_score分別為4.05、8.78、7.42和0.89,且預測結果符合美國醫療儀器促進協會標準(MAE<5mmHg,STD<8mmHg),而傳統RNN模型則為11.58、17.03、14.54和0.73。LSTM模型能較好地預測血壓參數,在生物醫學領域有較高的應用價值,其效果優于傳統RNN模型。
關鍵詞:同步血壓預測;PPG信號;LSTM網絡;循環神經網絡;深度學習
DOI:10. 11907/rjdk. 192606 開放科學(資源服務)標識碼(OSID):
中圖分類號:TP312文獻標識碼:A 文章編號:1672-7800(2020)008-0044-05
Abstract: In order to obtain the parameters of arterial blood pressure through the photoplethysmography signal, which is the basis of judging personal health status,the LSTM network model and the traditional RNN model were trained based on tensorflow framework, and 625 000 photoplethysmography data sequences were used to obtain the blood pressure parameters that conform to the physiological rules through forgetting, selecting memory and outputting stages, and the validity of the two models was verified in 125 000 sample test sets. The experimental results showed that the prediction of blood pressure of the trained LSTM model was more accurate than that of the traditional RNN model. The MAE, RMSE, STD and R2_score of LSTM were 4.05, 8.78, 7.42 and 0.89 respectively, and the prediction results were in line with the standards (MAE < 5mmhg, STD < 8mmhg) proposed by the American Association for the promotion of medical instruments, while the traditional RNN model was 11.58, 17.03, 14.54 and 0.73. The results show that LSTM model can predict the parameters of blood pressure better and has higher application value in biomedical field, and the effect is better than the traditional RNN model.
Key Words: synchronous blood pressure prediction; photoplethysmography signal; LSTM network; recurrent neural network; deep learning
0 引言
血壓(Blood Pressure,BP)是表征人類身體狀況的重要生理指標之一,也是防治心血管疾病的重要血流動力學參數。持續較高水平血壓會誘發中風、心肌梗死等心血管疾病[1]。因此對于該類人群的持續血壓監測十分重要,可預見、方便、低成本的連續無創血壓監測的重要性日益凸顯。
傳統侵入式血壓測量雖然測量結果精確,且其中動脈插管法被譽為“金標準”[2],但因對患者傷害大、操作復雜等原因逐漸被無創方式取代。無創測量也分為間歇式和連續式,其中間歇式有柯氏音法和示波法等,連續式有扁平張力法、恒定容積法和脈搏波傳遞時間測量法等[3]。
以扁平張力法為原理的產品,如浙江善時醫療公司的T-Line系列[4],雖然可測得實現較長時間連續的人體血壓,結果較準確,但在使用中需長時間定位在一個位置,壓力傳感器難以保證位置不會有偏差,同時長時間壓迫手腕使受試者感覺不舒適;而以恒定容積法為原理的袖帶式測量則不便于長時間觀測血壓,且會壓迫大臂,同樣產生不適。
近年來,利用機器學習[5]算法進行血壓測量的方法逐漸興起。2005年,Kim 等[6]綜合考慮了PTT、體重、身高、體質比、臂長等不同的生理因素,挑選出兩個與血壓相關性最高的特征,然后將這兩個特征輸入到人工神經網絡中建立血壓估算模型,其精度高于線性和非線性回歸方法;2016年,Kachue 等[7從ECG(Electrocardiogram)和PPG(photoplethysmography)信號中提取許多生理參數并進行多重回歸,然后采用人工神經網絡進行訓練,得到了不錯的結果;2016年,He等[8]通過隨機森林的方法篩選有用特征,結果發現隨機森林方法優于線性回歸以及普通的PTT模型。總的來說,使用機器學習方法訓練的血壓模型在一定程度上提高了估計精度,然而該方法目前最大阻礙是找到合適的特征集合,并且計算機模型背后的潛在機制尚不明確,有待進一步研究。
由于PPG信號與動脈血壓值均是與時間有強烈關聯性的數據,且兩者本身有明顯的呼應關系,所以可采用深度學習算法中對存在規律的時間序列有良好處理能力的傳統循環神經網絡(Recurrent Neural Network,RNN)模型[9]。通過已知PPG信號同步預測血壓值,從而避免傳統血壓監測方法繁瑣的操作與帶給受試者的不適感。但由于傳統RNN模型在前向傳播過程中只能考慮最近時刻的生理狀態,然而血壓預測需全面考慮先前的多種生理狀態,所以本文采用RNN的變種——長短時記憶網絡(Long Short-Term Memory,LSTM)模型[10]。LSTM可決定之前的哪些狀態需被強化或弱化,完全符合血壓預測的真實狀況。本文將系統介紹PPG信號原理與LSTM網絡原理,分析實驗結果并提出改進之處。
1 PPG信號數據集
1.1 PPG信號原理
PPG信號是通過光電容積脈搏波描計法獲得的一種波形信號,其測量原理為:將光照射到皮膚表面,由于人體組織(肌肉、皮膚等)可吸收光從而削減光強,光電探測器接收到的光強減弱,整個血液循環過程中減弱的光強值是穩定的。因此,當血液隨心臟搏動呈現出容積變化時,接收到的光強也呈同步脈動變化,將接收到的這種光強信號轉換為電信號,即為光電容積脈搏波[11]。其理論基礎是朗伯·比爾定律[12],其關系式為:
其中,A為吸光度,I0為入射光光強,It為被介質吸收后透射光光強,K為吸收系數,l為吸收介質厚度,c表示吸光物質濃度。
由于人體指端血流感受面積大,測量靈活方便,因此光電容積脈搏波描計法通常通過測量指端血流吸光度獲得PPG信號。
1.2 數據預處理
本文使用麻省理工學院計算生理學實驗室提供的多參數重癥監護智能監測(Multi-parameter Intelligent Monitoring in Intensive Care,MIMIC-II)在線波形數據庫[13]作為實驗數據集。2001—2008年期間,各醫院監測員記錄了心血管病患者上千萬個血流動力學參數,波形信號以125 Hz的頻率、至少8位精度采樣。本實驗從該數據庫中提取了2組共約75萬個PPG、動脈血壓(ABP)數字信號共6 000秒采樣時間,分別作為訓練集與測試集。
由于MIMIC數據庫信號包含了大量失真和偽影部分,導致最終結果誤差巨大,所以為了使神經網絡能準確提取出數據特征,首先通過預處理進行去噪。預處理總體思路是將數據集按照同一標準分割成若干波形段,然后對每個波形段進行包含4個步驟的處理:①使用簡單的平均濾波器平滑所有信號;②去除明顯不合邏輯的動脈壓值;③去除嚴重不連續信號;④計算PPG信號的自相關度,即波段間的相似度,并去除產生數值突變的信號。
數據集均經過以上步驟處理后方可劃分成神經網絡的訓練集與測試集。處理后的PPG信號與ABP信號如圖1、圖2所示。
1.3 PPG信號特征
PPG信號中包含大量與血壓相關的特征,這些特征會幫助LSTM網絡提高預測精度。將單個周期PPG信號波形數據歸一化至[0,1]區間內,可得如圖3所示特征。
LSTM內部結構如上所述,通過門控狀態控制傳輸狀態,記住需要長時間記憶的,忘記不重要的信息,而普通RNN只能以僅有的一種記憶疊加方式。LSTM對很多需要“長期記憶”的任務,如血壓監測、股價預測等優勢尤為突出。
2.2.3 LSTM網絡參數調節
數據集預處理后,使用默認的超參數設置,觀察loss的變化,初步定下各個超參數范圍,再依次進行調參。本實驗遇到的loss變化主要為train loss不斷減小,test loss不斷增大,是較為明顯的過擬合現象,即模型已記住所有訓練數據,對訓練集數據預測效果非常好,但對測試集數據的預測效果非常差。由于數據集已經過預處理并且樣本量足夠,實驗將采取以下兩種解決方法。
(1)使用L2正則化。正則化方法包括L0、L1和L2正則,LSTM通常使用L2正則。正則一般是在目標函數之后加上對象范數,L2范數指先求向量各元素平方和然后求平方根,可使應受懲罰影響的權重W的每個元素都加劇減小且不等于0。更小的W意味著模型復雜度更低,適用于訓練數據擬合,不會過分擬合訓練數據,避免過擬合,從而提高模型泛化能力。
(2)使用Dropout。Dropout方法在神經網絡中十分常見,該方法在訓練時讓神經元以一定概率不工作,即在訓練時以一定概率P跳過指定百分比數量的神經元。
3 實驗結果與分析
3.1 訓練過程
整個LSTM網絡訓練過程預測值與真實值對比如圖8所示,可明顯看出訓練前期預測值與真實值差距較大,隨著訓練樣本的不斷增多,預測值與真實值重合度越來越大,模型準確率也越來越高。
3.2 評價指標
LSTM網絡與傳統RNN測試集中模型結果各項指標對照如表1所示,指標包括:平均絕對誤差(MAE)、均方根誤差(RMSE)、標準差(STD)、R2值(R2_score),圖9進一步展示了兩種模型四大指標實時對比曲線,顯然LSTM網絡在同一測試集中各項指數均表現更佳。同時LSTM測試指標中平均絕對誤差不大于5mmHg,標準差不大于8mmHg,符合美國醫療儀器促進協會(AAMI)提出的標準,模型可靠性得到證明。
本實驗中平均絕對誤差(MAE)反映ABP預測誤差實際大小。均方根誤差(RMSE)衡量ABP預測值同真值之間的偏差。標準差(STD)反映了ABP誤差值離散程度。R2值(R2_score)表示ABP預測值與真值的擬合優度,R2_score=1,達到最大值,意味著樣本中預測值和真實值完全相等,沒有任何誤差,模型最為理想,此后小于1且越遠離1即意味著預測值與真實值相差越多,模型越差。
3.3 誤差分布
LSTM與RNN誤差數值頻數分布如圖10所示。RNN模型訓練在測試集中誤差多集中在-10~10mmHg,而LSTM模型則更多集中在-5~5mmHg。且RNN誤差在-20mmHg之前以及10mmHg之后仍有一定量分布,而LSTM則基本沒有。
4 結語
無創血壓預測方法雖然有很多種,但多數存在一定缺陷,例如數據樣本少導致不同受試者預測結果差異巨大[18]、更換受試者需要不斷校準[19]等問題。本文方法利用神經網絡結合大數據很好地解決了這些問題,同時為穩定、免校準的血壓估計提供了足夠的實驗支持。另外,本文使用的MIMIC-II數據庫包含從醫院獲得的臨床數據,由于對患者隱私的保護,缺少一些有價值的參數,例如年齡和身高,如能將這些重要特征添加到神經網絡輸入中,將獲得更準確的結果。
參考文獻:
[1] LIM S S, VOS T, FLAXMAN A D, et al. A comparative risk assessment of burden of disease and injury attributable to 67 risk factors and risk factor clusters in 21 regions, 1990-2010: a systematic analysis for the Global Burden of Disease Study 2010 [J]. The Lancet, 2012, 380(9859): 2224-2260.
[2] KASHANI A, DOYLE M, HORTON M, et al. Direct innominate artery cannulation as a sole systemic and cerebral perfusion technique in aortic surgery[J]. Heart Lung Circ, 2019, 28(4): 67-70.
[3] 李頂立. 基于脈搏波的無創連續血壓測量方法研究[D]. 杭州:浙江大學, 2008.
[4] DUECK R,GOEDJE O,CLOPTON P. Noninvasive continuous beat-to-beat radial artery pressure via TL-200 applanation tonometry [J]. Journal of Clinical Monitoring Computation, 2012, 26(2): 75-83.
[5] 周志華. 機器學習[M]. 北京: 清華大學出版社,2016.
[6] KIM J Y, CHO B H, IM S M, et al. Comparative study on artificial neural network with multiple regressions for continuous estimation of blood pressure [C]. Proceedings of the 27th IEEE Annual Conference of Engineering in Medicine and Biology, 2005: 6942-6945.
[7] XING X M, SUN M S. Optical blood pressure estimation with photoplethysmography and FFT-based neural networks [J]. Biomed Opt Express, 2016, 7(8): 3007-3020.
[8] HE R, HUANG Z P, JI L Y, et al. Beat-to-beat ambulatory blood pressure estimation based on random forest [C]. Proceedings of the 13th IEEE ?International Conference on Wearable and Implantable Body Sensor Networks , 2016: 194-198.
[9] 王敏, 曾浩. 循環神經網絡語言模型定點化優化算法研究 [J]. 軟件導刊, 2017, 16(2): 63-66.
[10] 李佳, 黃之豪, 陳冬蘭. 基于 LSTM 等深度學習方法的股指預測研究 [J]. 軟件導刊, 2019, 18(9): 17-21.
[11] DING X R, ZHANG Y T, LIU J, et al. Continuous cuffless blood pressure estimation using pulse transit time and photoplethysmogram intensity ratio [J]. IEEE Transactions on Biomedical Engineering, 2016, 63(5): 964-972.
[12] MOSOROV V. The Lambert-Beer law in time domain form and its application [J]. Applied Radiation and Isotopes,2017,128(10): 1-5.
[13] SAEED M, VILLARROEL M, REISNER A, et al. Multiparameter intelligent monitoring in intensive care II: a public-access intensive care unit database[J]. Critical Care Medicine,2011, 39(5): 952-960.
[14] ELGENDI M. On the analysis of fingertip photoplethysmogram signals [J]. Current Cardiology Reviews, 2012, 8(1): 14-25.
[15] PALOMBO C, KOZAKOVA M. Arterial stiffness is associated with adipokine dysregulation in non-hypertensive obese mice [J]. Vascul Pharmacol, 77(2): 1-7.
[16] TAI K S, SOCHER R, MANNING C D. Improved semantic representations from tree-structured long short-term memory networks [DB/OL]. https://arxiv.org/abs/1503.00075.
[17] HOCHREITER S,SCHMIDHUBER J. Long short-term memory [J]. Neural Computation, 1997, 9(8): 1735-1780.
[18] GESCHE H, GROSSKURTH D, KUCHLER G, et al. Continuous blood pressure measurement by using the pulse transit time: comparison to a cuff-based method [J]. European Journal of Applied Physiology, 2012, 112(1): 309-315.
[19] WONG M Y, POON C C, ZHANG Y T. An evaluation of the cuffless blood pressure estimation based on pulse transit time technique: a half year study on normotensive subjects [J]. Cardiovascular Engineering, 2009, 9(1): 32-38.
(責任編輯:江 艷)