徐正麗,蔣盟珂,謝梅英,蔡 翔**
(1.桂林電子科技大學,廣西桂林 541004;2.南京信息工程大學,江蘇南京 210044)
人體的呼吸信號涵蓋多方面的信息特征,如速率、形態、強度等,這些信息可有效體現如心肺功能等人體多方面功能特征。呼吸數據相關文獻表明,人體呼吸信號確實能在一定程度上反映人的身體狀況,因此對人類呼吸病癥的有效預防與及時發現,可以通過分析人體呼吸信號來實現[1]。
相較于基礎的呼吸信號獲取,國外的研究人員更多著眼于獲取呼吸數據或者通過實時呼吸數據進行疾病預警[2,3]。Sebastijan等[4]提出利用光學干涉儀對外部干擾造成光纖長度變化的特性來檢測呼吸。Alexander等[5]選取33個呼吸關聯特征結合睡眠階段的啟發式知識進行特征分類,用于判斷呼吸數據來自健康人還是病人,準確率達到80.38%。Agnel等[6]基于單片機設計了一個監測系統,用于測量睡眠狀態下受試者呼吸出現暫停的狀況。Raji等[7]通過兩個LM35溫度傳感器間接獲取患者呼吸樣本信息,然后根據呼吸率的特殊波動狀況來判斷患者是否哮喘發作。研究人員的共同目標是從簡單的長時程呼吸信號中提取精準的呼吸信號,并將其應用于呼氣功能檢測或疾病診斷等。但目前的研究多數僅是通過實時監控呼吸數據來查看是否出現異常情況,并沒有對患者的呼吸系統進行全面評估。
此外,對呼吸信號的分析和研究仍然存在許多有待突破的關鍵技術和難點:①如何對最初采集到的呼吸信號進行預處理。因為剛采集的、最初始的呼吸信號中存在大量噪聲數據,如果直接用來進行后續研究,將影響最后的實驗結果,因此需要先去除信號中的噪聲,為后續研究的開展打下良好的基礎。②不同階段的呼吸信號數據與心電信號數據有明顯不同,這可能是說話、打噴嚏、咳嗽等行為所導致的數據采集不準確,此外,還存在除了“吸氣”“呼氣”之外,無法更加細分呼吸信號程度的問題,這些問題都是開展進一步研究的巨大挑戰。③因為呼吸信號本身的屬性有一定程度的不確定因素,所以在對其做相關研究時,如何提高結果的精確度是個棘手的問題。相對于傳統的X光、核磁、呼吸機檢測儀器等測量手段,使用呼吸腰帶測量呼吸具有持續采集、對人體幾乎沒有傷害、方便、價格低、信號采集相對穩定等優點,且呼吸腰帶獲取的呼吸數據是具有時間序列特征的連續數據。因此,本研究使用呼吸腰帶獲取受試者呼吸信號數據,先對原始呼吸信號進行濾波處理,去除相應的異常數值與基線漂移情況;然后分別使用適合處理時間序列的長短期記憶網絡(Long Short-Term Memory,LSTM)、吸呼比結合LSTM,以及吸呼比結合在許多領域被廣泛應用的支持向量機(Support Vector Machine,SVM),對收集到的呼吸數據進行分類,判斷受試者的呼吸狀況是否異常。
受試者呼吸信號數據均采用呼吸腰帶獲取。實驗數據集由中國中醫科學院采集,總樣本數量為342個,其中包含人體呼吸異常55個、正常287個,在全部的樣例中,單個樣例均為24 h左右的十進制數值。正常人的吸氣時間一般為0.8-1.2 s,呼氣時間一般為0.5-1.0 s[1],加上1-2 s的呼吸間隔,一次呼吸的時間約3.5 s,吸氣與呼氣時間比為1∶(1.5-2.0)。由于呼氣時僅是胸腔回縮而沒有其他動能,所以需要的時間較長,但異常人群的呼吸比值會達到正常人的兩倍甚至更高。因此,針對有明顯差異的信息,可以收集對應的呼吸數據進行深層次的分析。
原始數據通常存在基線漂移等現象?;€漂移一般是由于人體呼吸、電極運動等引起的,在進行下一步的研究分析之前,需要先從原數據中去除基線漂移才能得到更體現原始呼吸特征的數據。常用的去除方法有中值濾波、小波變換法、形態學濾波法等[8]。本研究選用小波變換進行濾波處理。
小波變換廣泛應用于信號處理、圖像處理、模式識別等領域。通過伸縮平移運算對信號(函數)逐步進行多尺度細化,最終達到高頻處時間細分、低頻處頻率細分,能自動適應時頻信號分析的要求,從而可聚焦到信號的任意細節。小波變換是一個平方可積分函數與一個在時頻域上均具有良好局部性質的小波函數的內積,如公式(1)所示。
Wf(a,b)=
(1)
式中,a>0,為尺度因子;b為位移因子;*表示復數共軛;ψa,b(t)為小波基函數。
采用濾波的方式對最初的數據進行處理,呼吸頻率一般為0.2-0.8 Hz,先用Butterworth低通濾波器消除高頻噪聲,其中將操作中的截止頻率和采樣頻率分別定為0.8 Hz和32 Hz。公式(2)為呼吸曲線基準的計算方法,式子中樣例點的數量用m表示,第i個數據點的大小用xi表示。
(2)
單個樣例出現個體性差異的現象屬于正常范疇。本研究利用公式(3)的處理方法對沒有關系的差異性進行有效消除和分類。
(3)

(4)
式中,da為圖1中a點的數值,db為圖1中b點處的數值,L表示圖1中所有數值位于da和db間的關鍵點的個數。呼吸時會存在一些相對較小的波折(如圖1中紅色標記處),這些波折不可以當作真正的拐點,因此,設定一個經驗閾值的大小為σ=0.5,針對波峰波谷的垂直方向的距離大小進行相關的測量,如果測量值小于設定閾值的大小,那么該點將不會被當作拐點。

圖1 拐點(波峰/波谷)示意圖Fig.1 Schematic diagram of inflection point (peak/trough)
呼吸數據的相關分析常用的指標是吸呼比特征,吸呼比即一次呼吸周期中的吸氣時間與呼氣時間的比值。根據其特點可識別出數據中的峰值和谷值,呈上升趨勢的為“吸”,下降趨勢則為“呼”。圖2(a)為“吸”在呼吸帶上的壓力變化過程,體現了“吸”過程中肺部容積逐漸增大;圖2(b)為“呼”在呼吸帶上的壓力變化過程,體現了“呼”過程中肺部容積逐漸減小。各自的時間代表“呼”和“吸”維持的時長。

圖2 “吸”“呼”過程示意圖Fig.2 Schematic diagram of "inhaling" and "exhaling" process
得到“吸”與“呼”的時間后,則吸呼比特征可根據公式(5)計算得到,其中tx和th分別代表一次吸和呼的時間長度。
α=tx/th。
(5)
LSTM是一種特殊的循環神經網絡(Recurrent Neural Network,RNN)。對于RNN, LSTM能夠更好地處理RNN面臨的梯度爆炸和梯度消失問題,這主要是因為LSTM摒棄了簡單RNN中“連乘”的計算方式,改為“累加”的方式[9]。LSTM引入了記憶單元,這樣網絡可以控制什么時候遺忘不需要的信息,什么時候用新的輸入信息更新記憶單元,通過遺忘門、輸入門、輸出門來實現信息的保護和控制。在t時刻LSTM更新方式如下:
ft=σ(Wf·[ht-1,xt]+bf),
it=σ(Wi·[ht-1,xt]+bi),
(6)
ot=σ(Wo·[ht-1,xt]+bo),
ht=ot*tanh (Ct),
式中,ht-1為上一時刻的輸出,xt為t時刻的輸入,σ是激活函數。遺忘門ft控制每一個單元需要遺忘多少信息,輸入門it控制新的信息,輸出門ot控制輸出的信息。
由于呼吸數據具有時間前后關聯性,因此可使用LSTM對呼吸數據進行分析,從而判斷呼吸是否異常,并將其看作序列分類任務。本研究使用的LSTM單元,接收的輸入參數為去噪歸一化的呼吸數據,輸入的數據是去除基線漂移后并歸一化的,吸呼比結合LSTM正常異常分類的LSTM接收的是每呼吸段的吸呼時間比。每個吸呼周期采樣32個點,時間窗取10,時間窗內的LSTM提取的時序特征作為一維向量,再連接多層全連接網絡進行分類,輸出標簽為長度為2的one-hot編碼形式,(0,1)表示呼吸異常,(1,0)表示呼吸正常。則LSTM的網絡結構可表示為(320-h1-h2-…-2),其中hi(1≤i≤n)表示第i個隱藏層單元的數量,n為LSTM隱藏層的層數。網絡結構設計如圖3所示。

圖3 LSTM結構Fig.3 LSTM structure
SVM是一種主流的二分類模型,在許多領域都有廣泛的應用[10]。SVM將原始數據線性不可分的問題,通過核函數映射到更高維的特征空間中,轉化為求解線性約束的二次規劃問題。給定訓練樣本集D=((x1,y1),(x2,y2),…,(xm,ym)),yi∈{-1,1},假設在某個空間能用一個超平面:w·x+b=0,其中w為超平面的法向量方向,b為超平面位移量,決定了超平面與原點之間的距離。該超平面將訓練集分為兩類,最合適的超平面是最大邊距超平面(Maximum-margin hyperplane)[11]。通過求解判別式(7),可得到最佳的w與b的值。
(7)
式中,K(x,xi)為核函數,對應于在輸入空間構造一個最優的分割平面,ai和b通過SVM學習算法解得[12]。
將根據公式(5)計算出的每個吸呼周期的吸呼比進行可視化后(圖4),直接將其歸一化為20×20的圖片,然后采樣為長度為400的一維向量輸入SVM中,同時所有的數據被歸一化到[0,1]。實驗中,SVM使用的是徑向基核函數,其中SVM單個樣本的影響范圍γ以及模型準確率與模型復雜度平衡參數c均設置為2.0,訓練過程采用5折交叉驗證。

圖4 正常、異常吸呼時間比示意圖Fig.4 Schematic diagram of normal and abnormal breathing time ratio
正常、異常呼吸情況下的單個樣例信息可視化如圖5所示??梢钥吹剑瑑H憑借經驗難以直接分辨出呼吸正常與異常樣本的差距。初始呼吸信號曲線有很多毛刺信息,見圖6(a);進行濾波處理后,50 Hz工頻的干擾被濾除,濾波處理后的曲線較初始呼吸信號曲線光滑,見圖6(b),但基線漂移情況仍存在。進一步去除基線漂移處理后,呼吸曲線變換結果如圖7所示,其中圖7(a)為一段沒有經過基線漂移處理的呼吸曲線,圖7(b)為圖7(a)經過基線漂移處理的呼吸曲線。對比圖7(a)和圖7(b)可以看到,經過基線漂移處理的呼吸曲線在呼吸強度上的數值隨著時間變化更加平穩。

圖5 呼吸正常與異常數據示例Fig.5 Examples of normal and abnormal breathing data

圖6 原始呼吸信號(a)和低通濾波處理后的呼吸信號(b)Fig.6 Original respiratory signal (a) and respiratory signal (b) after low-pass filtering

圖7 原始信號(a)及基線漂移去除結果(b)Fig.7 Original signal (a) and baseline drift removal result (b)
對處理后的呼吸數據分別采用LSTM、吸呼比特征+LSTM、吸呼比特征+SVM進行正常呼吸和異常呼吸分類,其分類精度、召回率以及F-值如表1所示,其中LSTM隱藏層采用不同的神經單元數。可以看到,單純使用LSTM時分類精度不是很高,為62%左右,其中隱藏單元數為64的效果最好。相對于單純使用LSTM,吸呼比結合SVM的方法獲得的準確度有所提高,達72.8%。吸呼比結合LSTM的方法獲得的準確度提升最大,其中吸呼比結合LSTM(320-10-64-64-2)獲得的準確度最高,達79.2%,即同時使用64-64兩層隱藏層節點時效果最好。

表1 3種處理方法的分類精度、召回率以及F-值Table 1 Classification accuracy,recall rate and F-value of three processing methods
同時可以看到,召回率以及F-值方面,吸呼比結合LSTM(320-10-64-64-2)獲得的數值也相對更好,分別達到98.9%和44.0%,比傳統的吸呼比inspiratory/expiratory ratio+SVM獲得更好的效果。
由上述實驗可以看到,采用吸呼比結合SVM的分類方法比單純采用LSTM的結果更好。一個可能的原因是LSTM完全依靠神經網絡提取的特征,而吸呼比特征是目前在臨床廣泛認可的呼吸是否異常的標準,因此吸呼比特征結合SVM獲得了相對于單純使用LSTM更好的效果?;谶@個認識,進一步比較了吸呼比結合LSTM不同網絡結構的實驗驗證,結果發現吸呼比結合LSTM總體獲得比吸呼比結合SVM更好的效果。因為LSTM結構的一大特點在于遺忘門機制,并聯合上一時刻輸出、當前時刻輸入、激活函數以及輸入門和輸出門形成單元狀態保持和更換[見公式(6)所描述],其將上/下一個時間步長特征根據一定權值聯接到自身,拷貝自身狀態的真實值和累積的外部信號,學習到較長時程的吸呼數據的周期性特點。這使得LSTM擅長學習數據間的依賴性,能夠提高呼吸帶數據在正常、異常分類上的準確率。從表1的第7行到第12行的數據對比可以看到,更寬和更深的網絡相能夠提升識別精度,如吸呼比+LSTM(320-10-64-128-2)獲得了75.5%的精度,而吸呼比+LSTM(320-10-32-2)以及吸呼比+LSTM(320-10-128-2)精度分別為73.5%和73.1%,相對提高了2.0%和2.4%的準確度,同時在召回率和F-值上也獲得提升。然而,也可以看到,針對呼吸帶數據,持續地增加網絡的寬度和深度并不能一直提高準確度。表1第12行的吸呼比+LSTM(320-10-64-128-2)相對于第11行的吸呼比+LSTM(320-10-64-64-2)在第3層網絡節點數更多,然而其準確度反而比第11行的準確度要低3.7個百分點(79.2%-75.5%)。相似的情況也發生在第12行和第10行的網絡結構上。因此,采用合適的網絡結構可以獲得更佳的判斷結果。
目前,針對呼吸測量的傳統方法主要有溫度式檢測[13]、阻抗式檢測、通過獲取心電信號然后推斷得出呼吸信號等。溫度式檢測可復用、構成簡易,但因為用于測量的傳感儀器需要與人體的口鼻腔直接接觸,會給被檢測者帶來不適感[14]。阻抗式檢測法是當下在臨床中使用較為頻繁的呼吸測量方式之一,具有測量穩定、測量方式簡單易操作等特點。該方法雖然不會讓被檢測者產生任何身體不適,具有無創且安全的特性,但是在實施過程中對電極有一定要求,同時會由于血液流動的干擾造成相應比值不易確定等問題[1]。通過獲取心電信號然后推斷得出呼吸信號,是一種較新穎的無創檢測方法,但該方法存在測量的精確度不高,過久地使用心電電極裝置可能會給患者的皮膚帶來不適等缺點。相對于這些方法而言,呼吸腰帶是一種能夠長時間使用、無創地對呼吸功能進行測量與評估的方法和工具。
與傳統方法相比,使用呼吸腰帶有諸多好處:①持續采集,對人體幾乎沒有傷害。呼吸腰帶能直接對患者的呼吸信號進行采集,具有持續性,能連續采集整個時間段里的數據并且不會給患者帶來任何創傷。②方便,價格親民。呼吸腰帶使用方便快捷,其中的核心部件包括拉力傳感器和數據存儲設備,設備大部分功能的實現是將核心部件放置于腰帶中,依靠核心部件來檢測患者的呼吸信號。目前傳感器和數據存儲設備的價格并不高,所以整條呼吸腰帶的價格比較親民,能夠讓大多數患者購置和使用。③信號采集相對穩定。呼吸腰帶使用時綁定在患者腰上,有著不錯的穩定性;同時患者可以帶著它進行大部分的日?;顒佣皇苡绊懀辛己玫氖孢m性;此外,長時間佩戴和直接檢測可提升呼吸數據的精準度。盡管呼吸腰帶設備已經面世,但目前尚屬于新興呼吸監測設備,公開報道的文獻和研究相對較少[2,8],且目前對呼吸相關數據的研究分析較少,尤其是對呼吸腰帶數據的分析更少。因此,本研究為呼吸腰帶長時間、無創地對呼吸功能進行測量與評估提供了一種新的手段和方法。
為了有效區分呼吸正常與異常人群,本研究采用呼吸腰帶采集受試者呼吸數據,并對數據進行預處理后,分別使用LSTM、吸呼比結合LSTM和吸呼比結合SVM進行分類判斷,發現吸呼比結合LSTM方法獲得的呼吸正常、異常分類效果最好,準確率接近80.0%,相比于單一使用LSTM,其準確率提升15.0%左右,證明該方法的有效性,也為下一步呼吸臨床實驗、病理檢測等提供良好的數據支撐。下一步將考慮使用其他網絡結構如遞歸神經樹、隨機森林等進行分類判斷,并且與醫學相關人員進行探討,尋找吸呼比之外的其他特征,如每次呼吸周期的前斜率、后斜率等,以期得到更好的分類結果。
致謝
感謝中國醫學科學院張啟明研究員團隊提供呼吸腰帶實驗數據。