(北京科技大學土木與資源工程學院,北京,100083)
社會工業化和城市地下空間的不斷發展使得有限空間作業環境增多,有限空間由于其作業空間小、進出口常處于關閉狀態而容易導致溫度和濕度較高。高溫環境指35℃以上的生活環境和32℃以上的生產環境,高濕環境指相對濕度在60%以上的環境[1]。高溫高濕環境使得人體產生熱應力,熱應力會使人感覺意識模糊、疲勞乏力,較大的熱應力會導致人產生熱疾病甚至死亡[2-4]。LIND等[5]認為人體進入高溫高濕環境時,失水量逐漸增多,從而導致人體不能形成熱適應,在高溫高濕環境下,在較短時間內停留能避免環境對人體的傷害。有限空間作業環境并非專門用于人員作業,一般不設置固定式溫度濕度傳感器,而手持式溫度濕度測量儀在有限空間內操作復雜且占用人力資源,作業人員對溫度、濕度難以精確判斷,因而,無法主觀辨別進入的有限空間是否為高溫高濕環境,缺乏相應的警覺心理。人體進入高溫高濕環境時,為適應環境會自動調整產熱與散熱的平衡[6],從而導致人體的相關生理參數發生變化,如血管擴張、心跳加速、每博輸出量減少、血壓改變等[7-8]。人體的光電容積脈搏波(photoplethysmography,PPG)含有心臟搏動、血管、呼吸頻率、血壓等信息[9-10],信號的測量簡單快速,不對人體產生創傷,是一種合適的反映人體生理狀態的信號。隨著智能穿戴設備的發展,在線實時監測PPG信號并進行數據處理成為可能。金龍哲等[11-12]通過監測人體的PPG信號,分析人體生理狀態進而判斷其所處的環境。當人體處于舒適環境和高溫高濕環境中時,其生理狀態存在差異,本文通過PPG信號的差異性對高溫高濕環境和舒適環境這2種模式進行識別。傳統的統計學方法對信號進行識別時需要進行特征提取,人為設計特征提取方法存在特征提取不完全、特征有效性低、信息處理速度慢等問題[13-15]。本文利用深度學習自動提取PPG信號中的特征并進行分類,通過殘差神經網絡訓練過程,保證卷積層提取到特征的有效性和完備性,提高模式識別的準確率[16-19]。
實驗設置的高溫高濕環境為:溫度35℃,相對濕度80%。根據PMV(predictedmean vote)指數[19]設置正常舒適環境的溫度為25℃,相對濕度為30%。實驗人員共15名,包括8名男生(平均年齡22歲)和7名女生(平均年齡22歲),這15名被試人員的生理狀態良好,實驗前無飲酒、飲用咖啡、藥物治療等情況。實驗地點為北京科技大學土木與資源工程學院微環境實驗室,該實驗室能夠調節內部溫度、濕度及各種氣體環境。本實驗經北京科技大學倫理道德委員會批準。
實驗開始前,調節實驗室環境到指定的溫度和濕度,調節完成后被試人員進入環境內。待實驗室環境進一步穩定后,開始采集被試人員的PPG信號。采集完畢后,實驗人員離開實驗室充分休息,休息結束后進行下一次實驗。本次實驗共進行30組,每組采集數據時間為3~5min,實驗設備采樣頻率為500 Hz。采集到的PPG信號如圖1所示。

圖1 PPG信號振幅與時間的關系Fig.1 Relationship between amplitude and timeof PPG signal
采集數據過程中由于存在電磁輻射、呼吸、運動等干擾,因而信號存在較多噪聲,需要對信號進行預處理。信號處理軟件為Matlab,具體處理過程如下。
1)剔除野值。原始的PPG信號可能存在野值,根據不同個體差異設置不同的過濾閾值將野值剔除。
2)去除基線漂移。PPG信號采集過程中出現的基線漂移是采集過程中被試細微運動造成的,以“db5”小波基對原始信號進行10級分解,利用第8級近似分量重建信號,獲得信號的基線漂移趨勢并去除。
3)小波去噪。利用小波變換rigrsure閾值規則對信號進行去噪,該閾值規則使用無偏風險估計。設置閾值方法為“soft”,閾值尺度的調整方法為“sln”。離散小波變換的級數為5,小波基為“db5”。
4)去除高頻噪聲。高頻噪聲出現的原因主要是存在電磁輻射。利用滑動平均濾波器對信號進行平滑處理去除高頻噪聲,滑動平均的窗寬設置為20。
5)歸一化處理。傳統的數據歸一化方法是將全部的數據同時進行歸一化,保證數據進行相同縮放,保留較多的信息。由于不同個體的PPG信號振幅存在較大差異,這種差異大于由于環境變化所引起的PPG信號差異,因而,在進行歸一化時,將不同個體的PPG信號分別進行歸一化。此方法可以將信號振幅內所包含的信息去除,降低了個體間的差異。歸一化使用matlab的mapminmax函數將數據歸一化到[-1,1]。
數據預處理后得到較高信噪比的信號,數據預處理過程中信號的能量與頻率的關系如圖2所示。

圖2 數據預處理過程信號的能量與頻率的關系Fig.2 Relationship between energy and frequency of predisposing signal of data
為保證PPG信號的識別速度,將采集的3~5min之內的信號切分為每256個采樣點為1組數據,每組數據含有1個以上完整波形,共獲得7 200組數據。采取隨機切割的方法對數據進行切割。從隨機點開始,依次切割數據,且在切割過程中數據未重復使用。數據切割完成后,利用reshape函數將數據從一維拓展到二維,即從1×256轉換為16×16,以提高訓練準確率。
數據切割完成后,將數據隨機分為訓練集和測試集,訓練集含有6 480組數據,測試集含有720組數據。神經網絡訓練過程屬于有監督學習,因而,需要對每組數據進行標記,本文將高溫高濕環境下采集的PPG信號標記為1,將舒適環境采集的PPG信號標記為0。
2.1.1 激活函數
激活函數是神經網絡訓練時內部的映射函數,該函數能夠保證計算過程的非線性。隨著神經網絡層數和每層神經元個數增加,神經網絡內部激活函數的個數也會增加,提高了神經網絡的復雜度。
本文激活函數使用ReLU(rectified lineruints)函數,該函數的表達式為

該函數的輸入范圍為實數域,輸出范圍為[0,+∞)。ReLU函數由于沒有受指數函數的影響,因而簡化了計算過程,提高了計算速度,使得整個神經網絡的計算成本降低。
2.1.2 優化算法
本文所使用的優化算法為Adam(adaptive momentestimation)算法。Adam算法是一種一階優化算法,它能基于訓練數據迭代更新神經網絡權重。Adam算法兼具AdaGrad(adaptive gradient algorithm)和RMSProp(rootmean square prop)算法的優點。Adam算法基于一階矩均值計算適應性參數學習率,同時利用了梯度的二階矩均值。
2.1.3 損失函數

本文使用交叉熵函數作為損失函數,公式為式中:H為交叉熵;P為表征真實值分布情況的變量;Q為表征預測值分布情況的變量。交叉熵可以用于衡量P和Q分布的相似性。
利用Tensorflow搭建殘差神經網絡,網絡中包含4個卷積層、4個批歸一化層、4個ReLU層和2個全連接層。卷積層具體參數設置如表1所示。

表1 卷積層超參數Table1 Convolution layer superparameters
原始的數據經過人為歸一化處理,然而,中間層數據隨著訓練參數的更新,數據分布發生變化,當網絡層數較多時,中間層輸入數據的分布變化較大,從而使得網絡的泛化性能降低,因而,數據在進入ReLU函數之前進行批歸一化處理,以便解決訓練的中間層數據分布發生變化的情況。神經網絡結構如圖3所示。
訓練過程迭代時,每個批次喂入數據120組,共喂入54個批次。迭代次數設置為3 000次,當測試集準確率高于98%時自動停止迭代。停止迭代后,將所有訓練集和測試集數據輸入模型,并根據輸出結果與標記的結果進行對比以獲得模型的準確率、損失值及評價指標。
殘差神經網絡訓練共進行了489次迭代。在迭代過程中,訓練集準確率、測試集準確率、訓練集交叉熵、測試集交叉熵如圖4所示。從圖4可見:最終模型的訓練集準確率為99.8%,測試集準確率為98.3%,訓練集交叉熵為0.363,測試集交叉熵為0.383。訓練集與測試集準確率相差較小,為1.5%,因而認為該網絡的訓練結果有較強的泛化能力。

圖3 神經網絡結構Fig.3 Neuralnetwork structure

圖4 訓練過程中準確率與迭代次數的關系Fig.4 Relationship between accuracy and iteration times in training iteration processes
混淆矩陣是分析模型訓練結果的重要方法,可以通過混淆矩陣判斷模型的分類能力。神經網絡訓練結果的混淆矩陣如圖5所示(其中,坐標刻度數據0和1為標簽,是對數據的一種標記)。從圖5可見:模型在測試集的準確率為98.3%;在訓練集中,高溫高濕環境和舒適環境的查準率分別為99.8%和99.8%,查全率分別為99.8%和99.8%;在測試集中,高溫高濕環境和舒適環境的PPG信號查準率分別為96.9%和99.7%,查全率分別為99.7%和97.1%。高溫高濕環境雖然對人體產生不良影響,然而,該影響并不是瞬時的和致命性的,因而,對高溫高濕傷害預警的查準率更關鍵,訓練集和測試集對高溫高濕環境的查準率相差2.9%,因而認為通過訓練所得的模型在實際使用中有較強的泛化能力,能夠對高溫高濕環境和舒適環境的PPG信號進行較好識別。
受試者工作特征曲線(receiver operating characteristic curve,ROC)可以表征模型的分類性能,模型的ROC曲線如圖6所示(真陽率指檢測出來的真陽性樣本數除以所有真實陽性樣本數;假陽率指檢測出來的假陽性樣本數除以所有真實陽性樣本數)。ROC曲線與橫坐標所圍成的面積為AUC,AUC與分類性能的關系如表2所示。由圖6可知:訓練集和測試集ROC的AUC都接近于1,因而認為訓練所得的模型能夠對PPG信號進行準確分類。

圖5 混淆矩陣Fig.5 Confusion matrixes

圖6 ROC曲線Fig.6 ROC curves

表2 AUC與分類性能Table2 AUC and classification performance
利用PPG信號進行預警時,需要采集人體的PPG信號。使用本文方法,在采集頻率為500 Hz時,每次使用256個采集點,需要時間為0.512 s,即人體進入高溫高濕環境在生理參數自動調整后的0.512 s時開始發出預警,這樣,在較短的預警時間能夠保證進入高溫高濕環境的人員及時知曉自身當前生理狀態,提高警惕以保證自身安全,同時能夠使得作業人員在工作一定時間后及時退出高溫高濕環境進行休息,減少身體損傷。
1)人體在高溫高濕環境和舒適環境產生的PPG信號存在差異,通過殘差神經網絡訓練獲得的模型能夠識別這種差異,進而對人體是否處于高溫高濕環境進行預警。
2)通過訓練殘差神經網絡對人體處于不同環境的PPG信號進行識別分類,訓練集和測試集的準確率分別為99.8%和98.3%,對高溫高濕環境的查準率分別為99.8%和96.9%;該模型的AUC接近1.00,分類性能優良,有較強的泛化能力。
3)預警模型輸入的數據為0.512 s采集到的PPG信號。人體進入高溫高濕環境時生理參數發生變化,在變化后的0.512 s即可對作業人員發出預警。