崔希國,于 鯤
(1.山東能源臨沂礦業集團,山東臨沂 276000;2.山東通和信息技術有限公司,山東濟南 250000)
隨著物聯網技術的高速發展,智能手表、智能眼鏡等可穿戴設備的使用越來越廣泛[1-2]。可穿戴設備是一種集成于衣服、手表、鞋子等生活用品的便攜式設備,具有與用戶雙向互動的功能[3-5]。可穿戴設備具備多種類型的微型傳感器,其所采集的數據蘊含與佩戴人員的行為特性、健康情況等相關的豐富數據[6-7]。
在礦業方面,每年因事故傷亡的作業人員約為6 000 人。礦工作業過程中,監控人員無法實時掌握作業人員的身體健康狀況,導致較多安全事故的發生[8-10]。因此,文中將可穿戴設備應用于礦工作業過程,開展基于礦用可穿戴設備智能數據分析的礦業作業人員健康狀態評估研究。
礦用可穿戴設備為手表,用于礦業工作人員下井工作的實時安全健康數據監測。其外觀結構如圖1所示。礦用可穿戴設備具有以下顯著特點:

圖1 礦用可穿戴設備外觀
1)小型化。礦用可穿戴設備具有小型化的特點,體積較小、便于穿戴,不影響操作。
2)集成化。礦用可穿戴設備相比于普通的智能手表,集成了多種數據測量監測功能,不僅具有計時、計步等運動數據監測功能,且還集成了血壓測量、血氧測量、心率測量等功能。
3)雙向化。一方面,礦業工作人員遇到緊急狀況時可通過礦用可穿戴設備向系統主站發送求助;另一方面,可將實時監測數據傳回系統主站進行異常數據分析,然后通過礦用可穿戴設備向礦業工作人員下發指令和安全預警。
4)智能化。礦用可穿戴設備配置智能分析平臺對采集到的數據進行分析處理,提供統計分析、狀態監測、安全預警、用戶管理等功能。
基于礦用可穿戴設備的智能分析平臺架構如圖2所示。該智能分析平臺功能主要分為三部分:

圖2 基于礦用可穿戴設備的智能分析平臺
1)分析統計。礦用可穿戴設備所采集數據的分析統計具備計步、血氧、血壓、睡眠和心率相關數據的統計分析與可視化展示。
2)設備數據。實現對每一臺礦用可穿戴設備的數據監測和數據管理,具有佩戴者信息、設備健康數據、定位展示、軌跡信息、家庭成員、SOS 信息、關愛提醒、IMEI 錄入、數據清除和數據權限等功能。
3)APP 管理。實現對APP 用戶數據的管理,包括APP 用戶管理、APP 用戶統計、APP 安裝設備統計、APP 登記統計等。
對于礦用可穿戴設備所采集的步數、體溫、呼吸、心率、血氧、血壓等數據,文中基于多源數據融合(Multi-source Data Fusion,MDF)與支持向量機(Support Vector Machine,SVM)的智能數據分析處理方法,實現礦業作業人員的健康情況實時監測。
文中所提基于礦用可穿戴設備的智能數據分析算法流程如圖3 所示。

圖3 基于礦用可穿戴設備的智能數據分析算法
該算法的主要流程:首先對礦用可穿戴設備所采集的數據進行預處理,便于后續的數據分析;然后采用數據融合方法進行多源數據融合,進一步采用小波變換方法進行數據特征提取,并將數據樣本按一定比例劃分為測試樣本和訓練樣本;將訓練樣本作為支持向量機算法的輸入,實現SVM 模型的訓練;用測試樣本對訓練好的SVM 模型進行測試,微調校正SVM 模型參數;最終輸出礦業作業人員的身體健康等級評估結果。
常見的數據標準化方法有min-max 標準化和zscore 標準化[11]:
1)min-max 標準化
規范化后DE 數據描述如下:

2)z-score 標準化
規范化后的數據描述如下:

數據融合的原理如圖4 所示。其方法是直接將來自不同傳感器的原始信息進行融合處理,具有保留原始數據完整信息的優點[12]。

圖4 數據融合原理
礦用可穿戴設備采集的原始數據雖然包含了關聯礦業作業人員的各類相關信息,但這些原始數據的密度和體量都比較大,需要經過數據特征提取將有用的特征參數提取出來,并將不相關的數據過濾。文中基于小波變換方法實現數據特征提取[13]。
定義一個基本小波函數及其Fourier 變化,滿足以下關系:

式中,ψ(w) 為基本小波函數φ(t) 的Fourier 變化式。
則連續小波函數變換式為:

式中,x(t)為連續小波函數,ψ*(·)表示函數ψ(·)的共軛運算,a表示尺度因子,τ表示時間位移。
為了滿足實際工程應用中離散化信號處理需求,將尺度因子與時間位移進行離散化操作:

離散化的小波變換公式表示為:

在內積空間H中,定義一個超平面,其代數表示方式為:

式中,x為自變量向量,w為權重系數向量,b為常數項。
支持向量機的目的是構造一個超平面,將測試數據盡可能準確地分類。為了便于計算,通常采用歸一化方法來建立規范化的超平面模型:

式中,(xi,yi)為第i個訓練樣本,xi為訓練樣本的特征參數,yi為分類標簽。
如圖5 所示,H值越大表明分類結果越優,H值的計算公式如下:

圖5 支持向量機原理

式中,||·||為二范數運算符。
因此訓練尋優問題轉化為:

式中,?(x)為映射函數。
為驗證所提方法的正確性和有效性,采用礦用可穿戴設備的10 000 條測量數據作為數據樣本。按8 000∶2 000 的比例劃分為訓練樣本和測試樣本,輸出結果等級分為健康、非健康兩種。
每個樣本中包含的特征參數包括體溫、心率、呼吸、血壓和血氧等,部分測試數據如表1 所示。

表1 部分測試數據
為了驗證所提算法的性能,將相同數據樣本作為文中所提算法和BP 神經網絡算法的輸入。算法的性能對比如表2 所示。

表2 算法性能對比
由表2 可知,基于BP 神經網絡算法的礦業作業人員健康等級評估準確率為94.8%,算法收斂步數為85 步,訓練時間為1 832.7 s。基于所提SVM 算法的礦業作業人員健康等級評估準確率為98.6%,算法收斂步數為32 步,訓練時間為654.6 s。由此可見,所提算法在準確率、計算時間、收斂速度方面均更具優勢。
為分析多源數據融合對礦業作業人員健康等級評估結果的影響,設置以下5 組對比方案。計算結果如表3 所示。

表3 多源數據融合對健康等級評估結果的影響
方案1:僅采用體溫特征參數作為輸入;
方案2:采用體溫+心率特征參數作為輸入;
方案3:采用體溫+心率+呼吸特征參數作為輸入;
方案4:采用體溫+心率+呼吸+血壓特征參數作為輸入;
方案5:所提方法采用全部特征參數作為輸入。
由表3 可知,礦業作業人員健康等級評估結果的準確率由大到小依次為:方案5>方案4>方案3>方案2>方案1。這是因為礦業作業人員健康等級與體溫、心率、呼吸、血氧、血壓等特征參數均相關,采用更多類型的特征參數作為算法的輸入,能夠更加準確地分析出作業人員的健康狀態。
文中基于礦用可穿戴設備的數據結合多源數據融合與支持向量算法開展礦業作業人員健康狀態評估研究。通過算例分析表明,文中所提方法相比于BP 神經網絡算法,在準確率、計算時間和收斂速度方面具有更優的性能;通過體溫、心率、呼吸、血氧、血壓等多種數據融合分析,實現了礦業作業人員健康狀態評估,而且數據類型越多其評估結果的準確性就會越高。但文中對于礦業作業人員健康狀態等級,僅劃分為健康和非健康兩種。為了更全面、清晰地監測礦業作業人員的身體健康情況,需要進行更加細致的等級劃分,而這有待于結合醫學技術,合理配置參數權重展開更深入的研究。