孫 偉 ,姜 偉 ,黃 恒 ,吳家驥
(1.遼寧工程技術大學 測繪與地理科學學院,遼寧 阜新 123000;2.武漢大學衛星導航定位技術研究中心,武漢 430079)
隨著微機電系統(micro-electro-mechanical system,MEMS)技術的不斷發展,小體積,易攜帶,低成本的MEMS慣性傳感器的性能越來越高,已廣泛地應用到了各類可穿戴電子設備中[1-4]。基于可穿戴傳感器(如MEMS慣性器件)的行人活動識別,不需要事先固定儀器設備,且實時測量人體3維(3D)加速度信息和角速度信息,通過特征提取和分類算法,實現人體行為模式的判別,具有良好的便捷性和實時性[5-8]。然而受制造工藝、安裝精度和外部條件等因素的影響,使得加速度傳感器的觀測值中存在多種誤差,影響數據質量。因此,在基于加速度信息的活動識別中,對數據進行降噪顯得十分重要。
文獻[9]采用巴特沃斯低通濾波器,來消除原始加速度、角速度信號中的高頻噪聲信號。但由于該低通濾波器有較長的過渡帶,導致原始信號在過渡帶上極易造成失真,使降噪效果下降。文獻[10]利用中值濾波器,除去加速度信號中的噪聲信號,中值濾波器具有較好的弱化噪聲的能力,尤其適用于消除非平穩信號中的峰值噪聲,但由于中值濾波器的降噪效果與噪聲的密度分布有關,致使原始數據噪聲密度較大時,降噪效果不理想。文獻[11]利用梯度下降算法,對加速度數據進行優化,提高數據可用性,但該方法需要事先定義誤差函數,因此不具有自適應能力。文獻[12]采用小波閾值降噪方法,對數據進行預處理,通過對原始信號中不同頻率的成分進行分解,有效去除了加速度計中的隨機誤差,但在處理過程中,需事先確定小波系數和分解層數,且降噪結果過度依賴小波基函數,因此同樣不具有自適應能力。文獻[13]利用滑動均值濾波器,來消除加速度數據和陀螺儀數據中的高頻噪聲,滑動均值濾波是信號處理中的一種實用并易于實現的濾波方法,其基本思想為一個數的取值由該數所在窗口內的滑動平均值來代替,從而形成一個新的平均值序列,滑動均值濾波具有實時性好、平滑程度高的優點,但對數據中偶然波動較嚴重的噪聲,抑制能力較差。
針對以上問題,本文提出了一種集合經驗模態分解(ensemble empirical mode decomposition,EEMD)算法的數據降噪行人活動識別方法。EEMD是一種時頻分析方法,其分解基于信號本身極值點的分布,無需指定基函數與分解層數;利用高斯白噪聲頻譜分布均勻和均值為零的特性,經過多次分解抵消白噪聲對原始信號的影響,抑制了模態混疊現象。在原始信號中加入高斯白噪聲后,進行經驗模態分解(empirical mode decomposition, EMD),對多次EMD分解的結果進行均值化處理;得到降噪加速度數據后,提取三種時域和三種頻域特征,對分類器進行訓練,實現對日常行人活動的自動識別。
EMD算法是一種針對非平穩、非線性信號提出的自適應時頻分析方法[14-15]。該算法基于原始數據本身進行分解,不需要指定基函數和分解層數,具有良好的時頻分析能力。EMD算法將原始信號分解成多個具有不同特征尺度的本征模態函數(intrinsic mode function,IMF)分量和一個殘余分量,IMF分量既可以是線性的也可以是非線性的,其極值點個數與過零點個數最多不相差一個,且由 IMF分量局部極大值確定的上包絡線和局部極小值確定的下包絡線均值為零[16-18]。
然而當信號的極值點分布不均勻時,EMD算法會產生模態混疊現象。當模態混疊現象發生時,IMF分量失去原本單一特征尺度的特征,使同一IMF分量中存在特征尺度分布不均勻的信號,或在不同 IMF分量中,存在特征尺度相近的信號,導致相鄰兩個IMF分量難以區分。EEMD算法是在EMD基礎上提出的一種噪聲輔助的信號分解方法,該方法運用了高斯白噪聲頻譜分布均勻的特性,通過將高斯白噪聲加入到待分解信號中補充缺失的尺度;從而抑制或消除了模態混疊現象[19-21]。其算法具體步驟為
1)在原始信號x(t)中加入隨機高斯白噪聲nm(t)為

式中:xm(t)為加入高斯白噪聲后的待分解信號;h為高斯白噪聲標準差與信號標準差的比例系數。當h取值太大時,會掩蓋原始信號本質特征;當h取值太小時,不足以引起低頻部分極值點間隔的改變,h取值一般在0.01至0.5之間。
2)對待分解信號進行EMD分解,得到c個IMF分量Cl,m(t)(l= ( 1,2,…,c))和一個殘余分量rc,m(t)為

3)重復步驟1)、步驟2),進行N次EMD分解。為消除加入的高斯白噪聲對原始信號分解得到的IMF分量的影響,計算全部IMF分量與殘余分量的均值,則信號經EEMD最終分解為

將慣性測量系統(inertial measurement unit,IMU)固定到實驗人員的鞋面上,采集行人直線行走的步態數據,數據采集地點位于遼寧工程技術大學學生宿舍樓3樓。圖1為MEMS加速度計x軸數據EEMD分解圖。設置h為0.2,N為25,采用EEMD分解得到10層不同的IMF分量,依次按高頻到低頻特征排列。由圖1可知,IMF 1 至IMF 2分量周期短,波動較大,將其劃分為高頻分量,IMF 3 至 IMF 10波動較平緩,將其劃分為低頻分量,且IMF 1至IMF 10未出現模態混疊現象。

圖1 EEMD分解結果
特征提取是實現活動識別的重要環節,特征提取主要從時域和頻域兩個角度進行。頻域特征提取是指將原始信號從時域轉換到頻域,從頻域中提取信號特征[21-22];常見的頻域特征有快速傅里葉變換系數、能譜密度、頻域熵等。時域特征提取是從時間域中對原始信號提取特征[23-24],相對于頻域特征提取,時域提取具有提取方法簡單、計算量小等優點;傳統的加速度時域特征有滑動均值、方差、峰值強度、四分位距等。
1)加速度滑動均值為

式中:L為數據長度;V為窗口長度;i=v,…,v+L-1;fv為第v個窗口內加速度模值滑動均值。
2)加速度模值小于Q3的平方和。四分位數是指將數列分成四部分即一個數列有三個四分位數,分別為上四分位數Q3,中四分位數Q2和下四分位數Q1。將窗口內加速度模值按遞增順序排列后四等分,則加速度模值小于Q3的平方和為
2)PLC控制層,其中的PLC芯片是整個系統的核心,一方面負責監測和控制來自現場傳感器的開采或模擬信號;另一方面,負責將處理后的數據發送至上機位和執行器,保證上機位對現場數據的掌控,以及執行器按預設命令準確動作;

3)加速度模值小于Q1的平方和為

將加速度數據經快速傅里葉變換至頻域,頻域特征參數包括:
1)最大幅值為

式中:Mf為頻率f< 5 Hz 的幅值的集合;Fk為Mf中的最大幅值。
2)峰數值為

3)幅值之和為

式中:kσ為頻率為0~5 Hz之間的幅值之和。
實驗采用 MTi-G-710傳感器,包含三軸陀螺儀,三軸加速度計,三軸磁力計及氣壓計。實驗部分只用到加速度數據,MTi-G-710加速度計滿量程為±18g,g為重力加速度,g= 9.8 m/s-2,噪聲為g×80×10-6Hz-0.5。圖2為IMU坐標系示意圖。

圖2 IMU坐標系示意
x軸加速度與大腿方向一致,y軸加速度與行人前進方向一致,z軸測量人體橫向運動。由于z軸在該文所要識別的活動模式中變化并不明顯,因此,在進行特征提取時,只考慮x軸和y軸數據。將IMU置于大腿右側進行數據采集,設置采樣頻率為50 Hz,采集5種日常生活中常見的活動數據,即慢跑、行走、上下樓梯和站立,數據采集地點為遼寧工程技術大學玉龍校區惠和樓。數據采集完成后,利用 EEMD算法對原始信號進行降噪,并對降噪后的信號,以20 Hz采樣率進行重采樣,設置的窗口長度為2 s,提取窗口內不同活動狀態數據的特征,用于模型訓練。
用于活動識別的實驗數據采集方式與訓練數據相同。實驗地點位于測繪學院辦公樓內,實驗選取 3名測試人員進行數據采集工作,測試人員從辦公樓4樓西側站立5 s后,沿走廊自西向東行走至樓梯口,沿樓梯下至3樓,沿3樓走廊自東向西慢跑至樓梯口處,沿樓梯上至4樓,站立5 s后,數據采集結束。圖3為 3名測試人員活動識別結果,表1至表3為對應的混淆矩陣。由混淆矩陣計算識別結果即查準率α和查全率β,其計算方法為

表1 樣本1分類混淆矩陣

表3 樣本3分類混淆矩陣

圖3 行人活動識別結果

式中:TPi為被正確分類的第i類活動;FPi為其他類別活動被錯誤分類為i類;FNi為第i類活動被錯誤分類為其他類別。

表2 樣本2分類混淆矩陣
表 4為三組測試人員的活動識別查全率和查準率,表5為各類活動模式平均識別精度。

表4 各測試人員活動識別率

表5 活動模式識別精度
由表1至表3可知,降噪后的行人活動識別的查全率β和查準率α均在78%以上,其中站立的查全率β和查準率α均為 100%。對于慢跑這種行人活動,有一組慢跑被誤識別為下樓,導致查全率β為 97.1%;一組站立被誤識別為行走,查全率β為 97.5%。由表5可知,加速度數據經EEMD降噪后,對于行走,上樓,下樓這三種運動量較小的行人活動,會有少量的樣本被誤識別為其他活動模式,查準率α分別為83.5%,87.7%,90.9%;識別精度較高,滿足日常生活中對這5種行人活動識別的精度要求。
表 6為樣本 3利用原始數據進行活動識別對應的分類混淆矩陣。

表6 原始數據分類混淆矩陣
對比表3可知,行走、上樓和下樓三種模式的混淆程度,相較于降噪后明顯增大;除站立模式外,其他運動模式精度均有不同程度的下降,上樓模式查全率β下降4.3%,查準率α下降2.6%;行走模式查全率β下降2.1%,查準率α下降4%;下樓模式查全率β下降4.7%,查準率α下降6.2%。對比實驗結果表明,該文提出的降噪算法能有效提高行人活動識別的精度。
數據質量的好壞直接影響行人活動識別的精度。本文采用 EEMD算法將原始數據分解為多個本征模態分量和一個殘余分量,去除高頻部分的模態分量,將剩余分量進行重構,得到降噪信號后,提取時域、頻域特征,用于行人活動識別。三組測試人員的實驗結果及對比實驗表明,5種活動模式的查全率β為 81.3%~100%,查準率α為78.9%~100%,驗證了降噪方法的有效性。但當信號被噪聲污染較嚴重時,如何有效分離有用信號和噪聲信號,將成為下一步研究的重點。