郝占軍 喬志強 黨小超 張岱陽 段 渝
1(西北師范大學計算機科學與工程學院 蘭州 730070) 2(甘肅省物聯網工程研究中心(西北師范大學) 蘭州 730070)
隨著無線通訊的快速發展,人機交互技術逐漸被應用到各個領域之中,如智能家居、現代醫療等.人機交互的各種技術與應用已成為各行各業所聚焦的熱點問題之一.其中,室內位置服務以及人體動作識別作為人機交互的重要內容近十年也成為了科研人員與企業關注的焦點.為了滿足人與計算機更便捷的交互,眾多學者開始致力于低成本、非接觸式的技術研究.
WiFi技術的興起與其設備的大量部署為室內定位與人體動作識別提供了新的思路.基于WiFi信號的動作識別技術具有普適性強、隱私程度高、部署成本低等優勢.文獻[4]中利用WiFi的接收信號強度(received signal strength, RSS)進行室內人體的動作識別.但是由于多徑效應的影響導致RSS對環境噪聲特別敏感,所以其受到的外界干擾較大.文獻[5]中則用從WiFi信號中提取的信道狀態信息(channel state information, CSI)進行人體動作識別.相較于RSS,CSI是更細粒度的物理信息,在采集人體動作時受到的干擾更小,更加穩定.但是在目前的研究中,基于CSI的人體動作識別還存在一些問題,如絕大部分的研究工作所識別的動作往往面向同一方向,難以保證不同方向上識別的魯棒性.
針對上述問題,本文提出了一種基于WiFi信號的高魯棒性人員動作感知模型Wi-Do,利用CSI識別人體動作,證明了動作識別的方向無關性.首先通過商用WiFi設備收集動作的CSI信息,并利用離散小波變換(discrete wavelet transformation, DWT)進行降噪處理.接著使用主成分分析(principal com-ponents analysis, PCA)算法及短時傅里葉變換(short-time Fourier transform, STFT)提取動作數據的多普勒頻移作為其特征.最后將動作特征輸入帶有注意力機制的門控循環單元(gate recurrent unit, GRU)網絡進行動作的分類并輸出識別結果.
本文的主要貢獻包括3個方面:
1) 消除了天線之間相位偏移以獲取更豐富的CSI信息,以此放大由動作引起的多普勒頻移,并通過快速傅里葉變換來檢測動作的發生;
2) 引入注意力機制的雙向GRU網絡對CSI數據進行分類與識別,驗證了多普勒頻移、動作能量變換值與目標動作的相關性;
3) 證明了人體動作的方向無關性,并通過實驗說明動作的方向不會對實驗結果產生較大的影響.
目前人體動作識別基于多種技術方案,本節將從接觸式與非接觸式兩大類來闡述相關工作,并詳細講述了基于CSI對動作識別的國內外研究進展.
在人體動作識別領域中,傳感器技術已經得到了廣泛應用.其中,主要硬件設備分為智能手機和可穿戴設備2類.智能手機往往使用其內置傳感器,如三軸加速度計、陀螺儀、重力傳感器來實現對人體活動的探測.文獻[6]中利用三軸加速度計,三軸陀螺儀等傳感器收集人體動作數據,利用LS-SVM識別器來進行動作的分類和識別.文獻[7]提出了一種基于智能手機內置傳感器的人體動作識別系統,并使用在線獨立支持向量機進行動作識別.可穿戴設備的原理是將能夠探測人體運動狀態的傳感器嵌入到可以穿戴的日常物品中(如衣服、手表、手環),然后提取各項數據進行人體姿態或動作的識別.例如,文獻[8]利用多個可穿戴式傳感器(如加速度計、磁力計等)讀取人體運動時的各種數據,并用RNN網絡對跑步、坐、起立、騎行等動作進行了識別,證明了該方法具有較好的識別效果.
傳感器需要用戶以穿戴的方式采集數據,對用戶造成不便的同時也帶來了隱私性與安全性的困擾.傳感器在工作時受限于電池的續航能力.同時,如果用戶忘記攜帶相關設備,識別工作將難以開展.
以非接觸方式進行人體的動作識別主要分為計算機視覺技術與無線感知技術.在先前的研究工作中,基于計算機視覺技術的動作識別方法通常以高分辨率的攝像機來捕捉人體運動的視頻時間序列,通過圖像處理和模式識別技術識別相關人體動作.文獻[9]提出了一種新型的動作識別框架,稱為長期視頻動作識別,其利用遞歸的思想,允許訪問長期的信息,具有較好的識別效果.文獻[10]則利用基于注意力機制的LSTM(long short term memory)網絡進行視頻中的動作識別.首先提取視頻幀的關鍵信息作為特征,利用注意力機制標記重點特征,最后將特征輸入LSTM網絡進行識別并取得了較高的識別結果.
計算機視覺方法無法在弱光及黑暗環境下正常工作,使用無線射頻信號的感知方法克服了計算機視覺的局限性.根據采集無線信號的設備,其動作識別的研究熱點主要分布于RFID(radio frequency identification),UWB(ultra wide band)雷達以及WiFi等.文獻[11]提出了FEMO系統,通過粘在啞鈴上的無源RFID標簽以及從標簽反射的RF信號中提取的多普勒曲線進行運動動作的識別.文獻[12]使用UWB雷達提取多普勒圖像,利用PCA算法提取特征后采用門控循環單元進行動作的分類識別.但是,RFID和UWB需要專用的設備來采集數據且部署復雜度較高.
WiFi得益于其普適性,在動作識別方面存在易部署、成本低的優勢.其中基于RSS的檢測原理主要通過人體動作造成的信號強度變化值實現,Abdelnasser等人提出了WiGest系統,該系統由基元提取、手勢識別、動作映射3部分組成.在文獻[14]提出了一種基于RSS的室內活動識別框架,利用融合算法對日常的室內活動進行分類識別.雖然基于RSS的動作識別技術克服了傳統傳感器的缺陷,但是由于多徑效應和信道的衰落導致RSS的測量十分不穩定,其攜帶的大量環境噪聲也極難處理,所以基于RSS的動作識別同樣存在局限性.同RSS相比較,CSI反映信號傳輸過程中的物理層的信息,通過記錄發送端和接收端之間傳輸的子載波信息,可以更好地反應無線信號的變化情況,具有較細的識別粒度.
得益于較高的信號分辨率,CSI已成為室內情境感知研究的新浪潮.從人體動作到基本的生理特征以及復雜的人體行為,CSI被廣泛地應用于各種場景中.Zhang等人針對老年人跌倒問題,提出了一種人體跌倒檢測模型RT-Fall,利用CSI振幅和相位信息實現了實時的非入侵式人體摔倒檢測.Zhang等人提出的BreathTrack利用多徑效應中的優勢路徑和復雜衰減系數的相位變化提取了呼吸狀態來跟蹤人類呼吸.Wang等人提出的E-eyes利用CSI可以檢測室內人體的9種日常活動,如洗衣服、洗澡、做家務、做飯、睡覺等.文獻[18]提出的Wi-Finger通過分析人體手勢動作與CSI的關系,實現了對數字1~9手勢的高精度識別.Wang等人提出CARM模型,將CSI與人體運動速度建立聯系,能夠對走路、跑步等9種行為進行有效識別.
在本節中主要介紹WiFi人體運動感知的基本原理和信號轉換流程,并闡述了Wi-Do模型進行動作識別的工作機制.
當WiFi信號在室內傳播時,受到如墻壁、桌子、天花板等多種障礙物的影響,導致信號出現不同程度的折射、反射、衍射等現象.相較于直射路徑,反射路徑的信號到達時間有所不同,所以接收端會先后收到多個路徑的信號,這種現象被稱為多徑效應.根據Friis自由空間傳播方程可知:

(1)
其中,P
(d
)為接收功率,P
為發射功率,G
是接收機天線的收益,G
是發射機天線的收益,λ
為信號的波長,d
為發射機與接收機之間的距離.
由于室內存在地面及墻體等障礙物,會出現多條反射路徑,其傳播方程可表示為

(2)
其中,h
為地面及墻體上的反射點到直射路徑的距離.
當人體在信號的傳播范圍內發出動作響應時,人體自身也會對信號的傳播產生反射和散射.
在加入人體影響后,式(2)變為
(3)
Δ
為由人體引起路徑長度的近似變化.
根據式(3)可知人體運動時會對信號產生干擾,得到了新的傳播路徑進而使得接收信號的功率隨之變化.
運動感知原理模型如圖1所示:
Fig. 1 Multipath effect caused by human movement圖1 人體運動引起的多徑效應
本文利用WiFi信號中提取的信道狀態信息對人體動作進行識別.在IEEE 802.11n協議下,利用正交頻分復用技術(orthogonal frequency division multiplexing, OFDM)可以從WiFi信號中提取到CSI.在無線信號的傳播中,傳播信道通常用信道頻率響應(channel frequency response, CFR)在頻率f
和時間t
處可表示為
(4)
其中,R
為路徑個數,α
(f
,t
)為第k
條鏈路的衰減和初始相位,e-j2π()為第k
條路徑的相位偏移,τ
(t
)為傳播延遲,f
為載波頻率,e-j2πΔ為接收端與發射端之間載頻差所造成的相位偏移.
為了獲得功率延遲分布,可以通過逆快速傅里葉變換(inverse fast Fourier transform, IFFT)將CFR轉換為信道脈沖響應(channel impulse response, CIR):
(5)
其中,a
為第i
條路徑的幅度衰減,θ
為第i
條路徑的相位偏移,而τ
為第i
條路徑的時延.N
為多徑總數,δ
為脈沖函數.
在某一子載波上,CSI可表示為H
=|H
|ej sin ,(6)
其中,H
為第k
個子載波的CSI函數,|H
|為第k
個子載波的振幅,ej sin 為相位信息.
人員執行相應的動作時,CSI所反映的振幅及相位都會發生相應的變化,探索其變化的規律即能達到有效的人體動作識別.經短時傅里葉變換后得到多普勒頻移可以更直觀地體現CSI的動作信息,WiFi信號的具體轉換機制如圖2所示:

Fig. 2 WiFi signal conversion mechanism圖2 WiFi信號轉換機制
本節描述了Wi-Do人體動作識別的工作機制.核心思想是采用更豐富的動作信息,通過基于注意力機制的雙向GRU網絡體系結構識別WiFi環境下的人員動作.
Wi-Do系統的工作流程具體分為數據采集、數據處理、特征提取以及動作識別4個步驟.在實際場景中部署裝有Intel 5300網卡的2臺實驗設備來采集人體動作數據,這里我們使用Intel 5300 monitor模式完成了對CSI動作數據的獲取.模型工作流程如圖3所示.

Fig. 3 Overall flow chart of Wi-Do model圖3 Wi-Do模型工作流程圖
CSI刻畫了人體運動在頻域上造成的信道狀態影響,只需將其與人體運動建立有效的映射,即可識別出具體的動作.數據的預處理階段十分關鍵,決定著一個識別模型的泛化能力.然而,由于室內中存在嚴重的多徑效應和其他環境成分干擾,使獲取到的數據中包含了大量噪聲,從而影響到后續特征提取的有效性和動作識別的準確性.我們通常根據動作特征的類別和人體在頻域上的能量變化范圍選擇有效的數據處理方式.本文首先通過計算1對天線CSI的共軛矩陣,消除了由于環境干擾引起的隨機相位偏移,引入DWT對多徑和窄帶影響造成的高頻噪聲進行濾除.接著使用PCA算法完成在通信鏈路上的關鍵特征子載波選取,具體方法將在3.1節中詳細描述.該方法有效地去除了多徑噪聲,最大程度上保留了數據原有的特征信息.
動作特征的提取是動作識別的核心部分.在已有的基于WiFi人體動作識別的工作中,大多使用單一的振幅或相位信息或者以振幅和相位差結合等方式取得了較好的效果.然而,本文提出了一種針對運動方向無關的人體動作識別解決方案,傳統的振幅和相位特征中包含著大量的運動方向信息,無法對方向信息進行有效的削弱或剔除.因此,本文將采集到的CSI數據經短時傅里葉變換得到穩定的頻域特征,即多普勒頻移.由于多普勒頻移的特性,可以反映人體運動在頻域上的速度變化,通過保持相應的多普勒位移即可削弱方向對特征信息的影響.另外,為了判斷人體運動的開始和停止,增強系統可用性,我們構建了頻域能量指示器,將人體運動在頻域上的多普勒頻移與快速傅里葉變換(fast Fourier transform, FFT)值作為共同的動作識別特征.本文在3.3節中詳細說明了特征提取的方式和過程,該特征可以有效降低運動方向信息的影響,判斷運動的起始,具有良好的環境遷移性和識別能力.
動作分類識別一般通過訓練學習模型的方法實現.針對選取的特征屬性以及計算復雜度,本文使用了引入注意力機制的雙向GRU網絡來對運動特征數據進行分類識別.在3.4節中將詳細說明雙向GRU網絡的運行機制以及訓練過程,該模型將空間特征集成到時間模型雙向GRU中,提升了無線信號對人體動作識別的魯棒性與準確率.
本節將介紹Wi-Do模型的工作原理與設計實現.2.2節中,針對動作分析提出了幾種具體的感知分析方法.因此,下面的工作將提供本Wi-Do模型的分類基本原理與方法.
由于多徑效應,信號由發射機到接收機所傳播的信號存在多條傳播路徑.在通信過程中,信道沖激響應被用來評價每一條傳播路徑的優劣,見式(5).信道響應可以用各路徑上的多普勒頻移表示為

(7)
其中,h
(τ
)為靜態路徑上的響應,D
為動態路徑的集合.
傳統基于CSI的動作識別中,往往使用單天線單鏈路的信道特征作為感知數據的獲取源,其方法的選擇會丟失較多的動作特征數據.為了提升CSI對人員動作的敏感度,需要更好地平衡靜態響應與動態響應.振幅較高的CSI通常具備較大的靜態響應,這是因為室內環境中存在強LOS信號.而方差有助于反饋動作變化對CSI的影響,能更好地反映動態響應.因此本文選擇了CSI振幅最大方差最小和振幅最小方差最大的2根天線.圖4說明了對天線的選擇準則:

Fig. 4 Amplitude of different antennas圖4 不同天線的振幅
圖4中顯示了不同天線和不同子載波的CSI隨時間的分布,天線2具有最大的方差且振幅相對較小,天線3具有最大的振幅且方差相對較小.所以本文提取天線2,3作為動作信息的數據來源,計算2根天線的共軛矩陣,減少來自不同方向上的影響以便更好地提取多普勒特征,這將在之后的3.2節詳細說明.
原始的數據中,包含著與動作無關的低頻干擾與突發噪聲.為了準確地保留來源于人體運動的CSI信號,本文使用DWT將人體動作信號進行多次分解和重構,通過設置細節系數中的閾值模式和尺度噪聲過濾掉高于人體動作頻率的環境干擾.采用db3為波基函數并進行8次分解重構,細節系數選取minimaxi閾值模式.經小波變換處理前后的CSI數據如圖5所示:

Fig. 5 CSI wavelet transform diagram圖5 CSI小波變換圖
根據圖5中數據處理前后的對比,可以看出經過DWT處理后能夠較好地保留原有信號中反映人體動作狀態的峰值和突變部分,又將多徑環境和窄帶影響造成的高頻毛刺進行了有效的去除,為進一步使用短時傅里葉變換提取穩定的多普勒頻移特征奠定了基礎.
為了進一步去噪與對CSI數據進行降維以提取動作信息做時頻分析,本文對CSI數據進行主成分分析.由于第一主成分包含由運動引起的主要功率變化,選擇該成分作為短時傅里葉變換(short-time Fourier transform, STFT)的輸入以提取多普勒頻移特征.當人體向發射機和接收機移動時,反射的電磁波信號其波峰波谷以較快的速度到達接收機,而遠離時,其波峰波谷到達接收機的速度變慢.一般而言,多普勒頻移可以表示為

(8)
λ
為信號的波長,d
(t
)為反射路徑的長度.
由式(6),對于CSI通過時頻分析對譜圖可以得到多普勒頻移:
(9)
B
(f
(t
))為截取CSI動作信號段的窗口函數.由于WiFi網卡之間缺乏同步,從而導致了原始CSI中未知的相位偏移
(10)
2π(Δ
f
+Δ
t
)是引起的相位偏移載波頻率和時間偏移量.
因此從實際的CSI中直接提取多普勒分量是不可行的.為了消除未知的相位偏移,同時仍然保留完整的多普勒頻移,Wi-Do使用了WiFi網卡上的不同天線來解決這一問題.來自于同一網卡上的天線都有相同的相位偏移,Wi-Do采集了不同天線的CSI原始數據,用不同天線的相位解決了相位偏移的問題,以計算1對天線的CSI共軛乘法的方式消除了相位偏移.將消除相位偏移的CSI數據去噪后經PCA選擇第一主成分后,經STFT變換得到的多普勒頻移示意圖如圖6所示.

Fig. 6 Doppler spectrogram of CSI圖6 CSI多普勒頻譜圖
圖6為商用WiFi網卡提供的CSI在頭部、手部、腿部運動時所引起的多普勒頻移的頻譜圖.其中,圖6(a)描述了2 s內的點頭行為,前1 s為低頭動作,后1 s為抬頭動作;圖6(b)為手臂的向左揮動的多普勒頻移圖;圖6(c)為腿部的向前邁出與收回,圖中明顯可以觀察到1 s前的邁腿與1 s后的收腿所引起的多普勒頻移變換.
各多普勒頻移的能量雖然存在波動,但是圖6中依然能夠清晰地反映出由于方向以及動作的變換所帶來的多普勒效應.這為模型的分類提供了可靠的數據來源.
為了提升系統的效率與性能,應在人員運動開始時對動作進行有效的識別.因此,需要設置一個閾值來判斷監測區域內的能量變換,從而識別人員動作的起始位置.文獻[25]中證明了人員的不同行為活動會使能量強度和頻率產生差別.不同行為所引起的能量波動不同,以構建運動能量指示器的方式可以有效地分割不同活動行為.當WiFi區域內無動作發生時,其FFT曲線如圖7(a)所示,圖7(b)為實驗人員腿部發生動作行為時的快速傅里葉變換曲線.與腿部運動時所引起的能量變化相比,無動作發生的能量更低.

Fig. 7 FFT transformation curve圖7 FFT變換曲線
因此本文設置了一個能量指示器來檢測人體動作的發生.能量指示器根據降噪后的動作CSI序列以檢測CSI的FFT變換值:

(11)
其中,E
為計算得到的能量,n
為時間窗的長度,m
為每秒時間窗內計算得到的歸一化FFT系數.Wi-Do監測2個連續窗口中短期運動能量的差異.當差異大于設置的正閾值時,Wi-Do將認為有動作發生.當動作完成時,窗口中的運動能量將急劇下降即差值小于負閾值.此外,由于不同動作類別所引起的能量變換值各不相同,所以能量變換值也是體現人員動作的一部分.因此,FFT變換值也將作為人動作特征的一部分輸入至訓練模型中.既豐富了人員的動作特征,又避免了模型出現過擬合現象.
Wi-Do將識別模型應用于多普勒頻移來識別相應的動作.多普勒頻移在一段時間內都有變化,而由于人體運動的加速和減速,簡單地估計每個時間樣本對應的人體動作會產生較大的噪聲.為了提升動作識別的效率與魯棒性,Wi-Do選用了循環神經網絡中的GRU方法,與原始的RNN相比,LSTM和GRU更有學習長期依賴關系的能力,而GRU在序列建模方面的性能與LSTM相當,但涉及的參數更少,數據更少,更容易訓練.
Wi-Do將注意力機制引入模型中并采用雙向結構以幫助GRU建立時序關系.將計算得出的CSI時序特征以時序序列H
={,,…,}輸入到GRU中.由于不同運動所引起的CSI能量變換的不一致性,我們將能量指示器所獲取的快速傅里葉變換值E
={e
,e
,…,e
}也作為模型的輸入層.此外,在正則化過程中加入dropout層,并使用具有交叉熵損失的softmax分類器進行類別預測.GRU的網絡結構如圖8所示:
Fig. 8 Representation of GRU structure diagram圖8 GRU結構圖
GRU簡化了LSTM的輸入門、輸出門、遺忘門和單元狀態4個門結構,將其劃分為2個門,分別稱為重置門和更新門.在任意時間步長t
,GRU包括3個參數:復位門、更新門和隱藏狀態.
參數按下式進行更新:=σ
(·+·-1),(12)
=σ
(·+·-1),(13)

(14)

(15)
其中,代表時刻t
的輸入時序信息,-1表示時刻t
-1的隱藏狀態,,,表示權重矩陣,σ
為sigmoid函數.

雙向GRU可以提取出多普勒頻移以及傅里葉變換值中所攜帶的更多信息,并將其轉換為隱藏狀態.然而,2部分對于目標動作的重要性有所不同.本文通過增加模型對動作的關注程度來提高分類的準確性.權重得分可以用來表示模型的關注程度.分數越高,該部分與動作的相關性越強.因此,我們建立了一個注意機制來計算不同部分和動作之間的權重值.
Wi-Do以相反的方向計算注意力權重得分情況.一種是從多普勒頻移到FFT能量,另一種是從FFT能量到多普勒頻移.2部分特征分別通過GRU網絡后進入隱藏層,后經過池化注意力機制層由softmax輸出分類,圖9具體描述了GRU模型中使用注意機制的整體過程.

Fig. 9 Classification algorithm flow chart圖9 分類算法流程圖
注意力權重可由式(16)表示:
(16)
其中,

(17)

(18)


(19)

(20)
式(21)建立了非線性變換層和softmax分類器以計算分類動作概率值:
=tanh(d
·+),(21)
使用softmax函數分析動作類別p
的概率:
(22)
為了提高模型在分類任務中的性能,該方法對訓練過程進行了優化,包括輸入層、雙向GRU神經網絡層、注意層和非線性層.采用L2正則化的CrossEntropy作為損失函數,其定義如下:

(23)


(24)
ξ
表示學習速率.
在訓練過程中,該方法設計了dropout策略,隨機去除隱層的一些特征,以避免過擬合.通過上述方案,Wi-Do可以準確的識別出來自不同方向的人體運動動作.在本節中將驗證不同因素對Wi-Do的影響,并且分析了Wi-Do的性能與上限.
實驗所用硬件設備分為接收端與發射端.接收端、發射端均為包含Intel 5300網卡的電腦2臺,無線網卡連接3根外部全向天線,使用CSI tool工具提取網卡中的CSI信息.實驗設置了3根發射天線1根接收天線共3條傳輸鏈路.信道的中心頻率設置在5.7 GHz,調整采樣率至1 024 Hz.發射端、接收端設備之間相距2 m,高度1.5 m.
所有實驗都在教學樓內進行,分別為教室、會議室與大廳.教室區域周圍有課桌椅和其他設備,屬于復雜環境;會議室內擺放著會議圓桌與椅子,相對于教室而言為半空曠環境;大廳為完全空曠區域.
實驗運動動作分別設置為3類:頭部、手部、腿部.頭部包含點頭、搖頭等動作;手部包括上下左右4個方向上的揮手;腿部為前后左右以及各個方向之間的45°夾角8個方向上的伸腿.實驗選擇在3種不同環境下采集上述動作數據,其場景示意圖如圖10所示:

Fig. 10 Experimental scene diagram圖10 實驗場景
在初始訓練樣本時,不同的實驗環境、實驗人員、人員規模以及人員的不同狀態都會對人員的動作識別產生影響.為了測試算法的魯棒性,本文設置了多組對比實驗.實驗邀請了6名志愿者(3女3男)來采集CSI動作信息,如表1所示.為了控制除信號本身以外的其他變量,實驗設置了一個計時器,當測試人員按下計時器時,志愿者開始做實驗設置的運動動作,每個動作記錄10組數據.

Table 1 Experimenter Settings表1 實驗人員設置
4.2.1 實驗場景多樣性
在本節中,我們將使用普通WiFi設備實現Wi-Do,并在3種典型的室內場景(大廳、會議室和教室)中評估其性能.結果如圖11所示:

Fig. 11 Identification accuracy in three scenarios圖11 3種室內場景的識別準確率
可以看出,Wi-Do在不同場景下都表現出了優異的性能,動作發生在頭部、手部、腿部時,其平均識別準確率分別為87.65%,91.83%,94.45%.從實驗結果可以看出Wi-Do在空曠大廳中表現最好,在教室表現最差.這是由于教室障礙物較多,多徑效應嚴重,干擾了動作信號的傳播,導致動作識別準確率下降.而空曠大廳幾乎沒有障礙物阻擋,所以動作信號相對完整,動作的識別準確率也相應提高.從整體識別準確率來看,Wi-Do系統對環境具有較高的魯棒性.
4.2.2 人員多樣性
實驗比較了不同人員在相同環境下的動作識別準確率.本文分配表1中6名志愿者在空曠大廳中重復實驗設計的3組(頭、手、腿)動作,記錄Wi-Do對于3種動作的平均識別效果,結果如圖12所示:

Fig. 12 Graph of average motion recognition accuracy of different people圖12 不同人員的動作平均識別準確率
來源于不同人的動作數據可能會由于他們不同的行為模式存在差異.圖12(a)(b)描述了模型對人員頭部、手部運動的識別效果,雖然不同人之間識別準確率存在差異,但是平均識別準確率均都能保持在90%左右.由圖12(c)可以發現,Wi-Do對于腿部運動的識別有著更加穩定的效果與性能,可以為人體步態識別工作提供良好的實驗應用.Wi-Do對于6個實驗人員的動作平均識別準確率保持在90%以上,這充分驗證了該模型在人員多樣性方面的優勢與魯棒性.
4.2.3 動作方向多樣性
為了驗證Wi-Do在不同方向上的識別準確率.實驗設置了8個不同方向的相同動作,正常情況下人體的動作可劃分為前后左右、右上、右后、左上、左后8個方向.為確保方向上的動作一致性,志愿者在8個方向上做伸腿的動作.其結果如圖13所示:

Fig. 13 Accuracy distributions for orientation evaluation圖13 不同方向的準確率分布評估
如圖13,各個方向的識別準確率的平均值為93%左右.當人員向右后邁步時,其識別準確率最低,且較為穩定,通過實驗分析發現,右后方的多普勒頻移與后方的多普勒頻移較為相似,但其識別準確率依然可以能夠保持在87%左右.對于在不同方向上做的相同動作,Wi-Do都能有平均為90%以上的識別準確率.盡管在不同的方向之間存在差異,但對于人員動作的識別效果依然顯著.這充分驗證了Wi-Do模型能夠適應來自不同方向上的人員動作.
4.2.4 設備部署多樣性
一般情況下,由于不同室內環境中物品的擺放方式不同,WiFi的部署形式也會存在多樣性的特征.實驗設置了7種不同的設備部署方式以驗證模型的魯棒性,其部署位置示意圖如圖14所示:

Fig. 14 Different deployment locations for devices圖14 設備不同的部署位置
志愿者分別在7種不同的設備部署位置上做實驗設置的相關動作,實驗結果如圖15所示.

Fig. 15 Identification accuracy at different deployment locations圖15 不同部署位置下的識別準確率
從圖15中可以以看出,設備與人在一條直線上,即在部署位置4處時,識別準確率達到最高,而位置在1,7處的識別精度最低.這是因為設備之間的間距較近且與人的距離較遠,從而導致難以分辨人員的動作發生與動作行為,導致多普勒頻移與傅里葉變換值不穩定,致使識別準確率下降.
4.2.5 設置參數多樣性
發射端與接收端的間距也會對Wi-Do系統的識別準確率產生影響.為了得到最佳檢測距離,我們在空曠大廳內分別讓發射端與接收端間隔不同距離,并在每個距離下測試設計動作,結果如圖16所示:

Fig. 16 CDF of error rate圖16 錯誤率的累計分布函數
圖16給出了不同情景下的錯誤率累積分布函數(cumulative distribution functions, CDF).x
軸表示識別錯誤率,y
軸表示CDF百分比.在設備間距1 m時實現了最高的準確性,其中大約81%的測試數據的錯誤率小于10%.間距4 m時識別的性能最差,其中大約52%的測試數據的錯誤率小于20%.一般情況下,隨著設備間距的增加,Wi-Do的性能會越來越差.而間距1 m與間距2 m有著相似的識別率卻提供了更大的人員運動區域,所以實驗選擇2 m作為驗證運動的區域.這說明在一般室內環境中,Wi-Do對人員動作的識別能夠保持較高的準確率.本節將對不同識別算法、不同識別模型以及模型的邊界進行探討,詳細地闡述了Wi-Do的識別準確率與魯棒性.
4.3.1 不同分類算法比較
為了評估Wi-Do模型中分類方法的性能,在本文的實驗環境中,采集6個人的30 000包動作(包含頭部、手部、腿部動作)數據作為訓練樣本,將我們設計好的引入注意力機制的雙向GRU網絡與先前工作中的LSTM、HMM、決策樹等分類算法進行對比.將訓練樣本數據經過降噪處理后,提取相應的多普勒頻移和快速傅里葉變換值作為特征,分別帶入4個分類方法中進行動作識別,各個分類方法的動作識別效果如圖17所示:

Fig. 17 Accuracy comparison of different classifier algorithms圖17 不同分類器算法的準確率對比
從圖17中可以清晰的看出從頭、手、腿等動作,由于動作幅度變大,不同分類方法的動作識別精度均有所上升,Wi-Do的分類模型與LSTM,HMM以及決策樹方法的準確率分別為94.68%,92.36%,85.47%,78.51%,說明了改良注意力機制的神經網絡的深度學習方法比傳統方法在提取特征后識別分類能取得更好的效果,因此在實際實驗中我們采用了引入注意力機制的雙向GRU網絡作為模型中的分類器.
4.3.2 不同模型比較
WiAct利用身體運動和信道狀態信息中的振幅信息之間的相關性來分類不同的活動,使用極限學習機用于活動數據分類.Wi-Motion從CSI序列中提取的振幅和相位信息,用振幅和相位分別構造分類器,通過基于后驗概率的組合策略對分類器的輸出進行組合.Wi-Multi組合策略對分使用動態時間規整與支持向量機提取樣本,結合神經網絡識別目標動作.本文將平均識別準確率作為評價4種模型的指標,具體結果如表2所示:

Table 2 Comparison of Recognition Accuracy
觀察表2可得,4種識別模型中,Wi-Do的識別準確率整體高于其他3種模型.WiAct,Wi-Motion對于頭部、手部動作的識別準確率都在90%以下,相對而言,Wi-Do具有出色的表現.綜上Wi-Do適用于大多數室內環境中的人員動作識別,并能提供較為精確的識別率與優秀的魯棒性.
4.3.3 模型邊界探究

Fig. 18 Diagram of the influence of different people on the model圖18 不同人員對模型的影響
在真實環境中,往往存在除被檢測人員外的其他人員.由于其干擾,動作的識別結果可能會有所下降.為了探究多人對識別效果的影響,在空曠大廳中本文設計了2個實驗:1)實驗人員1在WiFi測試區域做動作,其余1~5位測試人員在區域內保持靜止.2)實驗人員1在WiFi測試區域做動作,其余1~5個人員在區域內做干擾動作,例如改變身體朝向或在測試區域中走動等.實驗結果如圖18所示.
從圖18(a)中可以看出,當其余測試人員保持靜止時,其準確率雖然有所下降,但是趨勢較為緩慢,總體識別準確率能夠保持在85%以上.然而隨著人員的增加,見圖18(b),識別準確率下降速度較快,但是依然能夠在6人時保持在80%左右.這是因為干擾動作同人數線性增長,導致模型無法準確識別人員動作.
隨著人數的繼續上升,識別準確率將會大幅度降低.但其應用場景已能滿足小型家庭及會議室的要求.我們將會把多人動作的識別工作置于今后的研究工作中.
本文提出了一種基于注意力機制的雙向GRU網絡來識別WiFi區域內的人員動作.利用天線分集消除相位偏移后引入離散小波變換以濾除人體動作無關的信號,分別提取出信號中的多普勒頻移和動作能量變換值作為Wi-Do模型的輸入.實驗結果表明,本文提出的CSI人員動作檢測模型在準確率和效率方面優于許多已有的檢測方法.
后續工作將在以下2個方面進行下一步的開展:1)提升Wi-Do模型的泛化能力,使其能在多人環境中對人員的動作進行識別.2)開展人員動作速度的特征提取,豐富人員動作的特征,進一步提高算法的魯棒性.
作者貢獻聲明
:郝占軍提出了研究思路,負責論文的起草;喬志強負責設計實驗方案,數據分析以及論文修改;黨小超給予了基礎理論支持和實驗建議,負責了實驗監督;張岱陽參與了數據可視化、實驗探究;段渝參與了實驗驗證與數據整理.