魏忠誠 焦壯興 張新秋 王 巍 趙繼軍
(河北工程大學信息與電氣工程學院 河北 邯鄲 056038)(河北工程大學河北安防信息感知與處理重點實驗室 河北 邯鄲 056038)
身份識別在日常考勤、設備認證、安防應急等領域有著廣泛的應用。生物特征由于其普遍性、唯一性、穩定性和不易復制性等使得生物特征識別技術成為當前研究的熱點。常用的生物特征包括虹膜、靜脈、指紋、臉像和步態等,其中依據虹膜、靜脈、指紋等進行識別所需專用設備的部署成本較高,且需要用戶的主動配合。而基于新興起的可穿戴設備進行步態身份識別,又會引起用戶佩戴的不適感。因此,無接觸的被動式生物特征識別技術越來越受到學術界和工業界的廣泛關注。
基于現有工作設備,在完成既定功能的同時實現對身份的感知與識別得到了研究者們的青睞,如基于視頻監控設備、無線通信設備的身份識別技術等。基于視覺設備可通過人臉、步態等實現身份的有效識別,但視覺設備對光線有一定的依賴性,存在視覺盲區并且容易造成用戶隱私泄露。
近年來,研究人員發現Wi-Fi技術在用作通信的同時還可以進行特定信息的感知。如利用接收信號強度指示(Received Signal Strength Indicator,RSSI)和信道狀態信息(Channel State Information,CSI)能夠實現室內定位[1-3]。CSI是細粒度的物理信息,對環境變化敏感,感知效果更好,利用CSI能夠進行檢測心跳和呼吸頻率[4-6]、肢體活動[7-8]和身份識別[9-10]等,本文在先前的工作中對人體活動持續時間進行了估計[11]。由于Wi-Fi設備成本低,不需要用戶接觸和佩戴任何感知設備,克服了視覺設備和可穿戴設備的缺點,并且不易侵犯用戶的隱私,增強了用戶使用的舒適度和安全感。隨著基于CSI的活動識別技術的發展,Zhang等[12]首次將CSI引入到身份識別中。但是該身份識別系統缺乏對身份合法性認證的考慮,容易遭到非法人員入侵,降低了該系統的實用性。在后來的工作中,部分研究人員考慮到身份合法性認證問題,但是識別率較低,并且需要引入非法人員數據,或者需要知道用戶群體中非法人員的百分比,在現實中不易實現。
針對上述問題,本文提出一種基于Wi-Fi信道狀態信息的身份合法性認證系統。首先利用Hampel濾波器、主成分分析(Principal Component Analysis,PCA)和巴特沃斯低通濾波器對CSI數據進行降維和去噪;隨后利用第2主成分的短時能量進行人體檢測;然后,根據人體檢測的結果,提取有效活動片段,提取離散小波變換的近似系數作為特征;最后利用K-means算法,將身份認證問題轉化為相似度比較問題,實現人員身份合法性認證。
區分人員身份和判斷人員身份合法性是身份識別系統中兩個重要功能。本節就基于Wi-Fi信道狀態信息的身份識別和基于Wi-Fi信道狀態信息的身份合法性認證進行文獻綜述。
2016年,Zhang等[12]首次提出基于CSI的身份識別系統的Wi-Fi-ID系統,該系統利用連續小波變換提取中與人員行走相關的CSI信息,提取用戶行走時CSI幅值的最大值、最小值和熵等特征,實現了身份的有效分類和識別,在區分2~6個人身份時識別率分別為93%~77%。同年,Hong等[13]提出WIFD系統,提取子載波幅度頻率作為特征,利用支持向量機(Support Vector Machine,SVM)算法進行分類,實現身份識別。Zeng等[14]提出WiWho系統,通過提取人員的步態特征和行走特征,實現身份識別。Xin等[15]提出FreeSense系統,提取離散小波變換的近似系數作為特征,將動態時間規整與KNN算法結合實現身份識別。隨著深度學習算法的發展,Nkabiti等[16]利用DBD-LSTM-RNN模型進行身份識別,該模型可以識別出人員走路的開始和結束,并且可以根據行走時身體對CSI的影響來判斷人員身份。Pokkunuru等[17]提出NeuralWave系統,利用深度卷積神經網絡自動獲得步態特征,并通過Softmax分類器對其進行分類。
上述的身份識別系統中,分類器中的類別是事先明確的,當出現非法人員時,非法人員的類別與分類器中所有分類類別均不相符,但分類器會將其當作訓練過的人進行分類。因此系統無法對人員身份的合法性做出判斷,容易遭到非法人員的入侵。
盡管現在的身份識別技術的精確度很高,但是無法識別非法人員限制了這些系統的應用性。考慮到人員身份合法性認證問題,部分研究人員在身份識別系統中增加了這一功能。Wang等[18]設計了WifiU系統,從CSI頻譜圖中提取步行速度、步態周期、軀干和腿部運動速度的特征,將訓練數據分為基準人員和目標人員兩個類別,利用支持SVM分類器計算出未知步態實例屬于目標人員的概率,將概率值高于閾值的步態實例視為合法人員;文獻[19]提出Wii系統,在實現身份識別的同時將一部分訓練集劃分為合法人員和非法人員,構建合法人員和非法人員兩個高斯模型進行區分合法人員和非法人員;Lin等[20]通過兩個專用損失函數來識別合法用戶身份和驗證非法用戶。上述系統在進行人員身份合法性認證時,訓練集中需要引入非法人員數據,或者需要知道用戶群體中非法人員的百分比,在現實場景下,該條件不易滿足。Shi等[21]為每個合法用戶構建一個支持向量模型,通過比較未知人員樣本與合法用戶樣本的支持向量的距離來判別未知人員身份的合法性,其存在模型中合法人員個數較少,識別率偏低的問題。本文針對人員身份合法性認證問題,利用聚類算法,將人員身份合法性認證過程轉化相似度比較,避免在訓練過程中引入非法人員數據,實現了對人員身份合法性的高精度認證。
近CSI描述了信號在發射機和接收機之間的傳輸變化。這些變化包含信號的散射、衰弱和功率隨距離衰減等信息。無線信號在傳輸過程中會沿不同路徑進行傳播,產生多徑效應。信道的多徑效應可以用信道沖擊響應(Channel Impulse Response,CIR)描述。在線性時不變的條件下,CIR可表示為:
(1)
式中:αi、θi和τi分別為第i條路徑的幅值衰減、相位偏移和時間延遲;N為傳播路徑總數;δ(τ)為狄克拉函數。
在頻域上,信號的多徑效應可以用信道頻率響應(Channel Frequency Response,CFR)來描述。在帶寬無限的條件下,CFR與CIR互為傅里葉變換。CFR可表示為:
(2)

CSI屬于無線通信協議中的物理層信息,無法直接獲取。近年來,研究人員通過修改固件,使得一些普通IEEE 802.11n標準的無線網卡(如:Inter 5300、Atheros AR9382等)能以CSI的形式提供不同子載波詳細的幅度和相位信息。本文使用Atheros AR9382網卡對Linux系統下的網卡開源驅動程序進行修改,可以得到CSI矩陣H:
H=[H(1),H(2),…,H(k)]NT×NR
(3)
式中:NT與NR分別為發射天線和接收天線數目,k為子載波序號。
本系統通過對CSI幅值進行分析實現人員檢測和人員身份合法性認證。首先,采用Hampel濾波器去除原始數據的離群點,PCA提取CSI幅值主成分,降低數據維度,利用巴特沃斯低通濾波器進行去噪處理;然后,進行人員檢測截取包含人員行走的有效片段;最后,在有效片段中提取特征,作為人員合法性判斷的依據,實現人員身份合法性的判斷。
由于硬件設備存在缺陷,工作過程中發射功率和傳輸速率等的變化,使得提取到的CSI幅值出現異常值[22]。為了保證后續工作不受異常值干擾,本文選用Hampel濾波器去除異常點[23]。計算CSI幅值任意點與其鄰近的6個點的中值μ與標準差σ將不在區間[μ-3σ,μ+3σ]內的值作為離群點去除,并且用中值代替。
在正交頻分復用(Orthogonal Frequency Division Multiplexing,OFDM)調制下,接收到的CSI包含114條子載波。為降低后續工作的計算復雜度,利用PCA對CSI幅值進行降維處理。PCA是將n維特征映射到k維(k 圖1 CSI第1-3主成分序列 由于周圍環境的影響,接收到CSI包含大量噪聲,而典型的人類活動只會影響300 Hz以下頻率的CSI變化[24]。在之前身份識別的工作中得以驗證,截止頻率為30 Hz時濾波效果最好。本文采用截止頻率為30 Hz的巴特沃斯低通濾波器去除CSI數據中的高頻噪聲。圖2(a)為濾波前CSI主成分的波形,圖2(b)為濾波后CSI主成分的波形。 (a) 去噪前的CSI第2主成分變化 (b) 去噪后的CSI第2主成分變化圖2 去噪前后的CSI第2主成分 設備工作過程中,接收端會不斷地接收CSI數據,因此需要檢測感知范圍內是否有人員存在,確定人員行走的有效區域,提取行走的有效片段,用于后續的人員身份合法性驗證。如圖2(b)所示,當有人在LOS行走時CSI主成分波形變化最明顯。短時能量是滑動窗口內平方信號的總和,對人體活動更敏感。如圖3為CSI第2主成分的短時能量序列,當LOS上沒有人行走時,第2主成分的短時能量值接近于0,當有人穿過LOS時短時能量值變化很大,這為確定行走的有效區域提供了依據。因此,本文通過短時能量進行人員檢測。 圖3 CSI第2主成分的短時能量序列 Emax=max(E) (4) (5) 式中:J為短時能量序列的長度。 實驗發現,短時能量序列的最大值與均值的比值可以作為人員檢測的條件。即: (6) 如果θ不小于設定的閾值則認為環境中有用戶行走,反之亦然。本系統中閾值為10。 特征提取是對信息提煉的過程,目的是提取出具有魯棒性的特征,使系統在不同的環境下具有穩定身份識別效果。離散小波變換(Discrete Wavelet Transform,DWT)可以對波形進行壓縮,變換后的波形能夠保留原波形大多數的時域和頻域信息[15]。因此,本文采用Daubechies D4小波對第2主成分波形進行處理,使用近似系數來表示原波形的形狀特征。 在判斷人員身份合法性的過程中,非法人員的數據樣本往往不確定,因此不適合用分類算法。本文采用聚類算法進行分析。 具體可分為以下步驟: (1) 將近似系數進行歸一化處理。 (2) 將10名志愿者特征數據分為2組,1~5號志愿者為合法人員,6~10號志愿者為非法人員數據集。 (3) 從合法人員數據中抽取若干合法人員,每名合法人員隨機選取30條數據作為合法人員的訓練集,剩下70條數據作為合法人員的測試集。 (4) 利用Hampel濾波器去除訓練集中每條特征向量的離群點。采用K-means算法對處理后的訓練集進行聚類,將聚類錯誤的數據刪除,并且得到第i類的中心坐標Oi和第i類中的第j點到Oi的距離lij。 (5) 通過式(7)、式(8)得到第i類中各點到中心坐標Oi的距離Li。設置距離系數c,使得距離半徑Ri=cLij。 (7) Lij=max(Li) (8) 式中:N為每類包含的數據個數。 (6) 計算每個測試數據到各個聚類中心Oi距離P,若P 本文使用和文獻[11]一樣的實驗室場景對系統的性能進行了評估。圖4為實驗場景平面圖。使用TP-Link 802.11n無線路由器作為發射機,配備Atheros 9382 NIC和開源工具Atheros-CSI-Tool的戴爾筆記本電腦作為接收機,運行Ubuntu 14.04 OS。發射器和接收器被放置在離地面約1 m的地方,彼此相距1.5 m。本文提取了發射機和接收機的第一根天線的主天線對之間鏈路的CSI幅值。此外,在數據采集過程中,由于設備處理能力有限,數據采樣頻率設置為500 Hz。 圖4 實驗場景平面圖 本次實驗招募了10名年齡相仿的健康志愿者,他們的基本信息如表1所示。在數據采集過程中,志愿者的行走速度和行走方式不受限制,自然地行走穿過一次收發機的LOS即可,每名志愿者行走100次。為了更接近現實的場景,在數據采集過程中有四個干擾人員在實驗室內正常工作。 表1 志愿者信息 為了驗證各個指標對系統性能的影響,本文采用以下評判指標。 真陽性(TP):TP指系統將合法人員正確識別為合法人員的事件。 真陰性(TN):TN指系統將非法人員正確識別為非法人員的事件。 假陽性(FP):FP指系統將非法人員錯誤識別為合法人員的事件。 假陰性(FN):FN指系統將合法人員錯誤識別為非法人員的事件。 真陽性率(TPR):TPR指系統對合法人員做出正確判斷的概率,如式(9)所示。 (9) 真陰性率(TNR):TNR指系統對非法人員做出正確判斷的概率,如式(10)所示。 (10) 正確率:正確率指系統對合法人員和非法人員做出正確判斷的概率,如式(11)所示。 (11) 用戶TNR需求度下識別率(PTNR):PTNR指用戶TNR需求度為P?(0,1)下的系統識別率,如式(12)所示。 PTNR=(1-P)×TPR+P×TNR (12) 本節將驗證不同分解層數下的近似系數對系統正確率的影響。此次實驗中,訓練集中包含1~5名合法人員,每名合法人員隨機選取30條數據。每名合法人員剩下70條數據作為合法人員測試集,非法人員測試數量與合法人員測試數量相同,每次實驗重復5次。實驗結果如圖5所示,隨著分解層數增大,正確率逐漸減小,這是由于離散小波變換的不同分解層數對波形的壓縮程度不同,使得近似系數包含波形信息不同。因此,本文使用第一層近似系數來評估后續實驗。 圖5 不同層數的近似系數正確率對比 本節將驗證訓練集中不同合法人員個數與距離系數c對TPR和TNR的影響。由式(9)和式(10)可知,TPR和TNR的結果不受測試集中合法人員和非法人員數量比例的影響。此次實驗中,訓練集中包含1~5名合法人員,每名合法人員隨機選取30條數據。每名合法人員剩下的70條數據作為合法人員測試集,500條非法人員數據作為非法人員測試集。每次實驗重復5次。實驗結果如圖6所示,訓練集中包含1~3個合法人員時,TPR和TNR的交點處超過0.95,訓練集中包含4~5個合法人員時,TPR和TNR的交點處超過0.8。隨著訓練集中合法人員個數增多,系統TPR和TNR有所下降。這是由于合法人員個數增多,通過K-means算法處理后,得到的不同人員的類別增多,使得合法人員的判定范圍變大,容易將非法人員識別為合法人員。因此,訓練集中合法人員個數是評判系統性能的重要指標。 (a) 訓練集中包含1名合法人員 (b) 訓練集中包含2名合法人員 (c) 訓練集中包含3名合法人員 (d) 訓練集中包含4名合法人員 (e) 訓練集中包含5名合法人員圖6 訓練集中合法人員個數與距離系數對TPR/TNR影響對比 隨著距離系數的增大,TPR值變大,TNR值變小。這是由于距離系數c越大Ri越大,致使合法人員判定范圍變大,從而容易將測試數據識別為合法人員。因此,用戶可以根據不同應用場景的需求來選定距離系數進行人員合法性認證。 根據用戶對不同TNR的需求傾向,本文為用戶提供了一個基于TNR需求度的選擇方案。本節將驗證不同距離系數下5種需求度的PTNR。此次實驗中,訓練集中包含5名合法人員,每名合法人員隨機選取30條數據。每名合法人員剩下的70條數據作為合法人員測試集,500條非法人員數據作為非法人員測試集。每次實驗重復5次。實驗結果如圖7所示,不同需求傾向的PTNR極值所對應的距離系數分布點隨著P值的減小而增大。因此,當用戶對TNR的需求高時,距離系數應設置小一些,當用戶對TPR的需求高時,距離系數應設置大一些。此外。5條線在c=1.05處相交,這是由于該點的TPR和TNR相等。 圖7 不同距離系數對PTNR影響對比 本節利用測試集中不同合法人員數量比例驗證系統穩定性。圖8(a)為測試集中不同合法人員數量比例下正確率隨距離系數的變化,此時訓練集中包含5名合法人員。由圖可知,隨著距離系數增大,測試集中合法人員數量越多,正確率越大,這是由于隨著距離系數增大,TPR逐漸增大。圖8(b)為測試集中不同合法人員數量比例下正確率隨訓練集中合法人員個數的變化,隨著訓練集中合法人員個數增多,系統正確率有所下降。這也再次驗證了圖6的結論,即訓練集合法人員個數是影響系統性能的重要指標。 (a) 訓練集中包含5名合法人員 (b) 訓練集中不同合法人員個數圖8 測試集中不同合法人員數量比例對正確率的影響 人員身份合法性認證是實現入侵檢測的重要一步。本文針對現有方法存在防偽性和隱私性較差的問題,提出了基于CSI的合法人員認證系統。該系統在訓練集不引進非法人員數據的情況下,利用聚類方法實現高精度合法人員認證,并在典型的實驗室場景中進行系統評估。實驗表明,系統中合法人員為1到5人時,TPR和TNR可達到80%以上,通過調節距離系數能夠滿足不同應用場景的安全需求。在未來的工作中,將根據不同安全等級提供更為詳細的用戶選擇方案,并且在非視距路線下實現人員身份合法性認證。同時,將進一步探索訓練集大規模合法人員個數情況下的身份合法性認證問題。


3.2 人員檢測與有效片段提取



3.3 特征提取
3.4 人員合法性識別
4 實驗分析
4.1 實驗設置


4.2 評判指標

4.3 近似系數層數

4.4 訓練集中合法人員個數與距離系數





4.5 用戶TNR需求度

4.6 測試集中合法人員數量比例


5 結 語