





摘 要:步態識別作為一種非侵入性的人體生物識別技術,因其無須用戶主動配合的特點,被廣泛應用于安防和智能家居等領域。然而,現實中步態識別系統面臨的一個重大挑戰是偽裝效應。當受試者改變著裝或攜帶物品時,步態數據的可靠性往往受到影響,從而使步態識別變得困難。為解決這一問題,該文提出一種基于Wi-Fi CSI的無監督偽裝步態識別方法。該方法引入一種新的數據度量策略,通過預訓練來獲取偽裝步態數據的偽標簽,并利用匹配濾波技術生成高質量的標記訓練數據對。最終,通過無監督學習實現數據分布對齊,克服偽裝步態數據的分布偏移問題。實驗結果表明,該文的方法在偽裝步態識別方面顯著優于現有最先進的步態識別技術。
關鍵詞:步態識別;Wi-Fi CSI;偽裝;無監督;數據分布偏移
中圖分類號:TP391.4 文獻標志碼:A 文章編號:2095-2945(2024)30-0016-04
Abstract: Gait recognition, as a non-intrusive biometric technology, is widely used in security and smart home applications due to its ability to function without active user cooperation. However, a significant challenge faced by gait recognition systems in practice is the effect of disguise. When subjects alter their clothing or carry objects, the reliability of gait data is often compromised, making gait recognition difficult. To address this issue, this dOnaTsiqizpe36IiTaUJyA==paper proposes a disguise gait recognition method based on Wi-Fi CSI (Channel State Information). The method introduces a novel data metric strategy, using pre-training to obtain pseudo-labels for disguised gait data, and employs matched filtering techniques to generate high-quality labeled training data pairs. Ultimately, it achieves data distribution alignment through unsupervised learning, overcoming the problem of distribution shift in disguised gait data. Experimental results show that the method significantly outperforms existing state-of-the-art gait recognition techniques in disguise scenarios.
Keywords: gait recognition; Wi-Fi CSI; disguise; unsupervised; data distribution shift
近年來隨著普適計算的廣泛應用,不引人注目用戶識別[1]逐漸成為研究熱點。與基于人臉[2]、指紋[3]和虹膜[4]等生物識別技術相比,基于步態的識別技術由于其不需要用戶的主動配合且具有唯一性和獨特性,更適合于此類用戶識別的任務。
目前,最廣泛使用的步態識別技術包括圖像、可穿戴傳感器和射頻信號。然而,基于圖像的步態識別受到環境因素(如光照和遮擋)的限制較大,并且容易引發隱私泄露的風險。可穿戴傳感器存在高成本、舒適性差和不能用于非合作目標等缺陷。基于射頻的方法因為射頻信號可以穿過障礙物,不受光線明暗的影響且設備更具通用性等特點成為研究熱點。近年來,許多研究探索了基于Wi-Fi CSI的身份識別方法。Zhang等[5]提出了Gate-ID,其是一種利用注意力加權融合先驗特征的深度學習模型,實現了在6~20人的群體中分別以最高90.7%和平均75.7%的準確度識別特定用戶。Pokkunuru等[6]提出的NeuralWave系統,采用深度學習的方法在24人的數據集上實現了89.9%的身份識別準確率。Wang等[7]提出的CSI-Net系統,利用用戶靜止時的CSI數據進行身份識別,最終在30人的數據集上實現了93%的身份識別準確率。
然而,將Wi-Fi信號應用于現實環境的識別面臨幾個挑戰。首先,對偽裝步態的準確識別。在用戶偽裝(變換著裝或攜帶物體)時,同一用戶對信號傳播的干擾會明顯不同,從而導致數據分布的偏移。其次,注釋數據集的限制。現有的基于Wi-Fi CSI的步態識別方法通常依賴于大量的有監督注釋數據,這不僅費時費力,而且注釋過程復雜。雖然Fan等[8]通過結合視頻進行少樣本標注,提供了一種解決方案,但這需要更高的部署成本,且存在泄露隱私的風險,從而限制了系統的實際應用。
為解決上述問題,本文提出了一種新的數據分布度量方法。通過域自適應技術,模型同時學習偽裝前后的不變特征,從而實現偽裝步態的有效識別。針對新狀態數據集注釋困難的問題,本文利用偽裝前的數據進行預訓練,生成新狀態數據集的偽標簽,并結合匹配過濾技術,獲得高質量的帶標簽訓練數據對,實現無監督訓練。
1 系統模型
本文提出的無監督域自適應偽裝步態識別框架如圖1所示,主要包括3個部分:數據采集、數據預處理和深度學習模型。
數據采集:本文使用了一對Wi-Fi收發設備進行數據采集。發送端為普通的Wi-Fi路由器,接收端為安裝了Wi-Fi CSI TOOL的筆記本電腦。信號工作頻段為2.4 GHz,接收器的采樣率為1 kHz。
數據預處理:收集到Wi-Fi數據之后,通過以下步驟進行預處理。
第一步:降噪濾波。首先,使用絕對中值差法去除噪聲,以獲得清晰的人體反射信號。其次,使用巴特沃茲低通濾波器去除高頻噪聲,僅保留與運動相關的數據。
第二步:選取步態數據。采用非重疊滑動窗口法選取步態數據。通過計算窗口的方差并設定相應的閾值來確定運動階段的起點和終點,最終選擇信號幅值較大的部分。圖2展示了經過上述處理步驟后的CSI數據。
深度學習模型:本文提出網絡模型如圖3所示。該模型通過偽標簽匹配機制和交叉注意力度量,實現了源域和目標域數據的對齊,從而提升了偽裝狀態下步態識別的精度。
模型輸入數據分為2個部分:源域和目標域。源域數據是帶有類別標簽的步態數據,目標域數據是偽裝狀態下沒有類別標簽的步態數據。雖然源域和目標域具有相同的特征空間和標簽空間,但它們的數據概率分布不同。源域數據的樣本包括有輸入數據x和輸出標簽y,數據概率分布為Ps,可以表示為Ds={Xs,Ys,Ps}。目標域數據的樣本只包括輸入數據x,數據概率分布為Pt,可以表示為Dt={Xt,Pt}。無監督域自適應的目標是利用源域數據學習一個在目標域上預測誤差最小的函數f(x),目標函數表示為
通過這種方式,模型在源域和目標域間實現了有效的對齊和適應。
1.1 目標域偽標簽和匹配過濾
偽標簽:為了提升領域自適應性能,采用預訓練的特征提取器將目標域數據映射為概率分布。這些分布用于加權k均值聚類,計算每個類別的初始質心
式中:δ表示K類中第t個樣本的概率分布。偽標簽通過最近鄰分類器產生
式中:d(ck,ft)是特征ck和ft的距離。偽標簽的更新通過重復上述過程完成。
匹配過濾:偽標簽生成過程中可能會引入噪聲,且由于目標域偽標簽的無監督生成方式,可能會導致目標域中的樣本數量與源域中的樣本數量不均衡。為了解決這個問題,提出了基于特征匹配的方法來過濾偽標簽。方法是將源域中的每個樣本與目標域中相同類別的樣本進行配對,使用余弦相似度作為度量標準
式中: 分別表示源域和目標域K類的樣本;d(fS_K,fT_K)表示樣本fS_K,fT_K之間的余弦距離。由于不限制目標域樣本的匹配次數,這可能會產生多對一的匹配,從而最大化高置信度偽標簽的利用。
為擴充訓練的數據,對目標域樣本進行同樣的操作。不同之處在于,匹配后使用源域的真實標簽作為目標域樣本的類別標簽,而不是目標域的偽標簽。這樣可以確保標簽的可靠性,因為源域的真實標簽比目標域的偽標簽更加準確,從而提高訓練數據的質量。目標域得到的數據對表示為
最終得到的訓練數據對為 。
1.2 交叉注意力度量
注意力機制因其能夠有效整合序列中的時序信息而備受關注[9],尤其適用于從CSI序列中提取步態信息。本文采用交叉注意力機制來度量源域和目標域之間的分布差異。交叉注意力機制可以表示為
式中: 為源域數據的查詢(query);KT,VT為來自于目標域的鍵(key)和值(value)。通過匹配源域的 與目標域的KT,計算樣本相似性的權重。最終,通過最小化 和 之間的距離,實現源域和目標域的對齊。分布差異的量化公式為
。
最終損失函數定義為
,
式中: 為源域和目標域的分類損失; 為交叉注意力度量損失。最終,通過目標域分支即可完成偽裝步態識別。
2 實驗結果與討論
收集30名測試者的Wi-Fi步態數據,數據涵蓋了一個場景下的3種狀態:正常著裝(H_n)、背包負重(H_p)、穿著長風衣覆蓋下半身(H_c),共計6 120條數據。
為了更客觀地評估所提方法的性能,將其與多種先進的無監督域自適應算法進行對比,包括BNM[10]、DAAN[11]、DAN[12]、DANN[13]、DSAN[14]和DTA[15]。為確保公平性,在所有對比實驗中使用了相同的特征提取器和分類器。
2.1 整體性能
在驗證偽裝步態識別性能時,隨機選擇一種狀態作為源域,另一種狀態作為目標域。實驗結果見表1,本文提出的方法比不使用域自適應的情況下準確率至少提高了13.05%,偽裝步態識別的最高準確率達到了94.61%。這表明本文的方法在偽裝步態識別中具備出色的魯棒性和競爭力
2.2 消融實驗
本節通過消融實驗評估模型各組件的貢獻,實驗結果見表2。
為驗證目標域預訓練和偽標簽匹配的有效性,將源域和目標域數據隨機組合生成訓練對,并取消了域自適應和目標域偽標簽的監督訓練。實驗結果顯示,性能顯著下降,證明了目標域預訓練和偽標簽匹配在偽裝步態識別中的重要性。
評估交叉注意力度量的有效性時,刪除模型中的交叉注意力模塊導致識別精度平均下降約10%。偽裝步態中,偽裝狀態會影響信號傳播并隱藏身份特征。實驗結果表明,交叉注意力度量能有效應對數據分布偏移,提取出與偽裝無關的身份特征,提升了識別效果。
3 結論
本文提出了一種基于Wi-Fi CSI的無監督偽裝步態識別方法。通過創新性的數據分布度量方法,實現了數據分布差異度量和類感知對齊。通過預訓練模型生成目標域偽標簽,并結合匹配過濾機制,構建高質量的帶標簽訓練數據對,解決了新偽裝狀態步態數據難以標注的問題。實驗結果表明,該方法在偽裝步態識別任務中表現優異,顯著優于現有方法,展現了良好的識別能力和魯棒性。
參考文獻:
[1] ZHANG J, WEI B, HU W, et al. Wifi-id: Human identification using wifi signal[C]//2016 International Conference on Distributed Computing in Sensor Systems (DCOSS). IEEE, 2016: 75-82.
[2] 王東.基于神經網絡的人臉識別模型研究[J].科技創新與應用,2024,14(22):5-8,13.
[3] 李碩,趙朝陽,屈音璇,等.深度學習技術在指紋識別中的應用[J/OL].計算機工程,1-25[2024-09-23].https://doi.org/10.19678/j.issn.1000-3428.0068276.
[4] 周奧.基于深度學習的人臉虹膜雙特征融合識別算法研究與應用[D].成都:西南交通大學,2022.
[5] ZHANG J, WEI B, WU F, et al. Gate-ID: WiFi-based human identification irrespective of walking directions in smart home[J]. IEEE Internet of Things Journal, 2020, 8(9): 7610-7624.
[6] POKKUNURU A, JAKKALA K, BHUYAN A,et al. NeuralWave: gait-based user identification through commodity WiFi and deep learning[C]//IECON 2018-44th Annual Conference of the IEEE Industrial Electronics Society, 2018:758-765.
[7] WANG F , HAN J , ZHANG S , et al. CSI-Net: Unified Human Body Characterization and Pose Recognition[C]// arXiv e-prints, 2018.
[8] FAN J, ZHOU H, ZHOU F, et al. WiVi: WiFi-Video Cross-Modal Fusion based Multi-Path Gait Recognition System[C]//2022 IEEE/ACM 30th International Symposium on Quality of Service (IWQoS). IEEE, 2022: 1-10.
[9] VASWANI A, SHAZEER N, PARMAR N, et al. Attention is all you need[C]// Advances in neural information processing systems, 2017:30.
[10] CUI S, WANG S, ZHUO J, et al. Towards discriminability and diversity: Batch nuclear-norm maximization under label insufficient situations[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 3941-3950.
[11] YU C, WANG J, CHEN Y, et al. Transfer learning with dynamic adversarial adaptation network[C]//2019 IEEE International Conference on Data Mining (ICDM). IEEE, 2019: 778-786.
[12] LONG M, CAO Y, WANG J, et al. Learning transferable features with deep adaptation networks[C]//International conference on machine learning. PMLR, 2015: 97-105.
[13] GANIN Y, LEMPITSKY V. Unsupervised domain adaptation by backpropagation[C]//International conference on machine learning. PMLR, 2015: 1180-1189.
[14] ZHU Y, ZHUANG F, WANG J, et al. Deep subdomain adaptation network for image classification[J]. IEEE transactions on neural networks and learning systems, 2020, 32(4):1713-1722.
[15] LEE S, KIM D, KIM N, et al. Drop to adapt: Learning discriminative features for unsupervised domain adaptation[C]//Proceedings of the IEEE/CVF International Conference on Computer Vision,2019:91-100.
基金項目:國家自然科學基金(62373300)
第一作者簡介:梁穎(1980-),女,碩士,講師。研究方向為深度學習、普適計算。