齊美旭 施文 盛志恒 李明東



摘 要:基于計算機視覺的被動檢測采用攝像頭作為采集工具,通過采集到的圖像信息進行人類行為的檢測,通常應用于室外行人檢測以及人識別等領域。而基于射頻指紋信號的被動檢測采用射頻信號作為感知主體(常用藍牙、WiFi等射頻信號),通常應用于室內等需要保證隱私場景中的人類行為檢測。本文針對室外和室內兩類場景,分別使用基于計算機視覺的方法以及基于WiFi信號的方法實現人類行為檢測的任務目標。本文所提出的修改后YOLOv5s算法在行人檢測方面明顯優于同類算法,具有88.65%的mAP性能,并且經過輕量化以后,占用內存僅為原模型的八分之一,顯著降低了內存占用率,
關鍵詞:機器學習;計算機視覺;YOLOv5s
一、引言
本文以室內場景下也可以作為一種新型的人機交互來執行智能醫療監控諸如智慧家居或者老年人跌倒檢測,或者可以通過識別人類行為來應用于交互式體感游戲等。而隨著深度學習的興起和廣泛應用,人類行為檢測的實時性和準確性也都有了大幅度的提高。大多數傳統的人類行為檢測系統使用佩戴式傳感器進行檢測和識別。盡管隨著技術的發展,傳感器的尺寸變得更小,數據收集變得更有效,但基于傳感器的檢測系統仍然面臨著部署的限制。特別是隨著傳感范圍和規模的不斷增加,部署和維護大規模傳感系統的成本也會急劇增加。
二、不同場景下基于計算機視覺的行為檢測分類研究
隨著現如今無線通信的迅猛發展,無線電環境的分布十分廣泛,人類在這些無線電環境當中的各項活動會引起環境中信號傳輸的變化,因此通過檢測和分析這些信號的變化則可以判斷出環境中的人類行為。傳統的感知方法為接收信號強度指示,RSSI廣泛應用于室內定位和運動物體被動跟蹤等場景當中。RSSI的采集十分方便,但是在實際的傳播環境當中,無線信號會受到多個障礙物的影響,從而產生多徑效應,因此RSSI的穩定性較差,很難滿足現如今日益復雜的傳感任務的需求。為了解決這個問題,信道狀態信息這一指標逐漸成為分析的主流,并且逐漸取代了RSSI的應用場景。
外場景下的計算機視覺領域,人類行為檢測作為目標檢測的一個分支,主要的檢測思路與傳統的目標檢測方法相一致,主要分為了三個階段。第一階段首先在目標區域生成目標區域提案,第二階段則分別提取各個提案當中的特征信息,最后的階段則是根據提取到的特征進行分類。然而,考慮到預測精度與預測速度,傳統的檢測方法已經不能滿足當今社會上的各項需求。而深度學習具備精度高、訓練速度快、以及計算量較低等優勢,逐漸成為檢測方法中的主流。
三、場內外環境的輕量化邊緣設備設置方法研究
邊緣設備的優勢在于成本低、便于大范圍應用,但是劣勢則在于其設備的局限性,往往不適合大型算法的部署。上一章節當中我們所使用的YOLOv5算法最終的占用內存大小約為190MB,即使是優化后的YOLOv5s算法內存占用也達到了55MB左右,過大的模型占用內存不利于現代環境實時通信、檢測的需求,因此針對模型進行輕量化操作非常有必要。
(一)輕量化網絡剪枝流程
神經網絡的輕量化近些年逐漸興起,主要的想法就是在不顯著降低模型性能的前提下,針對DNN進行算法模型的壓縮或者計算加速。在一般情況下,輕量化網絡的方法主要有四種,分別為DNN網絡參數的剪枝以及量化、低秩因子分解、轉移/緊湊卷積濾波器以及知識蒸餾等。
在使用轉移/緊湊卷積濾波器時,CNN的參數能有效保證針對輸入圖像的平移不變性,能成功保證訓練深度模型的時候不會導致嚴重的過擬合。雖然理論目前尚未得到證明,針對CNN的平移不變性以及網絡參數卷積權值共享這兩點至關重要。
采用了輕量化網絡剪枝的方法,對YOLOv5s網絡進行剪枝優化,具體的流程如圖1所示。首先將初始化的YOLOv5s網絡進行稀疏化,即信道稀疏正則化訓練,稀疏化過后則通過小比例因子對不同通道進行修剪,之后將修剪后的網絡進行微調,反復循環這三項操作最終就可以得到一個緊湊型的網絡。
BN層網絡剪枝優化,以卷積層為例,由于比例因子存在明顯差異,部分輸入層的通道比例因子可能無限接近于0,即這些層對于輸出層的影響十分有限,因此我們可以將這些層進行剪枝和修剪。通過迭代這個過程,最終可以得到一個非常緊湊的模型。
(二)基于WiFi信號的感知人類行為檢測方法
Wi-Fi環境中,人類進行不同的行為,會導致環境中分布的信號產生不同程度反射和衍射,同時改變信號的傳輸路徑和分布。針對這些Wi-Fi信號路徑所產生的變化,我們可以進行算法研究,從而識別不同的行為動作。人的運動行為導致了場景中Wi-Fi信號的傳播發生了不同程度的變化。信號接收器則可以收集變化前后各個傳播路徑的信號,將這些信號匯總最后生成并輸出CSI。
由于靜態路徑信號不受目標行為變化的影響,可以假定它是一個常數復值。假設A點和E點之間的距離很短,反射信號的幅度變化不大,因此也可以認為反射信號在該時間段內為常數。從而得到最終的簡化CSI模型:
CSI數據預處理 由于環境噪聲和各種干擾的存在,采集到的CSI流無法直接訓練。因此,輸出CSI流需要經過兩步預處理來提取特征,提取的特征將更有利于算法訓練,最終達到Wi-Fi感知的任務目標。預處理部分主要包括兩個部分,即CSI信號的去噪和轉換,以及特征提取。
信號去噪主要用于CSI振幅和相位噪聲的去除。相位方面,在實際Wi-Fi系統中,由于硬件不完善等原因,原始CSI測量值中存在相位偏移,如采樣時間偏移和采樣頻率偏移。具體如圖2所示。
四、總結
本章中主要探討了針對這類算法網絡的輕量化方法,首先進行了輕量化方法總結,考慮到目前常用的輕量化網絡方法可能并不適用于本文的研究目標,因此以行人檢測算法為例,討論其神經網絡剪枝的可能性。本章針對YOLOv5s網絡的BN層進行了剪枝可行性分析,首先針對網絡進行稀疏化工作,其次采用L1正則化將網絡比例因子進行調整,使原先正太分布的因子在逼近0時存在有效的可剪枝網絡層,通過剪枝去除等于0或者無限逼近0處60%的網絡層,最后對整體的網絡進行微調,重復操作得到最終的緊密型網絡模型。
參考文獻:
[1]張大慶,張扶桑,吳丹,等.基于CSI的通信感知一體化設計:問題、挑戰和展望[J].移動通信,2022,46(05):9-16.
[2]桂冠,王潔,楊潔,等.基于深度學習的頻分復用大規模多輸入多輸出下行信道狀態信息獲取技術[J].數據采集與處理,2022,37(03):502-511.
基金項目:安徽省教育廳重點科研項目(項目號:2023AH052240),教育部高等教育司產學合作協同育人項目(項目號:202102223021),教育部高等教育司產學合作協同育人項目(編號:220904723130951),教育部高等教育司產學合作協同育人項目(項目號:202102049012)。