方潛生,黃 晶,王 萍,張振亞
(1.安徽建筑大學智能建筑與建筑節能安徽省重點實驗室,安徽合肥 230022;2.安徽建筑大學電子與信息工程學院,安徽合肥 230601)
現階段我國建筑能耗約占全國社會終端總能耗的22%,遠高于發達國家的平均水平[1],建筑節能勢在必行。建筑物的使用與人員關聯甚緊,建筑物內人員數量、流量和位置分布均為節能調控提供了重要的數據參考。
當前,室內人員辨識及其在建筑節能領域的應用已成為學術界和工業界的一大研究熱點[2-9]。其中,人員計數、人群密度估計屬于計算機視覺領域的重要研究內容。例如,Alzaydi 等[10]對高密度視頻圖像的人員計數方法進行了研究;Chen 等[11]首次提出利用移動設備的麥克風和揚聲器等音頻技術實現人員計數的方法;Meyn 等[12]基于SUN(Sensor-Utility-Network)框架實現了室內人員計數,準確率比直接觀察提高了70%;Huang 等[13]首次提出基于二氧化碳濃度對室內人員數目進行估計,但準確率受外界環境影響較大。目前,上海交通大學、清華大學、香港中文大學、中國科學院自動化研究所等機構的專家學者們相繼開展了遮擋檢測和補償技術、背景消除技術、回歸算法(模型)等基于視頻圖像的人員計數方法研究[14-16]。
除人員計數外,人員定位也是人員狀態監測的重要組成部分。例如,Want 等[17]設計了第一個室內標記感測原型系統Active Badge;Valle 等[18]采用智能手機的Wi-Fi 信號、GSM、加速度計/磁場傳感功能實現了人員室內定位;Priyantha 等[19]研究了基于WLAN、藍牙、WiFi、RFID 等無線信號強度的人員室內定位方法,精度可達到厘米級;Sun等[20]基于慣性/磁傳感、無線通信技術,結合慣性導航算法實現了基于信號強度的人員室內定位;Kotaru 等[21]研發了基于Wi-Fi 的可精準到厘米級別的人體定位系統SpotFi;Wang 等[22]提出一種基于光學無線通信技術的室內定位系統。
以上人員計數與定位方法依賴于大量硬件設施,成本高昂,且很少將人員定位與計數相結合。為此,本文提出一種無需額外鋪設昂貴硬件設施和人員主動參與的室內人員自動計數方法。該方法基于當今社會人員與移動終端的強依賴關系,在感興趣區域部署多個可持續監測Wi-Fi 連接請求信息的低廉商用Wi-Fi 探針,以檢測人員的存在性。考慮到不同建筑物、區域、背景環境對Wi-Fi 信號存在不同程度的反射、折射、散射以及衍射等影響,本文從Wi-Fi 數據采集和模型構建兩方面著手,通過部署多探針裝置采集數據并構建通用室內人員辨識模型,以降低環境對模型性能的影響,提高其泛化能力,實現室內人員精準計數。
如圖1 所示,根據IEEE 802.11 系列協議,當移動終端打開Wi-Fi 模塊后便會廣播Wi-Fi 探測請求(Probe Request)幀,掃描所在區域內目前有哪些802.11 網絡可接入(圖1 中用虛線框表示無線接入點可有可無),該幀中包含終端MAC 地址、接收信號強度、信道號等信息。Wi-Fi 探針即利用Wi-Fi 探測請求幀的明文特性監測并解析出其中的有用信息。

Fig.1 Schematic diagram of Wi-Fi probe sniffing Wi-Fi terminal圖1 Wi-Fi探針嗅探Wi-Fi終端示意圖
除加密性和廣播性外,只要移動終端開啟Wi-Fi 模塊,無論是否成功接入到某個無線接入點,終端都會間歇性、突發性地廣播Wi-Fi 探測請求幀。加之室內無線傳播環境的復雜性,位于終端通信半徑內的Wi-Fi 探針不可能持續周期性地正確接收到來自于同一終端的Wi-Fi 探測請求幀;且在相同的時間間隔內,不同探針檢測到的幀數量也不盡相同。如圖2 所示,同一時間段內不同探針接收到的來自同一終端Wi-Fi 的探測請求幀相互獨立,具有間歇性和突發性。

Fig.2 Characteristics of Wi-Fi terminal network access detection request frame圖2 Wi-Fi終端入網探測請求幀特性

Fig.3 Data acquisition array device based on multi Wi-Fi probe圖3 基于多Wi-Fi探針的數據采集陣列裝置
如圖3 所示,為降低Wi-Fi 信號間歇性和突發性對室內人員辨識模型性能的影響,在建筑物空間內部署n 個商用WiFi 探針,記為R=(R1,R2,…,Rn),形成一個多Wi-Fi探針的數據采集陣列裝置。圖4 為本文設計的基于Wi-Fi的室內區域人員辨識模型,其中正數據指區域內移動終端的接收信號強度(Received Signal Strength Indication,RSSI)向量,負數據指區域外移動終端的RSSI 向量。為降低模型對環境的依賴性,提高其泛化能力,本文采集了多個不同區域的Wi-Fi 終端樣本數據并進行了標注。圖4(I)展示了離線階段模型訓練的過程,該階段采用粒子群優化(Particle Swarm Optimization,PSO)算法優化BP 神經網絡的方法訓練分類模型。圖4(II)為在線辨識階段,首先采用區域的Wi-Fi 探針聯合裝置捕獲Wi-Fi 數據幀;然后對Wi-Fi 數據幀進行解析,獲取探針ID、移動終端MAC 地址、RSSI 等信息;最后將解析后的信號強度處理成適合模型輸入的向量,通過模型分類識別獲取區域內人員數量。

Fig.4 Wi-Fi-based indoor occupant identification model圖4 基于Wi-Fi的室內人員辨識模型
Wi-Fi 信號在傳播時易受室內物品及人員的影響,存在嚴重的多徑現象。為此,將多Wi-Fi 探針的數據采集裝置置于區域某個高處(具體高度并不作要求),如柜子頂部等,盡可能使Wi-Fi 終端與探針裝置之間存在視距傳輸(LoS)。數據采集來源于室內多個區域,采集到的原始數據經過處理才能送入人員辨識模型進行訓練和判斷。
使用離差標準化對降噪后的RSSI 序列進行歸一化處理,使其取值范圍為[0,1],具體轉換公式為:

式中,min(RSSI)和max(RSSI)分別為當前一個時間窗口內探針檢測到的RSSI最小值和最大值。
為辨識終端是否在指定區域內,基于多探針感知到的同一終端的RSSI 值,圍繞多探針數據集構建基于BP 神經網絡的區域內人員辨識模型,其由輸入層、隱含層和輸出層組成,結構見圖5。對于同一個移動終端,可將同一時間周期內不同探針(如n 個)探測得到的RSSI 值(預處理后)構成一個n維向量,表示為:


Fig.5 BP neural network structure used by personnel indentification model圖5 人員辨識模型采用的BP神經網絡結構
將該向量作為模型輸入,其中RSSI′i表示第i 個探針探測到的移動終端的接收信號強度值(預處理后)。當輸出值為0時表示被感知的移動終端在指定區域外。
隱含層神經元的激活函數表示為:

輸出層神經元的激活函數表示為:

模型訓練過程中,采用PSO 算法優化BP 神經網絡的內部權重和閾值。PSO 算法可在更大的空間內搜索最優解,具有很強的全局尋優能力,在一定程度上彌補了BP 神經網絡易陷入局部最優的不足,能進一步減小神經網絡輸出誤差。PSO-BP 算法的具體流程如圖6所示。

Fig.6 PSO-BP algorithm flow圖6 PSO-BP算法流程
首先,根據BP 神經網絡的結構初始化輸入層、隱含層、輸出層的神經元個數以及各層之間的權重與閾值;然后初始化區域的鄰域拓撲結構,以及粒子的位置和速度,每個區域并行計算并比較粒子的適應值,尋找個體最優值和本地最優值,對本地最優值和鄰域最優值進行比較,尋找區域最優值;最后根據區域最優值更新粒子的位置和速度,算法迭代到最大迭代次數時終止,得到最終的區域內人員辨識模型。
由于Wi-Fi 終端入網通信具有固有的間歇性和非周期性,加之受室內環境的影響,位于移動終端通信范圍內的每個Wi-Fi 探針不能夠持續周期性地正確接收同一個移動終端信號,即使在相同的持續時間間隔內,不同探針檢測到的移動終端次數也不盡相同,且漏檢現象十分嚴重。為此,本文設計了如圖3 所示的Wi-Fi 探針聯合裝置,4 個Wi-Fi 探針同時工作,以降低上述問題對人員統計造成的影響。這4 個Wi-Fi 探針組成的數據采集裝置對應24-1 種組合方式,數據集可分為15 種情況,根據輸入數據的不同可以訓練15 種模型。此外,為了降低室內人員辨識模型對環境的依賴性,在訓練時需采集多種不同區域的大量數據,因此模型訓練任務重、耗時長。為此,本文引入并行計算的思想,使用實驗室服務器,配置為Intel Xeon E5-2637 的CPU,4 個NVIDIA Tesla k80 的GPU 和192G 內存。根據使用到的Wi-Fi 探針個數,模型可分為1-探針模型(包括4 種模型)、2-探針模型(包括6 種模型)、3-探針模型(包括4 種模型)和4-探針模型(包括1 種模型)4 種類型。采用并行訓練方式能夠同時訓練多個分類模型,采用分布式方法迭代優化粒子群,能大幅度縮短模型的訓練時間。每類模型的訓練時間如表1 所示。可以看出,采用并行計算可有效提高模型訓練效率。

Table 1 Training time of personnel identification model based on parallel computing表1 基于并行計算的人員辨識模型訓練時間
為測試人員辨識模型的性能,本文基于新型建筑智能化平臺搭建了一套分布式人員辨識系統,并在智能建筑與建筑節能安徽省重點實驗室4 樓開展了驗證實驗。該樓層的區域布局和Wi-Fi 探針裝置部署如圖7 所示,401、402、403、404、405、407 等標記為區域編號,在以上區域內部分別配置1 個WiFi 聯合裝置,放置在實驗區域的固定位置,離地高度約為2m。

Fig.7 Schematic diagram of experimental site layout and Wi-Fi probe deployment location圖7 實驗區域布局及Wi-Fi探針部署位置示意圖
將15 種數據集分別標記為data1、data2、data3……data15,具體信息如表2 所示。使用并行計算方法,在計算能力比較強大的服務器上訓練15種模型。
3.2.1 模型對Wi-Fi探針組合方式的泛化能力
為研究本文模型對探針組合方式的泛化能力,在407區域使用4 個Wi-Fi 探針同時采集數據,經過數據解析、處理,共得到31 517 個樣本,并對其進行標注。針對表2 中的15 種數據集并行訓練15 種區域內人員辨識模型。前文提到,根據使用到的Wi-Fi探針個數,15 種模型可分為4 大類。對4 種類型的人員辨識模型分別進行泛化性討論,分析模型在不同數據集之間的泛化能力。
4 種1-探針模型的召回率計算結果見表3。可以看出,1號Wi-Fi探針采集的Wi-Fi數據作為訓練集訓練出的模型能有效辨識1 號Wi-Fi 探針、2 號Wi-Fi 探針、3 號Wi-Fi 探針、4 號Wi-Fi 探針采集的數據,召回率達0.893 以上。同樣的,2 號Wi-Fi 探針、3 號Wi-Fi 探針、4 號Wi-Fi 探針訓練出的模型能以較高的召回率辨識其他Wi-Fi 探針采集的數據。4 種1-探針模型的準確率計算結果見表4,可以看出,1-探針模型的準確率可達0.893以上。

Table 2 Data set name and number of samples表2 數據集名稱和樣本數

Table 3 1-sniffer model recall rate表3 1-探針模型召回率

Table 4 1-sniffer model accuracy表4 1-探針模型準確率
2-探針模型、3-探針模型的召回率和準確率分別見表5、表6、表7、表8。可以看出,1 號和2 號Wi-Fi 探針同時采集的Wi-Fi 數據作為訓練集訓練出的模型能有效辨識1 號和3號Wi-Fi探針、1號和4號Wi-Fi探針、2號和3號Wi-Fi探針、2 號和4 號Wi-Fi 探針、3 號和4 號采集的數據,召回率可達0.995 7 以上。同樣的,其他2-探針模型均表現出很好的召回性能。

Table 5 2-sniffer model recall rate表5 2-探針模型召回率

Table 6 2-sniffer model accuracy表6 2-探針模型準確率

Table 7 3-sniffer model recall rate表7 3-探針模型召回率

Table 8 3-sniffer model accuracy表8 3-探針模型準確率
驗證試驗結果表明,本文模型對Wi-Fi 探針的組合方式泛化能力很強。因此,可以合并4 類1 種Wi-Fi 探針采集的數據集訓練1-探針模型,合并6 類2 種Wi-Fi 探針采集的數據集訓練2-探針模型,合并4 類3 種Wi-Fi 探針采集的數據集訓練3-探針模型。綜上所述,本文提出的基于Wi-Fi 的室內人員辨識模型對探針組合具有良好的泛化能力,即15 種不同探針的模型最終可簡化為1-探針辨識模型、2-探針辨識模型、3-探針辨識模型和4-探針辨識模型。
3.2.2 模型對不同區域的泛化能力
為進一步研究人員辨識模型對不同區域的泛化能力,采集6 個實驗區域(401、402、403、404、405 和407 區域)內的Wi-Fi 數據,每個實驗區域同時使用4 個Wi-Fi 探針采集數據。經過數據解析、處理,共得到79 995 個樣本作為實驗數據。打亂后隨機選取80%的樣本,共63 996 條數據作為訓練集,剩余20%的樣本共15 999 條作為測試集。訓練數據為訓練集中全部數據,并行訓練4 個人員辨識模型,設置BP 神經網絡的隱含層個數為6,迭代次數maxGen為1 000,學習因子c1 設置為2,學習因子c2 設置為2,慣性因子設置為0.8。模型訓練過程中,根據誤差MSE 值使用鏈式法則進行每層梯度參數變化的計算和不斷迭代調整。
對每個區域的召回率進行計算,結果如表9 所示。可以看出,各區域召回率均能達到90%以上。計算訓練得到的4 種辨識模型的準確率,結果如表10 所示。可以看出,各模型準確率均可達到91%以上。實驗結果表明,該模型能準確辨識人員是否在區域內,且具備較強的泛化能力,大大降低了不同室內環境因素對模型性能的影響。

Table 9 Recall rate of each area表9 各區域召回率

Table 10 Accuracy of each model表10 各模型準確率
本文結合Wi-Fi 探針技術與智能計算方法,設計并實現了一種基于Wi-Fi 的室內人員辨識通用模型。該模型采用PSO 算法優化BP 神經網絡內部的權重和閾值,不僅收斂速度快,而且不易陷入局部極值,具有較強的泛化能力。面對人員辨識通用模型繁重的訓練任務,本文采用并行計算方法,有效提高了模型訓練速度。驗證實驗結果表明,該模型對不同Wi-Fi 探針的組合方式具有良好的泛化能力,召回率可達到90%以上,準確率可達91%以上。此外,該模型對不同區域亦具有良好的泛化能力,解決了傳統人員辨識模型部署一次訓練一次的難題,滿足建筑物智能化系統快速部署人員計量方法的實際應用需求。
由于室內環境復雜,Wi-Fi 信號傳播特性多樣化,Wi-Fi 終端接入網絡時連接請求信號具有間歇性。本研究使用4 個Wi-Fi 探針,以降低Wi-Fi 信號間歇性和突發性對室內人員辨識模型性能的影響,但尚未考慮探針數量對模型檢測結果的影響,未來還需要對此進行進一步研究。同時,后續仍需針對WiFi 信號的特征進行更深層次的挖掘,建立既能反映人員的存在性與WiFi 信號特征關聯,又能抵抗室內環境影響的人員識別模型,以滿足建筑智能化系統對人員準確刻畫的需求。