胡賢賢, 汪云甲*, 孫 猛, 齊紅霞
(1.中國礦業大學自然資源部國土環境與災害監測重點實驗室, 徐州 221116; 2.中國礦業大學環境與測繪學院, 徐州 221116)
在現代社會,全球衛星導航系統(global navigation satellite system, GNSS)可以較好地解決室外環境下的實時定位與導航問題。在室內環境下,由于建筑物等的遮擋,衛星信號強度減弱導致定位精度大大下降,不能滿足人們的室內定位的需求。但室內環境中豐富的無線電信號為室內定位提供了充足的信號源,目前利用無線電信號的室內定位技術有WiFi定位[1]、藍牙定位[2]、超寬帶(ultra wide band, UWB)定位[3]、射頻識別(radio frequency identification, RFID)定位[4]等。然而,現代社會建筑的室內室外界限模糊,適用于復雜環境下的室內外無縫定位技術仍然是目前難以解決的問題,室內外無縫定位也終將是導航與位置服務未來發展的方向[5]。室內外場景識別是實現室內外無縫定位的關鍵,可以對GNSS技術和室內定位技術的使用策略,以及人的行為感知等方面提供指導意見。因此,室內外場景識別技術具有很重要的研究價值和實用價值。
中外學者在室內外場景識別領域已經有了較多的研究成果。目前,室內外識別大致可分為兩類,第一類是添加專門運用于室內外場景識別的硬件設施,該方法具有較高的識別精度且實現簡單,如宿舍的門禁系統、超市的防盜系統。但這類方法的硬件成本投入太高,限制了方法的普適性;第二類是使用環境中已有的特征數據進行室內外場景識別,該類方法需要選擇普適性好、室內外相關性強的特征數據構建合適的室內外識別模型[6-7]。文獻[8]利用機器學習算法對移動通信蜂窩基站在不同環境下的相鄰全局系統信號強度進行分類,雖然取得了較好的實驗結果,但實驗所用室內外的特征數據較少,且對特征挖掘程度不足。文獻[9]使用WiFi傳感器和弱分類器設計了一種基于半馬爾科夫條件隨機域的方法來識別室內外環境,但只使用WiFi傳感器會讓使用場景受到限制。文獻[10]利用手機低功耗組件構建室內外檢測模型并結合了GPS信息,可對特定位置的場景進行有效的室內外場景識別,但只能在特定位置使用限制了方法的普適性。文獻[11]通過用戶行為模式進行室內外識別,提出了基于轉彎頻率和運動占空比的識別算法,但行為特征和室內外識別的相關性較弱,識別精度較低。文獻[12]提出了一種基于支持向量機(support vector machine, SVM)的室內外檢測算法,該方法根據時間和氣象條件設計了多個分類器,但測試數據較少,普適性較低。文獻[13]使用基站模塊、光傳感器和磁力計3個輕量級模塊進行場景識別,算法簡單、功耗低是該模型的優勢,但該模型采用很多關鍵閾值憑借經驗確定,難以適應復雜的環境。文獻[14]利用兩個平行工作的分類器,使用不斷更新的協同學習方式訓練分類器,這種方式有效解決了不同環境所造成的識別準確率下降的問題,但該方法會使用新數據的識別結果直接進行監督訓練,模型的精度受最初所建立的分類器影響。文獻[15]使用圖像識別技術進行室內外場景識別,提出了一種不需要圖像分割的基于圖像的室內外識別的方法,但圖像識別算法復雜度較高。
針對上述的研究方法對室內外數據的特征挖掘程度不足、模型魯棒性差等問題,現提出利用室內外的GNSS衛星信號個數、衛星高度角、信噪比、地磁場數據以及光照強度數據作為特征數據,輸入神經網絡進行訓練得到室內外場景識別模型,以期利用所提取的室內場景識別特征訓練得到具有較高的識別準確率的模型。
神經網絡是一種機器學習算法,具有良好的自學習能力[16]。如圖1(a)所示,所用神經網絡共有3層,分別為輸入層、隱藏層與輸出層,相鄰兩層之間以全連接的形式連接。輸入層的神經元個數取決于訓練所使用的特征個數;隱藏層神經元個數則可根據實際需要調整,取為10個;輸出層兩個神經元分別代表室內與室外。

圖1 神經網絡Fig.1 Neural network
如圖1(b)所示,下一級單個神經元的輸入均是上級神經元輸出的加權和,假設上級神經元的輸出O=[o1,o2,…,on],w=[w1,w2,…,wn]為對應的連接權值向量,則對于隱藏層與輸出層的單個神經元的輸入值NEin的計算公式為

在計算出單個神經元的輸入值后,神經網絡需要根據一定的規則將神經元的輸入映射到輸出,從而向下一層神經元輸出數據。在神經網絡算法中,sigmod函數是最常用的計算函數,其可定義為

sigmod函數可以將輸入值信號變換成0~1的數值,然后神經元根據該數值計算向下一層神經元的輸出NEout,計算公式為
NEout=sigmod(NEin) (3)
假設下一層神經元的輸入信號為向量Y,將向量中的每一項用式(2)計算即可得到下一層神經元的輸出信號的向量,即
Y=WO(4)
式(4)中:W為神經元之間的權值向量按行排列組成的矩陣;O為上級神經元的輸出。

Ek=T-Ok(5)

式中: ΔWi,k為權值的更新值,使用式(7)計算,即。
ΔWm,i=αEiOk(1-Ok)OiΤ(7)
式(7)中:Ok為輸出層的輸出向量;Oi為隱藏層的輸出向量;α∈(0,1)為學習率,學習率可以調節權值變化的強度,避免權值變化過于劇烈,這里設定為0.01。
在完成了Wi,k的更新后,使用式(8)計算出隱藏層神經元的誤差Ei,并同樣使用梯度下降法更新隱藏層i和輸入層m之間的權值Wm,i,使用式(9)計算Wm,i的更新值ΔWm,i。


式中:Im為輸入層的輸入向量。
本文方法利用神經網絡作為訓練模型,主要包括訓練階段和測試階段。在訓練階段,首先要提取用于室內外識別的特征數據。根據導航衛星數據,結合地磁、光以及室內外標簽數據組成一條訓練數據,然后將采集的大量數據輸入神經網絡進行訓練得到模型;在測試階段,需要將新采集的數據輸入已訓練好的模型,模型的輸出結果就是識別結果,該方法的具體流程如圖2所示。

圖2 基于神經網絡的室內外場景識別方法流程圖Fig.2 Flow chart of indoor and outdoor scene recognition method based on neural network
室內外特征選擇的優劣直接影響神經網絡模型的識別準確率和魯棒性。選取3種特征用以區分室內外場景,分別是衛星信號特征、光照強度特征和地磁強度特征,對這3種特征進行實驗分析、提取,最終形成用于神經網絡算法的訓練數據。
由于建筑物等的遮擋,室內外的衛星信號特征具有明顯的差異。圖3是從室內環境走向室外環境的過程中衛星信號數量的變化,虛線是室內與室外的分界線,可以明顯看出室外可接收到的衛星信號數量明顯多于室內所接收到的衛星信號數量。實驗測試表明,在室內環境中由于建筑物的遮擋,衛星信號個數通常在10個以下;在半開放環境,如窗邊、由玻璃材料構成的走廊等環境中,衛星信號通常在20個以下;而在室外環境接收到的衛星信號在20個以上。

圖3 不同環境下的衛星信號數量Fig.3 The number of satellites in different environments
衛星高度角與信噪比數據與室內外環境也表現出非常強的相關性。如圖4(a)所示,當高度角在0°~50°的范圍時,室外的衛星信號數量遠遠多于室內所接收到的衛星信號。當衛星高度角超過60°,在室內難以接收到這些高角度的衛星信號。因此衛星高度角是一個可以用于識別模型的特征。信噪比(signal noise ratio, SNR)是電子設備中信號與噪聲的比例,信號質量越好,信噪比越大。如圖4(b)所示,在室內可以接收到大量的10~20 dB的衛星信號,而在室外可以接收到大量30 dB以上的衛星信號。因此衛星信號的信噪比也是一個可以用于識別模型的特征。

圖4 不同環境下的衛星高度角與信噪比分布Fig.4 Satellite altitude angles and SNR distribution in different environments
提取的衛星信號特征為衛星信號數量、高度角和信噪比,其中衛星信號數量特征是接收到的衛星信號數量的個數;高度角特征是統計以10°為區間的衛星信號個數;信噪比特征是統計以10 dB為區間的衛星信號個數。假設gi是第i個衛星信號特征的數據組織格式,gi可用式(10)表示為
gi=[n,e1,e2,…,e9,s1,s2,…,s5] (10)
式(10)中:n為衛星信號個數;e1為高度角小于10°的衛星信號個數;e2為高度角大于10°小于20°的衛星信號個數;e9為高度角大于80°的衛星信號個數;s1為信噪比小于10 dB的衛星信號個數;s2為大于10 dB小于20 dB的衛星信號個數;s5為大于40 dB的衛星信號個數。最后,將所有數據使用式(11)進行歸一化處理,所有衛星信號特征g組成了衛星信號特征的數據集,記為G。

式(11)中:x*為歸一化值;xi為樣本值;xi,max為該樣本數據的最大值;xi,min為該樣本數據的最小值。
圖5為在白天由室內環境到室外環境的光照強度變化,虛線是室內與室外的分界線,可知,室外環境的光照強度遠遠大于室內環境的光照強度。實測表明:白天在室內光照強度為0~500 lux,在半開放環境中光照強度為0~8 000 lux,在室外晴天光照強度會超過10 000 lux,陰天光照強度為0~10 000 lux。但是夜晚的光照強度在室內外環境的變化不明顯,光照強度受人造光源影響較大,此時光照強度與室內外環境關聯度變弱。因此光照強度可以在白天作為一個十分顯著的特征。將光照強度數據利用式(11)進行歸一化處理并將所有的歸一化數據組成光照強度特征數據集,記為L。

圖5 不同環境下的光照強度Fig.5 Intensity of illumination in different environments
由于現代建筑物采用了鋼筋材料,室內地磁容易受建筑物內環境的影響,而室外的地磁更加接近自然地磁,地磁數據相對穩定。假設智能手機內置的三軸磁力計測量的磁場數據為[mx,my,mz],單位為微特斯拉(μT),則該點的地磁強度m可用式(12)計算,即

圖6為相同面積下地磁強度的分布,可見,室外地磁分布相較于室內地磁更加平緩。因此,地磁強度可以作為一個特征用于室內外識別。將地磁場強度的歸一化值作為地磁場特征,所有的地磁場特征數據構成地磁場特征數據集,記為M。

圖6 室內外地磁Fig.6 Indoor and outdoor geomagnetism
使用紅米K20Pro手機和一加7T手機采集數據,如圖7所示,實驗地點是中國礦業大學南湖校區,室內實驗環境是環境與測繪學院樓,室外環境是南湖校區的隨機室外環境。實驗過程中,采用隨機游走的方式采集室內外的衛星數據、地磁數據以及光照強度數據。采用紅米K20Pro手機在白天和晚上分別采集200 000條訓練數據,再使用紅米K20Pro手機和一加7T手機在白天和晚上分別采集100 000條測試數據。

圖7 室內外場景Fig.7 Indoor and outdoor scenes
為更加直觀地驗證模型的有效性,將三類特征進行組合得到如表1所示的組合方式,然后對不同的組合進行訓練,以驗證不同組合方式的識別性能,并對結果進行對比和分析。

表1 特征組合及含義
首先使用白天采集的數據訓練得到室內外場景識別模型,并測試模型的識別準確率,表2為各個模型的識別準確率。

表2 白天的室內外場景識別準確率
如表2所示,4種特征組合的識別準確率均超過了95%。在白天光照強度與室內外場景關聯度較高,因此兩部手機的實驗數據顯示,使用[G,L]組合的識別準確率最高,而使用單一衛星數據的識別準確率最低。說明本文方法可以在白天有效地識別室內外場景,而且多特征模型的識別準確率相較于單一特征模型的識別準確率更高。
使用夜晚的數據訓練得到室內外場景識別模型,并采用測試數據得到各模型的識別準確率結果,如表3所示。

表3 夜晚的室內外場景識別準確率
在夜晚,各組合的準確率超過了93%。因為光照強度與室內外場景關聯度降低,所以[G,L]組合的識別準確率相較于白天有所降低,而[G,L,M]組合的識別準確率最高。這說明該方法同樣可以在夜晚有效地區分室內外場景。
實驗數據表明,無論是白天還是夜晚,多特征組合的方式會更加有效地區分室內外場景,并且識別準確率可以達到96%。
基于神經網絡的室內外場景識別方法利用衛星信號特征、光照強度特征和地磁強度特征組成訓練數據,將數據使用神經網絡算法進行訓練得到室內外場景識別模型。實驗結果表明,本文方法在區分室內外場景中有較高的識別準確率。但本文方法的不足在于:模型需要在室內外采集大量的訓練數據,工作量較大。在今后的研究中,將從如何減少工作量、細化模型或者使用新的模型等方面展開,以進一步提高識別準確率。