郭永紅, 宋彪, 趙東陽, 李旭光, 南懷良
(中國兵器工業計算機應用技術研究所 網絡信息體系論證與研發部, 北京 100089)
無設備定位(DFL)是一種新興的無線定位技術[1],即目標進入監測區域時不需要佩戴任何電子設備或與監測節點通信,從而實現目標位置估計。在DFL系統中,一定數量無線信號的傳輸節點(ST)和接收節點(SR)部署在監測區域邊緣,并組成無線通信鏈路。目標進入監測區域時會對無線接收信號強度(RSS)有較明顯的影響,從而利用鏈路的信號強度變化來估計目標位置。目前,DFL已在軍事、健康監護、緊急救援、安保等方面催生眾多應用需求。
無線射頻信號在無線通信環境中容易產生非視距、多路徑、衰減等問題,因此精準的DFL仍是具有挑戰性的問題。基于X射線層析成像的啟發,文獻[2-5]利用RSS的差值恢復目標的層析圖像,將DFL問題轉化為線性病態可逆的問題,并利用正則化方法求解,提出了無線層析成像(RTI)方法。Wang等[6]利用壓縮感知方法求解線性病態可逆的問題,使定位精度得到顯著提升。
文獻[7-8]提出基于指紋識別的定位方法。該方法分為離線階段和在線階段。在離線階段,首先對監測區域內布置通信節點,然后采集目標在參考點時所有鏈路的信號強度、構建離線數據庫;在在線階段,目標進入該區域時,采集區域內的鏈路信號強度,并與離線數據庫進行匹配、估計目標所在位置。該方法雖然能夠用較少的通信節點實現DFL,但需要構建離線數據庫并監測區域內的節點位置不能發生改變,大大限制了其應用范圍。最近,Shi等[9]通過信道狀態信息測量子信道的多輸入多輸出正交頻分復用物理層參數,來提升目標定位和跟蹤精度。
Guo等[10]利用指數- 瑞麗模型描述信號傳播模型,該模型近似地描述了目標與鏈路信號強度的視距映射關系,其定位精度仍有提高空間。Wang等[11]利用衍射理論提出了衍射測量(DM)模型,該模型用橢圓替代目標,解決了以往模型中利用質點代替目標的問題,但有較高的計算復雜度。文獻[12-14]利用目標與鏈路的幾何位置關系提出了基于幾何鏈路檢測模型的DFL優化方法,隨后利用高斯過程(GP)構建目標與鏈路信號強度的映射關系,提出了基于GP信號傳播模型的目標定位與跟蹤方法。
基于無線射頻信號傳播模型的DFL方法,其模型的魯棒性、準確性直接影響了目標定位與跟蹤的精度。而極限學習機(ELM)是單隱層前饋神經網路的延伸,隱層參數可隨機產生,輸出層的權重通過最小二乘計算,其計算精度和速度優于現有部分機器學習方法[15-17]。因此,本文提出基于ELM模型的粒子濾波(PF)(ELM-PF)DFL算法。首先建立目標與鏈路信號強度的數據庫;然后通過數據庫構建目標與無線信號強度的映射關系;最后結合PF實現目標跟蹤。
ELM是單隱層前饋神經網路的擴展,采用3層架構方式,包括輸入層、隱藏層和輸出層。與傳統的機器學習方法有所不同,ELM隱藏層的參數是提前隨機分配的,而輸出層的權重是通過最小二乘方法計算的,如圖1所示。圖1中:L為隱藏層單元的數量,ai、bi(i=1,2,…,L)為隱藏層單元參數,x1,x2,…,xn為n個輸入向量,β1,β2,…,βL為隱藏層到輸出層的權重連接,t1,t2,…,tj為j個輸出向量。

圖1 ELM的基本架構Fig.1 Basic structure of ELM

h(x)=[g(x;a1,b1),…,g(x;aL,bL)].
(1)
輸出單元可表示為
(2)
式中:β=[β1,β2,…,βL]T是隱藏單元到輸出單元權重向量。
ELM不同于其他機器學習方法,意使訓練誤差與輸出權重范數之和最小:
(3)
式中:σ1>0,σ2>0;p、q值為0,0.5,1,2,…,∞;C為權衡最小經驗風險和最小結構風險的參數;H為隱藏層輸出矩陣,
(4)
T為訓練集的觀測矩陣,
(5)
則隱層單元到輸出單元的權重可表示為
β=Η+Τ,
(6)
式中:H+為H的Moore-Penrose廣義逆矩陣。假設參數σ1=σ2=p=q=2,(3)式等價于

(7)
式中:ζi=[ζ1,k,…,ζi,k]是k個輸出單元的訓練誤差。
通過Karush-Kuhn-Tucker(KKT)條件,求解隱層單元到輸出單元的權重β,確定ELM的網絡拓撲結構.
無線傳輸節點和接收節點之間的無線射頻信號傳播機理復雜,容易發生折射、衍射、散射、反射等物理現象,這些信號的矢量和構成了接收節點的無線射頻信號[13]。
假設無線射頻信號發射節點和接收節點之間不存在目標遮擋時接收端的信號強度為RSS;當目標進入發射和接收節點所影響的范圍內時(見圖2),無線信號會發生折射、衍射和散射等物理現象,導致接收節點所接收到的信號強度RSSt發生較為明顯的波動,即
ΔRSS=RSSt-RSS.
(8)
另外,無線射頻信號的路徑損耗與節點之間的距離呈正比,即接收信號強度與兩節點之間的距離d呈反比[13]。接收信號強度變化可表示為
ΔRSS=f(d,xt,yt)+η,
(9)

圖2 鏈路信號影響范圍Fig.2 Affected area of link signals
式中:f為目標位置、無線鏈路與信號強度變化的映射關系;(xt,yt)為t時刻目標相對鏈路的位置坐標;η為信號傳播噪聲。由于信號傳播過程中會受到多種因素干擾,信號傳播噪聲難以估計,本文將噪聲認定為無線射頻信號傳播的一部分。
本文離線數據庫的建立不需要構建整個網絡,只需要無線信號發射節點和接收節點。首先采集兩個節點間沒有目標的鏈路信號強度;然后采集目標在不同參考點位置的鏈路信號強度,如圖3所示;最后根據兩組數據構建離線數據庫,則數據庫D為
D={(di,xi,yi,ΔRSSi)|i=1,2,…,N},
(10)
式中:di為第i個訓練樣本鏈路的長度;(xi,yi)為參考點相對于鏈路的位置;ΔRSSi為第i個訓練樣本的觀測值。

圖3 數據庫采集示意圖Fig.3 Data collecting
通過(10)式,結合(7)式構建基于無線射頻信號傳播模型如下:
ΔRSSELM=FELM(di,xi,yi)+ε,
(11)
式中:FELM(di,xi,yi)為無線射頻信號的傳播模型;ε~N(0,σ2)為觀測噪聲,σ為均方差。
PF是順序蒙特卡洛方法,它利用不同權重的粒子計算后驗概率分布函數,可解決復雜的非線性問題,并已經廣泛應用于目標定位與跟蹤。本文采用PF來解決目標跟蹤問題。
本文將采用常速度模型,t時刻目標的位置及速度可表示為
(12)

Xt+1=FXt+εt,
(13)
式中:εt為高斯噪聲矩陣;F為中間變量,

(14)
假設t時刻內所有鏈路信號強度變化的觀測值為
z1,…,t={z1,z2,…,zt},
(15)


(16)
(17)

(18)

粒子的權重可重新計算為
(19)

為了確保所有粒子權重和為1,對粒子進行歸一化處理:
(20)
目標位置可估計為
(21)
為了克服粒子退化問題,設定閾值Nth,有效粒子的數量為
(22)
如果Neff?Nth,則說明粒子發生退化,需要重采樣。
事實上,不受目標遮擋的鏈路信息,如果參與到目標定位中不僅不會增加目標的定位精度,而且會增加計算量,為此設定信號強度差值的閾值γ(本文中γ=-5 dB),選取信號強度波動較大的鏈路,
(23)
ELM-PF算法流程如下:
步驟1根據(10)式構建離線數據庫。
步驟2利用(1)式~(7)式訓練基于ELM的信號傳播模型(11)式。

步驟4當t≥1時預測粒子的位置。
步驟5根據(23)式選取受影響鏈路。
步驟6根據(15)式、(18)式、(19)式、(20)式更新粒子權重。
步驟6根據(21)式估計目標位置。
步驟7根據(22)式判別粒子是否需要重采樣。
步驟8目標繼續運動則返回步驟4,目標停止運動則停止循環。
實驗場景選取某活動室內,房間大小約為7.5 m×8.5 m,房間周邊放置圖書架和沙發等家具,在房間邊界等間距放置15個由CC2530作為控制芯片搭建的ZigBee節點,其中14節點既可作為無線信號的發射端又可作為無線信號的接收端,另1個節點作為協調器[13](見圖4),目標身高為174 cm、體質量為86 kg. 目標運動軌跡如圖5所示。

圖4 室內場景實照Fig.4 Experimental setup

圖5 目標運動軌跡Fig.5 Target trajectory
(24)
誤差的均方根誤差(RMSE)同樣也是目標定位、跟蹤的重要評判標準,RMSE可表示為
(25)
根據監測區域最短鏈路和最長鏈路,訓練樣本的鏈路長度d={2 m,3 m,4 m,5 m,6 m,7 m,8 m},參考點間隔為0.2 m,距離鏈路的最長距離為0.6 m,訓練樣本D={(di,xi,yi,ΔRSSi)|i=1,2,…,N},訓練樣本數量為1 008個,ELM模型中隱藏單元數量為15個(見圖6)。

圖6 參考點設置示意圖Fig.6 Reference point setting
將ELM-PF算法與高斯過程模型-PF(GPM-PF)[13]和支持向量機-PF(SVM-PF)[14]目標跟蹤算法進行對比,D={(di,xi,yi,ΔRSSi)|i=1,2,…,N}為統一訓練樣本數據庫,粒子數量及相關參數均相同。
粒子數量直接影響了算法精度,本文用實驗方法確定粒子數量。粒子數量選取從100~1 000(取整百數),采用相同的訓練樣本集算法重復50次。實驗結果如圖7所示。由圖7可見:當粒子數量Np≤500時,隨著粒子數量的增加,算法的RMSE隨之減小(定位精度增加);當粒子數量Np>500時,粒子數量對定位精度影響有限。為了降低計算復雜度,本文中粒子數量選取為Np=600.

圖7 不同ELM-PF、GPM-PF、SVM-PF算法的粒子數量與RMSE關系Fig.7 RMSEs of ELM-PF, GPM-PF and SVM-PF for the different number of particles

圖8 跟蹤效果示意圖Fig.8 Tracking accuracy
當粒子數量為600時,目標跟蹤效果如圖8所示。ELM-PF算法跟蹤精度明顯優于與GPM-PF和SVM-PF兩個算法,如圖8(a)、圖8(b)、圖8(c)所示。具體定位精度如表1所示,ELM-PF算法在室內復雜環境下目標跟蹤精度的誤差均值能夠到達0.202 7 m,相對GPM-PF算法提高了17.5%,相對SVM-PF算法提高了36.2%.

表1 ELM-PF、GPM-PF、SVM-PF算法跟蹤精度
跟蹤誤差的累計分布如圖8(d)和表2所示,從中可以看出,ELM-PF算法明顯優于GPM-PF和SVM-PF兩個算法。跟蹤精度在0.1 m以下的精度,ELM-PF算法能夠達到14.0%,其他兩個算法只有8.9%和6.4%,表明跟蹤的高精度數量明顯高于其他兩個算法。另外,ELM-PF算法在精度0.2 m以下的數量已經能夠達到49.0%,表明整體跟蹤精度較高、魯棒性更強。

表2 ELM-PF、GPM-PF、SVM-PF算法的累計誤差
以上室內跟蹤實驗表明:在DLF問題中,ELM-PF算法明顯優于GPM-PF算法和SVM-PF算法,有較好的目標跟蹤效果;基于ELM的無線射頻信號傳播模型可以更加精準地描述目標位置與鏈路信號強度的關系。
本文以數據為驅動,通過ELM構建無線射頻信號的傳播模型,可更加精準地描述目標相對鏈路位置、鏈路長度與鏈路信號強度之間的關系,降低了無線射頻信號在傳播過程中受除目標外折射、衍射和散射等物理現象噪聲的影響,同時也為多目標基于數據的無線射頻信號傳播模型構建提供了依據;將基于ELM的信號傳播模型與粒子濾波相結合,解決了DFL中單目標跟蹤問題。通過實驗驗證,在復雜的室內環境中,ELM-PF算法的目標跟蹤誤差均值能夠達到0.202 7 m,優于GPM-PF和SVM-PF目標跟蹤算法。
針對多目標的背景,目標與鏈路之間的相互關系會更加復雜,如何以數據為驅動刻畫多目標與鏈路之間的關系,是未來主要的研究工作。