蔣志函,王 斌,潘志文,2,劉 楠
(1.東南大學 移動通信國家重點實驗室,江蘇 南京 210096;2.網絡通信與安全紫金山實驗室,江蘇 南京 211100;3.通信網信息傳輸與分發技術重點實驗室,河北 石家莊 050081)
基于信道狀態信息(Channel State Information,CSI)的指紋定位技術能通過離線階段構建指紋庫和在線階段搜索匹配的方式實現定位,在非視距傳輸(Non Line of Sight,NLOS)下具有較高的精度和魯棒性,因此被廣泛應用于室內和其他復雜多徑環境下[1-3]。CSI指紋是對信道的細粒度描述,且在大規模多輸入多輸出(Massive Multiple Input Multiple Output,M-MIMO)和正交頻分復用(Orthogonal Frequency Division Multiplexing,OFDM)下的寬帶通信系統中,CSI包含精確的位置相關信息,如功率、角度、時延等,從而可以獲得更高的定位精度[4-9]。
現有的指紋匹配方式通常假設離線指紋庫和在線測試樣本滿足相同的分布。然而,由于環境的變化(如室內布局的變化),即使同一位置下離線和在線階段獲得的CSI指紋也可能存在偏差,因此只能獲得較差的定位精度。領域自適應方法可以通過學習域不變特征,來解決兩個相關領域的數據在不同分布下的問題[10-12]。通過將離線和在線指紋數據看作位于源域和目標域這兩個分布不同的相關領域,一些利用領域自適應來減輕指紋變化影響的方法被提出[13-14]。其中DMCA方法[13]通過聯合最小化最大均值差異(Maximum Mean Discrepancy,MMD)和相關對齊(Correlation Alignment,CORAL)損失學習域不變特征,再訓練位置預測器,FiDo方法[14]則利用自編碼器學習源域和目標域的域不變特征。但是這些方法在獲取域不變特征時都沒有考慮目標樣本和任務決策之間的關系,因此可能無法提取有效特征,導致定位精度有限。
本文提出了一種基于分歧差異的深度卷積對抗網絡(Disparity Discrepancy based Deep Convolutional Adversarial Network,DDCAN)領域自適應定位方法,其將M-MIMO的CSI經逆傅里葉變換(Inverse Fourier Transform,IDFT)得到角度時延信道幅度響應矩陣(Angle Delay Channel Amplitude Matrix,ADCAM)作為指紋,并構建深度對抗網絡訓練目標域的定位模型,在只有源域樣本和少量目標域無標簽樣本的情況下,目標域定位模型可以通過最小化源域誤差和源域、目標域的分歧差異得到有效訓練。此外,分別構建了分類和回歸的領域自適應定位方法,并針對分類方法中邊界用戶類別模糊的問題,提出了網格中心重定位的方法來進一步提高定位精度。仿真表明,DDCAN方法能有效地減輕環境變化的影響,達到較高的定位精度。
考慮一個單基站(Base Station,BS)的M-MIMO-OFDM系統,如圖1所示。

圖1 基站接收信號示意圖
不失一般性地,假設BS配置了以半波長λc/2的距離等間隔排列的均勻面陣(Uniform Planar Array,UPA),其中天線的列數為M,行數為N,基站處天線的總個數記為Nt=MN(均勻線陣(Uniform Linear Array,ULA)可看作UPA在M或N為1下的特例)。K個移動基站(Mobile Station,MS)在服務區域內隨機分布,每個MS配置單個全向天線,BS通過信道估計獲得CSI矩陣。假設無線信號到達基站經過的多徑數為P,第k個MS信號經第p條路徑到達基站的到達角(Angle of Arrival,AOA)可以被分解為垂直方向的俯仰角θp,k和水平方向的方位角φp,k,θp,k,φp.k∈(0,π),以BS處UPA中原點處的天線為參考天線,則該路徑所對應的陣列響應矢量為[9]:
v(θp,k,φp,k)=v(v)(θp,k)?v(h)(θp,k,φp,k),
(1)
其中,?為克羅內科積,且有:
v(v)(θp,k)=[1,e-jπcosθp,k,…,e-jπ(M-1)cosθp,k]T,
(2)
v(h)(θp,k,φp,k)=[1,e-jπsinθp,kcosφp,k,…,e-jπ(N-1)sinθp,kcosφp,k]T,
(3)

qp,k=αp,kv(θp,k,φp,k),
(4)

第k個MS的CIR可以表示為:
(5)
其中,Pk表示第k個MS信道的多徑數。

(6)
其中,Hk∈Nt×Nc,Υp,k=τp,k/Ts為采樣后的多徑傳播時延,[·]l表示矩陣的第l列向量或向量的第l個元素。
在實際通信過程中,BS通過信道估計獲得第k個用戶的CFR矩陣Hk。通過時間域和角度域的IDFT將矩陣從空頻域變換到角度時延域,得到角度時延信道矩陣(Angular Delay Channel Matrix,ADCM)Gk[9]:
(7)
其中,Gk∈Nt×Nc,Gk中的Nt行對應Nt個AOA,Nc列對應Nc個TOA,VM∈M×M、VN∈N×N為角度域IDFT矩陣,U∈Nc×Nc為時間域IDFT矩陣,它們分別定義為[9]:
(8)
(9)
其中,[·]r,c表示矩陣的第r行c列個元素。
定義第k個MS的ADCAM:
Ωk?{|Gk|},
(10)
δ(j-rp,k))=0,
(11)
其中,
(12)
由式(11)可知,當M,N,Nc趨于無窮時,Ωk為稀疏的并僅在有限的多徑AOA和TOA對應位置上有值。當M或N為1時,BS處的天線陣列變化為ULA,ADCAM只擁有垂直或者水平角度的分辨率。由于在一般的配置了UPA的M-MIMO-OFDM系統中M,N,Nc?1,因此Ωk是近似稀疏的。

與一般的指紋定位方法不同,DDCAN方法在離線和在線階段之間增加了一個離線校準的中間階段。
假設在定位區域內均勻劃分ns個參考點,則可以通過參考點構建離線指紋庫FDB:
(13)
其中,Fi為參考點指紋,ai為對應二維位置坐標。
分別考慮回歸任務和分類任務下的領域自適應方法。

分類問題中,離線階段在獲得指紋庫的基礎上進一步將定位區域以間隔d劃分為C個網格,則離線階段指紋庫中每個指紋的類別標簽為:
ci∈{0,1,…,C-1}, fori=1,2,…,ns。
(14)

errQ(fc)=(F,y)~QLc(fc(F),c),
(15)
式中,Lc為對應的分類損失函數。在線階段分類定位模型將待定位用戶的搜索范圍縮小到某一特定類別,再利用加權K近鄰(Weighted K-Nearest Neighbor,WKNN)方法進行位置估計。

(16)

(17)
其中,sup為取上界。
當損失函數L滿足三角不等式時,可以得到[15]:
(18)
其中,λ為理想誤差,其滿足
(19)

(20)
根據該優化函數構建了如圖2所示的DDCAN。

圖2 DDCAN結構

(21)
當在f′下的差異損失接近上界時,通過最小化下式可以達到有效減小errQ(f(ψ))的目的。

(22)
其中,ys為源域樣本的標簽,在回歸問題中為參考點位置坐標a,分類問題中為所屬類別c,η為平衡系數。最終的優化目標變為:
(23)
在分類任務中,DDCAN輸出為指紋所在的網格類別。受文獻[15]的啟發,針對源域和目標域給出不同的損失函數。記softmax函數為σ,對于z∈C有:
(24)

(25)
式中,?(·)為取向量最大元素對應下標。為了抑制在對抗學習中梯度爆炸或消失,目標域使用修正的交叉熵損失[16]:
L′(f′(ψ(Ft)),f(ψ(Ft)))?lb[1-σ?(f(ψ(xt)))(f′(ψ(Ft)))]。
(26)

(27)
需要注意,γ越大泛化效果越好,但過大會導致梯度爆炸。
離線校準階段通過有標簽的離線指紋庫和無標簽的目標域樣本完成對DDCAN的訓練,得到定位模型f(ψ(·))。在線階段將待定位用戶指紋作為測試數據輸入給訓練好的定位模型,得到其在每個網格的概率。由于相鄰網格的邊界重合,邊界附近的用戶容易被DDCAN誤判,且邊界上的用戶只用單個網格內的離線指紋進行WKNN估計結果次優,因此提出改進的網格重定位方法。具體地,保留第j個待定位用戶通過定位模型f(ψ(·))得到的概率向量bj=σ(f(ψ(Fj)))∈C,為了避免小概率網格的干擾,進一步對bj進行濾波后得到b′j,其中
(28)
其中,[·]i為向量第i個元素。將概率最大的4個網格塊的中心坐標進行加權求和,得到重定位的搜索網格中心坐標:
(29)
其中,gj為b′j中索引按照對應元素值降序排列后的索引向量,qi為第i個網格的中心坐標。重定位的搜索網格大小同為d,不會引入額外的搜索復雜度,但其更易包含待定位用戶,有助于通過WKNN方法估計位置。

(30)
其中,wi為加權系數,其滿足
(31)
式中,sij為第j個待定位用戶指紋和第i個離線指紋間的相似度,其可以表示為:
(32)


(33)

(34)
(35)
與分類定位方法相比,回歸定位方法直接進行位置估計,不需要進行搜尋匹配,顯著提高了在線階段定位的速率。但是分類定位方法對DDCAN提取域不變特征的要求低,只要能滿足待定位用戶所在網格的相對概率準確即可,而回歸方法的域不變特征直接影響到位置估計結果,因此分類方法更容易進行域自適應和在目標域獲得更高精度。
源域的離線指紋樣本和目標域的測試樣本通過DeepMIMO數據集[17]生成。

為了將DDCAN方法和其他領域自適應方法比較,在分類問題中對比了DaNN[10]、DANN[11]和BDA[12]方法。首先比較了這幾種方法的平均定位誤差(Mean Absolute Error,MAE):
(36)
如表1所示,RLoc_WKNN表示在WKNN前進行了網格中心重定位,在不同的方法中,相比于直接使用WKNN均獲得了一定的精度提升。NoAdp表示將在源域訓練的模型直接用于目標域的定位結果,由于環境的變化,源域訓練的模型存在較大定位誤差,不同的領域自適應算法都取得了一定的精度提升,其中DDCAN方法獲得了最好的定位結果,相比于BDA方法定位精度提升了29.7%。
幾種方法的定位誤差累計分布函數(Cumulative Distribution Function,CDF)曲線如圖3所示。

圖3 分類領域自適應方法CDF對比結果
從圖3中可以看出,DDCAN定位方法在可靠度為90%的概率下達到了最高的定位精度(1.2 m),DANN和BDA方法在相同的可靠度下能保證2 m以內的定位精度,而NoAdp方法僅能保證6.6 m內的定位誤差,這對提供定位服務來說是不可接受的。
在回歸問題中將DDCAN方法、DaNN和DANN方法(BDA不適用于回歸問題)進行了對比,其中MAE對比結果如表2所示。

表2 回歸領域自適應算法對比結果
回歸問題下幾種方法的定位誤差累計分布函數曲線如圖4所示。

圖4 回歸領域自適應方法CDF對比結果
圖4中,Rec表示回歸問題,可以看到DDCAN方法在90%的可靠度下達到1.4 m內的定位誤差,而DANN和DaNN在相同的可靠性下都只能滿足2.3 m內的定位誤差,而直接使用源域模型僅能滿足2.75 m內的定位誤差。
DDCAN方法和DMCA、FiDo兩個基于深度域自適應的定位方法對比如圖5所示。

圖5 域自適應定位方法CDF對比結果
DDCAN定位方法相較于其他的定位方法而言定位精度都有一定的提升,其中基于DDCAN的回歸定位方法在90%可靠性下的定位誤差為1.4 m,相對于FiDo的1.6 m定位精度提高了12.5%,相對于DMCA的2.2 m定位精度提高了36.4%。
本文提出了一種結合深度領域自適應方法的DDCAN指紋定位方法,該方法僅需要有標簽的離線指紋庫和離線校準階段采集的無標簽目標域指紋,通過聯合優化源域誤差和源域、目標域的分歧差異能夠有效訓練并提高定位模型在目標域上的定位精度。分別針對分類和回歸問題設計了相對應的定位模型,其中針對分類問題,考慮網格邊界處的用戶指紋分類困難的情況,提出網格重定位的方法,通過增加用戶包含在搜索網格內的概率,提高了定位精度。仿真結果表明,DDCAN方法相比于其他一些領域自適應方法和定位方法都取得了一定的精度提升。