











關鍵詞:電波傳播;無線電環境地圖;路徑損耗預測;深度學習;圖像生成
中圖分類號:TN011 文獻標志碼:A 開放科學(資源服務)標識碼(OSID):
文章編號:1003-3106(2024)11-2610-08
0引言
無線電環境地圖(Radio Environment Map,REM)結合地理信息對電磁能量衰減進行可視化展示,實現了快速、準確的環境電磁態勢分析,是無線通信網絡設計和優化的關鍵組成部分[1]。建立REM 通常是通過預測路徑損耗進行的,因此準確地預測環境中的路徑損耗分布對于構建REM 有著重大意義。
路徑損耗預測的一種方法是根據實測數據擬合特定地理環境中電磁波傳播的一般公式的經驗模型[2],例如,Shabbir 等[3]提出了基于測量與仿真的5G 路徑損耗模型,并評估了模型在不同場景下的適用性。對于3D 城市環境,可以構建3D 模型進行射線追蹤(Ray Tracing,RT)模擬[4-5]獲得該區域的高精度路徑損耗預測。然而,使用RT 技術進行城市環境的模擬將會消耗大量的計算資源與計算時間。
深度學習能夠從海量數據中學習其中的內部規律并進一步做出預測,已被廣泛應用于REM 預測,為了使深度學習能夠獲得更加準確的預測結果,除了設計更加精妙的網絡外,挑選合適的數據集與數據預處理也是重要一環。Cerri 等[6]提出了一種基于人工神經網絡(Artificial Neural Network,ANN)的路徑損耗模型,能夠通過簡單的建筑物圖像預測簡單情況下的路徑損耗,均方差(Mean Square Error,MSE)達到了1.418。基于發射端(Tx)和接收端(Rx)之間建筑物的高度信息,Sotiroudis 等[7]提出了一種用于900 MHz 下路徑損耗預測的綜合學習方法,通過將建筑物高度作為額外輸入,使得僅僅將平面圖像作為輸入的傳統方法精度提升了約5% ,MSE 達到了0.082。在文獻[8]中,發射端和接收端之間的建筑物輪廓被輸入到一個深度全連接神經網絡來預測接收端的路徑損耗,驗證了在廣域地圖中使用建筑物輪廓相比傳統散射輪廓具有更高的精度,能夠在復雜城市環境達到2.27 的MSE。文獻[9]利用深度學習和衛星圖像來預測路徑損耗,僅僅只需要將衛星圖像作為輸入便能獲得整片區域的路徑損耗分布,與傳統RT 方法對比,預測精度提高了約4.7 dB,每輪訓練需要大約12 min。然而深度學習在路徑損耗預測中往往對數據缺乏可解釋性[10],并且訓練仍然要消耗大量時間。
本文提出了一種改進模型與環境編碼方法用于深度學習中REM 的預測,該模型通過輕量級視覺轉換器(Mobile Vision Transformer,MobileViT)模塊增加了模型的全局視野,擁有更快的收斂速度,結合環境編碼方法,使深度學習具有更高的可解釋性,有助于提高模型的泛化能力并提高了圖像的一維熵,加快了模型的訓練速度。
1路徑損耗理論
在城市環境的無線通信中,路徑損耗的產生主要是由自由空間傳播損耗與建筑物的反射和衍射產生的,通常與頻率和距離呈對數關系,可表示為:
在市區環境下用于屋頂下傳播的視距(Line ofSight,LoS)傳輸與非視距(Non Line of Sight,NLoS)傳輸的建議值如表1 所示。
期望深度學習能夠學習電波傳播中的潛在物理規律,盡管式(2)在真實的情況下仍然存在一定誤差,但可以將其作為一種先驗知識用作對深度學習的補充,這種補充使得模型能預先接收部分物理規律,使得模型的預測受到部分限制,更傾向于向著真實規律擬合增加模型可解釋性。
由文獻[12]中的理論可知,在實踐中不必估計路徑損耗太大的負值,因此,需要對路徑損耗進行截斷處理,使之能夠適用于所提出的深度學習估計方法,具體的截斷方法將在后文給出。
2深度學習
本節將對深度學習的數據集進行詳細介紹,同時提出了一種基于輕量級MobileViT 的REM 生成模型,該模型能夠快速構建REM,且預測誤差較低。
2.1數據集介紹
本文數據集來源于IEEE Datapor 的公開數據集[13]。該數據集分為RadioMapSeer、RadioLocSeer、RadioToASeer 等多個子數據集,涵蓋了REM 構建、定位等方面。本文選用的是用于REM 構建的RadioMapSeer 數據集。
該數據集有700 張城市地圖,每張地圖匹配80 個發射源位置以及相對應的REM 模擬圖組成。
數據集中主要采用了考慮最強路徑的主導路徑模型(Dominant Path Model,DPM)[14]的REM 圖。
城市地圖主要包含了柏林、格拉斯哥、倫敦和特拉維夫的城市環境分布圖,每張地圖大小為256 m×256 m,分辨率為1 m,每張地圖進行了二值化處理(建筑物內部像素值為255,建筑物外部像素值為0)。
為了簡化數據,城市地圖中所有建筑物高度被設置為25 m,收發天線高度被設置為1. 5 m。城市地圖與天線位置圖示例如圖1所示。
表2展示了用于生成REM 的天線相關參數。
需要說明的是,天線位置圖中,為了更直觀地展示天線位置,將天線位置處及附近像素點都設置為255,實際仿真中只有一個像素點為255。
DPM 只考慮一條最強路徑,基于DPM 生成的REM 如圖2 所示。
2.3模型結構
Unet[15-16]網絡結構是一種廣泛應用在圖像分割與圖像生成領域的深度學習模型,因網絡結構形似大寫字母U 得名。Unet 結構主要通過卷積神經網絡(Convolutional Neural Network,CNN)來獲得圖像的特征。然而受到CNN 感受野的限制,CNN 對于圖像的全局特征并不敏感,然而,REM 圖像全局呈現高關聯性,因此本文采用MobileViT 模塊[17]替代傳統Unet 結構中的CNN 模塊。MobielViT 是一種輕量級架構,它解決了CNN 全局信息感知能力不強的問題。最終構建的網絡結構如圖3所示。
受殘差連接的啟發[18],本文在MobileViT 網絡訓練后凍結網絡權重,將輸出和原始輸入一起作為輸入再經過一個MobileViT 網絡進行訓練得到最終的輸出結果,第一個網絡隱式地學習了一種合成REM 的算法,為了檢查第一個網絡的輸出,第二個網絡從估計的REM、城市地圖中和所有其他輸入中提取高級特征,并綜合出對REM 的改進預測。
2.4圖像編碼
傳統深度學習方法大多是純粹數據驅動型模型,這種模型可能不符合實際規律或難以限制而缺乏可解釋性,為了提升模型的可解釋性將電磁學先驗知識引入機器學習中。先驗知識是預先存在的,并且獨立于學習算法,這種先驗知識與整個學習架構交織一起,使學習更傾向于實際規律。
實際應用中,復雜先驗知識與簡單先驗知識對模型產生的影響并沒有確定的量化,本文考慮在計算機視覺中定義圖像的一維熵,反映圖像信息豐富的程度,亦即度量圖像所具有的信息量。定義灰度圖像的一維熵如下:
2.4.2基于經驗公式的環境編碼
本文天線工作頻率為5.9 GHz,天線高度遠低于建筑物高度,城市圖片大小為256 m×256 m,考慮到建筑物密度默認所有圖片場景為NLoS 傳播。參考表1 選取對應的基本傳輸損耗系數代入式(2)對天線位置圖進行計算,利用式(4)將結果進行灰度級轉換代替各個點像素值實現了基于傳統經驗公式的環境編碼方式。將該編碼方式命名為編碼方式2,如圖5 所示。
3模型訓練
3.1訓練集劃分
數據集中選?。担梗箯埖貓D,隨機分成500張訓練圖片。每張圖片對應了80張發射源編碼圖,輸入為一張城市地圖與一張發射源編碼圖,輸出則為其對應的DPM 圖。同時,分割了99 張圖片用作測試集。
3.2訓練結果與分析
在數據集上進行監督學習,損失函數采用MSE損失函數。采用Adam 優化器進行優化,學習率為10-4 ,共訓練50輪,批大小為15。模型部署在一塊24GB"顯存的NVIDIA GeForce RTX4090顯卡上。模型的預測結果如圖6所示。
采取文獻[19]提供的模型結構搭建了一個基于傳統Unet 網絡的預測模型,將其作為對比模型。
深度學習中,損失函數是衡量模型預測性能的一項重要指標,本文訓練采用MSE 作為損失函數進行訓練。MSE 是一個無量綱量,函數表達式如下:
采用相同的訓練集劃分與優化方式,本文模型訓練集平均損失函數下降曲線與對比模型的損失函數下降曲線如圖7所示。
從圖7可以看出,本文提出的模型與對比模型相比,收斂速度要快得多,截取模型前10 000次訓練觀察其損失函數能更直觀地看出,結果如圖8所示。
2 種模型總的平均MSE 如表4所示。
本文計算了2種模型的MSE 損失函數下降到0.0002時所需要的時間,計算結果如表5所示。
結合圖8與表5的結果,可以認為本文提出的模型在訓練階段能更快地收斂,更快取得想要的結果,取得了更好的性能。之后在所提出的模型對訓練集進行環境編碼,編碼后訓練集每輪平均MSE損失函數下降曲線如圖9所示。
每輪平均MSE 損失函數計算方法為:每一輪計算每次訓練損失函數的累加除以每輪總次數,每輪平均MSE 損失函數能夠直觀地看出模型的整體性能。3種輸入損失函數都能夠下降到一個理想的范圍,而加入編碼方式的輸入在開始訓練時的預測與實際誤差更小,這也符合對信息熵理論的分析。3種輸入最后一次訓練的損失函數如表6 所示。
測試集主要用于評估模型的泛化能力,本文選?。危停樱?作為測試集的損失函數,3 種方式在測試集上的NMSE 如圖10所示。
3種輸入方式下,模型的預測結果誤差都能保持在一個良好的范圍內,3 種輸入方式在測試集上的平均NMSE誤差如表7所示。
隨著圖像一維熵的增加,模型的預測精度也有一些提升。
同時記錄了3種輸入下模型訓練的耗時用于檢驗不同編碼方式對模型訓練時間的影響,結果如表8所示。
結合表7 與表8 的結果可以看出,在符合現實規律的情況下,輸入圖像信息熵的增加與模型的訓練耗時呈負相關,這也符合本文的推斷。編碼方式2采用了傳統的經驗公式對環境進行編碼,對模型的學習加入了物理規律的影響,同時擁有最高的圖像一維熵,訓練耗時最短,平均每一輪的訓練中能夠減少43s 的訓練時間,每輪效率提升接近12% 。
綜上可以看出,本文提出的模型能夠以更快的收斂速度準確地預測REM,同時本文提出的編碼方式通過物理規律的嵌入提升圖像的一維熵能夠對模型的訓練起到加速作用。
4結束語
針對傳統深度學習預測REM 訓練時間長的問題,本文提出了一種改進模型結合根據經驗公式進行環境編碼的構建REM 的方法。通過與傳統模型進行對比試驗驗證了本文模型的有效性與先進性,加入環境編碼后的仿真表明,本文的編碼方式能夠在保證預測結果精度的情況下提升模型的訓練速度。本文的研究成果能夠減少深度學習冗長的訓練時間,將更多精力集中于模型的調參與結果分析。
作者簡介
田茂源 男,(1998—),碩士研究生。主要研究方向:電波傳播與計算電磁學。
(*通信作者)馮 菊 女,(1979—),博士,副教授。主要研究方向:電波傳播、計算電磁學、無線信道測量與建模。
唐彪 男,(2000—),碩士研究生。主要研究方向:電波傳播與計算電磁學。
薛文杰 男,(2004—)。主要研究方向:電波傳播與計算電磁學。