999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于XGBoost的無線傳播預測模型

2020-09-02 06:31:23朱家鵬段宇帥
軟件導刊 2020年8期
關鍵詞:數據分析

朱家鵬 段宇帥

摘 要:傳統的無線傳播模型通常需要根據經驗模型對傳播場景進行劃分。為了解決其在實際應用中不夠精確的問題,通過在大量工程參數中設計并選用合適的特征參數作為模型輸入,構建基于機器學習方法XGBoost的無線傳播預測模型,實現新環境下無線信號覆蓋強度的準確預測。實驗結果表明,該模型相較于基于長短記憶網絡(LSTM)、線性回歸方法,預測均方根誤差最小,為9.101。該方法在預測精度和模型魯棒性上都較好,對在不同場景下的信道傳播路徑損耗進行準確預測具有重要意義。

關鍵詞:集成學習;無線傳播模型;數據分析;特征工程

DOI:10. 11907/rjdk. 192477 開放科學(資源服務)標識碼(OSID):

中圖分類號:TP301文獻標識碼:A 文章編號:1672-7800(2020)008-0035-05

Abstract:Traditional wireless propagation models usually need to divide propagation scenarios based on empirical models. In order to solve the problem that it is not accurate enough in practical application, this paper designs and selects the appropriate feature parameters as input to the model through a large number of engineering parameters. The wireless propagation model based on machine learning XGBoost can accurately predict the wireless signal coverage in the new environment. The experimental results show that compared with the long-short memory network (LSTM) and linear regression method, the predicted root mean square error is 9.101, and the error is the smallest. The method of this paper is good in the accuracy of prediction and the robustness of the model. It is of great significance to accurately predict the channel propagation path loss in different scenarios.

Key Words: integrated learning; wireless propagation model; data analysis; feature engineering

0 引言

隨著5G技術的長足發展與逐步普及,高效的網絡估算以及合理的基站站址選擇,在運營商部署5G網絡中具有非常重要的意義。無線傳播模型正是通過對目標通信覆蓋區域內的無線電波傳播特性進行預測,使得小區覆蓋范圍、小區間網絡干擾以及通信速率等指標估算成為可能。由于無線電傳播環境復雜、會受到傳播路徑上各種因素的干擾,如建筑物、湖泊、平原等,使電磁波不再以單一方式和路徑傳播而產生復雜的折射、散射、透射,因此難以建立一個模型實現對不同場景下特定地理位置的實際平均信號接收功率(RSRP)進行準確預測。

針對不同頻段選擇合適的無線傳播模型,有助于5G通信系統的空口規劃和硬件選型,使工程師預測特定站址在實際環境下的傳播損耗,為網絡規劃及優化奠定基礎[1]。在無線網絡規劃工程中, 傳播模型預測傳播損耗的準確性從根本上決定了無線網絡規劃的合理性[2-3]。現有無線傳播模型一般可分為:經驗模型、理論模型和改進型經驗模型[4]。經驗模型可從經驗數據中獲取固定的擬合公式,典型模型有Cost 231-Hata[5-6]、Okumura[7]等。理論模型主要根據電磁波傳播理論,考慮電磁波在空間中的反射、繞射、折射等進行損耗計算,比較有代表性的是Volcano模型[8]。改進型經驗模型通過在擬合公式中引入更多參數從而為更細分類的場景提供計算模型,典型的有Standard Propagation Model(SPM)[9]。

經典計算方法在處理復雜數據和捕獲特征之間的內在聯系方面還存在困難。近年來,隨著機器學習的發展,大數據驅動的機器學習技術獲得了長足進步,并且在語音識別[10]、圖形圖像處理[11-13]、自然語言處理[14]和模式識別 [15-16]領域獲得了不錯效果。正是因為在應用過程中的高實用性以及低復雜性使其與無線通信的緊密結合成為可能。

為了快速準確實現無線傳播模型的預測效果,提高新環境下RSRP精度的準確預測,本文構建了一種基于集成學習方法極端梯度提升(XGBoost)的無線信號預測模型。本文運用數據清洗、特征設計和選擇方法獲取約38萬條數據進行模型訓練,選取10個相關指標作為參數特征。然后通過對特征的編碼、歸一化操作,將特征融合到XGBoost模型中進行訓練。該模型采用5折交叉驗證對模型評估并優化參數,最后調用模型參數預測新小區下的RSRP。在相同數據集下,與線性回歸方法、長短記憶網絡(LSTM)方法相比,該模型的擬合效果和預測性能整體較好,魯棒性更強。

1 集成學習方法XGBoost

由集成學習方法可以推廣出XGBoost的預測模型[17],如式(1)所示。

2.2 特征工程

本文選擇決策樹搜索算法用于特征產生過程[18],主要步驟如下:首先構建根節點,將從原始數據集提取出的所有特征放在根節點,選出一個最優特征;然后根據選中的特征將原始數據集分成子集,使得每一個子集得到最好的結果。此時,如果在子集中能夠獲得較好結果,就將子集分到相應的葉子節點上去。本文選擇的特征參數如表1所示。

對原始數據集進行異常值清洗,本文通過柵格(X,Y)上的地物類型索引(Clutter Index)與柵格(X,Y)上的建筑物高度(Building Height)的相互關系進行第一步初步處理。表2中列舉了一部分異常數據值,小區發射機的一些屬性字段省略,例如當地物索引為10時,其對應的建筑物高度應該大于60m,則小于或等于60m的數據即為異常數據。

數據處理除上述方法外,本文通過觀察數據集發現同一個小區的發射機相關屬性信息大體一致,因此可以根據Altitude、Building Height、Clutter Index 3個特征先實現分組再進行數據合并,同時對相應的RSRP與Distance取其均值。本文將加粗標示的數據進行合并操作,如表3所示。

2.3 模型框架與構建

在無線信號傳播過程中,站點工程參數和目標地理環境等因素對信號接收強弱有很大影響。為了更好地擬合不同特征參數與RSRP之間的關系,尋找設計合理的特征預測新環境下的RSRP,本文搭建了基于XGBoost的算法模型。該算法在每一輪訓練結束后,會降低被正確分類的訓練樣本權重,增大分類錯誤的樣本權重。多次訓練后,一些被錯誤分類的訓練樣本會獲得更多關注,而正確的訓練樣本權重趨近于0,得到多個簡單的分類器,通過對這些分類器進行組合,得到一個最終模型。

考慮到輸入特征數據的度量標準不統一,本文使用最大—最小標準化對原始數據進行線性變換,如式(12)所示。

其中,minA和maxA分別是屬性A的最大值、最小值,x是A的一個原始值,通過最大—最小標準化映射到區間[0, 1]的值為[x]。

本文算法流程如圖2所示。首先根據地物類型名稱編號的含義清洗掉200萬條數據,再通過對格柵上的海拔高度(Alitude)、小區站點格柵的地物類索引(Clutter_Index)、格柵上建筑物高度(Building_Height)3個條件進行分組合并數據,從而得到最終訓練數據集38萬條。然后選取工程參數、地圖數據和兩者計算的距離共8個指標作為特征,將兩個地物類型索引進行單熱編碼后融合所有特征放入XGBoost模型進行訓練預測。并且,使用5折交叉驗證優化模型參數:先選擇較高的學習速率(Learning Rate),再選擇對應于此學習速率的理想決策樹數量。XGBoost有一個很有用的函數“cv”,該函數可以在每一次迭代中使用交叉驗證,并返回理想的決策樹數量。對于給定的學習速率和決策樹數量,進行決策樹特定參數調優(max_depth, min_child_weight, gamma, subsample, colsample_bytree)。在確定一棵樹的過程中,可以選擇不同參數,進行xgboost的正則化參數調優(lambda, alpha)。這些參數可以降低模型復雜度,從而提高模型表現,最后降低學習速率,確定理想參數。最終參數為樹的深度、學習速率、迭代次數和損失函數(max_depth=6,learning_rate=0.01,n_estimators=160,objective=“reg:logistic”)。在新的小區環境下可以調用保存的模型直接預測RSRP值。

2.4 實驗結果與分析

本文數據集需要先自行處理和劃分,然后將其應用于算法模型訓練及預測。最終清洗得到38萬條數據,對其進行可視化,結果如表4所示。可以看出,距離的標準差最大,距離值震蕩最大。每個小區內的參數大多數都相同,不同小區數據集之間才會有很大差異,因此通過觀察這些參數特征,直觀上距離是主要影響因素。本文將在兩個新的小區112501和115001預測RSRP,編號112501小區測試集有4 548個樣本,編號115001小區測試集4 463個樣本。

本文基于XGBoost算法模型的特征提取如圖3所示。圖中f0~f9代表依次輸入到表中的特征參數(如表4所示),條形圖上的數據代表重要特征個數。由圖3可以看出,距離(Distance)是影響RSRP預測的主要因素,這與當初預想的相同。此外,兩個小區預測后表現的特征重要性先后順序沒變,可以看出本文模型較穩定,不會劇烈變化,由此可以推斷該模型泛化能力和準確率均較好。

為驗證基于XGBoost的無線信號預測模型有更好的泛化性能和在預測結果上的優勢,本文采用線性回歸[19]和基于LSTM方法[20]進行對比。線性回歸就是擬合一個線性函數,傳統的線性回歸會受因子多樣性和不確定性影響,大量數據下表現不佳。而LSTM可以模擬數據之間的依賴關系,本文特征之間沒有特別的時序關系,故效果會存在局限。本文在清洗出的相同數據集上進行訓練測試,在表4中對比了LSTM、線性回歸、本文使用的XGBoost模型3種方法的RMSE。結果表明,本文使用的XGBoost在不同交叉驗證迭代上的訓練集的RMSE均最優。本文XGBoost在所有網絡結構中表現最好,因為本文網絡結構能夠更好地決策出比較重要的特征,懲罰選取的相對次要的特征參數。

3 結語

不同環境因素下信號會受到相應干擾,本文算法模型能夠合理利用選擇的特征預測RSRP并減少干擾,所使用的特征和輸出數據有一定可靠性。并且,本文構建的基于XGBoost的無線信號預測模型,在與LSTM和線性回歸方法的比較中表現最優。通過對數據可視化和實驗結果的特征重要性分析發現,該模型能夠較為精準并穩定地預測出各小區的RSRP。同時,本文研究還存在一些不足和改進空間:數據合并時對Distance和RSRP取均值可能影響差值較大的數據;模型還能進一步優化,模型融合和距離單調性都是需要探索的方向,因此未來可考慮融合規則和特征的特性。

參考文獻:

[1] 楊光, 陳錦浩. 5G移動通信系統的傳播模型研究[J]. 移動通信, 2018, 42(10): 32-37.

[2] 韋再雪,張濤,楊大成. 一種無線網絡規劃中的雙斜率傳播模型校正算法[J]. 電子與信息學報, 2007, 29(10): 132-135.

[3] 朱江,王婷婷,宋永輝,等. 無線網絡中基于深度Q學習的傳輸調度方案[J]. 通信學報,2018(4):35-44.

[4] 劉欣. 基于GSM無線網絡傳播模型的基站發射功率開場測試研究[J]. 中國無線電, 2014(10): 54-55.

[5] VERMA R, SAINI G. Statistical tuning of Cost-231 Hata model at 1.8 GHz over dense urban areas of Ghaziabad[C]. New Delhi: International Conference on Computing for Sustainable Global Development,2016.

[6] WU H, ZHANG N, WEI Z, et al. Content-aware cooperative transmission in HetNets with consideration of base station height[J]. IEEE Transactions on Vehicular Technology, 2018,67(7): 6048-6062.

[7] 張延華, 段占云, 沈蘭蓀, 等. Okumura-Hata傳播預測模型的可視化仿真研究[J].電波科學學報, 2001,16(1): 89-92.

[8] 方明. Vlcano模型的分析及應用[D].上海:復旦大學, 2008.

[9] LI H, WEI F, FENG X, et al. On improvement to the Shock Propagation Model (SPM) applied to interplanetary shock transit time forecasting[J]. Journal of Geophysical Research Space Physics, 2008, 113(A9):A09101.

[10] HOSHIMI M, NIYADA K. Method and apparatus for speech recognition[J]. Journal of the Acoustical Society of America,2018,109(3): 864.

[11] 白琮, 黃玲, 陳佳楠, 等. 面向大規模圖像分類的深度卷積神經網絡優化[J].軟件學報,2018,29(4):137-146.

[12] 高如新, 李雪穎. 雙邊濾波的改進高光去除[J].中國圖象圖形學報,2018, 23(1):9-17.

[13] PASQUINI C, BOATO G, BOHME R. Teaching digital signal processing with a challenge on image forensics [SP Education][J]. IEEE Signal Processing Magazine, 2019, 36(2): 101-109.

[14] ONE K,KJELL K,GARCIA D, et al. Semantic measures: Using natural language processing to measure, differentiate, and describe psychological constructs[J]. Psychological Methods, 2018, 24(1): 92-115.

[15] SELVACHANDRAN G, GARG H, ALAROUD M, et al. Similarity measure of complex vague soft sets and its application to pattern recognition[J]. International Journal of Fuzzy Systems,2018, 20(6): 1901-1914.

[16] 聶棟棟, 賀悅悅, 馬勤勇. 基于PCA_LDA和協同表示分類的人臉識別算法[J]. 燕山大學學報, 2019,43(2):86-91.

[17] CHEN T, HE T, BENESTY M. XGBoost: extreme gradient boosting[R]. Package Version 0.4-2,2015,.

[18] 陳輝林, 夏道勛. 基于CART決策樹數據挖掘算法的應用研究[J]. 煤炭技術, 2011, 30(10): 164-166.

[19] 喻一凡, 曾道建, 李峰, 等. 線性回歸的渡船精準定位方法研究[J]. 小型微型計算機系統, 2018, 39(7): 234-241.

[20] HOCHREITER S,SCHMIDHUBER J. Long short-term memory[J]. Neural computation, 1997, 9(8): 1735-1780.

(責任編輯:孫 娟)

猜你喜歡
數據分析
電子物證檢驗的數據分析與信息應用研究
基于matlab曲線擬合的數據預測分析
商情(2016年40期)2016-11-28 11:28:07
分眾媒體趨勢下場景營銷的商業前景
商(2016年32期)2016-11-24 17:39:41
佛山某給水管線控制測量探討
科技資訊(2016年18期)2016-11-15 18:05:53
SPSS在環境地球化學中的應用
考試周刊(2016年84期)2016-11-11 23:57:34
大數據時代高校數據管理的思考
科技視界(2016年18期)2016-11-03 22:51:40
我校如何利用體育大課間活動解決男生引體向上這個薄弱環節
體育時空(2016年8期)2016-10-25 18:02:39
Excel電子表格在財務日常工作中的應用
淺析大數據時代背景下的市場營銷策略
新常態下集團公司內部審計工作研究
中國市場(2016年36期)2016-10-19 04:31:23
主站蜘蛛池模板: 色悠久久久| 超清人妻系列无码专区| 一级福利视频| 国产美女精品在线| 中文字幕亚洲电影| 欧美激情视频二区三区| 精品人妻无码区在线视频| 久久久久夜色精品波多野结衣| 青青草原国产精品啪啪视频| 国产亚洲精品自在线| 久久女人网| 国产无遮挡猛进猛出免费软件| 国产微拍一区二区三区四区| 99国产精品免费观看视频| 国产对白刺激真实精品91| 九九视频免费在线观看| 国产在线精品香蕉麻豆| 亚洲精品成人福利在线电影| 毛片免费视频| 国产美女无遮挡免费视频| 日本精品视频一区二区| 亚洲欧美成人在线视频| 国产sm重味一区二区三区| 国产午夜福利在线小视频| 欧洲一区二区三区无码| 蜜桃视频一区| 日本精品中文字幕在线不卡| 日韩资源站| 园内精品自拍视频在线播放| 欧美亚洲另类在线观看| 2021天堂在线亚洲精品专区| 成人国产精品网站在线看| 黄色网址手机国内免费在线观看| 亚洲色图欧美在线| 国产一级特黄aa级特黄裸毛片| 精品国产欧美精品v| 国产69精品久久久久妇女| 91丝袜在线观看| A级全黄试看30分钟小视频| 亚洲视频一区在线| 久久免费观看视频| 亚洲日产2021三区在线| 国产成人三级在线观看视频| 亚洲av色吊丝无码| 亚洲欧美精品在线| 久久大香伊蕉在人线观看热2| 久久99热这里只有精品免费看 | 精品国产美女福到在线直播| 97视频免费看| 亚洲黄网在线| 国产亚洲精品91| 国产色偷丝袜婷婷无码麻豆制服| 精品福利视频导航| 亚洲精品午夜天堂网页| 国产自产视频一区二区三区| 欧洲av毛片| 亚洲美女视频一区| 麻豆精品在线播放| 99在线免费播放| AⅤ色综合久久天堂AV色综合| 国产福利免费视频| 色偷偷男人的天堂亚洲av| 亚洲国产一成久久精品国产成人综合| 亚洲成年人片| 国产自在线播放| 一级毛片在线免费视频| 四虎精品国产AV二区| 粗大猛烈进出高潮视频无码| 久久精品午夜视频| 香蕉精品在线| 国产三级毛片| 国产成在线观看免费视频| 亚洲性视频网站| 九九热这里只有国产精品| 五月婷婷导航| 天天摸夜夜操| 九九热精品视频在线| 亚洲91在线精品| 久久婷婷六月| 色婷婷色丁香| 日本91视频| 欧美日在线观看|