金華濱
(福州數據技術研究院有限公司,福建 福州 350200)
根據全球移動通信系統協會發布的預測顯示, 未來五年內低功耗廣域網將超過傳統的2G/3G/4G 移動網絡成為物聯網的主流連接方式。截至2018 年底,6.94億物聯網終端通過傳統移動網絡進行連接,僅0.66億通過低功耗廣域網方式進行連接。到2025年,這個局面將得到徹底的扭轉,通過傳統移動網絡連接的物聯網終端數量將增加至13億,而通過低功耗廣域網連接的終端數量將突破18億。面對如此之快的增速,如何優化低功耗廣域網的網絡拓撲,在建設最少低功耗廣域網基站的同時,提升其覆蓋面積和網絡質量,是亟需研究的問題。低功耗廣域網按照工作在授權頻段和非授權頻段進行分類,NB-IoT、EC-GSM是工作在授權頻段的技術,而Lora、SigFox是工作在非授權頻段的技術。總的來說,低功耗廣域網技術具有覆蓋廣、功率低的特點,單個基站的覆蓋范圍在幾千米至幾十千米之間,非常適合物聯網的發展場景[1]。
低功耗廣域網多以星型拓撲的形式呈現,根據網絡的覆蓋情況,若干個物聯網終端連接至一個低功耗廣域網網關,網關的作用是負責接收各個終端上傳的數據,并負責指定各條鏈路的回程連接,最終達到多鏈路上傳和轉發的目的。傳統移動網絡仍需要負責服務器與網關之間的通信鏈路,服務器則主要負責介質訪問層網關的路由選擇、連接進程確認等相關工作的處理。在低功率廣域網的組網過程中,首先需要對實際測量數據庫中的數據進行初級的篩選和分析,將那些包含大量重復或者含有缺省值的屬性剔除,并使用統計學模型找出影響低功耗廣域網網絡覆蓋質量的主要特征,然后將數據輸入到人工智能學習模型中進行數據挖掘,最終獲得最為合理的低功耗廣域網基站布置圖。當然這里所說的人工智能機器學習模型既包括預測模型,也包括規劃模型。基站站點需要根據實際的覆蓋情況和網絡質量進行調整,模型計算出來的位置較為理想,一些后期干擾因素并未完全排除[2]。
圖1 基于數據挖掘的低功耗廣域網組網規劃系統框架圖
低功耗廣域網組網最需要解決的問題是信號覆蓋范圍,重點解決信號覆蓋盲區以及個別位置信號覆蓋較差的問題。其中涉及到三方面比較重要的因素:一是基站自身的因素,如基站的功率額、天線的情況等;二是信號在傳輸過程中是否會受到干擾;三是干擾對覆蓋范圍的定量影響效果。
基站自身的屬性包括基站的經度、維度和高度,還有其發射功率、天線掛高、基站名稱、部署地區編號、最后連接的時間和地址、上行鏈路的PDU誤碼率、信噪比、信噪比盈余、擴頻因子、信噪比與預定值之間的誤差和網絡狀態。測試點的屬性則包括下行鏈路接收信號強度指示器和傳輸一個SDU 的平均擴頻因子以及測試點的經度和維度。在確定好需要提取的特征屬性后,需要對得到的數據進行初步的去除和分析,一些重復性的屬性需要被移除,比如經緯度信息在地理位置中已有所體現,不需要再單獨列出。
這里采用了人工智能機器學習中常用的BRT回歸算法來預測信息覆蓋范圍,該算法能同時組成多個決策樹,具有更加優質的泛化能力,能提高預測模型的精確度。BRT模型可以用N棵決策樹的加法模型,如式(1)所示:
對于低功耗廣域網信號覆蓋范圍規劃模型的建立,一般使用均值聚類算法,該算法將數據庫劃分成x個點,并按照等距相似度的劃分原則, 將原來的數據庫A={a1,...,ax}轉 變 為K個 簇 集 合B={b1,...,bk}。把最小化簇內位置誤差平方和作為目標函數,即可得到每個數據點對定位簇中心的位置,從而獲得基站建設的規劃位置。當然數據挖掘的目的并不是簡單的數據轉換,而是需要在數據轉換的基礎上進行加權問題的處理,這樣得到的目標函數會更加精確。運用數據挖掘的算法需要的輸入包含若干個終端數據點的位置和所有基站初始點的位置信息數據,把二者作為聚類目標函數的初始化值。首先需要通過對距離進行歸類來判定數據點的族類,待數據點分配完成后再通過迭代的方式實現對基站建設位置的調節。低功率廣域網信息覆蓋的范圍以能覆蓋位置到基站的距離為最大覆蓋半徑,期間會受到建木筑物阻擋、信號傳播干擾等多方面的影響。另外還需要考慮距離對于信號質量的影響程度,所以對于本身覆蓋較差的終端會賦予其對基站建設位置影響更大的權重,這樣才能在多次的迭代過程中,讓基站完美的覆蓋這些信號盲點[3]。當然在實際情況中,經常出現通過加權算法仍然不能得到最佳組網結果的案例,就需要重復建立預測模型,并再次對基站的位置進行優化,直到滿足最優的目標函數,從而得到覆蓋范圍最佳的網絡拓撲實踐。在完成最佳的網絡拓撲設計后,還應通過仿真分析和性能評估的方法對其進行驗證,方可將模型投入到實踐中。
綜上所述,本文提出了一種基于數據挖掘技術實現的低功耗廣域網組網方法,其主要原理是通過機器學習的回歸算法提取和分析已獲得的數據值, 并通過均值聚類和多次迭代的方法找到目標函數的最優解,從而獲得最佳的組網方案。在實際的組網過程中,每條鏈路的數據量均不相等,需要在今后的研究過程中加以考慮,以便能獲得更精確的組網方案。