朱格苗 徐 慧 王計(jì)斌 閆興秀 余 健
南京華蘇科技有限公司
近年來,隨著通信網(wǎng)絡(luò)的不斷發(fā)展,其復(fù)雜性也越來越高,網(wǎng)絡(luò)優(yōu)化成為運(yùn)營(yíng)商面臨的主要問題之一,而準(zhǔn)確的工參尤其是方位角是網(wǎng)絡(luò)優(yōu)化的基石,如何獲取正確的方位角是目前研究的重點(diǎn)問題之一。
目前,小區(qū)方位角核查主要采用人工定期巡檢的方法,分批逐步核查全網(wǎng)所有小區(qū)的方位角,該方式不僅耗時(shí)、耗人、耗力,而且運(yùn)維成本較高。另一種自動(dòng)核查天線方位角的方法是分析小區(qū)覆蓋范圍,目前通常是對(duì)路測(cè)數(shù)據(jù)進(jìn)行分析。
目前很多學(xué)者的研究都是從某一方面對(duì)天線方位角進(jìn)行計(jì)算,而沒有全面考慮到數(shù)據(jù)的差異。本文利用OTT數(shù)據(jù)、MDT數(shù)據(jù)、MR數(shù)據(jù)和工參數(shù)據(jù),從各個(gè)方面考慮數(shù)據(jù)的差異性,相應(yīng)地提出五個(gè)算法,分別對(duì)用戶數(shù)據(jù)進(jìn)行分析,從而預(yù)測(cè)天線的方位角,并將五種算法通過賦予不同的權(quán)重形成一種聯(lián)合算法。本文方法的主要?jiǎng)?chuàng)新點(diǎn)是將五種預(yù)測(cè)算法聯(lián)合在一起,規(guī)避了單獨(dú)算法的一些缺點(diǎn),以達(dá)到更高的精度和更好的穩(wěn)定性。
我們的方法收集了三種不同的數(shù)據(jù):用戶數(shù)據(jù)(OTT、MDT)、小區(qū)工參信息表、小區(qū)真實(shí)勘站數(shù)據(jù)。
用戶數(shù)據(jù)收集的是特定時(shí)間及空間上用戶手機(jī)上報(bào)的實(shí)時(shí)信息。最終保留的指標(biāo)有:小區(qū)唯一標(biāo)識(shí)(ECI)、用戶經(jīng)度、用戶緯度、參考信號(hào)接收功率(Reference Signal Received Power,RSRP)(以下簡(jiǎn)稱RSRP)。
小區(qū)工參信息表收集的是一定區(qū)域內(nèi)大量小區(qū)的基本信息,每行代表一個(gè)ECI。最終保留下列指標(biāo):小區(qū)唯一標(biāo)識(shí)(ECI)、小區(qū)經(jīng)度、小區(qū)緯度、工參方位角、小區(qū)覆蓋類型。
小區(qū)真實(shí)勘站數(shù)據(jù)收集的是小區(qū)真實(shí)的信息,包括小區(qū)唯一標(biāo)識(shí)(ECI)、勘站方位角。
對(duì)用戶數(shù)據(jù)進(jìn)行分析,利用我們的聯(lián)合算法對(duì)小區(qū)方位角進(jìn)行預(yù)測(cè),并且將預(yù)測(cè)的方位角和真實(shí)勘站的數(shù)據(jù)進(jìn)行對(duì)比,得出算法預(yù)測(cè)的準(zhǔn)確性。當(dāng)算法的準(zhǔn)確性較高時(shí),該算法則投入生產(chǎn)應(yīng)用,這樣則可以節(jié)省大量的人力、物力,不需要對(duì)每個(gè)小區(qū)進(jìn)行實(shí)際勘站就能獲得準(zhǔn)確的工參。
在實(shí)際生活中,當(dāng)收集到的樣本數(shù)據(jù)量較小時(shí),預(yù)測(cè)值與真實(shí)值之間常常會(huì)有較大的誤差,為了避免誤差過大,本文將五種基本預(yù)測(cè)算法和權(quán)重算法結(jié)合,形成聯(lián)合算法,從而對(duì)用戶數(shù)據(jù)進(jìn)行預(yù)測(cè),這樣可以在一定程度上保證預(yù)測(cè)結(jié)果的準(zhǔn)確性。基于用戶數(shù)據(jù)實(shí)現(xiàn)天線方位角糾偏的方法主要分為以下5個(gè)步驟:
步驟1:收集數(shù)據(jù)。收集用戶數(shù)據(jù)和工參數(shù)據(jù)樣本以及勘站數(shù)據(jù)。
步驟2:數(shù)據(jù)處理。首先將工參表中小區(qū)經(jīng)度和緯度為空的小區(qū)刪除,只選取小區(qū)覆蓋類型為室外的小區(qū),在柵格級(jí)多天時(shí)間粒度上對(duì)用戶數(shù)據(jù)和工參數(shù)據(jù)通過小區(qū)唯一標(biāo)識(shí)碼進(jìn)行匹配,然后對(duì)匹配后的數(shù)據(jù)組進(jìn)行去重處理,統(tǒng)計(jì)每個(gè)小區(qū)下的用戶數(shù)據(jù)數(shù)量,僅保留用戶數(shù)據(jù)數(shù)量大于閾值區(qū),根據(jù)小區(qū)經(jīng)緯度和用戶數(shù)據(jù)經(jīng)緯度,計(jì)算用戶數(shù)據(jù)到小區(qū)的距離,并且進(jìn)行異常值檢測(cè),刪除距離較遠(yuǎn)的用戶數(shù)據(jù),再通過小區(qū)經(jīng)緯度和用戶經(jīng)緯度計(jì)算用戶相對(duì)小區(qū)的角度,以正北方位為0度。
步驟3:分別采用基于采樣點(diǎn)強(qiáng)度預(yù)測(cè)算法、基于采樣點(diǎn)密度分扇區(qū)預(yù)測(cè)算法、基于采樣點(diǎn)強(qiáng)度和密度結(jié)合的預(yù)測(cè)算法、基于采樣點(diǎn)強(qiáng)度的分層統(tǒng)計(jì)預(yù)測(cè)算法、基于采樣點(diǎn)強(qiáng)度分扇區(qū)的預(yù)測(cè)算法,計(jì)算每個(gè)小區(qū)的預(yù)測(cè)方位角。
步驟4:使用用戶數(shù)據(jù)和實(shí)測(cè)的勘站數(shù)據(jù)作為訓(xùn)練集,用步驟3的五種預(yù)測(cè)方法對(duì)訓(xùn)練集進(jìn)行預(yù)測(cè),再根據(jù)預(yù)測(cè)結(jié)果使用蒙特卡羅方法訓(xùn)練出五種預(yù)測(cè)方法的權(quán)重。
步驟5:根據(jù)步驟4的權(quán)重在訓(xùn)練集上得到的預(yù)測(cè)效果,選出最優(yōu)權(quán)重,確定最優(yōu)權(quán)重的預(yù)測(cè)模型,根據(jù)最優(yōu)權(quán)重的預(yù)測(cè)模型對(duì)用戶數(shù)據(jù)進(jìn)行預(yù)測(cè),得出小區(qū)的預(yù)測(cè)方位角。

圖1 基于五種預(yù)測(cè)模型算法的天線方位角工參清洗的說明示意圖
該算法從采樣點(diǎn)的強(qiáng)度出發(fā),將信號(hào)強(qiáng)度作為主要指標(biāo)進(jìn)行考慮。主要是計(jì)算每個(gè)小區(qū)唯一標(biāo)識(shí)碼下RSRP值最大的前n個(gè)采樣點(diǎn)角度的均值作為方位角預(yù)測(cè)值,n為自然數(shù)。
該算法從采樣點(diǎn)密度分扇區(qū)進(jìn)行考慮,將采樣點(diǎn)有規(guī)律地劃分為多個(gè)區(qū)域。每個(gè)小區(qū)唯一標(biāo)識(shí)碼下,以基站經(jīng)緯度為圓心,以基站的正北方向?yàn)?度,順時(shí)針方向角度增加,每N度劃分一個(gè)扇區(qū),將基站的區(qū)域劃分為360/N(取整數(shù))個(gè)扇區(qū)。根據(jù)采樣點(diǎn)的經(jīng)緯度和基站的經(jīng)緯度,計(jì)算得到采樣點(diǎn)與基站之間相對(duì)正北方向的夾角,根據(jù)該角度將采樣點(diǎn)按照到小區(qū)的角度,每N度劃分一個(gè)扇區(qū),分成360/N份,將每個(gè)采樣點(diǎn)都劃分到其所屬扇區(qū),統(tǒng)計(jì)每個(gè)扇區(qū)中點(diǎn)的個(gè)數(shù),取點(diǎn)的個(gè)數(shù)最多的扇區(qū)角度作為方位角預(yù)測(cè)值。
該算法將采樣點(diǎn)的密度和強(qiáng)度結(jié)合考慮,首先同2.2中的扇區(qū)的劃分方法一致,進(jìn)行扇區(qū)劃分,同樣是將采樣點(diǎn)有規(guī)律地劃分成多個(gè)區(qū)域。每個(gè)小區(qū)唯一標(biāo)識(shí)碼下,將采樣點(diǎn)按照到小區(qū)的角度每N度劃分一個(gè)扇區(qū),分成360/N份,N∈[1,360],360/N取整數(shù);然后統(tǒng)計(jì)每個(gè)小區(qū)唯一標(biāo)識(shí)碼下的采樣點(diǎn)總數(shù)扇區(qū)中采樣點(diǎn)數(shù)占比,取出360/N個(gè)扇形區(qū)域中采樣點(diǎn)個(gè)數(shù)大于總采樣點(diǎn)d%的扇區(qū),d∈[1,99],計(jì)算這些扇區(qū)中RSRP值最大的前n個(gè)采樣點(diǎn)RSRP均值,n為自然數(shù),取出RSRP均值最大的扇形區(qū)域t個(gè),t的范圍為[1,360/N]之間的整數(shù),計(jì)算這t個(gè)扇區(qū)角度的均值作為方位角預(yù)測(cè)值。
該算法是在第一個(gè)基于采樣點(diǎn)強(qiáng)度的預(yù)測(cè)算法的基礎(chǔ)上進(jìn)行的改進(jìn),這個(gè)算法考慮距離變量的作用。每個(gè)小區(qū)唯一標(biāo)識(shí)碼下,先將距離去重,再計(jì)算n-1個(gè)不同的百分位數(shù),按照從小到大排列,根據(jù)用戶數(shù)據(jù)到小區(qū)的距離劃分m環(huán),m≥3。第一環(huán):距離≦第一個(gè)百分位數(shù);第二環(huán):第一個(gè)百分位數(shù)<距離≦第二個(gè)百分位數(shù);第三環(huán):第二個(gè)百分位數(shù)<距離≦第三個(gè)百分位數(shù);第四環(huán):第三個(gè)百分位數(shù)<距離≦第四個(gè)百分位數(shù);第n環(huán):第n-1個(gè)百分位數(shù)<距離,刪除最小環(huán)和最大環(huán)的數(shù)據(jù),保留中間環(huán)數(shù)據(jù);確定位于中間環(huán)中每環(huán)RSRP值最大的前n個(gè)采樣點(diǎn)角度均值,最后求前n個(gè)采樣點(diǎn)角度均值的均值作為方位角預(yù)測(cè)值,n為自然數(shù)。
該算法是在第一個(gè)基于采樣點(diǎn)強(qiáng)度的預(yù)測(cè)算法的基礎(chǔ)上進(jìn)行的改進(jìn)。它將采樣點(diǎn)有規(guī)律地劃分為多個(gè)區(qū)域,然后基于采樣點(diǎn)強(qiáng)度進(jìn)行計(jì)算。每個(gè)小區(qū)唯一標(biāo)識(shí)碼下,將采樣點(diǎn)按照到小區(qū)的角度每N度劃分一個(gè)扇區(qū)分成360/N份,求每個(gè)扇區(qū)下RSRP值最大的前n個(gè)采樣點(diǎn)的RSRP均值,最后取RSRP均值最大的扇區(qū)角度為方位角預(yù)測(cè)值。
為了將前面的五種算法進(jìn)行聯(lián)合,通過蒙特卡羅方法隨機(jī)從訓(xùn)練集中抽取一部分?jǐn)?shù)據(jù)作為訓(xùn)練樣本,共隨機(jī)選取P次得到P份訓(xùn)練樣本;針對(duì)每份訓(xùn)練樣本隨機(jī)生成Q個(gè)權(quán)重組合,Q為自然數(shù);針對(duì)每個(gè)權(quán)重組合,統(tǒng)計(jì)訓(xùn)練模型輸出的預(yù)測(cè)方位角與勘站方位角的偏差在R°以內(nèi)的個(gè)數(shù)占比作為該權(quán)重組合的置信度,R的取值范圍為[0,360];針對(duì)每份訓(xùn)練樣本,確定置信度最大的權(quán)重組合。
在具體實(shí)現(xiàn)時(shí),按照如下公式(1)和(2),針對(duì)每份訓(xùn)練樣本確定置信度最大的權(quán)重組合。

其中,公式(1)中的Z為實(shí)際預(yù)測(cè)誤差,angelpredict為預(yù)測(cè)方位角,angeltrue為勘站方位角;公式(2)中cost表示權(quán)重組合對(duì)應(yīng)的誤差系數(shù),M為訓(xùn)練樣本中總勘站小區(qū)數(shù)量,K為設(shè)定的角度誤差閾值。
從上面的公式可知,權(quán)重組合的置信度為1-cost,例如,cost為20%,則權(quán)重組合的置信度就為1-20%,即為80%。
對(duì)于上述的聯(lián)合算法模型,我們通過最終損失函數(shù)值來衡量改進(jìn),損失函數(shù)越小則越好,通過訓(xùn)練出的最好模型可以對(duì)新的用戶數(shù)據(jù)進(jìn)行預(yù)測(cè)方位角,并根據(jù)最終輸出的結(jié)果更新小區(qū)工參信息。最終選取一部分小區(qū)進(jìn)行勘站,將預(yù)測(cè)結(jié)果和勘站數(shù)據(jù)進(jìn)行對(duì)比,判斷算法的準(zhǔn)確性。
本文收集了國內(nèi)某省30天691個(gè)小區(qū)的OTT(Over The Top)數(shù)據(jù),并且對(duì)這691個(gè)小區(qū)進(jìn)行勘站,獲取小區(qū)真實(shí)信息數(shù)據(jù),從而計(jì)算聯(lián)合算法預(yù)測(cè)結(jié)果的準(zhǔn)確性、穩(wěn)定性。
為了確保數(shù)據(jù)的完整性,需要對(duì)數(shù)據(jù)進(jìn)行異常值處理,對(duì)缺少小區(qū)唯一標(biāo)識(shí)碼和經(jīng)緯度信息的數(shù)據(jù)予以剔除,刪除采樣點(diǎn)中距離異常的數(shù)據(jù)和重復(fù)的采樣點(diǎn)數(shù)據(jù)。首先將訓(xùn)練數(shù)據(jù)放到模型中訓(xùn)練、預(yù)測(cè),將每個(gè)算法得到的預(yù)測(cè)數(shù)據(jù)和誤差數(shù)據(jù)保存,接著將訓(xùn)練數(shù)據(jù)放到聯(lián)合算法中訓(xùn)練、預(yù)測(cè),將得到的預(yù)測(cè)數(shù)據(jù)和誤差數(shù)據(jù)保存,最后是對(duì)比聯(lián)合算法和五種算法的預(yù)測(cè)效果,分別計(jì)算聯(lián)合算法和五種算法在訓(xùn)練集、驗(yàn)證集上的誤差,計(jì)算誤差小于20度(包含20度)的個(gè)數(shù)占比。
在實(shí)驗(yàn)中發(fā)現(xiàn),聯(lián)合算法的預(yù)測(cè)準(zhǔn)確性更高,使用聯(lián)合算法進(jìn)行預(yù)測(cè),得到如下所示的一些相關(guān)圖。
圖2是實(shí)驗(yàn)例中某個(gè)小區(qū)10米柵格級(jí)OTT采樣點(diǎn)RSRP熱力圖,從圖中可以看出該小區(qū)的識(shí)別碼、名稱、30天的采樣點(diǎn)數(shù)以及工參方位角和預(yù)測(cè)方位角,以及每個(gè)柵格中平均RSRP值的強(qiáng)弱。

圖2 10米柵格級(jí)OTT采樣點(diǎn)rsrp熱力圖
圖3是實(shí)驗(yàn)例中某市預(yù)測(cè)方位角與勘站結(jié)果對(duì)比分析圖,分別計(jì)算了預(yù)測(cè)誤差小于等于20度、35度、45度的小區(qū)個(gè)數(shù)占比,從圖中可以看出預(yù)測(cè)偏差小于45度的小區(qū)占比達(dá)到96.88%,預(yù)測(cè)偏差小于35度的小區(qū)占比達(dá)到87.53%,預(yù)測(cè)偏差小于20度的小區(qū)占比達(dá)到80.39%,占比都較大,說明預(yù)測(cè)模型有較好的準(zhǔn)確性。

圖3 預(yù)測(cè)方位角與勘站結(jié)果對(duì)比分析圖
圖4、5、6分別是居民小區(qū)、道路小區(qū)、城中村小區(qū)預(yù)測(cè)工參與勘站結(jié)果對(duì)比分析圖,分別計(jì)算了預(yù)測(cè)誤差小于等于20度、35度、45度的小區(qū)個(gè)數(shù)占比,從圖中可以看出預(yù)測(cè)偏差小于45度的小區(qū)占比分別達(dá)到95.96%、95.96%、93.96%,預(yù)測(cè)偏差小于35度的小區(qū)占比分別達(dá)到81.25%、86.25%、87.25%,預(yù)測(cè)偏差小于20度的小區(qū)占比分別達(dá)到75.36%、82.35%、79.36%,占比都較大且表現(xiàn)一致,可以說明預(yù)測(cè)模型在道路、城中村等場(chǎng)景中都有較好的準(zhǔn)確性。

圖4 居民區(qū)小區(qū)預(yù)測(cè)方位角與勘站結(jié)果對(duì)比分析圖

圖5 道路小區(qū)預(yù)測(cè)方位角與勘站結(jié)果對(duì)比分析圖

圖6 城中村小區(qū)預(yù)測(cè)方位角與勘站結(jié)果對(duì)比分析
圖7是實(shí)施例中方位角錯(cuò)誤實(shí)際效果圖,該小區(qū)中根據(jù)OTT采樣點(diǎn)預(yù)測(cè)的方位角為75度,而實(shí)際勘測(cè)的方位角為60度,但是工參表中的方位角為20度,預(yù)測(cè)的方位角與實(shí)際勘測(cè)的方位角誤差較小,經(jīng)驗(yàn)證發(fā)現(xiàn),該小區(qū)工參方位角為人為錄入錯(cuò)誤,此算法為平臺(tái)軟件快速甄別小區(qū)方位角異常提供了理論及技術(shù)支撐。

圖7 小區(qū)方位角錯(cuò)誤實(shí)際效果圖
圖8是實(shí)施例中接反小區(qū)實(shí)際效果圖,圖8中(a)和(b)的藍(lán)色加粗線條標(biāo)注的扇形區(qū)域和紅色加粗線條標(biāo)注的扇形區(qū)域表示兩個(gè)相鄰小區(qū),小區(qū)周邊的各小圓圈表示采樣點(diǎn)。參見圖8中的(a)圖可知,利用本方法提供的上述預(yù)測(cè)模型,基于采樣點(diǎn)的數(shù)據(jù),預(yù)測(cè)出第一個(gè)小區(qū)(紅色加粗線條標(biāo)注的扇形區(qū)域)的方位角預(yù)測(cè)值為300度,而實(shí)際勘測(cè)第一個(gè)小區(qū)的方位角為187度;參見圖8中的(b)圖可知,基于采樣點(diǎn)的數(shù)據(jù),預(yù)測(cè)出第二個(gè)小區(qū)(紅色加粗線條標(biāo)注的扇形區(qū)域)的預(yù)測(cè)方位角為120度,而實(shí)際勘測(cè)第二個(gè)小區(qū)的方位角為293度,可見,這兩個(gè)相鄰小區(qū)的預(yù)測(cè)誤差很大,這提供給維護(hù)人員作為參考數(shù)據(jù),維護(hù)人員現(xiàn)場(chǎng)核查發(fā)現(xiàn)這兩個(gè)小區(qū)的天線被人為接反,此算法為平臺(tái)軟件快速甄別接反小區(qū)提供了理論及技術(shù)支撐。

圖8 接反小區(qū)實(shí)際效果圖
本文提出了一種基于用戶數(shù)據(jù)實(shí)現(xiàn)天線方位角糾偏的方法,將五種預(yù)測(cè)算法聯(lián)合在一起,規(guī)避了單獨(dú)算法的一些缺點(diǎn),提高了方法的準(zhǔn)確性和穩(wěn)定性。經(jīng)實(shí)際勘站證明模型的準(zhǔn)確性如下:預(yù)測(cè)偏差小于45度的小區(qū)占比達(dá)到96.88%,預(yù)測(cè)偏差小于35度的小區(qū)占比達(dá)到87.53%,預(yù)測(cè)偏差小于20度的小區(qū)占比達(dá)到80.39%,并且在各個(gè)場(chǎng)景表現(xiàn)一致。本文通過對(duì)分析的數(shù)據(jù)畫柵格級(jí)用戶數(shù)據(jù)RSRP熱力圖,獲得小區(qū)周圍的采樣點(diǎn)信息以及預(yù)測(cè)的方位角,通過更深層次的分析,可以找出工參中方位角錯(cuò)誤、接反小區(qū)等問題,以對(duì)運(yùn)營(yíng)商的工參數(shù)據(jù)進(jìn)行修正,對(duì)其網(wǎng)絡(luò)優(yōu)化工作具有指導(dǎo)意義。