舒榮 聶祥松 王龍龍
(貴州航天計量測試技術(shù)研究所,貴州貴陽 550000)
據(jù)GSMA統(tǒng)計,截至2021年4月,我國5G通信基站建設(shè)總數(shù)達到819000個,商用規(guī)模位居全球首位。在5G時代全面到來背景下,需進一步加快5G技術(shù)與大數(shù)據(jù)技術(shù)的融合進程,聚焦數(shù)據(jù)采集、篩選、挖掘、分析、存儲、管理以及可視化等層面強化技術(shù)支持,更好地滿足數(shù)據(jù)增長需求,提升數(shù)據(jù)資源利用價值。
將5G技術(shù)應(yīng)用于通信網(wǎng)絡(luò)建構(gòu)中,涉及數(shù)據(jù)訪問層、基礎(chǔ)數(shù)據(jù)層、運營商日志數(shù)據(jù)群等不同結(jié)構(gòu),拓寬原有數(shù)據(jù)傳輸容量、使得數(shù)據(jù)類型日漸復(fù)雜化,需圍繞若干環(huán)節(jié)進行數(shù)據(jù)采集,相應(yīng)對于不同類型數(shù)據(jù)的分析與處理能力提出更高要求[1]。然而5G通信技術(shù)自身缺乏數(shù)據(jù)分析處理能力,仍需依托大數(shù)據(jù)提供技術(shù)支持,適應(yīng)復(fù)雜網(wǎng)絡(luò)環(huán)境下的數(shù)據(jù)捕捉、分析處理需要,為5G通信網(wǎng)絡(luò)的正常運營提供保障。
將超密集組網(wǎng)技術(shù)應(yīng)用于5G通信網(wǎng)絡(luò)建構(gòu)環(huán)節(jié),形成異構(gòu)的超密集組網(wǎng)架構(gòu),但受其結(jié)構(gòu)特征影響,這種組網(wǎng)架構(gòu)不具備對邊緣數(shù)據(jù)的良好感知能力,局限于依托主體架構(gòu)進行數(shù)據(jù)采集,增加邊界通信數(shù)據(jù)被截取的幾率,進而影響到數(shù)據(jù)采集結(jié)果的完整性,不利于后續(xù)進行通信數(shù)據(jù)分析及有效利用。
當(dāng)前5G網(wǎng)絡(luò)建設(shè)需應(yīng)用大規(guī)模智能天線、完成高密度基站的部署,但在實際通信網(wǎng)絡(luò)建構(gòu)環(huán)節(jié),大規(guī)模天線、基站間將產(chǎn)生信號干擾,削弱數(shù)據(jù)傳輸質(zhì)量,造成網(wǎng)絡(luò)卡頓、延遲等問題。基于此,還需引入大數(shù)據(jù)技術(shù)進行不同類型傳輸數(shù)據(jù)的分類處理,消除信號干擾,提升數(shù)據(jù)傳輸質(zhì)量與響應(yīng)速度。
鑒于5G通信網(wǎng)絡(luò)中的數(shù)據(jù)傳輸總量較大,需引入數(shù)據(jù)采集技術(shù)實現(xiàn)對通信網(wǎng)絡(luò)中不同數(shù)據(jù)源數(shù)據(jù)的分別采集,配合數(shù)據(jù)篩選技術(shù)進行海量數(shù)據(jù)的篩選、提取以及清洗,濾除錯誤數(shù)據(jù),使得數(shù)據(jù)結(jié)構(gòu)更加明晰,為下一階段的數(shù)據(jù)分析與挖掘創(chuàng)設(shè)良好條件。在IoT規(guī)模化部署背景下,可引入mMTC技術(shù)建構(gòu)5G典型應(yīng)用場景,支持海量數(shù)據(jù)連接,配合CS技術(shù)的應(yīng)用提升數(shù)據(jù)傳輸性能,滿足5G應(yīng)用mMTC場景下的數(shù)據(jù)采集需求[2]。
例如基于CS架構(gòu)進行數(shù)據(jù)采集方案的設(shè)計,主要包含以下3種類型:(1)正則化子空間追蹤算法(RSP),先對通信數(shù)據(jù)進行預(yù)處理,消除由原始稀疏信號x的加性噪聲引發(fā)的噪聲疊加問題,再以正規(guī)矩陣為基準(zhǔn)進行相應(yīng)列的選擇,確認(rèn)原始稀疏信號中的非零元素指數(shù)及其具體位置,最后通過保留最小均方根誤差獲取估計信號、達到最大的估計量,完成估計信號的更新處理。(2)基于隨機循環(huán)矩陣的模擬壓縮傳感采樣矩陣(SCM-ACS),以Zadoff-Chu循環(huán)序列為基準(zhǔn),先選取基準(zhǔn)數(shù)列進行循環(huán)移位,獲取若干個循環(huán)序列,利用該序列在自相關(guān)性上占據(jù)的優(yōu)勢將m個并行的子信道數(shù)量減少至1個,完成數(shù)據(jù)的篩選與處理。(3)隨機循環(huán)正交矩陣(RCOMACS),該矩陣采用模擬CS架構(gòu)建設(shè),能夠有效簡化移動通信網(wǎng)絡(luò)架構(gòu)在硬件配置上的復(fù)雜程度,利用Matlab求余函數(shù)循環(huán)移位模型,以m為周期實現(xiàn)周期延拓,借此減少并行子信道數(shù)量,優(yōu)化信號恢復(fù)效果。
在5G通信網(wǎng)絡(luò)建構(gòu)過程中預(yù)先完成數(shù)據(jù)采集、篩選后,需從海量模糊數(shù)據(jù)中挖掘、提取出具有潛在價值的數(shù)據(jù)信息,應(yīng)用聚類算法、機器學(xué)習(xí)等技術(shù)開展大數(shù)據(jù)分析,獲取到用戶的行為特征與需求信息,在此基礎(chǔ)上生成數(shù)據(jù)挖掘模型或序列模型,為后續(xù)5G通信網(wǎng)絡(luò)系統(tǒng)的完善與更新奠定良好基礎(chǔ)[3]。
基于K-Means聚類算法建立數(shù)據(jù)挖掘模型,輔助5G網(wǎng)絡(luò)基站選址部署。在聚類算法流程設(shè)計上,輸入量包括數(shù)據(jù)集X{x1,x2,…,xn}、鄰域率rr和分裂系數(shù)α,輸出量為K個質(zhì)心與各樣本的劃分,先選定一個初始質(zhì)心,完成樣本的統(tǒng)一歸類;隨后將每一個質(zhì)心設(shè)為ci,選取局部密度最大位置c'i進行ci密度的遷移;接下來進行分類決策,判斷是否分裂ci,完成當(dāng)前質(zhì)心、樣本的EM調(diào)整劃分;待觀察到當(dāng)前每一個質(zhì)心ci均未發(fā)生分裂現(xiàn)象后,即可結(jié)束算法流程,獲取到最優(yōu)K數(shù)值。將該聚類算法應(yīng)用于用戶網(wǎng)絡(luò)需求信息的挖掘?qū)用妫ㄟ^輸入用戶需求畫像獲得聚類結(jié)果、呈三維散點圖,將輸入數(shù)據(jù)劃分為黑色、深綠色、深藍色、淺綠色等若干個簇。觀察各簇的時長維度、上下行流量以及與原點距離,即可判斷各用戶簇對應(yīng)的網(wǎng)絡(luò)需求大小,可輔助供應(yīng)商完成用戶群體的分類、提供針對性服務(wù)。在此基礎(chǔ)上,從中抽選出網(wǎng)絡(luò)需求量大的用戶簇進行區(qū)域位置、歷史滯留位置等信息的分析,結(jié)合不同位置的需求量大小進行評分并投射在熱力圖上,其中顏色較深部位即對應(yīng)高評分區(qū)域,由此可供網(wǎng)絡(luò)運營商在此類區(qū)域進行5G基站的優(yōu)先部署,提高基站部署效率及性價比。
鑒于5G通信網(wǎng)絡(luò)中海量數(shù)據(jù)的激增,對于存儲空間的擴展性與數(shù)據(jù)分類功能提出更高需求,應(yīng)實現(xiàn)對結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)以及半結(jié)構(gòu)化數(shù)據(jù)的分類存儲與處理,還需引入大數(shù)據(jù)技術(shù)優(yōu)化通信網(wǎng)絡(luò)的管理質(zhì)量,為5G通信網(wǎng)絡(luò)運營創(chuàng)設(shè)良好環(huán)境。基于大數(shù)據(jù)技術(shù)建立5G網(wǎng)絡(luò)性能模塊的平面架構(gòu),主要由組件化管理模塊、分布式數(shù)據(jù)模塊、資源模塊3部分組成,其中組件化管理模塊包含NF-C、NF-U、開放網(wǎng)關(guān)、服務(wù)引擎、開放網(wǎng)關(guān)和接入模塊,利用統(tǒng)一接口實現(xiàn)與分布式數(shù)據(jù)模塊的連接;資源模塊包含網(wǎng)絡(luò)資源、存儲資源以及運算資源,為不同場景提供通信服務(wù)。
在混合云存儲模型建構(gòu)上,主要由公有云、私有云與供應(yīng)者3部分組成,其中公有云部分以較低成本支持?jǐn)?shù)據(jù)副本的存儲、存儲空間占用偏小,私有云部分采用密鑰進行數(shù)據(jù)加密存儲、保證用戶隱私安全,供應(yīng)者部分利用云存儲服務(wù)設(shè)備進行業(yè)務(wù)數(shù)據(jù)存儲、授予使用者訪問權(quán)限。在混合云存儲算法實現(xiàn)機制上,需預(yù)先明確大數(shù)據(jù)的彈性、聚合性與粒度等指標(biāo),基于數(shù)據(jù)訪問權(quán)限的等級進行混合云存儲模型梯度的劃分,并對照數(shù)據(jù)存儲請求將數(shù)據(jù)存儲至相應(yīng)節(jié)點處,由此建立的混合云存儲模型能夠最大限度減少存儲空間占用率,保證數(shù)據(jù)存儲的高效性與安全性,且維護云端其他數(shù)據(jù)的順利傳輸,具備良好存儲性能。設(shè)存儲梯度為Δ,數(shù)據(jù)彈性為ΔT(x),則大數(shù)據(jù)混合云存儲模型表示為:

在利用大數(shù)據(jù)技術(shù)篩選、提取有價值信息的基礎(chǔ)上,通過引入大數(shù)據(jù)技術(shù)建立圖標(biāo)或模型,實現(xiàn)對海量數(shù)據(jù)的量化處理與可視化呈現(xiàn),提升5G通信網(wǎng)絡(luò)服務(wù)質(zhì)量。例如引入大數(shù)據(jù)技術(shù)建立可視化互聯(lián)網(wǎng)金融平臺,利用AI攝像頭捕捉顧客面部頭像、自動生成ID,配合聚類分析、識別等算法的應(yīng)用進行顧客類型與關(guān)鍵顧客的界定,利用后臺管理模塊呈現(xiàn)出人流量、顧客運動軌跡等圖表數(shù)據(jù),供相關(guān)人員完成關(guān)鍵顧客群體的區(qū)劃、推出定制化服務(wù)項目,更好地拓寬互聯(lián)網(wǎng)金融的線下推廣機制,提升5G平臺運營與服務(wù)質(zhì)量。
將大數(shù)據(jù)連同云計算技術(shù)共同應(yīng)用于5G通信網(wǎng)絡(luò)建設(shè)中,其關(guān)鍵在于強化移動智能終端與云服務(wù)平臺建設(shè),保證實現(xiàn)終端與平臺間的快速響應(yīng)與穩(wěn)定連接,支持遠程控制數(shù)據(jù)采集、存儲及利用,為用戶查詢相關(guān)信息創(chuàng)設(shè)便捷條件。
總體來看,5G移動通信網(wǎng)絡(luò)建設(shè)需依托大數(shù)據(jù)技術(shù)提供支撐,為有效加快5G通信網(wǎng)絡(luò)的商用化進程,還需面向典型應(yīng)用場景與網(wǎng)絡(luò)部署過程中面臨的現(xiàn)實問題,引入大數(shù)據(jù)技術(shù)完善現(xiàn)有網(wǎng)絡(luò)架構(gòu),輔助數(shù)據(jù)采集、挖掘、存儲等模塊建設(shè),進一步優(yōu)化5G通信網(wǎng)絡(luò)應(yīng)用服務(wù)水平,促進數(shù)據(jù)服務(wù)價值效率的提升。