宋東輝
(中國聯合網絡通信有限公司 鎮江市分公司,江蘇 鎮江 212000)
通過數據挖掘或人工智能手段在網絡分析過程中建立復雜的關聯規則,可以利用現有的數據對今后的網絡運營提出規劃和建議要求,也能夠根據用戶需要展開內容的綜合調控[1]。本次研究的重點也在于通過大數據分析得到理論基礎,建立起具體的量化標準,以定量化的研究和優化處理實現通信網絡規劃。
通信網絡優化涉及到的主要技術包括數據采集、數據分析、網絡分析以及網絡優化等不同方面,但無論采取怎樣的方法,都需要提前了解網絡的運行狀態才能開展相應的工作,讓采集過程更加具備現實意義。采集數據是開展通信網絡規劃的前提條件,而分析數據的關鍵也在于經過綜合分析來獲取基礎數據。
大數據理論所描述的大數據分析技術和數據挖掘技術等內容之間存在著一定的聯系。對數據進行分類之后可以判定數據的有效性,最后預測后續的數據內容是否是分析結果當中的常見組成部分。從根本上看,是利用計算機的良好處理能力整體規劃科學的軟件技術。
數據庫作為存儲數據的主要載體,給通信網絡規劃工作提供了關鍵的信息保障和信息處理功能。具體而言,可以直接通過定義數據管理機制的方式完成數據采集,按照數據關聯規則直接通過數據庫進行內容分析和問題定位,更加明確網絡規劃優化的措施和方向,然后提供問題的解決方案并提高網絡服務質量。在當前的通信網絡規劃過程中,存在著的主要問題是大量的數據無法進行精確的信息篩選。雖然設備都能夠滿足數據存儲和互聯的要求,但僅僅只停留在這些層面是不夠的。為了綜合利用這些數據并了解數據模式與特征,就需要重新定位不同用戶區域的業務模式。對于某些業務類型,如果使用量較大可以綜合評估群體業務的發展趨勢,針對特定的工作目標以推進定向服務,保障服務效率和服務價值[2-4]。
在對大量的基礎數據進行分析和篩選之后,需要將其中符合要求的部分作為計算機技術的支撐對象。因為一個地區的通信網絡涉及到很大規模的數據,因此可以通過決策樹的方法來獲取決策支持,對日常優化工作中涉及到的大量數據進行問題處理和定位。從本質上看,決策樹作為一種用于預測數據模型的算法,可以有目的地將基礎數據展開分類,然后獲取一些更加具有價值的深層次信息,實現快速分類的發展目標,使用價值突出。
聚類分析是從大數據分析技術的基礎上發展而來,能夠在保障速度和質量的前提下對復雜的數據信息進行定義分類,然后選擇當中的接近數據進行量化評估,從同類型的數據中提取出有效的信息,實現對于數據的精確提煉,數據也會因此達到一個比較高的層次。從通信網絡的具體運行標準來看,在網絡規劃領域包含前臺和后臺兩個部分的工作,前臺工作主要指的是道路測試和定點測試等工作,而后臺工作則涵蓋了網絡KPI分析與優化等。這里所提出的數據分析優化就是基于聚類分析來展開的通信網絡數據處理。在目前的工作要求之下,網絡規模不斷擴大,網絡優化工作實際上需要從形式和方法層面進行調節,不僅要在工作內容上科學規劃,還要考慮到網絡建設與網絡優化的全過程,每個步驟之間相互聯系但并非獨立存在,需要做好前后的步驟銜接與周圍環境的合理協調。特別是在數據量比較大的時候,僅僅依靠人力資源很難統籌兼顧到所有的工作要求[5-7]。
按照前文有關通信網絡的結構說明內容可以看出,通信網絡優化過程的首要工作就是綜合調節數據庫,而在數據庫當中創建表就是移動通信網絡在優化之后的常見操作。一般情況下,網絡建設完成運行投入之后會保持一個相對固定的數據庫結構狀態,因而需要朝著數據庫內部添加某些關鍵數據,這不僅可以實現對網絡運行狀態的監控,而且可以及時地發現可能存在的網絡問題。需要創建的內容包括網絡網元表和基礎配置表等專業數據,這些數據共同地構成了數據庫的主要內容,同時也可以被作為通信網絡的信息而存在,具有良好的集成特性。如果創建查詢表,也可以從數據庫的不同表中提取出需要的數據,然后將所獲取的關鍵信息共同地組建成為一個新的表格內容,更加直觀地獲取數據并進行展示。即便在后期要進行數據庫更新,也能在固定的周期之內采集并分析有關數據,保障技術人員可以在短時間內完成對通信網絡性能的評估和監控,一方面處理現存的故障問題,另一方面合理地預測網絡發展的客觀趨勢。
當數據庫內容完善且數據準確率得到保障時,就可以通過聚類分析正式地開展通信網絡規劃工作,準確定位網絡問題并探討業務需求的實際情況。這里涉及到對所有指標的列舉和分析,然后將不同的類型和類別賦予權重,按照重要性差異和優先級別進行加權平均,得到相應的指標評估體系,所得出的網絡KPI評估結果才會更加合理而有效,具有應用價值[8]。具體而言,通過數據庫存儲和聚類分析可以建立后臺的通信網絡數據優化模型,對于數據的采集過程來說,可以定位某些反應網絡真實情況的數據,進行分類。后臺數據類型如表1所示。

表1 后臺數據類型
可以看到,后臺數據類型可以按照不同的分類標準來進行評估,在此基礎上加權之后獲得更加科學合理的聚類分析模型。按照所提取的數據屬性和對應的數據特征之后,可以將其劃分為不同的內容標準。例如在質量類型方面可以了解到通信質量和網絡性能,這些數據在某種程度上可以反映出某一個區域用戶對于通信網絡的使用情況,為后續的資源配置工作提供合理的數據參考借鑒。而業務類型可以反映出通信網絡是否需要進行擴充、是否需要對性能進行調節等??偠灾?,通過此類分類手段,可以將表面上看似無關的內容全方位地進行分類聚合,然后建立模型后就可以將準確率較高的指標體系應用于通信網絡的規劃工作當中。而某些指標越高,代表的就是此類指標的價值越高,網絡資源配置工作和用戶行為之間的密切聯系也可以被作為內容規劃時的主要組成部分,按照后臺數據庫的特性建立模型和規劃工作[9]。
后臺數據的優化正是利用聚類分析模型所需要實現的結果,針對后臺數據展開問題定位后就可以給出具體的內容和建議,以大數據處理分析方案來獲取不同類型的關鍵指標。通過關聯規則方法分析通信網絡的配置情況后,可以在后續工作環節確定某些優化建議和工作內容是否需要循環。
關聯分析的重點在于以分析方法獲得穩定的數據群體資源,完成層次信息篩選。
在當前的通信網絡中可能會存在著一些問題,而這些網絡問題逐漸成為各個運營部門重點關注的考核指標?,F代通信網絡的快速發展和用戶數量的大規模增加讓很多關鍵的數據未能得到及時解決,如果對每個問題都安排人員進行回訪和調度,不僅工作效率較低,而且人員配置也無法滿足實際的工作需求。如何對這些存在的問題甚至是矛盾缺陷展開分析和定位,是今后工作當中需要密切解決的問題。
通過關聯規則可以將相應的問題內容和業務類型展開分析和定位,在形成關聯體系之后確定內容區間,對某一個時間段內產生的問題綜合地進行聚類分析,針對某些情況來建設評估體系。評估體系建設環節會針對不同的評估項目建設科學合理的KPI指標體系,每個指標體系的權重不同,數據結果和指標體系之間的密切聯系也有助于展開對結果的雙向驗證,將基于關聯規則的內容處理方法應用至整個網絡區域[10]。
網絡問題數據采集可以通過處理系統實施,對接通信網絡相關的數據信息,在獲取某些區域的信息之后便具備了關聯分析模型的數據基礎。如果將這些數據和網絡覆蓋、網絡接入以及資源分配等內容進行綜合分析,就能建立基于關聯規則的投訴分析模型,但仍然要確定如何通過計算機來展開更大規模的網絡運營問題。所采集的數據本身并不具備互聯特性,是通過關聯分析之后得出的聚類分析結果,如果要借助計算機的處理能力從大規模的數據中定位相關信息,也可以利用到之前的數據挖掘技術獲取問題定位數據。此時通過模糊搜索技術將某一個時間段內的內容展開分類評估之后,就能得到一份相對完善的網絡問題評估報告。報告中的內容無論是采取降序分析還是升序分析,都可以獲取一份比較完善的結果。獲取了網絡性能數據和網絡基礎資源數據后就可以建立評估體系,并針對不同類型的評分項設置出對應的KPI指標體系,設置好評分項權重建立網絡和數據信息的對應關系。
在當前的通信網絡領域當中,網絡規劃工作與網絡道路測試密切相關,通過道路測試不僅可以了解到網絡移動性能的優勢和劣勢,同時還可以了解到哪些區域真正地被覆蓋,哪些區域是當前網絡覆蓋的盲區,從而確定區域內的通信網絡運行狀態,以點到面地對服務質量作出全方位考核。矩陣分析的數據流圖1所示。

圖1 矩陣分析的數據流程
實際上,傳統的道路測試和問題分析都是發現問題與解決問題的過程,就是此時問題已經產生,且優化人員是通過相應的規劃手段確定發生了問題的部分。顯然這種工作模式比較被動,且對于通信網絡覆蓋比較大的區域來說,網絡建設工作的道路測試成本將變得更高。但進行分析時可以通過已經發生過問題的點和區域來結合網絡數據進行反向驗證,確定那些已經發生過問題的區域是否真正產生問題,然后再以正向預測的方式列舉出可能存在隱患的區域和部分,為后續的工作優化提供合理的參考建議。
矩陣分析所獲取的數據內容指的是在某個時間段內收集的網絡底層數據。在網絡當中直接開啟測量數據可能會占用一定的資源,此時在默認狀態之下建立矩陣分析模型的重點在于確定測量周期保障網絡基礎數據的有效性。使用最新的干擾矩陣生成方式也能從根源上縮短數據獲取的時間,防止因頻率和區域等因素出現的干擾問題,迅速定位存在干擾和問題的區域。例如建立干擾矩陣和采樣點展開分析評估過后,可以定位網絡中存在的問題,提出解決措施,制定優化方案全面地提升通信網絡服務質量,節省大量測試工作。
互聯網的發展趨勢下,通信網絡的業務主體和工作重心將發生顯著改變,國內關于通信網絡的重點也發生了偏移。今后工作環境的改變和數據分析模式的轉變升級可以以更加穩定的技術措施來完成內容的篩選?;陉P聯規則的數據分析、基于聚類分析的數據優化以及基于矩陣分析的預測過程都可以被納入網絡規劃的工作內容中。