文|中國通信建設集團設計院有限公司二分公司 王 玲
如圖1所示,CDMA網優模型由動靜兩部分構成。靜態部分由物理層、協議(參數)和用戶組成。靜態部分實際上是一個可以自己運行的網絡系統,但是無法修正網絡變化和網絡缺陷帶來的服務問題。動態部分由各種網優動作及其對網絡的變動組成。動態部

圖1 CDMA網優模型圖
如果把網絡優化看作一個系統的話,那么這個系統是由各種客觀存在組成的,包括時間、空間、事件、物理層、協議、參數、性能統計及工具等客觀實體,以及把這些實體組織聯系起來的對比法、排除法、綜合法等網優分析方法。
(1)時間
時間往往和事件捆綁在一起,主要是所有網優事件,即并行的和串行的網優事件在時間上的排列結構,包括網絡軟硬件的變動、各種對網絡的操作、各種告警、各種指標的跳變、網絡空口環境的變化、用戶行為變化等在時間軸上的分布和相互關聯。
時間模塊的重要性在于各種事件之間往往在時間上橫向或者縱向相關,清楚這一點就可以利用對比法和排除法迅速找到各種網絡異常情況的原因或者問題的切入點。實際上這是最簡單的也是最重要的一點,但是往往被忽略。
(2)空間
主要是指覆蓋區內的地理環境、網絡接入設備的地理分布、網絡拓撲結構、空口信號質量和信號結構情況、用戶數量分布等。
空間包含的內容中,地理環境、設備的地理分布、用戶數量分布和網絡拓撲將會影響信號結構和信號質量,而空口的信號質量是移動網絡優化的核心,也是網優分析的起點和歸宿。網優工作做得再多再復雜,從等效的觀點來看無非就是做足夠容量、足夠質量的信號優化。
(3)物理層
對移動網絡優化來說,有線部分相對成熟可靠得多,主要是做空口部分。所以物理層主要指網絡設備空口物理層硬件,包括天線方位角、下傾角、掛高、天線型號、功率以及其他板件等。物理層是空間信號結構的直接決定因素,它的調整直接關系到Ec/Io的變化。
(4)事件
事件同時間。
(5)協議
和網優有關的協議可以分為靜態協議和動態協議。靜態協議主要指信道和信道結構、幀結構等;動態協議主要指接入、切換、登記、釋放等行為的步驟和規范。
協議與參數及物理實體三個要素構成網絡架構, 所以它對于通信網絡至關重要。這不僅體現在系統設計上,也體現在網優的應用上。協議不僅是網絡行為規范,同時也是網優分析中的重要參照點,是網絡的系統設置和精細網優、問題查找的重要依據。協議的網優應用在于:可以認為凡是違反協議的都會出錯。所以應用對比法,以協議為參照,考察問題點的協議和信令流程等,就可以找到問題的原因或者切入點。
(6)參數
主要指關系網絡性能的各種參數,包括系統參數和非系統參數,即基本參數、登記參數、接入參數、功率控制參數、切換參數、各種信道參數以及和業務配置相關的參數。
參數是CDMA網優的重要元素,和協議一起構成網絡的軟架構。參數的作用體現在兩個方面:一是正確的參數配置是系統正確運行的重要基礎之一;二是優化的參數配置是網絡性能得到較大或最大發揮的重要因素和手段之一。反過來說,參數引起的網優問題有兩類:參數配置錯誤(不符合協議規定)引起的系統運行出錯和參數設置不當導致網絡性能得不到較好發揮。
參數的優化方法有多種(當然首先要保證參數設置正確,網絡正常運行),一般按照先整體后局部的辦法來做,即先優化系統參數,再做局部的參數優化。另有一種方法也較為可行,即等效Ec/Io法。這種方法是將現有網絡和原始移動通信網絡作對比,把所有參數的調整等效于Ec/Io的調節,甚至所有網優動作都等效于Ec/Io的優化。因為最初的網絡較為簡單,只要空口有足夠信噪比的信道即可通信,后來發展的網絡等效于在此基礎上增加對信噪比的限制和調節。在已經商用的網絡里,各種參數已經有了初始設置,以此為初始對照點,可以將參數按照提升還是降低兩類來做優化。
(7)性能統計及工具性能統計
分為兩種:主動和被動。主動是指DT/CQT等主動獲取網絡性能表現的行為;被動是指通過各種軟件系統收集網絡的性能統計數據以及用戶投訴。工具是指各種測試分析和性能統計軟件。
這部分是獲取網絡性能的唯一通道,是所有網優項目必不可少的環節。
CDMA網優模塊的虛體部分是指為了完成某一網優項目,運用相應的實體模塊進行分析的方法,一般有對比法、排除法和綜合法三種。
(1)對比法
對比法是一種很高效的方法,因為它是以已知的正確存在作為參照物來做比較運算,實質上是一種簡單的邏輯運算。對比不僅是將事物在時空上聯系起來,而且是進行比較運算后得出一個差異,通過分析差異包含的信息得出有用的結論。因此說沒有對比就沒有判斷,對比是邏輯思維的基礎。對比法應用在網優的方方面面,比如:分析信令要以信令流程為參照,調整參數要以調整前后效果做對比選優,查找RSSI異常原因常常對調射頻通路做比較,從而做出判斷,實測指標與正常指標對比,實測性能指標空間結構與正常結構對比,更換正常部件后和原系統相對比,看故障是否消除來判斷問題點。
(2)排除法
排除法是通過快速排除正常部分來判定問題范圍,從而為后續的問題查找和排除提供便利的方法。排除法也是一種高效的網優分析方法,它基于這樣的事實:通信網絡中排除嫌疑要比肯定問題容易得多;這是由通信網絡的網絡特性和業務特性決定的。排除法是一種典型的反向思考問題的方法,它通過舉證的辦法將嫌疑一步一步地從較大范圍縮小到盡量小的范圍,再用綜合法找到問題,符合先易后難的處理問題的原則。
(3)綜合法
網優是由上述七大要素組成的復雜系統,其間聯系錯綜復雜。對比法只是一對一的比較,不能做橫向和縱向的聯系分析;排除法能將問題原因圈定在一定的范圍內,但是對問題區域內部的分析常常無法深入進行。所以說對比法和排除法只是網優分析的利器,但是只能用在局部分析當中,對于聯系復雜的系統分析必須用到綜合分析法,實踐當中網優分析常常是“排除(對比)——綜合”這樣的順序。
綜合法著眼于系統的內部聯系和作用,綜合運用對比、排除、假設、聯想、推演等方法進行分析并匯總各種結果,找到問題原因。網優往往不是一個定量的精確系統,在無法精確定位原因時,綜合法也可以將各種分析路徑、分析結果綜合起來,找出共同的結論指向,從而基本上確定問題原因。
可以把CDMA網優抽象成為如圖2所示的過程。

圖2 CDMA網優過程圖
CDMA網優本質上是很簡單的,它以“挖掘網絡潛力,提升網絡質量”為核心,是一個“發現問題——解決問題——發現問題”的循環過程。但是實際的網優工作較為復雜,在網絡發展的不同時期有不同的側重點,所以實際的網優工作名目較多,一般按照網絡發展的時間和優化的對象屬性將網優分為新站工程優化、片區優化、系統優化、日常網優、專題網優、投訴問題處理等。這些優化項目均可按照圖3所示的流程進行。
圖3中沒有列出對比、排除、綜合模塊,這是因為這些虛體模塊貫穿在流程的每一個環節,所以沒有表示出來。流程注解如下:
(1)網優問題的提出分兩類:其中一類是投訴等直接獲得問題的途徑;另一類是性能統計模塊里的測試和話統指標的途徑。若是投訴則直接發現問題。
(2)除了投訴,剩下的發現問題的途徑就是性能統計模塊了。這里是指用DT&CQT和話統數據、性能數據等途徑來分析,從而獲得網優問題。該模塊一般都能找出問題,至少可以按關鍵性能指標做TOPN排序,找出最差載扇處理。至于做怎樣范圍的分析,則要視具體的網優項目來定。新站優化需分析單站和周圍基站指標,網格優化則要對基站簇進行分析等,分析的指標也視需要而定。分析采用的方法常常是對比法,即統計值和正常值的對比、不同時間點指標的對比、載頻間指標對比、指標結構和正常狀態的對比、區域上指標的對比等。
(3)此處進行判斷,若是投訴和性能統計的途徑都沒有發現問題則流程結束,若是發現問題則轉到時間模塊分析。
(4)進入時間模塊。
(5)判斷網優事件的時間特性。時間模塊里首先要明確該網優問題發生的時間點,任何網優問題都有出現的時間點,若有則進入環節(20)分析;實際上相當多的網優問題往往無法明確出現的時間點,若沒有則進入環節(6)分析。

圖3 模塊化優化流程圖
(6)問題沒有時間特性,接下來要用性能統計模塊分析來確定問題的區域范圍。這時可以統計出涉及該問題的基站(載扇)的特性,即物理上、地理上和邏輯上這些基站(載扇)的共同屬性。由此可以判斷問題發生的范圍,比如單個基站、某個尋呼區、BSC某塊接口板、某個局向、某個BSC等。鎖定問題涉及范圍是快速準確定位問題原因的重要手段之一,是提高效率的必要條件。
(7)進入空間模塊分析。
(8)空間模塊首先要檢查問題點的空口信號質量情況。此時需要用性能統計模塊獲得現場的信號質量情況。信號質量檢查包括現場Ec/Io、TxPower等參數,這是一個重要的分析環節。
(9)若是空口信號質量良好,則轉到環節(18)進 行分析,否則轉到環節(10)分析。
(10)對于空口信號質量不好的情況要做干擾的排查。主要是檢查頻段內的上下行干擾,手段包括 RSSI歷史分析、頻譜儀掃描、測試數據指標分析等。
(11)若是沒有干擾則進入環節(12)分析;若有干擾則排除干擾或者采取減小干擾的措施,此后如問題解決則結束流程。
(12)若是沒有干擾出現則進入物理模塊分析。主要是檢查物理硬件的健康狀況,檢查物理硬件的參數(比如天線工參等)是否設置合理,檢查各信道功率的設置情況。物理上的檢查類似維護上常用到的一些邏輯方法,用到對比、排除、綜合邏輯模塊,比如典型的RSSI排查等。
(13)若問題仍未解決,轉到環節(14)分析。
(14)參數模塊首先檢查和空口信號質量緊密相關的各種參數設置,包括信道設置參數、信道功率設置參數、搜索窗設置等。
(15)問題仍未解決則進入環節(16)分析。
(16)協議模塊常常是分析的最后一個環節。這個環節首先要按照相關流程來回顧一下前面所有環節是否符合協議規定;其次可以通過DT&CQT取得數據來做信令分析,參照協議規范,找出不合理的地方,做出修改。
(17)若是問題仍未解決則從頭開始再做分析,問題解決則結束流程。
(18)此處須對用戶行為、用戶終端情況、終端使用習慣等網絡以外的因素做分析。是否單個用戶問題, 用正常的測試機對比可知,測試機使用正常則可排除網絡原因,再來查找用戶或者終端原因。
(19)若是用戶原因,此時一般不需要運用其他模塊做詳細分析,往往問題原因較為簡單。若是測試機使用出現同樣問題,則需從環節(14)起分析。若是群體用戶行為原因,一般只會是話務增多的情況,環節(6) 可以判斷這個情況。
(20)若有時間特性,則進行如下分析:盡量找到同樣的時間點附近所發生的網優事件。假設所有的網優事件都有詳細記錄或者都是知道的,那么一定可以有一些事件和該問題相對應,由此就可以找到解決問題的切入點。但是實際上網優事件有的因為發生較為隱蔽而沒被注意到,有的因為沒有記錄或沒有溝通而被遺忘,所以不是每個網優問題都能找得到相應的事件。
若有網優事件和問題時間點對應,馬上就可以找到問題的切入點,鎖定問題產生原因。接下來可以綜合運用各模塊做分析,一般來說這個時候問題的解決就相對簡單。若找不到事件和問題時間點對應,則按照環節繼續查找。
(21)以后的流程來查找問題原因。最后需要說明的是各模塊之間沒有明確的界限,也并非每次都要用到所有模塊,流程的順序也不是一成不變的。只有充分了解各模塊的特點,在一般化的流程之上根據實際靈活運用,網優的思路才能更清晰,效率才會得到提高。
2010年8月3日接到反映稱314國道阿克蘇-柯坪路段經常掉話,應用模塊分析法處理如下:
(1)時間模塊
首先在維護臺查詢該區域基站相關告警,結果是沒有告警。同時近幾日沒有什么網絡操作,網絡變動的原因排除,用戶行為上也沒有異常,該掉話的時間特性不明確。
(2)性能統計模塊
在M2000上查詢該區域各載扇的掉話統計信息,沒有發現明顯的時間特性,掉話率也不是明顯異常,掉話原因也都是空口信號誤幀過多。同時統計到各載扇RSSI、駐波比等性能參數正常,接下來對掉話點314國道阿克蘇-柯坪路段做DT測試。
(3)空間模塊分析
發現314國道阿克蘇-柯坪全路段測試正常,空口信號質量良好,但是途中阿克蘇阿音柯16大隊與阿音柯18大隊中總是出現掉話。掉話前幾秒鐘指標空間異常,即接收電平始終較好,但是總的Ec/Io急劇變差,直到掉話后重新鎖定小區后Ec/Io才恢復正常。期間幾部測試機都是同樣現象,所以基本排除用戶的原因。
(4)性能統計模塊
分析DT數據發現掉話前幾秒鐘,終端一直占用阿音柯16大隊-1扇區直至掉話,之后占用阿音柯18大隊-2扇區恢復正常,這種情況表明出現了干擾。DT時頻譜儀一直在掃描,沒有發現干擾,之前的RSSI等檢查也表明沒有干擾。因為反向測試一切正常,前向測試也沒有發現帶外干擾,所以物理上出問題的可能性較小,暫時排除物理模塊。
(5)參數、協議模塊找不到帶外干擾,在帶內查找干擾
上述的測試現象很像是鄰區漏配,于是檢查阿音柯16大隊-1扇區和阿音柯18大隊-2扇區的鄰區關系,已經互配。接下來取 DT信令分析,發現掉話前幾秒鐘終端取用阿音柯16大隊-1扇區信號,隨著終端逐漸遠離阿音柯16大隊,該站-1扇區信號逐漸減弱,而同時阿音柯18大隊-2扇區信號Ec/Io逐漸占據主導,終端多次向基站發送PSMM消息請求切向阿音柯18大隊-2扇區,但是奇怪的是對該請求基站始終沒有響應, 于是總的Ec/Io越來越弱直至掉話。到此,問題原因確定阿音柯16大隊-1扇區無法切換到阿音柯18大隊-2扇區。檢查切換請求期間空口信號質量沒有問題,切換門限等參數設置沒問題。
初步的參數檢查沒問題,但是問題的范圍已經鎖定,就是切換不成功;并且基本排除空口信號原因(M2000里的切換失敗原因為“其他”,也表明非空口質量原因)。所以接下來就只有參照切換流程,將涉及到的配置、參數等認真核對,最后發現,兩扇區分屬不同BSC,在給阿音柯16大隊-1扇區配置阿音柯18大隊-2扇區的外部載頻時,將后者所屬BSC的IP地址配錯了。改正之后測試恢復正常。
(6)后續處理
最后還需明確此類問題的范圍,即要把有相同問題的載扇找出。把BSC間邊界的所有載扇的外部BSC IP檢查一遍,發現兩個載扇有同樣的問題,進行了及時的修改。
(7)小結
在網優的過程中,利用模塊化得流程,思路清晰,可以快速找到問題的原因、關鍵點,迅速的解決問題,大大的提高了網絡的運行質量,同時節省成本。