【摘要】針對移動網絡中存在著很多基站閃斷和短歷時中斷(以下統稱為瞬斷)的情況,筆者和同事進行了專題分析。根據移動無線網和傳輸專業組網結構和維護經驗,總結出基站瞬斷的常見原因和具體應對措施,并在實踐中進行了應用,取得了較好的效果,為移動基站瞬斷的故障處理提供了很好的經驗借鑒。
【關鍵詞】瞬斷傳輸基站時鐘
一、第一方面:傳輸相關原因
1.傳輸環不規則倒換或者單板劣化導致誤碼,進而影響到基站中斷:在對各傳輸廠商的傳輸環網通過人工切換、拔纖模擬的環倒換測試中,基站沒有出現瞬斷和告警的現象。這表明按照規范設計的傳輸設備和基站間不存在配合問題,傳輸環倒換并不是造成基站瞬斷的原因。而在日常維護中,確實會出現環倒換時基站中斷的現象,其原因在于光纜中斷的過程中,會有一個受損的過程,此期間誤碼率增高;傳輸設備單板故障或性能劣化(包括SCB、OI2D、SP2D、EFT單板),保護功能無法正常啟動,也會使基站業務頻繁瞬斷。2. 2M傳輸線及接頭故障:由于工程時制作質量不高,如果存在虛焊等情況時,極易造成基站瞬斷。這種情況下,基站瞬斷通常會逐漸頻繁,嚴重時基站不再瞬斷而是長時間退服,需重新制作接頭即可解決問題。3.光端機或基站接地不良、用戶機房電源線干擾:接地不同或不良會使兩者間存在一個電壓差,這將使誤碼的機率大大增加,導致基站瞬斷以至無法正常工作,交流電源對2M纜進行干擾,這些情況下往往掛表測量時沒有誤碼出現,但可以通過測量電壓或者布放替代路由2M線發現問題所在,在確保兩者共地和2M線避開交流電源后基站將恢復正常。
二、第二方面:環境及電源因素
1.設備溫度過高:基站空調壞或設備過濾網堵塞可能導致設備高溫,設備溫度達到一定程度后,可能會導致設備瞬斷。2.停電原因:基站停電后,基站設備靠電池供電,當電池電壓下降到一定程度后(假設為45V),基站會中斷,基站中斷后,電池電壓能有一定程度的上升,假設升到46V,基站設備又會開通,但是開通較短時間內又會使電池電壓下降到45V以下,基站再次中斷……,這樣即會導致基站瞬斷。
三、第三方面:基站設備本身故障
1.硬件故障:MOTO GSM基站傳輸接口板NIU或BSC側的MSI板存在故障也會導致基站瞬斷,中興基站CMM板、CMB板故障可能會導致基站反復重啟;2.基站傳輸參數設置:通過合理設置MOTO??GSM系統傳輸參數,可以減少基站退服的發生和基站退服時長,其中關鍵是BER_OOS_MON_PERIOD和BER _RESTORE_MON_PERIOD這兩個參數。BER_OOS_MON_PERIOD參數是一個時間值,當E1傳輸線路誤碼在此期間的平均誤碼超過門限時,基站將自動退出服務。BER_RESTORE_MON_PERIOD也是一個時間值,當基站因傳輸誤碼自動退出服務后,只有在這個時間內,傳輸誤碼率保持低于10-6,基站才會自動恢復服務。3.電源模塊負荷過高:MOTO基站規范上要求載頻數大于等于4時,需配置2塊電源模塊,當基站載頻配置較多,而電源模塊配置不能滿足要求時,導致電源模塊負荷過高,這可能會導致基站瞬斷。
四、第一方面:針對傳輸相關原因,采取如下措施
1.優化傳輸環網結構、檢查網絡倒換參數、路由梳理和老舊設備替換:(1)優化網元數量過多、結構復雜的傳輸環網,將其中的小環網業務割接至其他網元,減少環網嵌套的結構,降低了因環網異常倒換造成業務瞬斷發生的幾率。(2)對匯聚層以上設備配置的保護情況按季度、月度定期進行核查整改,特別是MSP線性1+1和MS-SPRING環網的保護倒換問題進行清理。將MSP線性1+1(除特別需求如BSC外)保護統一規定為單端非恢復式倒換模式,每月進行非恢復倒換的清理,保證網絡處于正常狀態,保護設置完好可靠。(3)將承載移網基站的傳輸ASON二平面的資源情況進行梳理,減少迂回ASON網絡路由緊張的情況,避免承載基站的ASON網絡資源緊張導致基站業務重路由時間過長引發基站瞬斷。2.嚴格把關2M傳輸線及接頭施工質量、排查光端機或基站接地不良和不共地、改變業務開通方式、改進驗收測試方法:(1)針對工程質量中出現的2M傳輸線纜焊接不過關的情況加強隨工和驗收抽測的力度。(2)針對偏遠基站接地不良和基站、傳輸不共地的情況和用戶機房2M線纜受交流電影響進行專項排查并立即解決。(3)結合IBSC建設,將原通過2M電口轉接2G電路,通過155M光口與IBSC對接開通業務,通過傳輸1+1/SNCP保護等方式,全程通過VC12直接開通,去除了2M電口轉接環節,大大降低了因2M線纜故障導致的基站瞬斷和。
五、第二方面:針對環境和電源原因
(1)加強基站巡檢,及時維修基站空調,及時更換或清洗基站過濾網,防止過濾網堵塞。(2)針對停電導致基站頻繁瞬斷、且對用戶使用造成頻繁切換的情況,由無線專業將基站暫時LOCK,等基站來電或者發上電后,再將基站恢復。