【摘要】 本文結合移動核心網MGW與RNC對接過程中出現的問題,介紹了分析問題、定位問題的思路及解決問題的方法。
【關鍵詞】 故障分析 故障定位 解決方法
一、引言
對設備維護人員來說,故障處理極為普遍,故障類型也多種多樣,在遇到故障時,能對故障準確定位,以最快速度恢復網絡的正常運行,除有一套網絡維護理論,還需要掌握故障分析判斷的方法。接下來本文將以MGW與RNC對接無法建立呼叫為案例,對發生的故障進行快速定位、分析并排除障礙。
二、問題處理總體思路及定位方法
設備開通過程中遇到故障,整體定位思路是:
1、接口跟蹤和用戶接口跟蹤
接口跟蹤和用戶接口跟蹤能夠直接觀察到交互的信令和業務內部處理流程,是我們定位業務相關問題最重要,最直接有效的手段。
接口跟蹤在話務量高時會嚴重影響系統運行,產生嚴重后果,只能在話務量非常低或調測階段打開。
用戶接口跟蹤對系統影響很小,不受話務量的限制,而且能夠將業務處理流程及與各接口的信令都跟蹤出來,是最常用、最有效的定位手段。
2、MTP鏈路信令跟蹤和信令儀信令跟蹤
有時候需要觀察MTP層收發的信令,需要跟蹤MTP鏈路,但現網由于話務量原因,往往不能打開鏈路跟蹤或消息量巨大,此時可以根據鏈路跟蹤的過濾器對消息進行過濾。
3、數據配置檢查
通過前面用戶接口跟蹤或鏈路跟蹤的結果,找到問題最早出現的可疑點,逐步排查各環節,檢查相關數據配置是否正確。
注意:需檢查是否有相關軟參,軟參值是否設置正確。
4、告警,話統,調試日志,操作日志
有時問題現象不局限于單個流程或呼叫,此時需要將BAM庫,告警,話統和日志進行綜合分析。
三、典型故障案例分析
3.1 故障現象
MGW與新建RNC設備聯調時,A用戶呼叫B用戶,A撥號后無任何提示音,直接返回重撥界面,B用戶無振鈴,但手機上會顯示有未接來電。
3.2 問題分析
3.2.1 故障判斷
(1)查看MGW設備,無告警;(2)基站與RNC 側均無告警,排除硬件故障導致此種情況的原因;(3)使用命令DSP SAALLNK、DSP N7DSP、DSP AAL2PATH分別查看信令面和用戶面的狀態均正常。
呼叫后被叫手機可以收到響應,說明信令面正常,可以初步判斷有以下幾類問題:(1)信令鏈路正常,懷疑為用戶面問題;(2)全局數據配置錯誤,導致未通先斷;(3)MGW與RNC對接數據有問題,用戶面參數問題。
3.2.2 信令分析
從MSOFTX3000側跟蹤A號碼消息:RN_RAB_ASSIGNMENT_RESPONSE消息內容如下:
此消息是對RAB ASSIGNMENT REQUEST的響應,是由RNC上報給3000的。
指配失敗,該消息中的失敗原因是Iu傳輸連接建立失敗(Iu Transport Connection Failed to Establish)。由此可見承載面建立不成功。核查MGW側用戶面數據腳本:
SET AAL2VMGW:BN=2,VMGWID=1,MAXUSERNUM=10240;
SET AAL2VMGW:BN=3,VMGWID=1,MAXUSERNUM=10240;
1號虛擬媒體網關對應的資源數為10240,而虛擬媒體網關0 上沒有分配任何ATM資源。
查詢本局虛擬媒體網關信息:
從上圖可以清楚的看到,虛擬媒體網關號配置錯誤,該問題就是錯誤所在:配置AAL2VMGW資源的時候,MGW的ASU單板可以通過設置,將其資源分配給不同的VMGW,檢查AAL2VMGW資源配置的情況,發現之前分配該資源的時候,把資源分配到一個錯誤的VMGW上,而實際使用的VMGW卻沒有分配到資源,從而導致呼叫時用戶面無法建立。
四、解決措施
1、重新配置AAL2VMGW資源,把資源分配給已定義的虛擬媒體網關VMGW,
SET AAL2VMGW:BN=2,VMGWID=0,MAXUSERNUM=10240;
SET AAL2VMGW:BN=3,VMGWID=0,MAXUSERNUM=10240;
再次撥打測試,正常,問題解決。
2、同類問題定位方法
(1)通常先查看失敗原因值,對原因單一的錯誤碼,直接定位原因;對通用錯誤碼,劃出可能的錯誤范圍;(2)排除RNC消息錯誤和配置錯誤;(3)對比查詢MGW的數據配置,定位解決配置上的錯誤。
五、建議
(1)通過信令準確定位問題;(2)仔細檢查參數的正確配置,這類情況無任何告警和異常,需要從底層排查,要熟練掌握好協議和信令原理。
六、結論
綜上所述,MGW與RNC調試中,用戶無法正常呼叫問題,通過信令分析數據排查相結合的方法使問題得以解決,在日常的維護過程中,需要維護人員具備扎實的理論基礎外,還要熟練掌握問題定位思路和技巧,并不斷積累豐富經驗,這樣我們在處理問題時才能做到得心應手。
參 考 文 獻
[1] 華為MSOFTX3000產品文檔幫助手冊