李鴻


摘要:本文通過對各種類型的計量自動化終端上行通信故障的診斷分析,探討如何幫助計量運維人員排查、處理因上行通信故障而造成計量自動化終端與主站無法正常通訊的現(xiàn)象,制定日常維護方案以保證終端上線率和減少故障率,介紹通過應用故障排查方法,在日常維護中取得的成效。
關鍵詞:上行通信;故障;診斷;分析;應用
引言
計量自動化終端與主站能否正常通訊的關鍵環(huán)節(jié)在于上行通信鏈路正常。由于計量自動化運維工作與通信知識密切相關,針對部分計量運維人員對通信專業(yè)不了解的情況,無法排查調試過程中由于各種原因導致終端無法與主站建立連接,造成調試工作的停滯,影響電能量數(shù)據(jù)的正常采集。本文通過深入分析各類終端上行通信故障,摸索總結出各類終端參數(shù)設置、通道故障排查、前置機排查的方法及分享經驗和應用成效。
1.計量自動化上行通信技術
目前可用于計量自動化終端與主站的遠程通信技術主要有:PSTN電話撥號、4線音頻專線、數(shù)據(jù)網(wǎng)絡和GPRS/CDMA無線公網(wǎng)。其中負控終端、配變終端、低壓集抄(以下簡稱為無線公網(wǎng)終端)是采用GPRS/CDMA通信方式;廠站終端則采用電話線、專線、網(wǎng)線3種通信方式與主站通信。
2.計量自動化終端上行通信故障診斷分析
2.1無線公網(wǎng)終端通信故障分析
2.1.1無線公網(wǎng)終端撥號流程
GPRS(或CDMA)模塊初始化→開始撥號連接→撥號成功發(fā)送登陸幀→登陸成功→與主站正常通信。
2.1.2撥號故障分析
若終端撥號失敗,則說明終端尚未連接至無線運營商,需檢查SIM卡是否欠費、腐蝕或接觸不良、卡槽、模塊故障等;
若終端撥號成功,則說明終端已經正常連接無線運營商基站或服務器,無線運營商基站或服務器至計量自動化主站的通道出現(xiàn)異常。
2.2廠站電能量采集終端通信故障分析
2.2.1上行通道故障:包括網(wǎng)絡通道、電話通道、四線專線通道故障。
2.2.2 設備故障:網(wǎng)卡、模塊、裝置故障等。
3.計量自動化終端上行通信故障排查方法
3.1 無線公網(wǎng)終端通信故障排查
3.1.1 檢查無線公網(wǎng)終端通信通道是否正常
所謂的公網(wǎng)終端通信通道也就是指無線通信運營商提供一條專給電力專網(wǎng)提供的數(shù)據(jù)專線,因此若出現(xiàn)無緣故大批量的終端掉線現(xiàn)象,則首先應提供一批因這次故障而掉線的終端IP給通信運營商查找原因,分析到底是SIM卡數(shù)據(jù)未捆綁好需要重置數(shù)據(jù)還是因為通道故障需要處理。
3.1.2檢查終端參數(shù)設置是否不正確或未設置
(1)檢查APN設置:在新安裝或更換終端時,需在終端設置好APN(即登錄電力專網(wǎng)的身份通行證),沒有設置好(以湛江地區(qū)為例APN為ZJDLCB.GD)這個密碼,則所上傳的數(shù)據(jù)無法通過電力網(wǎng)關。
(2)檢查主站IP地址設置:需在終端設置好主站的服務器IP地址,(以湛江地區(qū)為例:負控服務器地址是192.168.2.30;配變是192.168.2.40),各類終端都有自己所屬的主站IP地址,否則數(shù)據(jù)無法到達指定的目的地。
(3)檢查通信協(xié)議及終端端口號(以湛江地區(qū)為例:TCP為5112、UDP為6112)。
3.2 廠站電能量采集終端通信故障排查
3.2.1 網(wǎng)絡通道故障排查
(1)檢查網(wǎng)絡連接情況(通過遠程服務器ping交換機網(wǎng)關IP)。
(2)檢查裝置登錄情況(通過遠程服務器ping終端IP,然后telnet終端)。
(3)通過終端調試軟件進行測試,(將網(wǎng)線接頭接入筆記本電腦,筆記本電腦的IP、端口號等設置與終端一致,通過模擬主站檢查能否遠程鏈接到筆記本電腦上。)
(4)重啟終端(檢查有的終端是否處在死機狀態(tài))。
3.2.2電話通道故障排查
(1)使用手機撥通終端接入電話號碼,查看是否有moden音
(2)使用萬用表測量測量電話線電壓是否正常(直流50伏左右)
3.2.3 四線專線故障排查
(1)核對終端內四線音頻專線MODEM 波特率、起止位、字節(jié)長度、校驗位與主站通信系統(tǒng)是否匹配。
(2)信號收發(fā)接線是否錯誤,局方四芯專線的發(fā)(TX)要接終端的收(RX),終端的發(fā)(TX)接局方的收(RX)如下圖3-1所示。
(3)檢查四芯專線上送頻率是否正確,四芯專線的中心頻率為1700Hz,頻偏:±400 Hz,發(fā)送“1”,頻率為1300Hz,發(fā)送“0”,頻率為2100Hz,可用萬用表測頻率是否為1(T+與T-間交流電壓約0.6V左右)。
(4)將四芯專線環(huán)測,主站發(fā)命令進行自發(fā)自收測試。
4.計量自動化主站設備故障排查方法
如下圖4-1所示為計量自動化系統(tǒng)數(shù)據(jù)傳遞流程,計量自動化終端將現(xiàn)場采集的電能量信息通過通訊模塊,經由各種通信方式經通道到達電力專用網(wǎng)絡登錄主站系統(tǒng)。這些數(shù)據(jù)首先經過防火墻的安全認證,投送目標地址,這些數(shù)據(jù)包在經過確認安全之后再轉發(fā)給路由器,路由器對數(shù)據(jù)包的報文報頭進行解析,確定數(shù)據(jù)包交換機的轉發(fā)到達前置設備,前置設備對這些收到的數(shù)據(jù)進行解析和初步處理,再將處理后的數(shù)據(jù)發(fā)給主站服務器,再由主站進行后期處理和數(shù)據(jù)存儲等。其中交換機用來拓展網(wǎng)絡數(shù)量和劃分網(wǎng)絡; 路由器主要起到網(wǎng)絡數(shù)據(jù)包的轉發(fā)和解析; 防火墻用來應付整個網(wǎng)絡的攻擊。所以無論防火墻、路由器、交換機、前置機哪一環(huán)節(jié)出現(xiàn)問題,都會影響數(shù)據(jù)是否最后進入數(shù)據(jù)庫。通過多年來的運行維護統(tǒng)計,出現(xiàn)故障最多的還是在前置機是否正常工作、服務器的網(wǎng)絡連接是否正常這個環(huán)節(jié)。
4.1檢查是否為服務器無法啟動
主要原因為:①市電或電源線故障(斷電或接觸不良);②電源或電源模塊故障;③內存故障(一般伴有報警聲);④CPU故障(一般也會有報警聲);⑤主板故障;⑥其它插卡造成中斷沖突。
4.2檢查系統(tǒng)是否頻繁重啟
主要原因為:①電源故障(替換法判斷解決);②內存故障(可從BIOS錯誤報告中查出);③網(wǎng)絡端口數(shù)據(jù)流量過大(工作壓力過大);④軟件故障(更新或重裝操作系統(tǒng)解決)。
4.3檢查是否死機,進行前置機硬件和軟件檢查
4.4當原硬盤壞了,檢查更換新硬盤時是否出現(xiàn)無法通過機器自檢現(xiàn)象
4.5將新的硬盤取下,檢查機器是否可以自檢通過
4.6檢查新增加的硬盤的ID號是否與原來的硬盤的ID號相同,如果硬盤的ID號相同的話,自檢將無法通過
5.終端本體或本體器件故障排查方法
無論是GPRS公網(wǎng)終端或廠站電能量采集終端,到現(xiàn)場首先第一步還是要檢查終端是否已死機,分析其故障原因.
5.1 看是否能夠重啟終端
5.2檢查GPRS模塊是否故障
5.3 檢查SIM卡或網(wǎng)線接口、網(wǎng)卡等其他模塊故障
6.基于計量自動化上行通信日常維護方案
人長時間工作,會出現(xiàn)勞損的現(xiàn)象,機器也不例外,所以需制定日常維護工作方案,做好日常維護工作,減少故障發(fā)生次數(shù)。
6.1做好前置機日常維護工作
前置設備是位于應用系統(tǒng)服務器端(計量自動化系統(tǒng)主站)與客戶端之間的獨立處理設備,肩負數(shù)據(jù)格式轉換、連接管理、業(yè)務流管理外圍調度、外圍處理,報文認證、個人密碼PIN變換、并把業(yè)務數(shù)據(jù)交后臺應用服務系統(tǒng)處理等任務。因此,它是日常維護的一個核心部分。計量自動化班必須每天專人進行跟蹤檢查并做好日志記錄。
6.2做好通道的監(jiān)測維護工作
上行通道是終端數(shù)據(jù)的必經之路,做好這方面的日常監(jiān)視維護工作至關重要。當終端與主站無法正常連接可以首先考慮是否為通道的問題。如公網(wǎng)終端通道就與無線運營商聯(lián)系處理,廠站終端通道則采取通過遠程服務器ping交換機網(wǎng)關IP, ping終端IP,然后telnet終端的方式。如果還是不通就到現(xiàn)場排查故障,如果是通道故障則需通知調通中心運維部門處理。
6.3 做好終端在線率監(jiān)測
每日做好終端在線監(jiān)測至關重要,將掉線的終端逐一篩選出來分析一遍,然后再進行主站故障排查、通道故障排查、終端本體故障及其他原因逐一排查。
6.3.1如果在線率與上日比較下降2%左右,查看停電終端是否有明顯增加,與各區(qū)縣局責任人聯(lián)系,核實是否存在線路停電或線路改造。
6.3.2由于通訊廠商業(yè)務升級導致在線下降。在計量自動化系統(tǒng)查看終端掉線清單,查看終端IP段屬于哪個通信運營商 (以湛江地區(qū)為例:192.168開頭是移動卡,192.169是電信卡,192.170是聯(lián)通卡)。掉線終端突然增多,聯(lián)系通訊廠商技術員查找原因。經過多年的經驗統(tǒng)計,移動主要是業(yè)務切換故障;聯(lián)通經常為數(shù)據(jù)轉換器故障;電信常出現(xiàn)路由器故障。
6.3.3由于主站程序異常導致在線率不穩(wěn)定,突高突低,需檢查前置機運行程序。
6.3.4新安裝某終端廠家參數(shù)出廠問題導致在線率下降,應去現(xiàn)場檢查故障終端,查看終端設置等情況。
6.3.5由于部分區(qū)域信號導致在線率下降或終端反復登陸主站。出現(xiàn)此類問,應與通信運營商聯(lián)系。
7.故障排查應用實例介紹
7.1 因公網(wǎng)終端上行通道故障導致批量掉線故障處理實例
2012年6月30日9點45分湛江計量自動化系統(tǒng)出現(xiàn)大批量終端掉線現(xiàn)象,其中配變終端掉線約3000臺,負控終端掉線約5000臺,共計約8000臺。由本人擔任工作負責人進行計量自動化緊急消缺處理。①首先排查前置機的運行狀態(tài):登陸管理員賬戶,核對系統(tǒng)應用服務的運行情況,查驗是否有未知服務器開啟;查看所有管理員賬戶數(shù)量和賬戶ID,核對賬戶是否被修改或新添加的管理員賬戶,如有被修改或添加賬戶應及時向賬戶持有人核對;檢查設備是否有新的服務端口開啟,如有新的端口開啟應立即關閉,然后再核實新開端口的安全性;檢查有沒有病毒;檢查CPU性能好壞情況;檢查內存是否滿足,確認數(shù)據(jù)的存取空間是否滿足等。做完這些工作后,確認前置機是正常工作的,服務器的網(wǎng)絡都是正常的,那就可以很肯定地排除了是前置設備異常導致的故障。②考慮到移動專線通道的問題,本人導出了所有掉線終端的IP地址發(fā)送給移動公司,并聯(lián)系移動公司工程師赴機房進行故障處理。6月30日11點15分,配合移動協(xié)維工程師檢查路由器,故障原因確診為RT互聯(lián)結構2層改3層優(yōu)化實施時,廣州CR01/CR02與廣州RT01/RT02無法交互路由導致GZRT01/RT02下掛業(yè)務全阻和設備脫管,影響湛江局GPRS企業(yè)接入業(yè)務。協(xié)維工程師在兩臺CR上與RT所有互聯(lián)接口開啟OSPF點對點屬性,完成該節(jié)點工程優(yōu)化改造并檢查確認業(yè)務正常。6月30日11點50分終端與主站上行通信恢復正常。
7.2應用效果
在6月30日當晚能及時排除和處理大批量掉線異常現(xiàn)象,保證系統(tǒng)上線率正常,使7月1號抄表日數(shù)據(jù)采集、營銷收費不受故障影響。
8.結束語
本文通過多年來的工作經驗,摸索分析了計量自動化各類型終端上行通信故障原因和總結出故障排查的各種方法,詳細描述了上行通信知識的原理,解決計量運維人員對通信專業(yè)不了解、無法排查終端與主站建立連接的故障現(xiàn)象,制定了日常維護工作方案以及達到持續(xù)提升終端上線率的實效。
參考文獻:
[1]肖勇,周尚禮,申妍華,伍少成.大規(guī)模大客戶負荷管理系統(tǒng)數(shù)據(jù)采集方案的研究.電測與儀表,2010,8
[2]肖勇,周尚禮.基于VxWorks實時嵌入式操作系統(tǒng)平臺的計量自動化遠方監(jiān)控終端的設計.電測與儀表,2008,07
[3]關飛,吳小美,劉朝輝.基于GPRS通訊的配變監(jiān)測管理系統(tǒng).電測與儀表,2010,8
[4]肖勇,周尚禮,張新建,化振謙.電能計量自動化技術.中國電力出版社,2011,11
[5]鐘仕超.惠州計量自動化系統(tǒng)的設計和應用[J].中國高新技術企業(yè),2009,7