摘要:本文分析了光線測溫系統數據傳輸流程及其主要運行特點,在此基礎上梳理、總結現有測溫系統日常巡檢主要內容。為了能夠實現測溫系統缺陷的遠程快速準確定位和及時處缺,以測溫系統通信規約為指導,匯總、梳理日常運行維護工作內容,給出了光纖測溫系統遠程缺陷處理方法。
關鍵詞:光纖測溫 通信規約 巡檢 遠程處缺
0 引言
分布式光纖測溫系統是電纜網運行監控系統的一個重要組成部分,負責向監控平臺實時傳遞電纜本體和隧道的溫度數據、后向散射數據和溫度報警信息。該系統子站設備多,地理分布廣,采集數據量大,且各自為戰,獨立運行。通信規約作為聯系紐帶,將該子系統眾多采集和通信設備有機結合在一起,形成了一個數據采集、傳輸和存儲的完整流程。
測溫系統的日常維護工作的目的和主要內容是保證每一條測溫數據交互通道的穩定和通常,以及實時數據的有效性和準確性。工作對象包括:測溫、通信設備,數據匯集設備還有將這些設備聯系在一起的通信規約。做好日常維護工作,能夠在一定程度上降低光纖測溫系統的缺陷發生率。并且大多數情況下能夠快速遠程進行缺陷處理,避免了大量的現場工作,提高了工作效率。
本文以測溫子系統通信規約為指導,總結分析主要設備運行特點,針對測溫系統遠程巡檢、缺陷定位和缺陷的遠程處理工作進行總結、梳理和改進,最終固化下來。以便能夠做到隱患的及時排查,缺陷的準確定位和缺陷處理的迅速響應,進一步提高測溫子系統日常運行的整體穩定性和可靠性。
1 測溫系統運行特點
測溫系統的主要功能是測量電纜表皮和隧道溫度,并將相關數據傳輸至監控平臺,其數據傳輸流程包括數據采集、格式處理、本地存儲、數據通信、后臺服務和數據庫存儲等環節。測溫系統運行特點如下:
1.1 主站設備量少,重要性高
主站端與測溫系統相關的數據匯集服務器數量較少,共3組,6臺(兩兩互為熱備用)。軟件功能簡單、明確,但重要性較高。測溫數據匯集服務器負責向每一個子站通信主機發送數據傳輸命令,并接受數據,同時寫入數據庫;監控中心報警服務器負責接收測溫系統報警信息并推送至C/S的客戶端。
1.2 子站設備量大,分布廣
已接入系統運行的測溫子站主機和工控機設備共54臺,均位于各變電站主控制內,數量大,分布廣。導致現場維護工作的效率較低。
1.3 子站設備運行時間較長
子站的測溫主機和通信主機設備已運行了將近四年時間。工控機設備的生命周日要比普通臺式主機生命周期(4年)更長一些,但是從目前的運行狀況來看,在未來的一段時間內,設備的老化、故障將是影響測溫子系統穩定運行的一個主要原因。
1.4 統一通信規約
目前的測溫子系統通信規約是以國網公司輸電線路在線監測相關標準[1]為基礎,借鑒了GB/T18657系列配套標準[2]。該通信規約基于TCP/IP協議族,采用平衡傳輸方式,包括了數據校驗、重發、確認、閾值觸發等主要功能,基本上能夠滿足對于數據傳輸的實時、準確和可靠性要求。
1.5 統一維護方式
不同類型測溫主機和通信主機軟硬件系統功能基本一致,無論在功能上,還是軟硬件系統的配置上均采用了測溫和通信分開管理,因此可采用一致的維護方法。
1.6 兩類缺陷
常見缺陷集中出現在子站端測溫、通信主機和前端所敷設的光纖。子站端缺陷處理基本上可通過遠程操作方式實施;光纖衰減和斷裂點必須經由現場處理方式解決。
總的來講,測溫系統是目前電纜網運行監控系統當中較為復雜的子系統之一。但通信過程相對透明。他擁有自己的測溫系統、通信系統、前段監測設備,覆蓋范圍大、數據量多,并且中間環節較多。對日常維護工作的細致程度要求很高。
2 測溫系統巡檢
2.1 巡檢工作的主要環節
根據該通信規約特點,可知測溫子系統巡檢和處缺工作的重點應該從以下兩個環節為重點展開:
2.1.1 主站數據匯集服務器和中心報警服務器。這兩種服務器位于通信協議的主站端,可理解為整個數據交互的核心或主動端。共部署了所有數據采集和報警信息接受后臺服務共30個。負責通信命令發送接受、數據接受、設備代碼以及通道代碼等實時交互等,這些詳細的信息均存儲于服務日志當中。
2.1.2 子站通信服務器。此類服務器部署于不同的變電站中,位于通信規約的廠站端,可理解為多個數據交互的被動端。每一臺通信服務器共部署了兩種服務:一種是通信服務,數據發送命令的接收、數據的放松和報警信號的發送;另外一種服務作為主站端和廠站端通信服務的中間件,用于過濾、篩選、有效性確認以及閾值觸發等功能。
2.2 主站數據匯集服務器
數據匯集服務器是整個測溫系統維護過程當中最關鍵的一個環節。該服務器上所部署的測溫服務進程運行狀態的好壞,直接決定了整個測溫系統的穩定性。特別是子站與主站數據、命令交互日志。可以全面、準確的反應當前所有子站與主站服務器的通信過程狀態,數據交互時間、周期、各通道通信狀態、子站主機端口狀態等。在測溫系統的巡視和處缺過程當中,無論采用怎樣的方法和工具,最終的目的便是保證數據匯集服務器及其所部屬的軟件服務正常運行狀態,并具備正常、規范的日志。
對于該設備的巡檢內容主要為后臺服務日志的完整性和有效性。
2.2.1 完整性:為服務日志當中的信息是否完整,如:命令發送時間,接收時間和數據接收時間是否及時;服務代碼,通道代碼,設備編碼是否正確;測溫數值和后散射曲線數值及其測點數量是否完整,并符合測點間距的要求。
2.2.2 有效性:包括:日志是否存在溢出信息,是否為無效日志;各條命令和數據的發送、接收時間是否等間隔;各個代碼端是否準確。
2.3 子站測溫和通信主機
在對子站測溫主機和通信主機的巡檢過程當中主要的巡檢內容如下:
2.3.1 測溫主機
測溫軟件的通道巡檢狀態是否正常,是否存在不巡檢通道;本地磁盤空間,網絡及共享文件掛載狀態,兩臺主機間通信是否正常;系統時鐘和CPU及內存占用率是否正常,硬件設備運行狀況是否良好。
2.3.2 通信主機
通信軟件中各通道的運行狀態、數據的及時展示、報警信息的展示是否正常;系統時鐘和CPU及內存占用率是否正常,硬件設備運行狀況是否良好。
3 遠程缺陷處理
缺陷的發生多由細微的誤差引起。因此,缺陷的處理切不可采用粗放的手段來解決,例如:主機重啟以及相關軟件的重啟。首先這種處理方法很有可能無法根除缺陷;其次,頻繁地重啟對主機的軟硬件會造成損害。所以一定要逐個排查每個環節,分析缺陷原因,制定處缺方法,最終完成缺陷處理。下面將針對該流程分兩部分說明缺陷處理的方法。
3.1 主站分析和處缺方法
無論通過巡檢方式或是其他方式發現了測溫系統的缺陷,首先要從主站端入手來分析和初步確定缺陷發生的位置和原因,并繼續進行處缺工作。在這一過程當中,要緊緊把握住日志文件,對其進行細致梳理和認真分析。
3.1.1 如果日志當中保存有完整且正確的時間、光纖編碼、通道編碼、測溫數據和后散射數據等信息,那么可確定缺陷應位于主站端數據庫服務器和數據庫。因為所有的測溫信息通過數據匯集服務器和數據庫服務器寫入數據庫。無論是C/S和B/S客戶端,都要重新由數據庫當中調取所需曲線并作相應展示。可通過數據庫操作軟件查看當前對應表空間名稱,路徑和空間來做相應的缺陷處理。
3.1.2 如果日志中測溫數據采集命令的發送時間間隔和命令代碼缺失、有誤或重復,那么可確定缺陷位于后臺測溫服務。通過重新調整測溫后臺服務的相關設備代碼、時間和通道代碼配置來完成缺陷處理。
3.1.3 如果日志中出現目標設備無法連接,或者缺乏某一通道測溫或后散射數據,那么缺陷應位于子站端。
3.2 子站分析和處缺方法
當確定了缺陷的位置位于子站端設備后,可按照先通信主機后測溫主機的順序,對兩臺主機的軟硬件系統分別進行缺陷排查。需提起注意的是,大部分子站缺陷均可通過遠程方式來處理,除非遇到遠程無法解決的問題,例如:主機失去外部電源等現場處理才可解決的情況。所以,該部分分析和處缺的原則是:盡可能將所有缺陷遠程處理,避免現場處缺。
3.2.1 通信主機時鐘與數據匯集服務器時間差異較大而引起的通道中斷。由于數據傳輸周期為15分鐘,若差異大于此,便發生雙方不能按照統一約定時鐘進行傳輸,因此造成通道通信條件無法建立,通信失敗。此缺陷處理過程非常簡單,以數據匯集服務器為基準,修改通信服務器始終便可解決。
3.2.2 由于通信軟件運行時間較長而存在的誤差積累而導致的某一通道或者所有通道均無法正常傳輸數據。可通過重新加載配置數據,或者對故障通道的配置數據進行微調來處理此類缺陷。
3.2.3 測溫軟件運行時間較長所積累的誤差所導致的軟件崩潰、退出導致的通信失敗。可通過重新啟動該軟件并配置相關參數來處理。
3.2.4 測溫和通信主機的硬盤空間不足影響操作系統和應用軟件的運行,造成軟件的自動退出。可通過轉移或刪除部分數據來完成。
4 結論和展望
本文所給出遠程缺陷處理方法,是在充分了解測溫系統主要設備功能和運行特點基礎上,通過分析測溫子系統通信規約并以其為指導,從而總結和固化下來的。整個流程力求簡單、明了,便于操作和理解,在實際工作中也取得了令人滿意的效果。
測溫系統遠程巡檢和處缺方法的提出為其他子系統相應工作的開展奠定了基礎,文中部分內容可直接推廣至其他子系統,最終可實現監控系統全面狀態巡檢和處缺。
參考文獻:
[1]國家電網公司企業標準.架空輸電線路在線監測系統通用技術條件.
[2]IEC 6 08 70-5-104:200.遠動設備及系統第5部分:傳輸規約第104篇:采用標準傳輸協議子集的IEC 60870-5-101網絡訪問.