李銀碧
(浙江郵電職業技術學院,浙江 紹興 312366)
通信機房電源是電信網絡運行的基礎和心臟。設備的斷電、關機等故障現象會造成系統數據的丟失或出錯,影響整個數據機房的正常運作。數據中心掉電導致業務中斷的案例數不勝數,可靠穩定的供電是系統穩定運行的基本要求。通信機房采用科學合理的維護模式,優化電源網絡資源,圍繞“電源不掉電”這個目標展開各項工作,保障通信設備安全優質供電,提供良好的機房環境。通信電源專業的核心工作就是電源防掉電,為通信網絡提供基礎保障。
日常主動性維護作業和巡檢。動力系統設備實行統一管理、集中監控和分區維護的原則。根據維護規程要求制定作業計劃,做好設備日常維護和測試工作。
定期巡視機房現場,檢查機房環境和日常清潔,檢查機房設備工作是否正常,運行時有無異常聲音和氣味,及時發現隱患并排除故障,保證動力系統穩定運行。
精確統計在網電源設備(特別是蓄電池)的運行年限,并對超年限的設備給予重點關注與及時替換,是電源安全保障重要的一項工作。通過創新升級動力環境監控系統,可以減少維護工作量。當設備超過正常使用年限后,網管自動出現“設備運行時間超年限”的告警,有效降低人工資源管理帶來的疏漏。
在做好電源日常維護和巡檢工作外,還應結合實際情況,以安全第一,預防為主,制訂科學有效的應急保障預案。這直接關系通信電源“防掉電”工作的成敗。以“先搶通,后搶修”為基本原則,當通信電源供電出現大面積停掉電事故時,應首先保證重要局(站)供電安全,采取各種必要措施保障電信網絡的暢通,防止出現系統性癱瘓和損毀的嚴重后果。預案內容包括組織架構、人員安排、設施及器材配置、手段及方式、距離及時限要求、處理流程、廠商技術支撐以及傳報制度等方面。應急保障設施包括移動油機、應急設備接入設施、配套纜線和相同型號的整流模塊[1]。
完善應急預案演習機制,不定時組織開展供電緊急處置演習,通過預案和演練兩者有機配合,使電源不中斷或盡量縮短中斷時間,提高對事故處理和應急綜合處置能力,做到防患于未然,確保通信局站“防掉電”。
某機樓發生一起因開關電源輸入空開容量配置不合理、故障處理不及時而導致的直流供電系統故障。該套開關電源由1個整流架(15個100 A模塊)、1個直配屏、4組1 000 Ah蓄電池組成,與機房空調共用交流屏,負載電流約1 020 A。
1.3.1 障礙發生及處理過程
(1)網操中心對蓄電池核對性容量測試,檢查正常后于11:00離開現場;
(2)12:01省動環監控產生“直流電壓欠壓”告警,維護分局接到故障工單,認為是蓄電池容量測試觸發告警,未對現場維護人員派單;
(3)12:07省動環監控系統產生“15個整流模塊通信異常告警”告警;
(4)12:26維護分局接到第二張工單,通知值守人員現場查看;
(5)12:40值守人員到達現場檢查;
(6)12:55確認是開關電源系統交流輸入開關跳閘引起,但經多次合閘嘗試未成功;
(7)13:15中心技術支撐人員到達現場,確認為開關內部機械故障必須更換,現場無備件,立即啟動備件緊急調用程序;
(8)14:07斷路器送達現場;
(9)14:42更換完畢并合閘供電,故障恢復。
該次故障原因為開關電源交流輸入開關配置不合理(100 A),隨著蓄電池充電功率的增加,開關發熱直至引起熱脫扣,同時出現機械故障;現場沒有備件,也沒有采取積極有效的應急措施,導致故障處理時間過長。
1.3.2 后續防范措施
(1)加強對配電系統配置和保護整定值符合性檢查,及時更換、調整容量配置或參數設置不合理的斷路器;
(2)在樞紐局(站)配置維護應急處置所必須的備品、備件和應急處置工具(如應急短接電纜等),縮短故障處理時限;
(3)通過“應急培訓→實戰演練→完善應急預案”多階段的循環與鞏固,提升現場維護人員應急處置能力;
(4)加快動環監控手機APP應用,故障派單、信息傳遞流程盡量扁平化;
(5)及時記錄安全管理隱患清單,根據匯總收集的運行數據分析系統及設備運行狀況,提出改善供電質量的對策和相應措施。
對設備而言,當前運行狀態是其正常狀態的最直接表現,所以定期進行運維安全檢查,能幫助及時發現并處理各類設備預警。
現場巡檢時,首先要注意檢查設備有無異響、異味、異色、異動等情況。若有異常須及時處理,現場無法處理的需及時上報。
高壓交流供電系統由高壓供電線路、高低壓配電設備、變壓器及防雷等設施組成,如表1所示。

表1 高低壓配電設備現場維護
案例1:斷路器整定值設置不合理引發斷電故障
某機房樓層總交流配電屏采用雙電源ATS轉換方式供電,雙電源轉換開關下端總斷路器(額定容量:800 A)自動斷開保護,所有在用分路斷路器(額定容量小于400 A)均處于閉合狀態。
故障處理:
(1)測量市電電壓、頻率等指標,確定市電正常;
(2)斷開各在用分路斷路器,做好應急準備后逐級送電,所有設備工作正常,說明負載側無短路現象;
(3)測量負載電流為300 A,含蓄電池充電電流,800 A斷路器不存在過載或偏載問題;
(4)觀察一段時間后,總斷路器仍能正常工作,確定斷路器沒有損壞;
(5)核對斷路器Ir、tr、Isd設置,發現Ir(過載長延時脫扣電流整定值)出廠設置為0.4倍(800×0.4=320 A)。機房內現有3臺專用空調和4套開關電源在用,如果空調啟動和蓄電池均充等因素同時發生,斷路器易造成過載保護;
(6)將樓層總交流屏雙電源開關下端斷路器Ir設定為0.9,同時對所有綜合樓機房和變電所斷路器進行普查,調整了一部分斷路器相關設置參數,工作正常。
在市電故障或市電停電的情況下迅速起動并帶動發電機組,保證向通信設備供給安全可靠、質量保證、電壓和頻率滿足通信設備要求的電力。維護過程中停電油機正常啟動,關注供電穩定性及出現故障時的應急處理等內容(見表2)。

表2 自備發電機組現場維護
UPS為設備提供交流不間斷電源,其維護內容見表3。

表3 UPS電源現場維護
案例2:某電力室130 kVA愛克賽UPS B系統輸出屏11#空開壓降過大,如圖1所示。

圖1 輸出屏11號空開壓降過大
測量空開數據如表 4 所示。

表4 測量空開數據
壓降為空開內部存在,確定為空開內部觸頭接觸不良造成,需要更換空開。
開關電源是由交、直配電、整流和監控模塊組成的直流供電系統[2],其維護內容見表5。

表5 直流開關電源現場維護
案例3:開關電源熔絲異常溫升,如圖2所示。

圖2 熔絲溫升異常
溫升異常原因:電流過大;設備端故障;熔絲老化;接觸不良。其中,電流過大考慮不均流,后三項則為故障隱患。
現場對熔絲電流和電壓量取值如表6所示。

表6 現場的熔絲電流和電壓量取值
考慮電流影響和測量誤差因素,應該是熔絲座與電纜連接或是熔絲座與銅排接觸不良導致異常溫升。用起拔器將熔絲刀體插緊,將熔絲下端與銅排的螺母緊固,量取銅排與電纜銅鼻子壓降,變為8.1 mV,恢復正常,一段時間后溫度也恢復正常。
蓄電池是通信電源中交流不間斷和直流不間斷供電的重要保證,其維護內容見表7[3]。
案例4:蓄電池短路著火燃燒,如圖3所示。
本次故障是因一個蓄電池殼體滲液引發對地短路,蓄電池著火產生的高溫進一步破壞電池匯流電纜絕緣,短路引發自燃,在走線架上有明顯短路點。
安裝蓄電池時采用電池安裝面有絕緣片或有防漏底座的安全型蓄電池架,可以有效避免由于滲漏而引發的嚴重故障。

表7 蓄電池組現場維護
一套與日常維護工作緊密結合、完善的監控系統,可以幫助及時了解電源設備的運行狀況[4]。一旦發生故障,可以及時搶修。動環監控系統的維護內容見表8。

圖3 蓄電池防漏液安全架
隨著通信業務的迅速發展,電源主設備密集度提高,空調作為機房環境設備對機房運行起著至關重要作用。如何提高空調設備運行可靠性,將局部高密度的熱量移除是重點研究內容,而可靠性和節能降耗是機房空調研究的永恒主題。對機房空調的管理重點關注空調開啟臺數和溫度設置是否合理。而在節能減排過程中,冷通道封閉機房應安裝盲板并齊全;對退網設備及時關閉電源;歸并提高開關電源、UPS等負載率;交換退網后及時調整空調位置,以利散熱降溫。
良好的機房環境是通信設備穩定工作的保證,機房環境主要檢查內容有:
(1)機房溫、濕度、清潔度符合規定要求;(2)機房門、窗、電纜孔洞封堵規范;
(3)一樓機房設有防止小動物進入措施;
(4)高低壓配電屏、UPS電池、240 V電池四周敷設絕緣墊;
(5)機房煙霧探頭、報警系統工作正常,消防設施良好齊全,無易燃物;
(6)工程施工、設備安裝規范,使用線纜或其他材料符合規定。
綜上所述,圍繞落實“電源防掉電”目標,加強通信機房環境的管理與維護,工作扎實到位,及時發現安全隱患。同時,制定供電應急預案,組織開展應急演練,才能在實際應對掉電故障時做到“手中有糧,心中不慌”。只要電源設備運行質量和專業維護水平高,就能確保通信電源的可靠和穩定。

表8 動環監控現場維護