艾 淵
(云南電網有限責任公司曲靖供電局,云南曲靖655000)
駐場運維,即安排專業的技術人員在機房工作,對機房進行日常維護保養;對設備信息化完善進行登記,對出入機房人員進行登記,對各系統設備參數進行每日的例行登記,建立設備檔案,應對突發故障,制定巡查規范及制度,定期聯系設備供應商對運行的設備或軟硬件進行維護保養。駐場運維是一種日常化的工作,需要投入一定數量的穩定的駐點人員,對機房各個系統存在的隱患進行提前預判,協調處置,同時及時上報問題原因及處置方式,為機房的整體安全運行提供可靠的數據或報告支撐。
機房的設備分類眾多,根據不同的側重點又可分為很多部分,各設備彼此之間工作內容既相互獨立又有內在的緊密聯系,而且機房里的設備不僅自身的價值很高,其本身的數據也非常重要。當機房安全平穩度過試運行期后,即可投入正常使用,此時為了延長設備的使用壽命,便需要定期地維護保養。駐場運維的側重點在于保障設備的正常運行,當出現問題時應急協調解決的處置能力及時間控制,取決于運維工程師對日常設備維護的認識和駐點運維工作的完善性和有效性,這決定了是否會出現額外的費用、人力、時間的支出;而從另一個角度來說,在問題發生的第一時間,如果現場運維人員能在日常維護中積累相應的處置能力,那么將能大大節約時間、人力、物力成本。
因此,機房駐場運維的意義在于通過每日對設備的維護、記錄、保養延長設備生命周期,保障機房設備運行穩定,降低故障率。在機房突發事故導致設備發生故障,影響機房正常運作時,可以及時得到機房專業運維人員的技術支持和維修,快速解決故障,及時恢復正常工作。
機房駐場運維通過每日的記錄維護,按每周、每月的時間節點,比對設備運行參數及報警記錄,生成各系統性能評估及運行生命周期狀態表,總結出目前設備在運行中存在的問題及隱患,并通過會議或報告的方式將各系統性能評估及運行生命周期狀態表反饋給設備管理方,給出合理化建議,同時協助設備管理方將各系統存在的問題統計出來,形成后續完善的機房運維及改造計劃,從而提升機房整體運行質量,達到延長系統工作壽命,減少系統突發性故障,保障機房穩定運行的目的。
機房的駐場運維項目可分為七大部分:綜合布線系統、空調系統、動力環境監控系統(含門禁、視頻監控、入侵報警)、機房消防系統、防雷接地系統、配電系統、基礎環境,現場運維工程師需要每日對這7塊進行巡視記錄,以保障各系統設備正常運行及預防突發故障。駐點人員采用以下方式對各系統進行維護:
綜合布線日常維護需注意:(1)機柜內是否存在臨時作業的跳線、飛線,未做標示、未進行整理的需要進行整理,并按線纜對應的端頭標注標簽。(2)機柜是否存在未捆扎的線纜,需要使用扎帶或魔術帶進行捆扎,并整理進理線器、分線槽或橋架。(3)線纜是否存在松脫或接觸異常問題,需要每日對各監測系統、網絡系統進行檢查,防止臨時作業導致的未接入問題或線纜接錯問題。(4)對出現臨時作業的綜合布線類工作,按范圍、位置、端口、時間進行登記,防止違規操作導致的線纜端頭故障耽誤故障排除時間。(5)檢查內容每日需進行相關記錄,以保證設備單日進行過檢查,確保設備在日常維護中的可靠性,為預防突發故障做出相應的數據支撐。
機房精密空調主要由壓縮機、冷凝器、膨脹閥、蒸發器、風機、空氣過濾器、加濕器、加熱器、排水器等組成,安裝的目的是確保室內空氣溫度、相對濕度、噪聲、壓力、潔凈度等參數保持在規定范圍內。因此,保證空調設備的正常運行也是保障機房各系統安全、穩定運行的重要工作,其中主要工作內容如下:(1)檢查液晶面板,查看溫濕度是否正常,查看時間是否正常,看是否存在報警記錄,查看參數顯示是否異常。(2)檢查精密空調內環境,是否存在漏油跡象,是否存在銅管結霜或壓縮機結霜,是否存在接水盤堵塞等情況。(3)檢查壓縮機啟動是否正常,通過電流表檢查啟動電流、電壓是否正常。(4)使用壓力表檢查動態壓力,觀察視液鏡顏色,判斷制冷劑是否充足。(5)檢查冷凝器,看是否有冰、污垢附著,檢查風扇是否存在異響等。(6)檢查蒸發器是否有冰、污垢附著,蒸發器翅片是否存在變形或損壞。(7)檢查空調濾網是否潔凈,是否需要清洗或更換。(8)檢查內容每日需進行相關記錄,以保證設備單日進行過檢查,確保設備在日常維護中的可靠性,為預防突發故障做出相應的數據支撐。
(1)傳感器檢查:傳感器設備有無鳴叫(滴滴聲)。(2)視頻監控系統:查看視頻監控系統的畫面是否清晰、顯示是否正常、錄像是否正常、球機是否轉動。(3)門禁機:日常保養、刷卡檢測、通信檢測、顯示檢測、按鍵檢測,讀卡器及電鎖之間的電源電壓是否正常。(4)精密空調系統:檢查精密空調和監控軟件通信是否正常,參數監測是否準確。(5)市電質量檢測系統:監測實際市電輸入數據與監控數據是否一致。(6)溫濕度監測系統:查看實際溫度和濕度與監控軟件顯示的溫度、濕度是否準確,通信是否正常。(7)重要開關監測系統:檢測重要的開關,查看實時開關的狀態和監控軟件的重要開關顯示狀態是否一致。(8)漏水檢測系統:測試漏水檢測系統及設備運行是否正常。(9)測試電話、短信報警是否正常工作。(10)監控軟件:確定監控軟件運行的穩定性、數據記錄的準確性,及時對軟件進行升級。(11)檢查系統設備清潔程度,特別是設備內部的積塵及其他物質。(12)檢查系統設備運行環境,通風及散熱是否良好,環境溫度以及設備有無進水可能。(13)檢查內容每日需進行相關記錄,以保證設備單日進行過檢查,確保設備在日常維護中的可靠性,為預防突發故障做出相應的數據支撐。
(1)檢查電磁閥與控制閥的連接導線是否完好,端子有否松動或脫落。(2)從啟動鋼瓶上卸下電磁閥,檢查其動作是否靈活。(3)卸下報警及控制系統與執行機構的連接裝置,用模擬試驗方法,檢查自動控制、報警及延時功能的靈敏度和動作可靠性。(4)檢查貯存容器開啟機構靈活可靠性。(5)檢查滅火劑貯存容器閥和啟動容器閥的安全裝置和管路安全閥放氣口。(6)檢查所有鋼瓶外表有無腐蝕和鍍層脫落現象。(7)對系統中所有軟管進行外觀檢查,發現任何缺陷及時更換或對軟管進行耐壓試驗。(8)檢查內容每日需進行相關記錄,以保證設備單日進行過檢查,確保設備在日常維護中的可靠性,為預防突發故障做出相應的數據支撐。
防雷接地系統在日常維護中注意,定期使用接地電阻測試儀對機柜接地、設備接地、機房接地網、接地環進行測試,看是否存在異常接地數值,檢查是否有違規接地;應制定防雷接地設備預防性駐場運維計劃,對防雷接地的運行狀況、安全性等進行定期檢測。
運維工程師及時處理日常運行過程中出現的問題:(1)對電位端子箱、防浪涌抑制器等防雷設備進行外觀檢查,并清除雜物。(2)檢查接線端子,對接頭松動或出現氧化的部分及時進行處理。(3)檢測接地網接地電阻,對不符合要求的及時進行處理。(4)檢查接地線纜、銅排等,對有破損的部分進行修復或更換。
配電系統大致可分為動力配電柜、ATS柜、UPS柜三大部分,日常維護主要內容如下:(1)檢查液晶面板,查看溫濕度是否正常,查看時間是否正常,看是否存在報警記錄,查看參數顯示是否異常,采集數據是否正常。(2)使用紅外測溫儀檢查柜內溫度,接頭溫度,及空開、斷路器、浪涌保護器、漏電保護等是否正常。(3)記錄當天柜上數據,檢查內容每日需進行相關記錄,以保證設備單日進行過檢查,確保設備在日常維護中的可靠性,為預防突發故障做出相應的數據支撐。
機房駐場人員應對進行機房環境作業的人員提出以下要求:(1)進入機房需穿戴全套工作服,配帶鞋套等保護機房環境。(2)進入機房需有許可并進行登記。(3)進入機房產生的垃圾或廢料需及時清理。(4)向進入機房的工作人員說明機房管理制度。
機房駐點人員日常對機房環境的檢查包括:(1)檢查過程中著重查看靜電地板是否存在凹凸不平及踩踏松動等情況,記錄上報缺陷并協商更換。(2)對于防靜電地板的保養維護,應使用吸塵器或墩布進行板面的清潔,不要將液體撒在地板表面上。(3)工作區域應穿軟底專用鞋或腳套進入,嚴防粉塵進入工作場所。(4)搬運機器設備時嚴禁機器設備在地板上拖檫。(5)對防靜電地板及地板下進行吸塵處理,保證機房顆粒狀物質不超過設備正常運行要求。(6)對墻面平常不易打掃到的角落及彩鋼板進行除塵。(7)對吊頂內定期除塵,杜絕頂面灰塵掉落。(8)對頂面管子、吊桿等進行巡查,防止松動、脫落。(9)對插座電壓燈進行測試,及時發現有隱患的部分;對照明、插座的運行狀況、安全性等進行定期檢測。(10)對照明燈具、開關面板、插座進行外觀檢修,對出現松動現象的進行校正。(11)對各個區域燈具照度進行抽查,按照規范要求,若有照度不夠的,根據現場情況同甲方提出相應的整改建議。(12)檢查燈具、開關面板、插座等接線端子,對接頭松動或出現氧化現象的及時進行處理。
機房各系統及環境的維護從駐場運維方式發展,可使用穩定的運維資源,獲得較為長期的保障;通過機房現場安排駐場工程師,進行每日的現場檢查及例行記錄,檢查中有效應對突發故障,再將各系統設備的運行情況記錄下來,按每周、每月的時間節點,比對設備運行參數及報警記錄,生成各系統性能評估及運行生命周期狀態表,總結出目前設備在運行中存在的問題及隱患,并通過會議或報告的方式將各系統性能評估及運行生命周期狀態表反饋給設備管理方,給出合理化建議,同時協助設備管理方將各系統存在的問題統計出來,形成后續完善的機房運維及改造計劃,從而提升機房整體運行質量,達到延長系統工作壽命,減少系統突發性故障,保障機房穩定運行的目的,進而推動機房駐點運維方式的長遠發展。
駐場運維方式適用于設備管理方在沒有足夠專業人員數量配置的情況下,和機房建設方簽訂合同,派遣專業的工程師,對機房進行駐點維護;也適用于大型信息機房、通信機房、數據中心等大型機房的穩定維護。駐點運維人員可在機房各系統還未建設完成時就加入駐場運維,在機房各系統投入運行前就對現場的系統設備有一個深入的認識,在后期的駐場維護中,更容易排查問題所在,檢驗系統運行狀態、減少系統的突發性故障。在后期的駐場維護工作中,將日常巡視及檢查結果生成設備運行記錄、故障分析與排查、系統性能評估及運行生命周期狀態表,有利于提出完善的機房運維建議及改造計劃,逐步完善機房各系統的維護及管理。