王俊杰

摘要:信息網點巡檢工作是很多企業的信息部門必不可少的一項日常工作。文章從工作準備、臺賬資料、巡視要點、記錄字段、交流溝通、信息系統、遠程監控這幾個方面提出了一些建議,有助于規范網點巡檢工作。
關鍵詞:網點臺賬:巡視記錄:巡視照片;系統
在企業的信息運維工作中,信息網點的巡視工作是不可缺少的一部分。如何規范信息網點巡檢工作,最大限度地發揮巡檢工作的作用,是信息運維運行和管理人員需要思考的問題。以下是筆者巡檢工作中的思考和經驗的總結,希望能起到拋磚引玉的作用。
1信息網點管理的現狀及巡檢的意義
筆者所在的單位是一個大型國有企業,有員工2000余人,主要的信息網點100個,散布于全市各處,各類交換機近200臺。除了信息中心機房具備機房監控系統外,其余99個網點均無監控設施。設備的運行狀態靠網管軟件通過SNMP協議監控。設備的現場運行狀態、現場運行環境、網點安全隱患等只能靠人員定期巡檢確定。由于巡視工作是運維工作不可或缺的一部分,提升巡檢質量和記錄信息的完整性、科學性也就提升了運維工作的質量。
2巡檢工作的規范化要點
2.1信息網點臺賬
完整的信息網點臺賬是故障發生時準確定位的基礎,是巡檢工作必不可少的基礎資料,是優化運維工作、消除安全隱患的基礎。所在企業有100個信息網點,單純靠記憶或是簡單的記錄是不可靠的。對于一個信息網點,筆者認為需要記錄以下信息(見圖1)。
下面本文將說明每一個字段的意義。
網點名稱:給網點起一個名字,可以是企業中約定俗成的名字。運維人員在互相交流某一個信息網點的情況時用到的都是這個名稱。地址:需要記錄完整的路名和門牌號碼,以便任何人接手工作后都能準確地找到位置。所屬區域:根據所在地點設置,筆者所在城市分為4個區。今后可以根據區域篩選,方便查找。鑰匙保管人:記錄鑰匙的保管位置、保管人及聯系方式。適用于信息運維人員沒有保管所有網點鑰匙的情況。當某個網點信息機房不是專用機房時,鑰匙可能由所在地部門專人保管。空調:記錄空調的品牌、出廠日期、制冷量。掌握機房空調臺賬有助于管理人員統籌考慮老化空調更換計劃。交換機信息:記錄該信息網點內的設備信息。該信息可以使運維人員對該網點的設備情況有一個整體的認識。這個信息將來還可以和其他系統聯動。其他還包括房間號、面積等字段,這些字段需要記錄的內容一目了然,無需贅言。將所有網點的臺賬信息記錄完整,至少有幾個好處:(1)當有故障發生時,可以立即了解網點的基本信息,對故障的影響范圍和可能原因有個大致的評估。(2)任何運維人員,無論他是否有做過巡視工作,當需要時,都可以迅速找到信息網點的準確位置。(3)根據記錄的網點基礎信息,可以開展其他的工作。比如,評估空調的使用情況以確定更換計劃。
2.2巡檢記錄
巡檢記錄記錄了某個時間點下某個網點當時的狀態。通過巡檢記錄,運維人員最直觀地了解到信息網點存在的問題、問題解決的情況、歷史狀況等。每一次巡檢都要記錄相關的巡檢信息。筆者認為,以下內容是巡檢記錄的重點。
巡查人員:完成此次巡查的人員姓名。時間:巡查開始與結束的時間,格式為yyyy-mm-ddhh:mm。信息網點:巡查的網點名稱。門關閉情況:可以按“開”“關”“無鎖”3種情況記錄。窗戶關閉情況:可以按“開”“關”“無窗”3種情況記錄。空調運行情況:可以按“無空調”“正常”“關閉”“異常”4種情況記錄。如果是異常情況,還需記錄具體的異常信息。空氣質量:可以按“好”“中”“差”3種情況記錄。好、中、差的定義如下。好:不用帶口罩,中:建議帶口罩,差:必須帶口罩。這是為了保護巡檢人員,提醒巡檢人員在空氣質量差的環境中注意先通風后工作,防止出現密閉空間缺氧。衛生情況:可以按“好”“中”“差”3種情況記錄。理論上,如果此網點由信息科管理,信息科巡檢人員應對信息網點的衛生情況負責。如衛生狀況較差,巡檢人員無法完成清掃工作的,應記錄在巡檢記錄中。如果此網點由所在地部門管理,應將檢查情況通知相關部門領導,由該部門安排清掃工作。雜物堆放情況:可以按“有”“無”2種情況記錄。如果有堆放雜物,應通知相關部門將雜物清理干凈。設備運行情況:可以按“正常”“異常”2種情況記錄。如果異常,應記錄具體的異常現象。設備標簽:網絡設備端口處、跳線端頭處應有標簽。可以按“有”“無”2種情況記錄。如果無標簽,巡檢人員應補齊標簽。廢舊設備拆除情況:可以按“有”“無”2種情況記錄。如有廢舊設備未拆除,應記錄具體的型號數量。巡檢照片:應對以上提到的巡檢要點拍照取證。
2.3巡檢的準備工作
在開展巡檢工作前,首先應制定巡檢計劃,確定每月、每周的進度及具體巡檢地點。其次,對巡檢裝備實行定置管理。巡檢裝備包括筆記本電腦1臺、網線3根、SC,FC,LC接頭的尾纖各2根、SC,FC,LC之間的轉接頭各2個、標簽機、相機、手套、口罩、安全帽、急救箱、黑色水筆2支等。這些裝備的狀態和數量都要定期檢查。每次巡檢后都要歸位,專人保管。最后,在每一次巡檢出發之前,要先打印信息網點信息表和巡檢記錄表,做到對巡檢的目標心中有數。
2.4交流與溝通
信息網點的物理位置不一定都在信息部門的管轄范圍之內。巡檢時發現問題可能有很多種類,有的是信息設備本身的故障,有的是信息通道的故障,有些是機房基礎設施的問題。不管是否是巡檢人員能夠單獨解決的,都應在巡檢結束后,與信息網點所在地部門的負責人和鑰匙管理人員交流巡檢時發現的問題。通過和相關人員交流巡檢時發現的問題,互相交流掌握的情況,往往能夠找到最合適的解決方案。同時,將一些工作情況互相通氣,有助于工作的順利開展。
3巡檢系統的設計
通過建立一套巡檢信息系統,可以將上文所說的信息網點臺賬、巡檢記錄、交換機信息等信息電子化,方便查詢、統計、分析。由于篇幅所限,不再展開說明巡檢系統的設計細節。巡檢系統可獨立使用,也可作為網絡綜合管理系統的一個模塊使用。
4用遠程監控代替巡檢
近年來,網絡監控攝像頭日益普及。我們可以在各個網點安裝網絡監控攝像頭。將各網點攝像頭信息接入機房監控系統,可在監控系統中統一查看。安裝攝像頭后,可大幅降低巡檢頻率。比如,原先3個月巡檢一次的,可以更改為半年巡檢一次。這樣,運維人員可以花費更少的時間在巡檢上。
5結語
巡檢工作看似簡單,實際要真正做到位還有很多提升的空間。究其原因,首先是巡檢人員對巡檢工作的輕視,認為無非是到現場走走看看,缺乏認真負責的態度和深入的思考。其次,沒有一個標準制度或標準作業卡來規范巡檢工作的開展。三是未能有效利用計算機技術輔助工作。通過上文提出的一些規范化的做法,可以使工作開展更順暢有序,信息利用更充分有效。