翟書敬
(新華社陜西分社技術中心,西安 710004)
機房是單位所有信息數據采集、加工、傳送、存儲的核心區域。機房內部安放著各種所有網絡傳輸設備、對內對外各種服務器、防火墻、交換機。監控安防系統、動環網絡系統、OA 系統、財務系統、工作平臺等各個系統的服務器以及相關的數據存儲設備,所以一旦因為管理與維護不當,機房出現故障,就會給各個業務造成無法估量、不可挽回的損失。因此,做好機房的管理與維護工作就顯得相當的重要。
我們日常能接觸到的機房管理及維護的主要內容,大體涉及到以下六個方面:
(1)機房內部放置的各種服務器、交換機、路由器、PC 機等硬件設備。
(2)機房管理維護的各種系統。包括機房電力監控系統、環境檢測系統、安保監控系統、門禁系統等。
(3)機房電力保障。包括電力線路、主副配電箱、UPS 電池、照明、開關等。
(4)機房環境設備。包括空調系統及新風系統。
(5)機房消防安全設備。包括煙感探測器、火災報警器、滅火器等。
(6)機房清潔除塵等基礎維護。
首先就是要制定規矩,要制定詳細的機房管理與維護制度,要制定發生故障時的應急處理辦法,規范日常檢修各個操作流程和登記制度,明確責任到人,制定詳細的日常檢查記錄表格和記錄方式,做好登記工作。定期對相關登記做檢查、抽查,加強管理及監督,獎罰明確。
管理人員要熟練的掌握機房內部放置的各種服務器、交換機、電腦等硬件設備的維護方法和手段,要會根據錯誤代碼、指示燈狀態,來辨別機器運行的情況,并做到及時有效的處理故障。對重要的交換機服務器要做好備份工作,如果條件允許,最好選用帶有備份機制的相關設備。
機房環境監控系統對保障機房所有設備正常運行起著相當重要的角色,管理人員要熟練使用各類機房管理維護系統,要密切監控各項數據,掌握報警處理的方法和流程,通過智能化管理,提高機房管理效率。但不能完全依賴于監控系統,還是要按規定,做好日常的人工排查梳理工作,人和機器完美配合、相互補充,確保萬無一失。
灰塵對于設備的運行具有極大的風險,一粒微小的灰塵對于精密的電子設備來說,都相當于一顆定時炸彈。要定期對機房的環境衛生進行徹底打掃。要建立一整套周、月、年的相關清潔流程和清理內容。對設備進行清理時應提前做好防靜電措施,最好斷電操作。使用毛刷、無水酒精、吸塵器等輔助設備進行除塵。對綜合布線進行清理時還有注意及時修復松動變形等情況,檢查布線標簽。
要定期檢查精密空調及新風系統的運行情況,保證機房溫度控制在18℃~25℃之間、相對濕度控制在45%~65%之間。定期清潔空調及新風機的過濾器,仔細檢查空調水管有無漏水,空調干燥過濾器、壓縮機電壓保護開關及其他附件,需要時要請專業人員補充制冷劑。
要定期檢查整個機房的動力、通信、監控等用電系統,檢查防雷擊過電壓保護裝置。加固接地線觸點并防止氧化老化。檢查UPS 電池組的運行情況,檢查電池組的零地之間電壓、輸出波形、諧波含量等參數,定期進行切換測試,有條件可以進行充放電維護,保證電池組的狀態和壽命。
消防系統是整個機房的安全屏障,一般機房都采用氣體滅火系統。要定期檢查煙感探測器、火災警報裝置的報警功能,檢查氣體滅火系統的運行狀況,各個按鈕的效果。要在機房內部放置足夠的滅火器,及時更換壓力不足的滅火器。有條件可以進行滅火演練,讓管理人員熟練掌握滅火器的使用方法。
在計算機機房維護管理過程中,除了要進行計算機硬件維護外,還要對計算機軟件系統進行維護。較之于上述硬件維護管理,計算機系統中的軟件維護工作具有較高的技術含量。
首先要熟悉各個維護軟件的使用方法,在實踐中逐步摸索總結經驗。提前制定操作失誤的補救措施,對重要的軟件定期進行數據備份。在工作中中為了能夠有效防止誤操作問題的發生,應當對相關服務器的操作系統,主要交換機的配置,提前都要做好備份工作,最好能有備份機器,這樣即使突然壞掉,也能迅速補位,不會對網絡產生影響。
或者選取一些專門的加密和恢復的多功能軟件,可以有效防止出現數據信息丟失、病毒侵入計算系統等問題。從應用實踐來看,此類軟件可以在計算機開機后將其初始化所預設的時間節點,以便于避免病毒寫入,對已經下載的病毒文件可以徹底刪除。
機房維護和管理人員應當熟悉計算機軟件系統的安裝規范和要求,也要經常學習最新的知識,補充個人眼界的局限性。對新知識新技術要有天然的敏感反映。常學常新,學以致用。
綜上所述,機房的管理與維護就是建立在科學高效的管理規則之上,同時隨著技術發展的日新月異,管理人員也要及時學習,提高個人素質與專業水平,提升服務能力,盡可能的將所有安全隱患都消除在萌芽之中。保障機房安全、高效、平穩的運行!