董智
?
淺談機房電源故障與處理
董智
新疆專用通信局工程技術中心,新疆 烏魯木齊 830002
隨著網絡和信息技術的不斷進步,各種不同用途的機房逐漸增多,機房承擔著相對重要的工作,是系統的靈魂。一旦機房出現問題,將直接影響到正常的生產及生活。基于此,詳細討論了機房電源的常見故障和處理方法,旨在為相關人員在機房的電源故障處理方面提供一定的理論依據。
機房;電源故障;處理
結合國內外機房的相關工作經驗,我國在吸取不同經驗的同時進行了極大改進。機房的故障中最常發生的就是電源故障。一旦出現故障,就會導致大面積的網絡停止工作,給人們的生產和生活造成了極大的不便。為了盡量避免機房出現電源故障,應在日常的工作中注重對供電系統的實時監測與維護,以保證外部供電停止的時候,機房的供電狀況依然正常,能夠繼續為人們的生產和生活服務。
在常規狀態下,機房的電源為普通城市供電,其供電如果發生中斷,通常是由于城市的供電系統出現問題或者進行檢修時造成的供電間斷。在城市供電終止的時候,為了保證機房的正常工作,通常需要采取其他的供電手段,常用的代替普通城市供電的手段有油機供電系統和蓄電池供電系統。供電的切換,要通過制定的設備進行,通常采用不間斷電源設備。一旦正常的城市供電終止,不間斷電源設備能夠實現自動的對供電系統切換電源。
對于有機供電系統和蓄電池供電系統,其工作的原理及供電時間的長短各不相同。蓄電池供電系統的供電時間較短,但是使用較多。一旦城市供電終止,通常機房首選的供電方式為蓄電池供電。
在供電一段時間以后,需要進行供電的切換。如果城市供電恢復,則切換為正常的城市供電系統。如果城市供電沒有恢復,則需要切換為油機供電系統,以避免蓄電池電能用完,不能對機房正常供電而導致的機房停止工作、網絡全面暫停的現象發生。機房維護人員需要對其供電系統進行定期的檢修和維護,維護的對象包括不間斷電源設備、油機供電系統和蓄電池供電系統。工作人員還需要準確了解不同供電系統的供電持續時間,由于蓄電池等設備隨著使用年限的延長,供電時間將不斷縮短,維護人員應對這些設備有及時、詳細的了解,保證在一種供電系統電能耗盡之前,合理地對其進行切換,避免機房的正常運行受到影響。另外,也可以在蓄電池電量不充足的時候,及時關閉一些作用不是很主要的設備,以節約能源,延長蓄電池的使用時間。
2.1 故障現象
不間斷電源設備的空開現象在機房的運行過程中較為多見,其主要分為兩種:一種是機房的全部設備的空開;一種是部分設備的空開。不間斷電源設備的空開將會導致電源供電失敗,主要包括:第一,部分設備空開引起的機房內部部分電路的中斷;第二,機房全部設備空開引起的全部設備的電路中斷,供電系統失靈。
2.2 故障原因
導致不間斷電源設備空開的因素有很多,可以從先排查可能性大的因素開始,逐一進行。空開可能性最大的因素是機房的電源承受的負載超出允許范圍,導致其無法正常運行,進而引起空開。其次,是機房中的設備在運行中出現故障,導致空開。
2.3 解決辦法
當機房由于不明原因而停止工作時,技術人員應對整個系統進行檢查,首先查看不間斷供電系統,看起是否出現了空開現象,電源是否停止供電。如果電源停止供電,且停止運行的所有設備都是由統一個不間斷電源設備所控制,則應對不間斷電源設備進行檢查,并停止對其供電。之后,再分別斷開有其控制的所有設備與電源連接,技術人員對設備進行全面排查,看設備是否存在故障,比如是否出現超轉或者內部線路老化等問題。如果確實有某個設備出現了故障,則表明機房電源的中斷是由于設備的異常而引起的,應對出現故障的設備及時進行維修或者更換,確保其正常運行,不影響線路中的其他設備。之后再打開不間斷供電系統的空開,恢復整個供電線路工作。如果所有設備經過仔細的排查,均沒有發生故障,則檢查后也應打開不間斷供電系統的空開,繼續供電,再逐漸接入不用的設備。開始可以先接入一個對系統貢獻不大、耗電較少的設備,之后再逐一接入其他設備。接入的順序按照耗電量有小到大,功能有次要到主要的順序。在設備接入的同時,嚴密監測設備的運行情況和不間斷供電系統的工作狀況。一旦出現異常現象,馬上采取緊急措施,切斷電源及所有設備的連接,如果發現不間斷控制系統的負載過大,則及時對設備進行切換。如果運行中沒有異常,則系統可以繼續工作,當初的故障是由于暫時性的設備異常而引起的,不會產生較大的影響。所以,在機房的正常工作時,也應注意對設備進行嚴密的監測與維護,以確保其能夠穩定的運行。
設備運行時供電穩定性不足通常是因為設備所供給的電壓不夠穩定。機房的維護人員可以通過現代化的技術手段對其進行實時監測,將設備接入遠程控制系統,通過局域網和計算機監測和控制供電系統。某些機房的條件有限,也可以采用萬用表與不同的設備相連接,通過檢測設備的電壓是否波動,來查看供電系統的穩定情況。供電系統的電壓不穩定,容易造成設備在運行過程中出現巨大的波動,影響其使用壽命,對運行效果極為不利。一旦發現供電不穩,通過計算機切換或者手動操作,及時停止設備的運行,直到電壓恢復正常,再將設備接入系統。
綜上所述,機房的正常運行對生產和人們的生活有著重要的意義,是網絡正常工作的前提和保障。相關工作人員應做好機房運行中的供電監測工作。一旦外部供電停止,能夠保證機房在使用備用電源供給的情況下正常運行。
[1]丁桂萍.淺談計算機的維護與故障的維修[J].新課程,2011(1):115.
[2]田育新,孫立萌,孟穎悟,但星亭.熱插拔技術在機載計算機電源系統 中的研究[J].航空計算技術,2009,39(5):104-106.
[3]姚信安,宋飛,胡世平.高性能計算機系統電源設計[J].計算機應用,2012(4):24-25.
TN86
A
1009-6434(2016)05-0029-01