姚婷婷,周 琳
(湖南警察學院 a.信息技術系;b.培訓部,湖南 長沙 410138)
基于集群系統硬件監控技術的機房管理系統的改進策略
姚婷婷a,周 琳b
(湖南警察學院 a.信息技術系;b.培訓部,湖南 長沙 410138)
本文針對文獻[4]、文獻[5]中討論的基于集群系統硬件監控技術的機房管理原型系統提出了兩個方面的該進策略。
集群系統硬件;監控技術;機房管理系統;改進策略
我院基于集群系統硬件監控技術的機房管理原型系統已經開發并調試完畢,在文獻[4]、[5]中主要描述了該系統的理論支撐以及具體實開發過程與調試效果。現從兩方面討論可以將來可以繼續改進的方向。
在本文的特定應用目標指向下,IPMI規范和WMI規范似乎都離我們的目標不遠。在文獻 [4]中已經詳細介紹了IPMI的技術細節。本節著重討論IPMI規范和WMI規范各自的適用范圍。
1.IPMI功能以及適用對象。1998年Intel、DELL、HP及NEC共同提出IPMI規范,可以通過LAN遠端監控服務器溫度、電壓等電氣設備。IPMI是智能型平臺管理接口(Intelligent Platform Management Interface)的縮寫,是管理基于Intel結構的企業系統中所使用的外圍設備采用的一種工業標準,該標準由英特爾、惠普、NEC、美國戴爾電腦和Supermicro等公司制定。用戶可以利用IPMI監視服務器的物理健康特征,如溫度、電壓、風扇工作狀態、電源狀態等。而且更為重要的是IPMI是一個開放的免費標準,用戶無需為使用該
標準而支付額外的費用。其工作原理如圖所示。

從上圖可知,該規范的工作對象為服務器且該規范可獨立于操作系統對服務器進行遠程監控。基于該規范的監控模式是通過LAN遠程監控服務器上的各電器元件的運轉情況。隨著版本的不斷升級,還可以實現對多路電氣元件(如多個CPU)的監控。我院的學生機房有建立了服務器的小型局域網網絡,也有只是實現了局域網互聯的無服務器網絡。這給我院基于集群系統硬件監控技術的機房原型系統的開發增加了難度。
2.WMI功能以及適用對象。Windows管理規范(Windows Management Instrumentation是一項核心的Windows管理技術;用戶可以使用WMI規范管理本地和遠程計算機的軟硬件資源。WMI規范通過編程和腳本語言為日常管理提供了一條連續一致的途徑。例如,用戶可以在遠程計算機器上啟動一個進程;也可以設定一個在特定日期和時間運行的進程;用戶還可以遠程啟動計算機;或者用戶也可以獲得本地或遠程計算機的已安裝程序列表或者查詢本地或遠程計算機的Windows事件日志。WMI中的“Instrumentation”特指WMI可以獲得關于計算機內部狀態的信息,這與汽車儀表盤獲得并顯示引擎的狀態信息非常類似。WMI對磁盤、進程、和其他Windows系統對象進行建模,從而實現“指示”功能。WMI的功能還包括事件觸發、遠程調用、查詢、查看、架構的用戶擴展、指示等。
由上可知,WMI規范也可以實現對計算機的軟硬件資源的實時監控。但該規范與IPMI規范的最大區別是能否獨立于操作系統單獨工作。后者可以實現獨立于操作系統單獨監控軟硬件資源的工作,這種不依賴于操作系統的特性更符合我院配置了服務器的學生機房的客觀實際情況。WMI規范不需要部署和配置服務器的特性,相比之下更加簡單、經濟、實用。在文獻[5]中實現了基于WMI規范的遠程監控系統。
在文獻[4]和文獻[5]提到的解決方案中,集群系統中各個計算機電器元件的運轉數據被采集在服務器端的數據庫中。通過第一節的討論,我們可以知道,如果基于WMI規范做解決方案,整個集群系統中不存在服務器了,那么臨時采集的各電氣元件的數據放在哪里隨時提供查詢服務呢?本文提出兩種關于數據所在位置的思路,在文獻[5]中也是基于第一重考慮而開發設計的。
1.在特定計算機上存儲監測數據供隨時查詢。基于WMI規范的解決方案中,由于沒有特定的服務器,那么實時采集的計算機軟硬件資源的運轉情況的數據存儲在什么位置,也是必須考慮的問題。本文提出可以任意指定一臺局域網中的計算機為數據存儲單位,在部署軟件時額外加裝數據收集模塊。這臺主機扮演的就是收集數據和提供數據查詢的角色。在文獻[5]中,就是采用的這種方法。
2.每臺機器都收集自己的數據。事實上,基于2.1小節提出的解決方法相反的思路,是否有另外一種方法,解決數據存儲問題呢?順著這個思路,本文提出如果每臺主機都采集本機的軟硬件資源運轉情況的數據,只在用戶遠程查詢的時候在當前查詢的機器做臨時的數據組合,一旦查詢完畢,數據即釋放空間,也是可以解決問題的。類似于分布式數據庫的數據裝載和數據分布存儲的思路。朝這個方向努力,可以發現這種思路具有更大的靈活性。一旦局域網中的某一個節點出現了問題,那么其他的某一個正常工作的節點馬上能夠擔負起數據重組的任務,規避了2.1小節提出的解決方案中一旦作為數據庫存儲節點的機器不能正常啟動,那么整個監控系統就會癱瘓的風險。
當然,這個方向,是以增加了每個節點上安裝的程序的復雜度為代價的,但顯然是值得的。
[1]許柯,鄭明雪.基于WEB的大規模集群監控系統設計[J].網絡安全技術與應用,2008,(9):78-79.
[2]李娜.基于IPMI技術的服務器管理系統設計與實現[D].北京:北京郵電大學,2009.
[3]馬海東.基于互聯網的遠程監控系統的研究[D].大慶石油大學,2007.
[4]姚婷婷,許柯.基于集群系統硬件監控技術的機房管理解決方案[J].教育教學論壇,2013,(08).
[5]姚婷婷,賀永恒.構建學生機房硬件監控系統的解決方案[J].教育教學論壇,2013,(12).
G647
A
1674-9324(2014)04-0016-02