劉澤輝(天津天鐵冶金集團技術中心,河北涉縣056404)
天津鐵廠自1998年就將計算機網(wǎng)絡系統(tǒng)應用到生產經(jīng)營業(yè)務中,取得了較好的應用效果,如銷售系統(tǒng)、生產管理系統(tǒng)、質量系統(tǒng)、計量系統(tǒng)、原料系統(tǒng)、燃料系統(tǒng)、財務系統(tǒng)、設材系統(tǒng)和設備管理系統(tǒng)等。配備有相關設備交換機200余臺、服務器60臺、小型機6臺、光纜線路210公里。計算機機房配電總功率達210×107W。要保證企業(yè)生產經(jīng)營正常進行,首先要確保計算機房的配電、網(wǎng)絡、數(shù)據(jù)庫的安全穩(wěn)定運行,保證24 h不間斷運行。
針對以上問題,從三方面著手建立了一套統(tǒng)一、完整、有效的配電、網(wǎng)絡、數(shù)據(jù)庫實時監(jiān)控管理系統(tǒng)。
(1)電流互感器65套,分別監(jiān)測40個機柜的電流,各房間15個分線箱電流,5個零線電流,5個地線電流,電壓互感器2套分別監(jiān)測變壓器輸出電壓和UPS輸出電壓。
(2)組態(tài)王編程256點開發(fā)軟件,一套用于編制配電數(shù)據(jù)的實時顯示和歷史存儲,自主開發(fā)網(wǎng)絡管理軟件一套,實時顯示各交換機的運行狀態(tài)及流量統(tǒng)計,并通過軟件設置實現(xiàn)網(wǎng)絡廣播風暴的報警、抑制、隔離功能。
(3)配置數(shù)據(jù)庫監(jiān)控軟件一套,通過數(shù)據(jù)策略設置和數(shù)據(jù)庫監(jiān)控軟件的配置,對服務器數(shù)據(jù)庫關鍵運行參數(shù)實現(xiàn)實時監(jiān)測、報警。
安裝電壓、電流互感器采集配電系統(tǒng)中主路電壓、分支電流、N線和PE線電流,安裝接口采集卡采集UPS的配電運行數(shù)據(jù),通過PLC編程上傳至上位機數(shù)據(jù)庫連接至太網(wǎng);編制軟件,對數(shù)據(jù)庫中的數(shù)據(jù)進行統(tǒng)計分析并實現(xiàn)歷史曲線查詢并在以太網(wǎng)進行發(fā)布。解決只能依靠實時監(jiān)控UPS數(shù)據(jù)信息來推斷配電系統(tǒng)存在的隱患和問題,無法了解之前的歷史記錄,從而不能隨時發(fā)現(xiàn)配電系統(tǒng)存在的隱患并進一步制訂整改措施的問題。
把每個交換機的IP地址、交換機每個端口連接設備的IP地址及MAC地址錄入數(shù)據(jù)庫,通過開發(fā)軟件實現(xiàn)每臺設備的在線監(jiān)測和歷史曲線查詢,通過配置網(wǎng)絡流量帶寬控制實現(xiàn)網(wǎng)絡廣播風暴抑制、阻斷功能避免大面積網(wǎng)絡癱瘓,通過防火墻技術、和以太網(wǎng)的物理地址綁定功能,杜絕IP地址的私接盜用,配置ARP阻斷功能,阻擋惡意攻擊,自動禁止企業(yè)內部網(wǎng)與互聯(lián)網(wǎng)相連,杜絕計算機病毒的感染泛濫。有效杜絕公司生產經(jīng)營數(shù)據(jù)的安全可靠。
采用軟件實現(xiàn)對小型機、服務器、應用程序、數(shù)據(jù)庫運行的監(jiān)控,通過對系統(tǒng)運行占用小型機和服務器CPU、內存的在線分析應用程序的代碼編寫、數(shù)據(jù)庫設計規(guī)范是否合理,網(wǎng)絡吞吐狀況,進程統(tǒng)計信息,系統(tǒng)響應時間是否正常等。有選擇性地聚焦到應用程序和數(shù)據(jù)庫問題發(fā)生點,系統(tǒng)化地定義業(yè)務服務、IT服務和基礎架構等之間的關鍵聯(lián)接,從而進行程序代碼和數(shù)據(jù)庫設計的優(yōu)化和完善,幫助IT極大地減少應用的MTTR,解決只靠增加或擴充硬件配置來解決軟件、數(shù)據(jù)庫的繁冗和不規(guī)范帶來的計算機業(yè)務系統(tǒng)運行速度慢、運行效率低的問題。增強了專家級性能建議能力,性能極限能力,下鉆能力,跟蹤能力,對不合理的設計及時提出建議,超出系統(tǒng)承載極限及時報警,直接定位系統(tǒng)問題的根源和瓶頸,再針對性地采取相應措施進行改進。具體內容包括J2EE應用管理,MQ管理,Siebele-BusinessApplications管理,OracleeBusinessSuite管理,Webserver、應用服務器(Tuxedo)和數(shù)據(jù)庫服務器管理。
(1)自項目投運以來,通過對零線電流過大分析實現(xiàn)了配電負載均衡分配,通過對異常電流數(shù)據(jù)分析,發(fā)現(xiàn)故障隱患設備并及時修復,通過對地線電流的異常分析發(fā)現(xiàn)消防隊用電影響,采用獨立變壓器隔離消除了影響,發(fā)現(xiàn)了零地混接現(xiàn)象和部位進行了整改。通過電網(wǎng)異常電壓的報警,及時切換備用電路,消除了異常停電的影響,實現(xiàn)了各種情況下24小時不間斷供電。
(2)通過網(wǎng)絡監(jiān)控及時定位網(wǎng)絡故障,大大縮短了故障處理時間,有效阻斷了企業(yè)網(wǎng)絡與互聯(lián)網(wǎng)的連接,通過端口自我保護功能的應用,避免了網(wǎng)絡廣播風暴的發(fā)生,有效解決了以前多次因網(wǎng)絡廣播風暴造成的全網(wǎng)癱瘓。計算機預防病毒能力大大提高,不會像互聯(lián)網(wǎng)中計算機,總是因為病毒感染造成系統(tǒng)崩潰或數(shù)據(jù)丟失。網(wǎng)絡信息軟件編制實現(xiàn)了所有網(wǎng)絡地址信息的查詢,為今后的網(wǎng)絡系統(tǒng)升級擴容、設備隱患排查提供了詳盡依據(jù)。網(wǎng)絡系統(tǒng)穩(wěn)定性、數(shù)據(jù)安全準確性得到了可靠的保證。
(3)監(jiān)控軟件實現(xiàn)了對數(shù)據(jù)庫整體性能監(jiān)控分析管理,收集的數(shù)據(jù)更加簡潔、及時,為發(fā)現(xiàn)性能瓶頸提供了快速診斷和解決功能,有效實現(xiàn)了可用性的管理目標。查找出計算機業(yè)務系統(tǒng)軟件中繁冗代碼和數(shù)據(jù)庫設計缺陷,并組織技術人員進行了優(yōu)化,如銷售系統(tǒng)、設材系統(tǒng),大大提高了系統(tǒng)運行速度,節(jié)約了大量不必要的采購資金,有效解決了不斷增加的硬件環(huán)境復雜程度和維護難度。