茍毅博 劉偉 西安郵電大學計算機學院
我單位在監控系統的歷程中,先后建立多種監控系統,如監控網絡質量、監控服務器硬件、監控操作系統,監控存儲設備等十幾個系統。在各系統的單一監控部署完成且通過磨合期 之后,為了實現系統基礎資源的統一監控,需要將各監控系統進行整合。將來自各個不同監控系統 的監控信息進行篩選、分類、閥值匹配、事件關聯, 然后通過多途徑的報警機制對異常信息以聲響、短 信、郵件等方式進行通報。具體分為以下幾個大塊:

圖1
我們通過學習運維管理中的一些理論,如CMDB(配置管理),ITIL(IT基礎架構)、BSM(業務服務管理)和SLA(運維服務等級),借助開源監控系統Zabbix的選型和部署為測試、以及結合工作需求,通過腳本、接口實現了存儲監控和虛擬化監控的運維需求,最終實現融合監控平臺的搭建。
后期還可以實現報表展示等二次開發。 將以被動報警為主的I T監控平臺提升為主動分析 處理的專家型I T綜合監控平臺。
通過標準協議和接口獲取的數據,需要標準化處理,如字符串要限定格式,數值類要限定類型,最終標準化格式為具有時間序列的一條記錄:

網絡地址 指標名稱 結果 獲取時間192.168.1.16 內存利用率 30 2018/02/12 19:30
同時,與系統資源庫表中的閥值策略對比,如上述內存利用率在生產環境中我們設定的閥值為60%到80%,即內存利用率小于60%為正常范圍,60%與80%之間為問題關注范圍,大于80%則認為嚴重問題,此時需要產生事件,并且發送告警信息給相關責任人。
在大數據的背影下,這些指標數據的潛能也被發掘出來了。來自各系統全面的監控數據使得預測性維修具備了可行性。并使我們的運維工作思維及工作方式發生了轉變。
指標數據積累形成的原始數據,即可以提供給其它系統,又可以通過分析來作為設備的負載和后期資源擴容的判斷標準,目前采用的判斷算法來源局限于工作中的經驗比例。
基于大數據的故障預測也被稱為預測性維護,即以這些數據為基礎,從策略層面來實施維護流程,那么設施管理人員就可以實現所謂的預測性維護——將維護技術與從不同設備和機器上得到的實時信息關聯起來,從而可以實現按需完成維護工作。這樣不僅可以降低停機時間,提高產量,還能消除在不必要的維護上所花費的時間和資源。
一旦設備完成網絡連接,具有測量和監視數據功能,生產運營經理就可以與數據專家合作,確保設備能夠以最優的方式采集和使用數據。數據專家可以通過對現場甚至是虛擬場景的評估,來改進數據運營。聯網設備采集的數據,可以存儲在云端,通過一個基于服務器的模型來實現虛擬監視。當數據被虛擬存儲時,就可以對其進行訪問、分析,并在數據專家的幫助和指導下,用其指揮和實施預測性維護。這種虛擬化,作為數據專家提供服務的一種,可以加速在工廠內實現預測維護
當系統的負載壓力就明顯上升時,就應該考慮項目擴容。常規考慮的因素有IOPS、CPU、內存、磁盤空間,借助運維知識庫和預測模型,從而大大提高整體的運維管理水平,從系統架構角度來關聯分析和定位擴容根源。
對底層IT資源到業務應用系統的提供統一的多融合監控解決方案,可實現對應用系統所依托的網絡資源、主機資源、應用系統資源等信息基礎設置進行統一綜合管理和全方位的監控,同時在業務支撐、應用系統、自動化故障處理等方面顯示明顯的功能優勢。綜合考量,可作為大數據背影下企業復雜網絡環境和IT系統使用的一體化監控系統。
[1]熊桂喜,王小虎譯,計算機網絡(第三版),北京:清華大學出版社,1998
[2]曾誠;高性能ASP.NET應用程序的探討與研究[J];湖北大學學報(自然科學版);2004年01期
[3]劉權;;基于CMDB的網管系統業務可用性監控平臺的設計與實現[J];電信工程技術與標準化;2012年10期
[4]葉枝平;;IT監控系統的設計與實現[J];現代計算機(專業版);2010年06期
[5]李春剛;;淺談IT業務系統應用程序監控的實現[J];電腦知識與技術;2009年20期
[6]丁美珍;黃晨;;基于Nagios的網絡監控系統的設計與實現[J];信息技術與信息化;2015年04期
[7] 孫桂萍;基于SNMP協議的網絡拓撲自動發現的方法與實現[D];山東大學;2006年
[8]孫柔玲;楊旭;莊磊;項穎;張曉軍;;ITIL變更管理在ERP系統運維中的應用[A];2012電力行業信息化年會論文集[C];2012年
[9] 李成鐵;顧德英;汪晉寬;;基于B/S結構在線監控研究應用[A];中國儀器儀表學會第六屆青年學術會議論文集[C];2004年
[10]羅可;數據庫中數據挖掘理論方法及應用研究[D];湖南大學;2005年
[11]韋志勇;張子良;;基于開源的軟件產品測試過程研究[J];企業科技與發展;2010年22