畢云星
摘要:建設數(shù)據(jù)中心機房動力環(huán)境集中監(jiān)控系統(tǒng)具有重要意義,通過動力環(huán)境集中監(jiān)控系統(tǒng)可以將不同地區(qū)機房的監(jiān)控數(shù)據(jù)進行集中監(jiān)控管理,采用數(shù)據(jù)挖掘模型能夠進一步提升監(jiān)控的智能化水平。文章對數(shù)據(jù)挖掘模型應用于機房動力環(huán)境監(jiān)控系統(tǒng)中的設備故障預警等進行研究,建立GMDH神經(jīng)網(wǎng)絡,利用監(jiān)控系統(tǒng)中的歷史數(shù)據(jù),可以有效地對機房中的各類設備故障進行預警,加強對機房的監(jiān)控,提高機房監(jiān)控的智能化水平。
關鍵詞:動力環(huán)境;監(jiān)控系統(tǒng);神經(jīng)網(wǎng)絡;監(jiān)控預警
doi:10.3969/J.ISSN.1672-7274.2024.03.047
中圖分類號:O 157.5,TP 183? ? ? ? ? 文獻標志碼:A? ? ? ? ? ?文章編碼:1672-7274(2024)03-0-03
1? ?研究背景
建設數(shù)據(jù)中心機房動力環(huán)境集中監(jiān)控系統(tǒng)具有重要意義,通過動力環(huán)境集中監(jiān)控系統(tǒng)可以將不同地區(qū)機房的監(jiān)控數(shù)據(jù)進行集中管理,實現(xiàn)實時監(jiān)控、遠程管理、預警功能、統(tǒng)一展示的運維管理目的。該系統(tǒng)的主要監(jiān)控對象包括電力供應設備、精密空調(diào)、溫濕度、漏水檢測、消防、紅外、視頻監(jiān)測等。集中監(jiān)控系統(tǒng)需要具備穩(wěn)定、可靠、安全的特性,提供7×24×365不間斷的系統(tǒng)監(jiān)控及運行保障。動力環(huán)境監(jiān)控系統(tǒng)在對機房進行全面監(jiān)控的過程中,所產(chǎn)生的監(jiān)控數(shù)據(jù)是寶貴的資源。通過運用數(shù)據(jù)挖掘技術對這些數(shù)據(jù)中的潛在價值與隱藏知識進行分析,能夠為機房管理和運維提供洞察力和決策支持[1]。
首先,數(shù)據(jù)挖掘技術能夠深入分析機房監(jiān)控對象的數(shù)據(jù),從中識別出潛在的趨勢和規(guī)律。例如,通過對動力設備的歷史數(shù)據(jù)進行分析,系統(tǒng)可以發(fā)現(xiàn)設備故障的周期性規(guī)律,預測可能再次發(fā)生的故障情況,監(jiān)控人員能夠提前采取維護措施,降低機房運行出現(xiàn)故障的風險。
其次,數(shù)據(jù)挖掘技術還可以實現(xiàn)對機房能耗的優(yōu)化。通過分析能耗數(shù)據(jù)和環(huán)境參數(shù)的關系,系統(tǒng)可以識別出能耗過高的設備,并分析導致能源浪費的原因。通過對比設備在不同時間段的能耗數(shù)據(jù),識別能源消耗的高峰期和低谷期,優(yōu)化設備在不同時段的使用,達到降低能源開支、提高機房運行效率的目的。
再次,數(shù)據(jù)挖掘技術有助于加強機房的安全防護。通過對安全監(jiān)控數(shù)據(jù)的分析,系統(tǒng)可以檢測出異?;顒雍腿肭中袨?,及時發(fā)出預警,確保機房的安全。同時,對設備運行數(shù)據(jù)的挖掘,能夠識別潛在的故障風險或安全隱患,有利于機房管理人員采取措施,保障機房的安全。
最后,除了保障機房的運行安全,數(shù)據(jù)挖掘技術還能提升機房的運維效率。通過對設備維修記錄和運行數(shù)據(jù)的挖掘,系統(tǒng)可以建立設備運維的智能計劃,制訂更加科學合理的維護周期和預防性維護策略。機房管理員可以在保證設備穩(wěn)定運行的前提下,最大程度地減少不必要的維護成本和停機時間。
2? ?GMDH神經(jīng)網(wǎng)絡基本原理
GMDH(Group Method of Data Handling)神經(jīng)網(wǎng)絡能夠應用于回歸與分類問題。GMDH神經(jīng)網(wǎng)絡由A.G. Ivakhnenko于1968年提出,經(jīng)過不斷發(fā)展與完善,被應用于各類場景中。GMDH神經(jīng)網(wǎng)絡是一種根據(jù)樣本信息自動確定網(wǎng)絡結構的模型。與BP神經(jīng)網(wǎng)絡等不同,GMDH神經(jīng)網(wǎng)絡無須事先預定網(wǎng)絡結構,而是根據(jù)數(shù)據(jù)的特性和復雜程度自動選擇合適的網(wǎng)絡結構。在每一層神經(jīng)網(wǎng)絡中,GMDH神經(jīng)網(wǎng)絡會對變量進行組合,形成新的特征,擴展模型的復雜度。通過原始變量的線性及非線性組合,可以實現(xiàn)對不同函數(shù)的擬合。在GMDH神經(jīng)網(wǎng)絡中,由傳遞函數(shù)負責具體組合原始變量。傳遞函數(shù)可以選擇不同的函數(shù)形式,主要包括以下幾類。
GMDH神經(jīng)網(wǎng)絡采用多層結構處理數(shù)據(jù),每一層結構都對數(shù)據(jù)集進行計算。最初的輸入層接受原始的輸入變量,然后逐層進行變量組合和篩選來建立新的模型。假設對機房設備故障預警的判定指標可以表示為,其中,代表預警輸出的狀態(tài)向量,D代表由故障預警指標組成的矩陣,滿足半正定矩陣的性質(zhì),如公式(1)所示。
采用AUC、查準率等指標作為模型的評價依據(jù),則機房故障預警樣本劃分可以采用式(2)進行表示。
對公示(2)進行正則化以后,得到式(3)。
式中,代表公式(2)中,對應的A組樣本的各項輸入向量,代表公式(2)中,對應的B組樣本的各項輸入向量,第h層GMDH神經(jīng)網(wǎng)絡的結構需要滿足公式(4)。
式中,代表預警輸出的狀態(tài)向量,代表第H層的傳遞函數(shù)形成的矩陣。通過求解以上公式,GMDH神經(jīng)網(wǎng)絡能夠自適應的調(diào)整網(wǎng)絡結構,達到對機房設備故障進行預警的目的。
3? ?基于GMDH神經(jīng)網(wǎng)絡的機房動力環(huán)境預測應用
基于GMDH神經(jīng)網(wǎng)絡,采用機房動力環(huán)境監(jiān)測數(shù)據(jù),可以構建機房設備故障預警模型。
如圖1所示,在將GMDH神經(jīng)網(wǎng)絡應用于機房動力環(huán)境集中監(jiān)控時,首先,需要收集機房動力環(huán)境中各個設備的傳感器數(shù)據(jù),如溫度、濕度、電壓、電流等。同時,記錄設備的運行狀態(tài),包括正常運行和故障情況。收集好的數(shù)據(jù)將用于訓練和測試GMDH神經(jīng)網(wǎng)絡模型。對收集到的數(shù)據(jù)通過預處理、數(shù)據(jù)清洗、缺失值處理、特征選擇等步驟,確保數(shù)據(jù)的質(zhì)量和完整性[2]。
其次,在訓練GMDH神經(jīng)網(wǎng)絡時,可以采用遺傳算法進行參數(shù)優(yōu)化。遺傳算法是一種基于自然選擇和遺傳機制的參數(shù)優(yōu)化算法。該算法是一種在解決復雜問題時尋找近似最優(yōu)解的啟發(fā)式搜索算法。遺傳算法模擬自然界中的遺傳和進化過程,通過模擬生物個體的繁殖、適應度和遺傳變異等機制,搜索問題的求解空間,找到最優(yōu)或接近最優(yōu)的解。
再次,在GMDH神經(jīng)網(wǎng)絡訓練完成后,可以采用額外的樣本數(shù)據(jù)進行測試。將數(shù)據(jù)輸入到訓練好的GMDH神經(jīng)網(wǎng)絡模型中,得到GMDH神經(jīng)網(wǎng)絡模型的預測結果,與設備的實際運行狀態(tài)進行比較,對模型進行估計。在使用測試集數(shù)據(jù)驗證訓練好的GMDH神經(jīng)網(wǎng)絡模型時,評估模型預測性能的指標主要包括準確率、召回率、精確率等,通過對這些指標進行分析,確保模型的可靠性和準確性。
最后,在驗證完GMDH神經(jīng)網(wǎng)絡的性能以后,可以將GMDH神經(jīng)用于生產(chǎn)實踐中。一旦GMDH神經(jīng)網(wǎng)絡訓練完成并通過驗證,就可以將其應用于實時數(shù)據(jù)的監(jiān)控中。當實時數(shù)據(jù)被輸入到GMDH神經(jīng)網(wǎng)絡中時,模型根據(jù)歷史數(shù)據(jù)的規(guī)律來預測設備的運行狀態(tài)。如果GMDH神經(jīng)網(wǎng)絡檢測到異常情況或設備故障的潛在跡象,即可發(fā)出預警信號。通過將GMDH神經(jīng)網(wǎng)絡模型集成到機房動力環(huán)境集中監(jiān)控系統(tǒng)中,可以實現(xiàn)實時的設備故障預警。預警信息可以通過各種方式通知相關工作人員,比如手機短信、郵件、App通知等,以便機房管理人員及時采取措施進行處理和維修。
4? ?應用效果分析
為分析GMDH神經(jīng)網(wǎng)絡模型應用于機房動力環(huán)境監(jiān)控系統(tǒng)中的作用,筆者搜集了機房中精密空調(diào)設備的報警數(shù)據(jù),構建了基于GMDH神經(jīng)網(wǎng)絡的故障預警模型。其中,預警采用的各項指標主要包括環(huán)境溫度、濕度、空調(diào)負荷、空調(diào)轉(zhuǎn)速等。采用監(jiān)控系統(tǒng)中累積的過去一年的監(jiān)控數(shù)據(jù)119 090條進行建模測試,其中隨機抽取80%的數(shù)據(jù)作為訓練集用于構建GMDH神經(jīng)網(wǎng)絡,采用剩余的20%作為測試集合數(shù)據(jù),對GMDH神經(jīng)網(wǎng)絡的預警性能進行樣本外測。樣本外測試結果如表1所示。
如表1所示,在機房動力環(huán)境監(jiān)測系統(tǒng)的故障預警樣本中,GMDH神經(jīng)網(wǎng)絡模型能夠預測實際發(fā)生故障的2 073個樣本中的2 036個樣本,具有較為準確的預測性能。采用ROC曲線以及AUC值評估GMDH模型的預警效果,得到圖2數(shù)據(jù)。
如圖2所示,ROC曲線是一種常用于評估分類模型性能的工具。在ROC曲線中,每個點代表預測模型在特定閾值下的性能表現(xiàn)。閾值控制了將樣本分為正例和負例的邊界,不同的閾值會導致不同的真正例率和假正例率。ROC曲線的理想狀態(tài)是盡量向左上角靠攏,即真正例率高而假正例率低,這預示著模型在各種情況下都能有較好的預測性能。AUC值是ROC曲線下的面積,用來定量計算模型的性能。AUC值的范圍在0到1之間,AUC值越大越好。AUC值反映了模型辨別正常情況和故障情況的能力。從圖2中可以看到,采用GMDH神經(jīng)網(wǎng)絡模型對設備故障預警具有較好的預測效果。
5? ?結束語
通過建立GMDH神經(jīng)網(wǎng)絡,借助機房集中監(jiān)控系統(tǒng)中的歷史數(shù)據(jù),可對機房中各類設備故障進行預警。采用GMDH神經(jīng)網(wǎng)絡模型進行設備故障預警,有利于提高機房智能化運維的水平。
參考文獻
[1] 邢毓華,李凡菲.用改進GA-BP神經(jīng)網(wǎng)絡的設備故障維修時間預測[J].計算機仿真,2021(10):90-94.
[2] 梁浩,楊偉偉,周娟,等.基于云計算平臺的運維監(jiān)控系統(tǒng)數(shù)據(jù)檢測算法研究[J].自動化技術與應用,2023(4):5-10.