熊振華
(吐哈油田公司信息技術公司,新疆 吐魯番 838299)
隨著廣播電視行業的迅猛發展和數字化轉型,廣播電視數據機房作為關鍵的基礎設施,承擔著存儲、處理和傳輸海量數據的重要任務[1]。數據機房的正常運行對于廣播電視節目的連續播出和服務的穩定性至關重要。然而,由于設備老化等,數據機房故障在一定程度上成為制約廣播電視行業發展的因素。大數據分析技術以其對大規模數據的高效處理和深度挖掘能力,給廣播電視數據機房故障維護帶來了新的機遇[2]。通過收集和分析數據機房的實時運行數據,包括設備狀態、溫度、濕度、能耗等指標,機房維護人員能夠實時監測數據機房的運行狀況,及時發現潛在的故障風險。
本文旨在通過大數據分析技術解決廣播電視數據機房的故障監測與維護問題,構建人工神經網絡(Artificial Neural Network,ANN)模型,建立故障智能分析的求解模型,提高故障維護的效率和可靠性,保障廣播電視節目的連續播出和服務的穩定性[3]。
服務器是廣播電視數據機房的核心,主要負責存儲和處理眾多數據。當服務器出現硬件、軟件或網絡問題,都可能導致服務器故障。數據機房內的網絡設備如路由器和交換機也是關鍵組件,確保數據的順暢傳輸也可能因各種原因出現故障。電力供應對機房的正常運行至關重要。電源一旦出現問題,如電力中斷或電壓波動,不間斷電源(Uninterrupted Power Supply,UPS)設備就會發揮關鍵作用,提供穩定的電力,確保信號的正常傳輸。數字接收器也是機房的重要部分,若其發生故障如電源問題或過熱,都會影響其性能[4]。
數據機房的故障診斷與維護需要獲取足夠的數據以支撐數據分析,監控對象包括溫濕度等方面。該系統實現全天候的集中監控和管理。機房環境監測在廣播電視數據機房監控中扮演著關鍵角色,主要涵蓋對空調設備、溫度、濕度及漏水情況的監測。監控系統由管理系統、監控管理單元、數據采集單元及監控探頭組成。廣播電視數據機房中不同系統所采集的傳感器信息如表1 所示。
表1 不同系統采集的傳感器數據
數據管理與儲存采用云端管理方式,選擇一個可靠的云計算平臺,如Amazon Web Services (AWS)、Microsoft Azure 或Google Cloud Platform (GCP),這些平臺提供了強大的計算、存儲和網絡資源,以支持數據機房管理的需求;使用云計算平臺提供的數據庫服務,如AWS RDS (Relational Database Service)、Azure Database 或GCP Cloud SQL,這些服務提供了托管的數據庫實例,可提供高可用性、自動備份和擴展性[5]。基于大數據分析的數據機房故障維護系統如圖1 所示。
圖1 基于大數據分析的數據機房故障維護系統
對于采集到的原始傳感器數據,需要利用大數據分析技術進行初步處理,用于后續故障分析和診斷。以風冷空調系統為例,傳感器采集的數據可能存在數據缺失、異常值和噪聲等問題。對于缺失值,維護人員可以選擇直接刪除含有缺失值的記錄,或者使用平均值、中位數或眾數來填充。特別是對于時間序列數據,如排氣溫度測量值,維護人員還可以使用前一個時間點的數據或后一個時間點的數據進行填充。對于異常值,設定一個閾值,超過或低于這個閾值的數據被認為是異常值,如冷凝器空氣流量異常高或異常低的值。另外,還可以使用標準差法或箱線圖法來識別異常值。對于噪聲,維護人員可以使用平滑法或濾波法來處理,尤其是對于蒸發器空氣流量這種信號數據[6]。
接著進行數據轉換。為了使數據適合分析,需要進行標準化、歸一化、離散化或編碼。以空調系統的傳感器數據為例,可使用z-score 法進行所有數據的標準化,從而將原始數據統一表示為無量綱歸一化特征,將原始數據轉換為一個一維向量,作為后續分類器的輸入,具體表達式為
式中:x表示某一維度的傳感器數據,μ表示該數據的均值,σ表示該數據的標準差。
經過上述數據采集和預處理,將得到單個機房系統模塊的各傳感器數據作為后續故障診斷的輸入,后續將基于大規模的歷史運行數據進行原始模型訓練。神經網絡能夠便利地獲取和處理大數據,在機房各個系統的健康評估方面得到了較多應用。與傳統的機器學習算法相比,ANN 對于大型數據集具有更高的準確性,因此本文采用ANN 作為故障分析模型。
為了解決分類問題,本系統中的傳感器數據被輸入到ANN模型中。{(x1,y1),…,(xn,yn)},其中的x表示特征,對應于本系統中的傳感器數據,如空調系統中的排氣溫度測量值,冷凝器空氣流量等。y變量表示歷史數據中獲取到的故障信息,標注基于人工記錄。
設計損失函數時,本文的故障診斷維護系統屬于分類問題,因此采用交叉熵損失函數作為損失函數項,隨后使用隨機梯度下降法完成神經網絡中的權值更新,具體表達式為
式中:M為故障類別數,不同設備具有不同的故障類別數;yic表示真實標簽,i真實類別為c則取1,否則為0;pic表示樣本i為類別c的概率。
基于大數據分析的數據機房故障維護系統中,通過對各個系統使用上述數據挖掘算法,可以獲得當前數據機房中某些設備存在故障隱患的概率Pt,當該概率大于一定閾值,報警模塊將啟動向機房維護組發送報警信息,同時根據上述輸出的各種設備故障的可能性大小,同步在報警信息中加入此時機房故障設備的信息,進一步實現精準的機房設備維護。具體表達式為
式中:Pt表示t時刻檢測數據機房中該模塊故障的概率大小,threshold表示人為設置的閾值大小。
本文展示了大數據分析在廣播電視數據機房故障維護中的潛在應用。通過實時監測、故障診斷和預測等手段,大數據分析技術能夠提高故障維護的效率和可靠性,保障廣播電視節目的連續播出和服務的穩定性。然而,仍然需要進一步的實驗來完善大數據分析在廣播電視數據機房故障維護中的應用框架和方法。