姜楠
國網哈爾濱供電公司 黑龍江哈爾濱 150046
隨著電網規模的不斷擴大,用電信息數據規模增大,用電信息采集以及計量業務的工作量不斷增多,用電信息采集和管理涉及到對電網的故障診斷、用電調度、電力稽查、智能電能表設計以及通信、計量、遠程費控等諸多業務,對用電信息采集的運維監測就是實現對用電數據的供電電壓監測、電能質量管理的數據分析過程,采用大數據分析技術進行用電信息采集運維監測,通過終端廠商協助運維監測,實現對用電網絡的故障定位、故障處理以及用電監測等。
(1)基礎設施監控系統獲取的如動力、環境、網絡等指標信息;(2)安防系統的人員設備出入管理數據;(3)管理流程數據如工單、服務申請記錄、設備部署信息等;(4)CMDB庫中的設備資產信息。
(1)基礎設施的監控數據大多是以秒級時間間隔來采集,數據體量非常大。(2)視頻監控、告警信息以及服務申請記錄等數據的非結構化導致運維數據具有多樣性。(3)數據中心的高可用性和連續性要求數據處理速度快,以便于快速響應并處理故障。(4)現階段數據中心運維數據利用率較低,多停留于簡單報表呈現。
在上述構建了基于大數據的用電信息采集運維監測系統的總體構架模式和進行用電信息采集后的信息融合的基礎上,進行用電信息采集運維監測系統的優化設計,本文提出設計一種基于大數據的用電信息采集運維監測系統,采用關聯規則挖掘算法進行用電信息的特征挖掘,對用電信息采集的異常數據進行譜分析,通過對異常數據的關聯規則挖掘,進行用電網絡的故障判斷和定位。
通過對原始數據進行加工處理,生成數據寬表,同時,確定需要解決的業務問題,其中業務目標即為模型因變量(Y),選取數據寬表中的數據作為模型自變量(X)。然后再進行模型設計,如選線性或非線性算法。再進行模型訓練、校驗和預測,并通過調整模型自變量X來優化模型算法,最后輸出模型預測結果。
設計和執行一個以監控數據分析模型為核心的DCIM監控數據應用機制,對采集數據進行快速和有效的處理。分析結果與現有的監控系統進行有效集成,為用戶提供實時的數據分析服務。
通過運用大數據挖掘和分析技術,發現大數據技術可以提高運維的可靠性。數據中心運營的第一要務就是保證全天不間斷可靠運行。如果出現故障需即時處理,以減少事故處理時間,降低故障帶來的損失和風險,因此,數據中心運維需要重點關注設備故障。
大多數據中心都建設有自己的基礎設施監控系統(DCIM系統),但是目前大多DCIM系統仍然停留在簡單的監控和數據統計展示上,并未對監控數據進行深層次的分析,難以發現故障的誘因和共性。在基礎設施管理系統的基礎上加入大數據分析技術,探索縮短故障歷時的途徑:如通過基礎設施管理系統獲取關鍵設備如蓄電池的歷史運行參數及其基本屬性信息、歷史故障信息、機房環境參數等,對這些數據進行挖掘分析,構建一個預測模型,那么通過預測模型,結合相應的風險預警規則,就可以提前預測和識別一部分存在高風險故障可能性的電池組,并且將預警信息與前臺的運維系統進行集成,定期實時更新風險標簽,從而提醒運維人員提前維護和更換該組電池,以避免故障的發生,減少宕機的可能。
通過對機房各級配電設備的監測,可以實時動態了解機房各設備的能耗情況,如空調能耗、IT設備能耗、照明能耗等,可以通過對單元能耗數據的挖掘和分析可以獲取機房內整體能耗利用率,建立健全相應的能耗智能調度系統,從而幫助管理人員清晰了解機房能耗消耗和分布情況,為后期機房節能措施的應用提供數據依據。
為了驗證基于大數據的用電信息采集運維監測系統的應用性能,進行仿真實驗,實驗依據2016年1月1日至2016年5月31日某省24907294戶低壓用戶每日采集的用電信息作為運維監測數據的原始樣本,以2016年3月1日至2016年5月31日采集的用戶抄表數據作為測試樣本,進行大數據集成分析和運維監測,采集的數據樣本數共計1417869條數據、42536070個數據項,采用改進系統中用電信息關聯規則挖掘算法以及信息融合方法進行數據加工和信息處理,在用電信息運維監測系統中進行實際用電情況分析,其中,用電信息采集的停滯時間為120-200s,采集的用電信息為用電功率,時間間隔為120s,信息采樣的時長10000s,根據上述實驗環境和參數設定,得到用電信息采集的時域波形如圖1所示。

圖1 用電信息大數據信息采樣時域波形
為了提高電能信息采集和監測的工作效率,提出設計一種基于大數據的用電信息采集運維監測系統。應加強大數據分析,可以說大數據分析可增強數據中心運營的核心競爭力