王 鵬,雷 敏,王家良,苗 磊,趙旭陽
(中鐵信大數據科技有限公司,天津 301737)
近年來,隨著數據中心規模的擴大與復雜程度的不斷增加,如何高效地管理數據中心的電能,提高電能利用效率已經成為了一個迫切需要解決的問題[1]。
目前,中國鐵路主數據中心(簡稱:主數據中心)運行有以下3 套電能采集與監測系統包括:電力監控系統負責10 kV 中壓系統的電能數據采集;數據中心基礎設施管理(DCIM,Data Center Infrastructure Management)系統負責信息機房供配電及機房即不間斷電源(UPS,Uninterruptible Power Supply)、動力UPS 的電能數據采集;能源管理系統負責除電力監控系統、DCIM 系統以外的低壓電力設施的電能數據采集。由于以上3 個系統形成的電能數據過于分散式,迫使運營維護(簡稱:運維)人員不得不采用現場手工抄表方式獲取[2],再通過統計、合并、匯總計算的方式獲取數據中心各類基礎設施的整體電能數據[3],降低了工作效率。本文針對以上問題設計了基于B/S 架構的鐵路主數據中心綜合電能管理原型系統(簡稱:本文系統),通過跨系統間的集中數據獲取與基于實際場景的精細化統計計算,來實現對數據中心電能消耗情況的全面監測和與高效管理[4-5]。本文系統的應用對實現主數據中心電能的精細化管理與高效利用必將起到積極促進作用。
本文系統重點在于對現有采集系統形成的電能數據進行數據挖掘、分析與輸出。本文系統邏輯架構,如圖1 所示 。

圖1 綜合電能管理系統架構
數據集成引擎能夠連接各分系統數據源,將來自不同分系統中采集的電能數據統一匯聚到本文系中。
1.2.1 數據收集
本文系統能夠與數據源(電力監控系統、能源管理系統、DCIM 系統)進行通信,從中收集能源消耗、能源質量、設備狀態等數據,這些數據源可以是不同類型的系統、設備或傳感器等。
1.2.2 數據處理與轉換
數據集成引擎收集到的數據是不同的標準和格式,通過對數據進行處理和轉換,使其符合本文系統的統一格式和標準,確保數據的一致性和可比性。
1.2.3 數據存儲
數據集成引擎將處理后的數據存儲到數據庫中,以便后續的分析使用。
1.2.4 實時數據更新
數據集成引擎能夠實時監測數據源的變化,并及時更新本文系統中的數據,確保數據是最新的。
(1)能源管理系統北向接口基于Modbus-TCP通信協議,提供實時數據上傳。本文系統對該接口進行實時數據采集,并將非關鍵數據清洗,以1 h 為間隔存儲數據。
(2)電力監控系統北向接口基于電力遠動系統IEC60870-5-104 協議,提供周期性數據上傳。本文系統對該接口以1 h 為間隔進行數據采集,并全量存儲數據。
(3)數據中心基礎設施管理系統北向接口基于Web Service 通信協議,按設備類別采用命令調取數據。本文系統對該接口進行實時數據采集,通過定制采集命令,僅對特定數據進行數據請求,并以1 h為間隔存儲數據。
基礎計算平臺提供了的數據分析和決策支持能力,輔助運營維護團隊實現了對數據中心基礎設施的調參、調優,使現場設備設施安全、高效運行。
基礎計算平臺用于管理集成后的電能數據,它提供了一系列的基礎計算功能,并對電能數據進行分析、優化和控制[6]。
1.3.1 能耗計算模塊
跨系統基礎計算是進行能耗分析和能效評估的關鍵環節,可進行分類能耗計算、總能耗計算、信息設備能耗計算、電能利用效率(PUE,Power Usage Effectiveness)、能耗指標計算、能耗比較計算等。
1.3.2 能耗趨勢分析模塊
該模塊可以對主數據中心能耗進行分析和評估,通過對歷史數據和實時數據的比較,可以識別能耗高峰期、能耗異常等,并提供相應的預警和優化建議。
1.3.3 節能分析模塊
該模塊可以對主數據中心基礎設施能效進行評估,通過計算能源利用率、功率因數、電能損耗等指標,幫助用戶了解主數據中心基礎設施的效率水平,提供節能分析結果以及改進建議。
本文系統采用內存數據庫技術來實現高效的實時數據分析,可以實時地監測電能消耗情況、能源負荷分布和設備狀態等信息;可以實現異常檢測機制,在檢測到異常情況時會及時發出告警。
歷史歸檔查詢模塊用于存儲和檢索歷史電能數據。該模塊可以訪問和分析本文系統已存儲的能源歷史數據,以便進行性能評估、趨勢分析和報告生成等工作;為便于后續查詢和分析,數據以時間序列的形式保存。
數據展示模塊負責將處理后的數據以易于理解和分析的圖表、圖形及其他可視化形式展示,以幫助用戶更好地理解和管理電能消耗情況[7]。
報表查詢可以按照特定的組合條件查詢系統中存儲的數據;可選擇導出整個報表或者特定的部分,并將生成的報表以特定格式保存或分享。
本文系統采用B/S 架構,界面簡單、操作方便,只需瀏覽指定的服務器網址即可使用,所有功能均以菜單方式呈現,通過瀏覽器可在任意界面間快速切換。本文系統功能結構如圖2 所示。

圖2 本文系統功能結構
通過本界面可快速了解當前整個數據中心電力系統的總體運行情況,對運營維護起到實時、快速、動態、直觀的監控效果。
市電運行界面顯示回路容量、安全使用容量、實際使用容量、使用占比數據,并提供實際使用容量、使用占比上月與本月的數據對比,能夠實時顯示20 臺變壓器的設計容量、安全容量、使用容量、使用占比等數據。
本文系統共展示了8 個機房模塊,主要對單個機房模塊的信息設備負荷分布、局部電能利用效率(pPUE,Partial Power Usage Effectiveness)模塊使用情況、機房列頭柜容量及負荷的實時顯示[8]。
主要圍繞主數據中心能耗情況進行計算統計分析后的展示及分析結論描述。其中,包括當月制冷系統能耗比例、信息設備負荷比例、總損耗比例等,并以餅圖方式展示數據。
可對采集及計算后的數據進行條件組合查詢及導出,報表可按日報、月報、年報方式進行指定時間段查詢。報表提供一鍵導出當月的月報功能,根據運營維護管理的需求,月報以Word 格式方式導出,包含各電力月度數據、圖表及分析結果說明。
本文系統是一套集成了電能監測、能源計量、能效分析和節能優化等功能的系統,關鍵技術包括以下幾個方面:
不同設備和廠商使用不同的數據格式和通信協議。數據集成技術用于確保不同設備和系統之間的數據能夠按照統一的標準進行交換和共享,以實現數據的一致性和互操作性。
3.1.1 流處理及批量數據集成
流處理是一種實時處理數據的方式,它允許對數據進行連續的、即時的處理和分析。本文系統采用Spark Streaming 流處理框架來實時采集、處理和集成來自多個子系統設備的電能數據,Spark Streaming 框架具備可靠的消息傳遞機制、容錯性和可伸縮性,可將其集成到統一的數據處理管道中。
3.1.2 數據標準化及轉換
(1)通過數據標準化,可以消除不同設備和子系統之間的數據差異,使得它們能夠無縫地進行數據交換和集成。本文系統建立并按照電量儀表通用、標準的數據點表進行計算、存儲。
(2)數據轉換是將不同設備和系統的數據從其原始格式轉換為統一的格式。包括數據的格式轉換、數據單位的轉換、數據結構的轉換等,數據轉換可以通過編碼轉換、格式轉換、數學運算和邏輯處理等方法實現。
例如,有些分系統采集到電能設備中的電壓返回數據為22000,有些子系統采集到220.00,實際儀表讀數都為220 V,系統根據各分系統或設備不同比例進行換算,最后以標準的數據格式(220 V)進行計算、存儲。
3.1.3 數據映射與匹配
數據映射與匹配是將不同設備和系統的數據映射到統一的數據模型或數據結構中,以實現數據的一致性和可操作性。涉及識別和定義不同數據源之間的關聯關系和對應關系,將其映射到共同的數據模型中。
本文系統通過對所有信息化設備數據進行分類并映射,再打包成整體的數據源,便于能耗趨勢分析模塊、節能分析模塊和實時分析模塊的數據匹配和調用。
3.1.4 數據校驗和清洗
數據集成過程中,可能會存在數據質量問題,如數據缺失、重復、錯誤等。數據校驗和清洗技術用于檢測和修復這些數據質量問題。可以進行數據的有效性驗證、邏輯一致性驗證和數據沖突解決等操作,確保集成的數據具備高質量和可靠性。
例如,當UPS 設備出現通信故障時,子系統可能采集為“2519932.00”電壓異常數據,此類數據明顯超出正常設備的運行范圍值,本文系統對數據進行校驗時就會將此部分數據丟棄。
本文系統利用數據分析和建模技術,對能源數據進行處理和分析,以識別能源消耗的瓶頸和優化潛力,能效分析可以幫助數據中心確定節能目標、識別能耗異常,并提供可行性評估和性能指標跟蹤。
(1)本文系統采用Hadoop 大數據技術對當前和未來的能源消耗進行分析和挖掘。根據具體的分析目標和數據特征選擇不同的算法。使用季節性分解方法對主數據中心的每月電能消耗數據進行分析,通過季節性分解,可以將該時間序列數據分解為趨勢、季節性和殘差成分,用于識別每年的電能消耗季節性模式,如夏季高峰期和冬季低谷期,從而指導運維人員調整能源管理策略。
(2)聚類分析算法用于將能耗數據分組為具有相似模式的簇,從而發現能耗行為和潛在的節能機會。本文系統中某個數據集,包含了數據中心的不同時間段的能耗數據,通過K-means 算法將能耗數據分為幾個不同的簇,每個簇代表了一個能耗模式,例如高能耗模式、低能耗模式或波動能耗模式。對于高能耗模式的簇,可以進一步探索高能耗的時間段、相關因素和節能策略;對于低能耗模式的簇,可以分析其特征,以了解其背后的能源管理策略;對于波動能耗模式的簇,可以探索其波動性的原因和優化方案。
(3)關聯規則挖掘算法用于發現能耗與其他因素之間的關聯性和依賴關系,如設備之間的關聯規則或時間段的關聯規則。根據采集的時間段和設備編號,將能耗數據進行整理和組織。本文系統將每個設備編號視為一個項目,每個時間戳作為一個事務,設置支持度和置信度閾值。應用關聯規則挖掘算法,將從數據中找出滿足支持度和置信度閾值的頻繁項集和關聯規則。
(4)預測建模算法基于歷史數據預測未來的能耗趨勢,從而進行需求預測和能源規劃。本文系統已經收集了過去一年的電能消耗數據,每小時的消耗量和相應的時間戳的情況下,如果預測未來一周內的電能消耗量,通過以下步驟完成。
首先,對數據進行預處理和特征工程,將時間戳進行拆分,提取出小時、日、月、年等相關的特征;其次,使用預測模型學習歷史數據中的模式和趨勢,并進行預測訓練,訓練過程中,可調整模型的參數和超參數,以獲得更好的擬合效果。最后,利用訓練好的模型進行未來一周內電能消耗量的預測。
數據管理技術將不同來源和系統的數據進行整合和集成。數據中心使用多個系統和設備監測和管理能耗,數據整合和集成可以幫助運營維護人員將各種數據源中的能耗數據匯總到一個中心化的數據庫中,方便統一管理和分析。
數據可視化技術用于將大量的數據以直觀和易于理解的方式呈現出來,將單一維度的數據轉化為可視化的形式。用戶可以通過可視化界面直觀、快速瀏覽和分析。
通過本文系統在主數據中心實際運維環境下實現了能耗監測、分析和管理的設計目標。首先,能夠實時采集和記錄能耗數據,包括信息系統、制冷系統、照明系統等能源的使用情況,并將實時采集的能耗數據自定義分類,以此顯示為PUE、供電負載系數(PLF,Power Load Factor)、制冷負載系數(CLF,Cooling Load Factor)、其它負載系數(OLF,Other Load Factor)、制冷性能系數(COP,Coefficient Of Performance)等能效指標。其次,系統提供能效分析和報告功能,通過對能耗數據的分析和比對,識別能耗的趨勢和問題,自動生成包括變壓器損耗、UPS 損耗、其它損耗等趨勢圖。系統可以通過以上幾種功能,最終輸出數據中心能耗報表,為數據中心能效管理提供重要的技術依據,包括運維管理中制定節能計劃、設定能效目標、評估節能項目的實施效果等。
本文針對主數據中心運維過程中發現的一系列問題,設計了一套基于B/S 架構的鐵路主數據中心綜合電能管理原型系統,基本解決了主數據中心建成以來存在的數據采集與數據管理離散化的問題,實現了對數據中心內電能運行數據綜合一體化的實時匯總計算與分析管理,減輕了運維人員的工作強度,顯著提高了運維的精細化管理水平與人員工作效率。在本文系統投入試運行期間,主數據中2023 年1~5月平均PUE 相比2022 年同期下降了3%,對節能降耗起到了積極的促進作用。