龐九鳳++陳亮


摘 要 智能電網作為電力系統的研究熱點和未來發展趨勢,實現電力流、信息流、業務流的高度融合,將帶來大量的生產、營銷、管理數據。本文提出了電力大數據處理平臺,從電力企業內部和外部的海量數據中洞察規律、提取知識,并通過宏觀經濟、產值電耗、城鎮化三者與電力需求之間關系的案例分析,展示數據背后所蘊含的價值。
【關鍵詞】智能電網 大數據
電力工業作為國民經濟的基礎產業,也是重要的能源工業,它的發展與經濟的發展密切相關,一方面電力是國民經濟發展的動力,電力供應不足會嚴重制約經濟的健康發展,另一方面國民經濟發展的速度和質量對電力需求的增長、電力供需的變化起著決定性的影響。
智能電網作為電力系統的研究熱點和發展趨勢,是以信息通信平臺作為支撐,具有信息化、自動化、互動化等特征,包含電力系統的發電、輸電、變電、配電、用電和調度各個環節,實現電力流、信息流、業務流的高度一體化融合,是電網運行和管理的“中樞神經系統”。海量的生產、營銷、管理數據將成為智能電網的核心資源,結合經濟、政策、氣象、地理等外部數據源,充分發掘隱藏在這些數據背后的價值,將為企業的生產、營銷、管理提供輔助決策支撐。
本文結合電網的實際情況和業務需求,提出集數據預處理、數據分析與挖掘、知識庫生成于一體的數據分析平臺,并闡述了在宏觀經濟、產值電耗、城鎮化三者與電力需求之間的關系分析中的應用。
1 電力大數據處理平臺
電力大數據處理平臺包括數據收集、數據預處理、數據挖掘與分析、解釋與決策支持等,平臺架構如圖 1所示。
1.1 數據來源及特點
電網數據大致分為三類:
(1)電力企業生產數據,如裝機容量、發電利用小時數等數據。
(2)電力企業運營數據,如階梯電價、用電客戶、全社會用電量等數據。
(3)電力企業管理數據,如ERP、協同辦公等數據。電網數據,尤其是生產數據大多來自于分布在各處的現場采集裝置,具有數據質量差、種類混雜、類型不一致的特點。
外部數據的來源更多,包括國民經濟、宏觀政策、法律法規、氣象、地理、水文等對電力生產、運營和管理可能產生直接或間接影響的各個方面。外部數據源的統計口徑多樣,一些數據例如國家政策無法直接參與建模,在數據的收集和使用方面存在諸多挑戰。
1.2 數據預處理
針對數據質量問題,電力大數據處理平臺集成了數據預處理模塊,實現數據清理、數據集成與變換、數據規約與壓縮等功能。數據預處理作為各類數據源進入數據庫之前的必要環節,不僅有效提高數據挖掘的質量,而且降低挖掘所需要的時間。
數據清理去除數據中的噪聲,糾正不一致。數據變換通過平滑、概化、規范化、屬性構造等方法將數據轉換成適合挖掘的形式。數據集成將多個數據源合并成一致的數據存儲。數據規約通過聚集、刪除冗余特性等方法來壓縮數據。
1.3 數據挖掘與分析
挖掘出信息、提煉成知識并入庫,是電力數據平臺發揮價值的關鍵所在。
(1)基礎統計分析功能:包括均值分析、頻率分析、參數檢驗等。
(2)高級數據挖掘功能:包括分類、聚類、預測、關聯分析、孤立點分析等。
數據挖掘與分析必須建立在對挖掘對象深刻認識的基礎上,結合電力生產、經營、管理的實際需要,選擇合適的數據挖掘技術。通過對歷史數據的分析,可以實現對電網規模、全社會用電量等方面的趨勢預測;判斷全社會用電量是否與國民經濟數據存在相關關系需要關聯分析;找出線損率與其他省份存在明顯差異的省份則采用孤立點分析。
2 電力大數據分析應用
2.1 宏觀經濟與電力需求
全社會用電量與國家宏觀經濟及宏觀政策調控息息相關。首先分析宏觀經濟指標與用電量之間的相關系數,篩選出相關性較強的宏觀經濟因素指標,建立量化預測模型,預測年度用電量。
將1995~2011年的宏觀經濟類指標與全國全社會用電量通過皮爾森(Pearson)相關系數算法進行相關性分析發現,國民生產總值、社會消費品零售總額等經濟指標與用電量之間的相關系數達到了0.99以上,并且呈現較強的線性關系。通過RBF神經網絡和線性回歸建立全社會用電量預測模型,并對2012年和2013年用電量進行預測。在預測2012年用電量時,RBF-4*神經網絡預測誤差為0.97%,線性回歸模型預測誤差率為0.19%。兩個模型在預測2013年全社會用電量時,誤差相差在6%以內。綜合兩個模型預測結果,可以得出2013年全社會用電量大約為54000億千瓦時。與2012年相比,預測2013年全社會用電量增長率保持在8%左右。
2.2 產值電耗
產值電耗是反映能源消費水平和節能降耗狀況的主要指標。1990年以來,我國產值電耗(單位GDP的全社會用電量,即GDP單耗)總體呈下降趨勢。2011年產值電耗為994kWh/萬元,比1990年的3301kWh/萬元(按當年價格計算)下降了70%,如圖 3所示。
第一產業單耗和第三產業單耗變化幅度不大,總體呈下降趨勢。第二產業單耗的變化趨勢與GDP單耗的變化趨勢基本一致,是決定GDP單耗變化的主要影響因素原因。1990年以來我國產值單耗總體分為三個階段:一是1990年~1999年快速下降期,雖然第二產業在GDP所占比重有所上升。但由于科技進步的力度較大,重工業等行業的生產效率明顯提升,促使GDP單耗顯著下降;二是2000年~2005年緩慢上升期,我國工業增長明顯轉型以重工業為主導的格局以化工、建材、鋼鐵冶煉、有色金屬為代表的高耗能行業得到較快發展,產值電耗有較大幅度的上升;三是2006年至今緩慢下降期,面對日益嚴峻的環境形勢,我國出臺節能減排政策,淘汰產能低下的設備,有效遏制了第二產業電耗上升趨勢,促使產值單耗呈逐年下降。
基于孤立點分析和單樣本均值校驗等數據統計分析方法,挖掘出產值單耗異常的重點省份。青海的歷年產值電耗與其他省份存在顯著差異。進一步剖析青海的產業結構,青海的第一和第三產業比重呈整體下降趨勢,而第二產業比重上升明顯(38.5%->58.4%),這主要源于青海省重工業和高耗能行業的快速發展。雖然第二產業單耗從1990年到2011年呈逐年總體下降趨勢,但仍遠遠高于同期全國平均水平,其中高耗能行業用電量位居全國前十。
2.3 城鎮化與電力需求
城鎮化水平的提高和人民消費水平的升級帶來了城鎮居民用電和商業用電的增加,同時帶動相關的原材料生產、制造行業快速發展,間接促進了工業用電的增長,促使全社會用電量的不斷增長,從而帶動人均電量的快速增長,如圖 4所示。因此,隨著城鎮化進程的不斷加快,城鎮化率的提高是促進經濟發展、促進電力需求增長的動力之一。
基于電力大數據處理平臺對城鎮化率和全社會用電量進行相關性分析。城鎮化率同全社會用電需求具有正向相關性,其相關系數高達0.95(越接近于1,正相關程度越高)。在城鎮化率上升較快的時期,用電量增長也相應較快。2000~2011年全社會用電量年均增速高于1990~1999年年均增速。這一時期也是城鎮化水平快速提高的階段,城鎮化率由2000年的36.22%提高到2010年的49.95%,并且在2011年達到51.27%,城鎮人口首次超過農村人口,這標志著我國的城鎮化進程已經進入了新的歷史階段。
3 結論
在信息時代,面對智能電網的飛速發展,我們所缺少的不是數據,而是處理數據的能力。本文介紹的電力大數據處理平臺是從電力企業內部和外部的海量數據中洞察規律、提取知識的工具,通過對宏觀經濟、產值電耗、城鎮化等主題的統計分析與數據挖掘,使得對電力供需與外部影響因素有了較為明確和定量化的了解,有助于為電網發展規劃提供輔助決策支持。
參考文獻
[1]朱靖愷,章淵,陳明.基于數據挖掘技術的電網調度運行分析系統[J].上海電力,2008.
[2]仲紅,謝榮傳.基于Web的數據倉庫[J].安徽師范大學學報(自然科學版),2002(02).
[3]譚顯東,胡兆光,李存斌,丁偉,劉達.基于改進BP神經網絡的全社會用電量預測模型研究[J].華北電力大學學報,2007(03).
[4]Jia Wei H M K.數據挖掘概念與技術[M].北京:機械工業出版社,2007.
[5]單葆國,胡兆光.國民經濟用電單耗變化解析[J].中國電力,2007(09).
作者單位
國家電網公司信息通信分公司 北京市 100761