林麒麟 俸世洲



摘要:針對海量負荷數據分析,本文提出了一種MR-CPGA-Elman的并行負荷預測模型。首先采用粗粒度并行遺傳算法(CPGA)對Elman網絡權重和閾值進行了優化;然后結合MapReduce進行分布式并行計算;最后以實際負荷數據為例,說明該方法能提高預測精度和計算效率。
關鍵詞:海量負荷數據;并行預測;MapReduce;CPGA;Elman網絡
中圖分類號:TM715 文獻標識碼:A 文章編號:1007-9416(2019)06-0101-02
0 引言
負荷預測技術是電力大數據的重要應用之一,旨在加深對用戶用電需求的認知水平,建立科學的管理營銷決策平臺[1]。隨著智能電網、通信網絡和傳感器技術的發展,電力數據采集系統積累了數百萬條記錄,每年的數據存儲規模將從目前的GB級增長到TB級,甚至是PB級[2]。為此,本文提出了MR-CPGA-Elman并行負荷預測模型。首先采用粗粒度并行遺傳算法(Coarse-Grained Parallel Genetic Algorithm,CPGA)對其權重和閾值進行了優化。同時,為了提高處理海量數據的能力,借助分布式并行編程框架MapReduce模型進行并行計算。最后,以某地區負荷數據進行相關實驗,結果表明該方法能夠提高海量負荷數據的處理精度和效率,對電力企業有一定的實際意義。
1 MapReduce框架
MapReduce是一種分布式計算技術,采用計算機集群,解決海量數據集分布式計算問題[3]。MapReduce主要由Map和Reduce兩大功能組件構成,基本思想是“分而治之”。首先將數據進行分片,分配給相應的Map對應的工作節點;然后在Map節點上產生相應的