宋倩蕓



摘 要: 提出了一種基于功能聚類、極限學習機和混合模型的區域短期用電量預測方法。該方法使用功能聚類算法對用電量曲線進行分組,隨后針對聚類分組使用極限學習機模型進行用電量預測,最后使用線性回歸方法對獨立的分組模型極限進行混合實現對區域客戶的短期整體用電量預測。此外該方法還使用溫度分區策略提高聚類分組的合理性。實驗表明該方法能夠提高最終用電量預測的準確性。
關鍵詞: 用電量預測; 功能聚類; 極限學習機; 混合模型
中圖分類號: TP391,TM714 ? ? ?文獻標志碼: A
Abstract: This paper proposes a regional short-term electricity consumption prediction method based on functional clustering, extreme learning machines and hybrid models. This method uses a functional clustering algorithm to group power consumption curves, then uses a limit learning machine model to predict power consumption for clustering grouping, and finally uses a linear regression method to mix independent grouping model limits to achieve short-term regional customer overall electricity consumption forecast. In addition, the method uses the temperature partitioning strategy to improve the rationality of clustering and grouping. Experiments show that this method can improve the accuracy of the final electricity consumption prediction.
Key words: electricity consumption prediction; functional clustering; extreme learning machine; hybrid model
0 引言
隨著電力市場的開放,用電量預測對于降低電力交易成本都具有重要意義[1-2]。但是由于多種隨機因素的干擾導致短期用電量預測的難度很大,因此本文提出一種基于功能聚類[3]的混合預測模型。首先,使用功能聚類算法根據用電量曲線的相位和幅度將用電客戶劃分為不同分組,接下來,根據不同氣候對單一區域進行劃分,進而細分第一步聚類的分組。隨后通過對這些更加細分的分組來研究溫度對用電量預測的影響。之后在細分的分組中分別訓練復雜程度不同的極限學習機(ELM)[4-5],并生成特定的ELM模型。最后通過集成這些單獨預測模型的混合模型實現更為準確的最終的用電量預測。其中功能聚類算法重點是通過功能線性回歸模型預測用電量。ELM是一種用于前饋神經網絡的學習算法,該算法可以隨機選擇隱藏層節點的輸入權重和偏差,實現在達到最小訓練誤差的同時大幅減少訓練時間[6]。本文首先闡述所提出預測方法,并簡要說明了用于實現該方法的功能聚類、ELM模型和模型混合方法。隨后通過實驗演示了該方法的預測過程,并對實驗結果進行了介紹和討論。
1 預測方法
本文所提出的用電量預測方法通過匯總用電量曲線來實現對具有不同經濟活動客戶的用電量進行預測。用電量曲線的聚合對象必須是對具有相同用電模式的客戶才能實現較好的預測準確度。由于本文的目標是實現對區域匯總用電量的預測,因此通過將針對聚類分組客戶的單個預測模型進行混合,并使用不同的樣本進行訓練,實現預測誤差的相互補償,減少匯總的預測方差和偏差,提高混合模型的準確性。所提出預測方法如圖1所示。
由圖1可知,該預測方法側重于在一個由三個步驟組成的統一框架內處理區域短期用電量預測。第一步,對所收集的客戶日用電量數據進行數據清洗、數據約簡、數據歸一化等數據預處理操作。第二步,對用電量曲線圖進行相位和幅值聚類分析,并對依據天氣因素對聚類分組客戶進行細化,最后根據區域劃分及其環境溫度建立了獨立的分組預測模型。第三步,通過混合模型來實現對整個區域的更高精度預測。
1.1 功能聚類
大多數聚類算法的對象都是靜態數據,即特征值不隨時間變化或變化很小的數據[7]。因此,傳統的聚類方法,如劃分、分層或基于模型的方法,不適用于以曲線形式出現、指定為功能數據或縱向數據的分組數據。當應用于功能數據時,傳統的聚類方法因為忽略功能數據的相位變化可能導致信息丟失。為了處理這類數據,一些研究提出了一些函數聚類算法。其中一些算法是對傳統聚類算法的改進,以處理時間序列數據;另一些算法對時間序列數據進行轉換,使傳統的聚類算法可以直接應用與動態數據[8-9]。前一種方法通常直接對原始時間序列數據進行處理,因此稱為基于原始數據的方法,主要的修改是將靜態數據的距離或相似性度量替換為適合時間序列的度量[10]。后一種方法首先將原始時間序列數據轉換為低維特征向量或多個模型參數,然后對提取的特征向量或模型參數應用傳統的聚類算法,稱為基于特征的方法[11]。
本文提出一種專門用于分析縱向變化數據的K均值算法(Kml算法)[12]。Kml算法提供了幾種不同的技術來處理曲線軌跡中的缺失值,運行的距離是專門為縱向數據設計的,比如弗雷切特距離或動態時間扭曲,或任何用戶定義的距離。由于K-means是一種局部擇優算法,為了避免收斂到局部解,Kml改變了迭代的起始條件,并對集群數量進行優選。與現有算法相比,Kml另外一個優點之是通過圖形界面幫助選擇最優的聚類分組數量。
在實驗1#、2#、3#中,引入溫度變量的36個模型的實驗3#獲得了更好的預測結果,因為占總用電量的69.5%的客戶在某種程度上是受到溫度條件影響。另一個原因與實驗3#使用了較多的單個預測模型,這也有利于模型混合。
最后將對模型的預測結果做簡單的可視化處理,即繪制真實值和預測值曲線,以發現預測結果不佳的區域。可視化處理結果如圖5所示。
如果僅在匯總統計數據(如R2)上對模型進行度量,就會導致可視化圖形的定性信息丟失。為此,計算了2019年(測試數據集)所有周的周平均R2。圖5比較了7天的實際用電量曲線和模型的預測曲線。如圖所示,使用線性回歸混合模型所得出的預測曲線與實際用電量曲線非常相似。
4 總結
本文提出了一種基于功能聚類、極限學習機和混合模型的區域短期用電量預測方法。 實驗表明,KmL函數聚類算法表現良好,已根據其形狀、相位和幅度正確對用電量曲線進行了聚類分組。對比測試證明了基于線性回歸的混合模型優于基于求和的混合模型,可以有效地提高最終預測結果的準確度。
參考文獻
[1] 張文濤,馬永光,董子健.基于優化核極限學習機的短期電力負荷預測[J].計算機仿真,2019,36(10):125-128.
[2] 李永通,陶順,趙蕾,等.基于短時間尺度相關性聚類的負荷預測[J].電測與儀表,2019,56(16):32-38.
[3] 史佳琪,張建華.基于多模型融合Stacking集成學習方式的負荷預測方法[J].中國電機工程學報,2019,39(14):4032-4042.
[4] 謝偉,趙琦,郭乃網,等.改進的并行模糊核聚類算法在電力負荷預測的應用[J].電測與儀表,2019,56(11):49-54.
[5] 李杰,靳孟宇,馬士豪.基于粒子群算法的極限學習機短期電力負荷預測[J].制造業自動化,2019,41(1):154-157.
[6] 劉南艷,賀敏,趙建文.基于大數據平臺的電力負荷預測[J].現代電子技術,2018,41(20):153-156.
[7] 王琳璘,謝忠局,陳永權,等.機器學習聚類組合算法及其應用[J].山東農業大學學報(自然科學版),2018,49(3):463-466.
[8] 王知芳,楊秀,潘愛強,等.基于改進集成聚類和BP神經網絡的電壓偏差預測[J].電工電能新技術,2018,37(5):73-80.
[9] 朱祥和.考慮氣象因素的短期負荷預測模型研究[J].數學的實踐與認識,2018,48(3):131-143.
[10] 黃青平,李玉嬌,劉松,等.基于模糊聚類與隨機森林的短期負荷預測[J].電測與儀表,2017,54(23):41-46.
[11] 劉蓉暉,趙才濤.基于數據挖掘技術的氣溫敏感負荷短期預測研究[J].電網與清潔能源,2017,33(11):32-38.
[12] 蘇舟,李燦,姚李孝,等.電力負荷數據預處理研究及應用[J].電網與清潔能源,2017,33(5):40-43.
[13] 李黎,楊升峰,邱金鵬,等.電力系統供電短期負荷預測方法仿真研究[J].計算機仿真,2017,34(1):104-108.
[14] 雷景生,郝珈瑋,朱國康.基于“分層-匯集”模型的短期電力負荷預測[J].電力建設,2017,38(1):68-75.
(收稿日期: 2020.01.03)