胡志亮 董新微 萬祥虎 江蒗 周志國



關鍵詞:光伏;GBDT;氣象數據;出力預測
中圖分類號:TP301 文獻標識碼:A
文章編號:1009-3044(2023)02-0100-03
1 引言
21世紀以來,現代化工業的迅速發展給全球能源供應和環境治理帶來了嚴峻的挑戰,能源危機和環境保護問題的日益突出。一方面,隨著煤炭、石油等化石燃料的高速消耗,導致化石燃料的自然生產量不能滿足人類發展需求,造成能源短缺;另一方面,大量CO2 的排放導致了溫室效應和臭氧破壞等環境問題,嚴重威脅了人類的生存。因此大量發展綠色、清潔、可持續能源成為解決上述問題的必然措施。
近年來光伏發電以其綠色、清潔、環保等特點,得到迅速發展,以光電代替火電也成為我國能源結構調整必然趨勢。但光伏因受天氣類型、太陽輻照度、溫度等氣象因素影響,其出力水平具有波動性、間接性等特點,這些特性嚴重影響了光伏發電消納水平,造成清潔能源浪費。因此開展光伏發電功率預測研究對促進光伏產業發展和清潔能源消納具有重要意義。
本文基于天氣類型和GBDT[1]算法進行光伏短期發電功率預測研究,構建一套能夠預測光伏短期發電功率模型,能夠有效提升光伏短期發電功率[2]的專準確性。
2 光伏發電影響因素
影響光伏發電效率的因素眾多,正常投用的光伏系統,其位置及各項組件已經固定,這些因素對光伏發電功率影響都隱含在歷史出力數據中,因此只需考慮影響光伏出力的外部氣象因素。本文使用安徽某光伏場站的2018 年數據,以其出力數據和各類氣象要素數據為分析對象,分析光伏發電影響因素[3]。
2.1 溫度-出力關系
通過選取光伏場站任意一天發電功率數據和場站的溫度數據,繪制溫度-出力關系圖,如圖1 所示,當溫度上升時,光伏發電功率也隨之增加,兩者呈現明顯正相關性,這是因為光伏組件周圍環境溫度影響了光伏組件的光電轉換效率[4]。
2.2 輻射度-出力關系
通過選取光伏場站任意一天發電功率數據和場站的輻照度數據,繪制輻照度-出力關系圖,如圖2 所示,由圖可知,光伏發電功率曲線與輻照度曲線有很強的相似性。這是因為光伏電站的發電功率與太陽輻射強度有直接關系,太陽輻照度越強,發電功率也越大。
2.3 天氣類型-出力關系
通過選取光伏場站晴天、多云、陰天、降水4 種天氣類型下發電功率數據,繪制發電功率曲線圖,如圖3 所示,各種天氣類型下發電功率有明顯的區別。由于各天氣類型是通過太陽輻照強度、溫度等因素的共同作用影響光伏發電功率的,而天氣類型主要決定了光伏發電功率的峰值,因此天氣類型是影響光伏出力水平的一個重要因素。
通過選取光伏場站任意一天發電功率數據和場站的濕度數據,繪制濕度-出力關系圖,如圖4 所示,由圖可知發電功率與濕度呈負相關性,這是由于當空氣中濕度較大時,水汽吸收了一部分太陽輻照強度,導致光伏組件上的輻照強度減弱,發電功率也隨之減少,反之,當空氣濕度降低時,照射在光伏組件上的光照強度會增強,光伏發電功率會相應提升。
3 模型構建
3.1 數據選擇
本文研究采用的數據來源安徽省某光伏場站,該場站設有微氣象采集設備,因此能夠提供光伏實際出力數據和場站歷史氣象數據。共采集場站2018 年有效發電功率數據96782條,氣象數據95869 條。通過數據清洗和時間匹配,最終獲得有效數據對(氣象數據,發電功率數據)89144 條數據。
3.2 模型設計
3.2.1 數據劃分
本文基于季節特性,將數據集劃分為四個子集,分別用D1,D2,D3,D4 表示,然后將每個子集按照7:3 的比例劃分訓練集[5]和測試集兩部分,分別記為Di1,Di2(i=1,2,3,4),Di1 作為相應季節的模型構建數據基礎,Di2 作為相應季節的模型測試數據。
3.2.2 模型構建
模型構建思路及方法總體架構圖如圖5所示。
本文使用梯度提升樹GBDT(Gradient BoostingDecision Tree)進行模型構建,GBDT 是一種基于Boosting 樹[6]的集成算法,其集成方式為梯度提升法(Gradient Boosting)。該算法原理是通過組合梯度提升和回歸決策樹法,實現后決策樹在前決策樹損失函數的梯度下降方向上進行訓練,從而實現對預測值進行一系列精確化。模型構建具體步驟如下。
第一步,初始化弱學習器:
其中,L (yi,γ) 為損失函數,N 代表訓練集個數,yi第i 個樣本發電功率值數據,為訓練集中發電功率的均值。
第二步,首先計算當前損失函數的負梯度:
從Di2(i=1,2,3,4)數據集中分別選取春、夏、秋、冬天數各10 天數據,即每個模型共選取40 天的數據,分別作為4 個模型的測試集,進行模型預測準確率分析,將每天288 條數據預測結果通過公式(6)計算,得到每天的預測準確率,通過計算分析得到四個模型的預測準確率,計算結果如圖6 所示。
根據圖6 分析,四個模型的預測準確率基本在75%到87%之間。其中V1 與V3 預測準確率相近,準確率在80%到87%之間;V2 模型的波動性較大,主要在76%到86%之間波動,經過分析,主要是因為夏天天氣類型變化較多,模型針對多變的天氣發電功率預測相對還不夠穩定;
V4模型的預測準確率較為穩定,預測準確率在81%到85%之間。經上述分析,本文研究的短期光伏發電預測算法能夠滿足光伏預測準確率的需求。
4 結束語
本文以安徽某光伏場站歷史出力數據和氣象數據為建模基礎,分析了影響光伏出力水平的主要氣象要素,提出通過按照季節劃分數據集,并基于GBDT 進行光伏發電預測模型構建的研究方法。首先通過季節劃分,將數據劃分為不同數據集,預測模型直接以氣象信息和歷史發電功率數據作為輸入,以對應時刻的發電功率值為輸出,分別訓練了4個季節的發電模型,可有效提高光伏發電預測準確性。經測試分析,多模型預測有效地提高了光伏發電預測效果,符合光伏場站并網[8]管控需求。