成 珂,張 璐,楊力人,勞志軍
(1.西北工業大學動力與能源學院,陜西西安 710072;2.西安博威新能源科技有限公司,陜西西安 710000)
由于外界環境變化,光伏發電存在波動性與間歇性,并入電網后會對電力系統的運行產生影響。準確地對發電量進行預測,有助于電力調度部門提前做好安排,降低對電網的沖擊。多數學者針對光伏發電量預測進行了相應研究,選擇出相關性最大的因素及合適的預測模型是提高預測精度的關鍵。
關于光伏發電的影響因素,何旻[1]針對影響光伏發電的主要因素提取不當及數據質量不高的問題,提出了基于copula 函數的相關性分析方法。Long Huan 等[2]提出一種參數選擇方法用于選擇光伏預測的重要參數。Khan Idris 等[3]基于霧霾特殊天氣下光伏預測精度低的情況,引入空氣質量指數(AQI)及溫度、風速、濕度等常規參數作為預測模型的輸入量。陸爽等[4]基于Pearson 相關系數分析輻照強度、氣溫等與光伏發電量的相關性。
同時需建立合適的預測模型,目前在光伏發電量預測中應用較多的有馬爾科夫鏈、支持向量機、人工神經網絡等[5]。Sharadga Hussein 等[6]對比了不同的時間序列預測方法,結果表明神經網絡用于光伏發電量的預測比統計模型更準確。Gao Yang 等[7]依據歷史光伏出力數據提出一種基于機器學習的自適應超短期直接預測模型。王晨陽等[8]提出利用遺傳算法對卷積長短記憶混合神經網絡模型(CNN-LSTM)參數進行優化,在預測精度及運行時間方面表現良好。
近年來城鄉建筑屋頂建設的小型分布式光伏電站,一般不收集氣象數據,采用上述方法預測較困難。因此本文利用公開的天氣資料,依據8.16 kW 屋頂光伏電站2016―2021 年1 744 d 的實際運行數據,開展光伏發電量預測研究。研究首先基于聚類劃分天氣數據,采用灰色關聯法分析各氣象因素與光伏發電量之間的相關性,接著采用麻雀搜索算法優化預測模型,并與常規及采用粒子群優化的模型進行了對比。
不同天氣類型下的太陽輻射、溫度等氣象因素有不一樣的規律變化,導致光伏發電存在較大的差異。相關性分析方法對氣象因素進行篩選,可以提高不同天氣類型的預測精度。其中灰色關聯度是一種多因素分析方法,通過計算能得到某個量受其他因素影響相對強弱,可獲得多個不同因素之間的關聯程度。由于對樣本數量要求不高、計算量小等特點[9],故本文選擇灰色關聯分析作為篩選氣象因素的方法,得到研究對象與各影響因素之間的關聯度后,通過比較各個關聯度的大小對二者的關聯程度進行分析,進而得到與研究對象關聯性較大的因素。
光伏發電量預測常采用誤差反向傳播神經網絡(error back propagation neural network,BP),即通過梯度下降法將誤差反向傳播更新權重w和偏差b完成訓練進而進行預測,是目前預測技術中有效的神經網絡算法之一。本文選擇典型的3 層神經元網絡結構,通過對數據的處理,確定以西安馬王鎮2016―2021 年的有效數據作為研究樣本,其中輸入量為2016―2021 年對應的溫度、相對濕度等氣象因素,輸出量為采集的日發電量數據。
三層的BP 網絡應用廣泛,但因其收斂速度慢、易陷入局部極值等缺點,需要對BP 網絡進行改進。常見的群智能優化算法有遺傳算法、粒子群算法、蝙蝠算法及灰狼算法等,因其在適用性、收斂性及穩定性等方面的優勢,在組合算法中應用較廣泛。本文基于天氣聚類及灰色關聯的結果,采用麻雀搜索算法(sparrow search algorithm,SSA)優化BP 預測模型的權重及偏差值,實現提高預測精度的目的,并與常規及采用粒子群優化算法(partical swarm optimization,PSOBP)的模型進行了對比。
1.2.1 麻雀優化模型
麻雀搜索算法是Xue 等[10]依據麻雀覓食行為及反捕食行為提出的一種群體優化算法,具有搜索能力強且調節參數少的優點。算法本身依托于麻雀的生物行為,麻雀種群中具有較高適應度、能夠提供覓食區域及方向的是發現者;跟隨發現者能夠搜索到食物豐富的區域的是加入者;同時部分加入者為增加捕食率會監視發現者并搶奪食物;當監測到捕食者時,通過鳴叫報警引導加入者進入安全區域。其流程圖及優化過程如圖1 所示。

圖1 麻雀搜索及優化算法流程圖
麻雀搜索優化算法首先確定BP 及麻雀網絡結構及參數,通過計算初始種群適應度值并進行排序,對發現者、加入者及預警者的位置進行更新,得到當前最優解。通過對比判斷是否滿足更新操作的要求,得到全局最優解并傳遞給BP 網絡進行優化。
其發現者位置更新公式為:

式中:Xij為第i只麻雀在第j維中的位置,j=1,2,3...d;t為迭代次數;maxiter為最大迭代次數;α∈(0,1]的隨機數;Q為服從正態分布的隨機數;L為1×d的矩陣,矩陣內全部元素均為1;R2∈[0,1]為預警值;ST∈[0.5,1]為安全值。
加入者位置更新公式為:

式中:Xp為當前發現者占據的最優位置;Xworst為當前全局最差位置;A為1×d的矩陣,矩陣內的元素隨機賦值為1 或-1。
預警者位置更新公式為:

式中:Xbest為當前全局最優位置;b為步長控制參數,值為服從均值為0、方差為1 的正態分布隨機數;K為[-1,1]之間的隨機數;fi為第i只麻雀的適應度值;fg為當前全局最優適應度值;fw為當前全局最差適應度值。
1.2.2 粒子群優化模型
PSO 是一種群體智能優化算法,通過各粒子之間的相互作用,對特定的區域進行智能搜索?;舅枷胧浅跏蓟蝗喊珺P 網絡權值及偏差的粒子,并用位置、速度及適應度來表征粒子屬性,通過跟蹤個體最佳位置及群體最佳位置得到BP 網絡最佳的初始化權值及偏差值,達到優化的目的,具體流程如圖2 所示。

圖2 PSO-BP算法流程圖
研究以陜西省西安市馬王鎮小型光伏電站為例,采用2016―2021 年的光伏發電量實際運行數據,以及對應時間序列的公開氣象數據。該電站處于北緯34.194°,東經108.707°,屬太陽能資源III 類地區,年總輻射量45.74×108MJ/m2,平均每天約有5.43~6.21 h 的日照,全年約有1 983.4~2 267.3 h 的日照時長。圖3 為光伏電站。

圖3 光伏電站
該電站為建筑屋頂安裝的分布式小型光伏電站,裝機容量為8.16 kW。光伏組件正南方向排列,安裝傾角為23°。光伏組件選型為HH255(30)P,單個容量為255 W,單塊尺寸1 650 mm×992 mm×40 mm,工作電壓為30.10 V,工作電流8.47 A,組件效率15.67%,方陣排列方式為16 塊串聯為一個單元,2 個單元并聯。并網逆變器型號為suntree8000TL,數量1 臺,最大直流(DC)輸入電壓9 000 V,最大效率98%,三相輸出,具有防孤島、過欠電壓關機等功能。
整理電站記錄的數據得到光伏發電數據1 789 d,為提高數據的可靠性,將整理的數據進行初步清洗,結果表明缺失及無效值有7 d,由于數據較少,直接簡單篩除,故得到有效的光伏發電及氣象數據1 782 d。接著以輻射量與發電量作為篩選參數,二者擬合后選擇95%置信將遠離樣本主體的離群值剔除,得到1 744 d 有效數據,具體如圖4 所示。

圖4 剔除離群值
5 年的數據中包含不同的天氣類型,從數據中選取連續一周的光伏輸出功率數據,曲線變化如圖5 所示,明顯可見不同天氣下的光伏發電有較大差異。為減少類型數對預測精度的影響,需要對天氣類型進行分類處理。

圖5 不同天氣下光伏輸出功率曲線
分類過多時,預測需要大量的數據樣本;分類過少時,每一類天氣類型復雜導致預測精度低。因此本文基于初次劃分的天氣類型利用SPSS 進行二次聚類劃分,具體如圖6 所示。根據聚類結果,將復雜的天氣類型進行分類合并,考慮到樣本數據有限,當分類數過多可能對預測精度產生的影響,本文選擇相對距離為3.5 將其分為6 類,其中A 類樣本330,B 類樣本299,C 類樣本588,D 類樣本269,E 類樣本179,F 類樣本79。

圖6 使用平均聯接(組間)的譜系圖
基于1.1 節的內容,本文選擇太陽輻射、晴空指數及相對濕度等10 個參數作為灰色關聯度計算的比較序列,實際光伏發電量作為參考序列。以A 類樣本為例,根據計算得到各個氣象因子與光伏發電量的相關度如表1 所示。

表1 A 類灰色關聯度
結果表明,選取的各氣象因素的灰色關聯度均大于0.6,表明各氣象因子與發電量之間有一定的關聯性,A 類樣本選擇太陽輻射、晴空指數等大于0.8 的9 個參數作為輸入特征進行發電量預測。同理B-F 類樣本取10、9、8、8 及9 個參數依次作為輸入量。
借助MATLAB 平臺,結合1.2 及3.3 節的內容,確定預測模型的輸入量為溫度、相對濕度等各種氣象因素,但由于包含不同天氣類型的研究樣本基于灰色關聯分析導致A、B 及C等6 類樣本的輸入量有差異,輸出量為電站實際的光伏發電量,隱含層節點數采用經驗公式來確定。
為與粒子群優化算法進行對比,麻雀優化算法與粒子群優化參數設置保持一致,種群數為20,最大迭代數為100,依據各分類樣本下的輸入量及隱含層個數,得到種群維度為M=輸入層神經元數×隱含層神經元數+隱含層神經元數×輸出層神經元數+隱含層神經元數+輸出層神經元數,隨機生成M個包含神經網絡權值及偏差信息的粒子,通過迭代尋優將最優的權值及偏差值賦給BP 網絡,進行后續訓練預測。
為準確評價預測模型的性能,本文選擇了平均絕對誤差(MAE)、平均平方根誤差(RMSE)及平均絕對百分比誤差(MAPE)三個參數作為評價指標,其中ti為預測值,yi為實際值,n為樣本數。具體的計算方法如下:

結合3.2~3.4 節的內容,將經過灰色關聯篩選后的數據分別基于天氣聚類輸入到BP、粒子群優化BP(PSOBP)及麻雀優化BP(SSABP)模型中進行分析。具體結果如圖7 所示。
圖7 所示依次為A-F 等6 類天氣下的預測結果對比,A、B、D 及E 類的曲線更貼近真實曲線;而C 及F 類天氣下受到云層、雨水等的影響較大,復雜的天氣變化情況使光伏發電波動性更強,導致預測誤差較大。
根據表2 進一步對預測結果進行分析,從各項評價指標可見優化后的算法比BP 算法性能更好,且麻雀優化算法比粒子群優化算法預測誤差更小。如A 類天氣下相比常規BP 預測,PSOBP 預測平均絕對誤差可降低0.131 4 kWh,平均平方根誤差可降低0.115 8 kWh,平均絕對百分比誤差可降低0.120 4。SSABP 預測平均絕對誤差可降低0.303 1 kWh,平均平方根誤差可降低0.345 6 kWh,平均絕對百分比誤差可降低0.133 0。通過比較,SSABP 比常規方法平均絕對誤差可降低0.419 7 kWh,平均平方根誤差可降低0.412 6 kWh,平均絕對百分比誤差可降低0.082 9;比PSOBP 平均絕對誤差可降低0.209 8 kWh,平均平方根誤差可降低0.235 5 kWh,平均絕對百分比誤差可降低0.052 5。

表2 預測結果評價
本文以實際小型光伏電站為研究對象,為提高不同天氣類型下的預測精度,基于聚類劃分天氣數據,并采用灰色關聯法分析氣象因素與光伏發電量之間的相關性,結合優化算法實現了日光伏發電量預測。結果表明:
(1)對天氣類型進行統計、劃分得到6 類不同的子天氣樣本,為降低因輸入量冗余度較大導致預測精度低的不利影響,每一類采用灰色關聯法篩選出與發電量關聯性較大的氣象因素,劃分的A、B 及C 等6 類樣本下模型的輸入量個數依次為9、10、9、8、8 及9。
(2)基于上述的結果,采用麻雀搜索算法優化BP 網絡的權值及偏差值,并建立了BP、粒子群優化BP(PSOBP)及麻雀優化BP(SSABP)預測模型。
(3)每一類樣本分別采用三種算法進行預測對比,預測結果可知優化后的算法預測精度更高,相比傳統及粒子群優化算法,麻雀優化算法誤差更小。
以上研究結果可為電力能源規劃及可行性分析等提供支持,對于提高電網接納光伏及電力系統的安全穩定運行有實際作用。本文將出現次數較少的天氣歸類到相近的天氣類型中,對預測精度的提高有一定的影響,后續在增加樣本的前提下,可細分天氣類型,進一步提高預測精度。