程 澤, 蔣春曉, 楊柏松
(1.天津大學 電氣與自動化工程學院,天津 300072; 2.廣東石油化工學院,廣東 茂名 525000)
光伏(photovoltaic,PV)并網發電在替代常規能源[1~3]方面有著巨大的潛力,但PV發電的決定性因素—輻照度對天氣變化十分敏感,受大氣環境中溫度、濕度、氣壓以及光伏板自身特點等諸多因素的影響,具有不穩定性、間歇性和隨機性等特征,容易造成巨大的經濟損失[4,5]。PV并網發電功率預測課題的研究在太陽能應用領域尤為迫切。
國內外現階段對于PV發電預測方法的研究主要分為直接法和間接法[6]。比較可知,直接法具有精度高,計算負擔小,普遍性強,無需對輻照度進行監測,省去了一類方法中的多次建模等優點[7,8]。但使用單一模型預測難免出現過擬合問題。另外,對于我國北方近年來霧霾天氣頻發的現狀,在影響光伏發電的主要氣象因素中,還應該包括空氣質量指數(air quality index,AQI)和PM2.5等與霧霾相關的氣象因素,但霧霾因素往往與其他影響因素有著高度耦合的現象,必須采用多傳感器采集海量數據才能保證準確性及預測的穩定性。
本文提出了通過由電流傳感器、電壓傳感器、溫度傳感器、光照傳感器、風速傳感器組成的光伏微系統采集環境溫度、濕度、大氣氣壓、AQI、PM2.5等對光伏發電量有明顯影響效應的大量歷史數據,基于逐步選擇方法對數據和與霧霾相關的AQI和PM2.5等參數進行變量之間耦合研究,利用更加準確的高斯混合模型代替一般K—means聚類方法對不同天氣類型進行聚類,對不同的日類型建立不同的神經網絡模型。利用天津大學26教學樓光伏微網系統的2012年上半年到2015年10月份天氣參數和發電功率歷史數據進行訓練,建立模型,在實際的預測中采用模糊數學的方法對天氣預報中的各天氣條件的語言描述進行推理,選取預測模型進行預測。
逐步選擇(stepwise selection,SS)法每次引入一個變量,檢驗先前引入變量的判別能力是否因新引入變量而小于閾值,若是,則及時從判別式中剔除,直到判別式中的變量都很顯著,且剩余的變量無重要的變量可引入判別式時,逐步篩選結束。首先,假設諸多氣象因素在影響PV發電量之間的關系存在著顯著的差異,但無論增加或者去掉其中若干個變量后,仍能達到對PV發電量的相同影響效果。
假設已經引入了p-1個變量X1,X2,…,Xp-1,有
(1)
式中p個變量構成的離差矩陣分塊
(2)

本文所使用的變量約減方法是運用逐步選擇法從原始氣象、發電量數據庫中發現影響PV發電量的不同氣象參數之間的關聯,從而得出影響PV發電量的主要影響因素,對非主要影響因素進行剔除約減,降低變量之間的強耦合性。
霧霾天氣通常由多種污染源混合作用形成,其嚴重程度與PM2.5、風速、AQI相關,3個指標同時并不同程度地影響著霧霾標準,并且各指標間存在著很大的耦合性,因此,通過變量約減的方法對以上4個變量進行去耦合,通過不斷迭代約減,將最后剩余的一個變量標準作為霧霾的嚴重程度的標準,能夠很好地給出霧霾與發電量之間的影響因子大小。本文選取溫度(T)、濕度(H)、大氣壓(P)、風速(S)、AQI(A)、PM2.5(PM)等參數作為影響PV發電的變量組合。根據以往PV發電預測經驗,以上各參數已基本包含了影響PV發電的所有氣象指標,但其中不乏若干個變量對光伏發電相同的影響情況,所以,按照以上自然次序依次計算各變量顯著度和加入新變量后的顯著度,若檢驗統計量落在不同隸屬區間內,本文根據變量約減的經驗選取F=4和F=0.8 2個值,按照相應的隸屬區間選擇變量或者剔除變量,最終得到最佳組合,具體程序流程如圖1所示。

圖1 逐步選擇法的程序流程
利用SPSS工具箱計算結果如表1所示。

表1 各變量的檢驗統計量
根據檢驗統計量的值選擇出了溫度、濕度、風速、AQI4個變量作為影響發電量的最佳變量組合。
采用高斯混合模型[9](Gaussian mixture model,GMM)對約減后的氣象數據樣本進行天氣聚類。在此基礎上,對每種天氣類型建立不同的人工神經網絡模型。高斯混合聚類使用期望最大化(expectation maximization,EM)算法更新群集的中心。
GMM由K個單高斯模型(single Gaussian model,SGM)據不同概率值組成,其中,任意一個單高斯模型為高斯混合模型的一個component,有
(3)
其中
(4)
與K-means方法類似,K值為預先確定的所要尋找的群集數,本文期望對氣象數據進行晴天、云天、陰天、雨天、霧霾天5種不同天氣類型劃分,所以,取K值為5,為d維列向量輸入,由于每一類別C均有其自己的均值、方差,將代入式(3),當概率大于一定閾值時,即認為數據樣本數據屬于C,本文閾值取經驗值0.7~0.75。運用此方法對氣象數據分時聚類的步驟如下:
1)利用EM算法確定模型中πk,μk,εk參數。
2)從混合模型中選取出第k個component,概率為πk,計算x屬于第k個類別的概率;如果大于閾值,即認為x屬于k類;如果概率小于閾值,重復步驟(2),直到得到K種不同的天氣聚類結果。
本文將歷史數據庫和K=5值作為高斯混合模型的輸入,輸出為5種不同的天氣聚類結果及相應概率值。
將經變量約減后的歷史數據庫,在不同的天氣聚類結果基礎上,分別建立分時徑向基函數(radial basis function,RBF)模型,具體的流程如圖2所示。

圖2 天氣聚類結合RBF建立模型
以2012年下半年到2015年10月的歷史數據為基礎,分不同天氣狀況進行聚類,分時建立各自的RBF模型,利用以上數據訓練確定參數。
將約減后的變量數據進行歸一化處理,作為RBF的輸入變量,有效減少了神經元飽和的可能性,所用到的RBF的結構如圖3所示。

圖3 RBF神經網絡的各層結構
隱含層采用高斯函數
μj(x)=exp[-(x-cj)2/σ2],j=1,2,…,q
(5)
式中μj(x)為隱含層節點的輸出;x=(x1,x2,…,xn)T為輸入變量;cj為第j個高斯函數的中心值;σj為第j個高斯函數的尺度因子;q為隱含層節點個數。
建立并訓練了10∶00~16∶00的每1 h不同天氣狀況下的35個不同模型,利用模糊數學的方法確定預測時刻模型,使用該模型進行功率預測,獲得更好的預測精度。
模糊數學的方法選擇模型的階段框圖如圖4所示。模糊推理(FF)體形式如下:
Theny1∈Bk

圖4 模糊推理選擇子模型圖解
如圖5所示,通過天氣預報和中國氣象網分別獲取天氣描述的4個不同的模糊變量輸入,溫度、濕度、AQI等4個模糊輸入變量分別劃分為3個模糊域,經模糊化過程,規則評估,去模糊化,最終得到一個清晰的RBF預測子模型。4個模糊輸入在不同模糊值情況下,分別觸發不同的模糊輸出,得到不同的預測子模型,135個不同觸發規則所對應的模糊輸出如表2所示。

圖5 天氣預報口頭描述天氣類型的模糊輸入

規則天氣描述模糊輸入溫度濕度 模糊輸出AQI子模型1晴高低低晴2晴高低中晴3晴高低高晴??????133雨低高低雨134雨低高中雨135雨低高高雨
如圖6所示,模糊輸出變量分成4個不同的區域,分別包括了晴、云、陰、雨。利用預測時刻的4個模糊輸入變量,預測時刻前一時刻的模糊輸入,預測時刻后一時刻的模糊輸入分別獲得模糊輸出值。

圖6 模糊輸出變量的4個不同分區
經過重心法獲得最終模糊輸出值
(6)

為驗證本文提出預測方法的有效性和發電功率的精確度,采用均方根誤差(root mean square error,RMSE)和平均絕對百分比誤差(mean absolute percentage error,MAPE)如式(7)、式(8)
(7)
(8)
針對天津大學光伏PV微網系統不同天氣條件下的日常時刻發電功率進行預測,實驗結果誤差分析,如表3所示。

表3 不同天氣類型的誤差比較 %
可以看出:晴天的發電功率預測誤差相對于其他天氣類型誤差較小,由于云天的輻照度波動性較大,對發電量的影響較大,所以在幾種不同天氣類型下誤差最大,但基本能夠達到商業預測發電功率的要求。總體來說,運用本文所提的方法在5種不同天氣狀況下的預測精度聚能達到較高的要求。
為說明本文預測方法與傳統一般方法具有較高的精確度,使用方法與其他方法分別進行發電功率預測,并比較實驗結果,如表4所示。可以看出:霧霾天下的預測誤差相對較好,混合高斯聚類辨析不同天氣類型的精度相對較高,逐步選擇法篩選出的霧霾指標能夠很大程度上代表霧霾對光伏發電量的影響標準。該方法在我國北方天氣類型聚類當中亦具有較好的精度。

表4 不同預測方法下的誤差比較 %
圖8為不同預測方法效果比較,可以看到,高斯聚類結合模糊推理的預測方法誤差較小,效果較好。

圖8 不同預測方法的結果比較
應用逐步選擇法、高斯聚類、徑向基函數和模糊推理相結合的方法對光伏發電功率進行預測,能夠獲得更高的預測精度。得到以下結論:
1)針對繁復的氣象數據利用逐步選擇的方法,篩選出對光伏發電影響的最佳氣象因素組合。
2)高斯聚類能夠以期望最大化算法更新群集中心結合RBF的方法,相對于其他聚類方法有較好的預測精度。
3)模糊推理選擇子模型的方法,能夠通過預報天氣數據,推理得到預測時刻的天氣類型,選擇子模型更能反映氣象數據和發電量之間的規則,有效性更好。
[1] Femia N,Petrone G,Spagnuolo G,et al.Optimization of perturb and observe maximum power point tracking method[J].IEEE Transactions on Power Electronics,2005,20(4):963-973.
[2] Kim I S,Kim M B,Youn M J.New maximum powerpoint tracker using sliding-mode observer for estimation of solar array current in the grid-connected photovoltaic system[J].IEEE Transactions on Industrial Electronics,2006,53(4):1027-1035.
[3] Xiao W,Lind M G J,Dunford W G,et al.Real-time identification of optimal operating points in photovoltaic power systems[J] .IEEE Transactions on Industrial Electronics,2006,53(4):1017-1026.
[4] Xu R,Chen H,Sun X.Short-term photovoltaic power forecasting with weighted support vector machine[C]∥2012 IEEE Inter-national Conference on Automation and Logistics(ICAL), IEEE,2012:248-253.
[5] 徐 英,吳海濤,張 濤.基于可調恒流源技術的熱式氣體質量流量計[J].傳感器與微系統,2016,35(5):64-66.
[6] Cooke W F,Liousse C,Cachier H,et al.Construction of a 1°*1° fossil fuel emission data set for carbonaceous aerosol and implementation and radiative impact in the ECHAM4 model[J].Journal of Geophysical Research,1999,104:22137-22162.
[7] 顏 鵬,劉桂清,周秀驥,等.上甸子秋冬季霧霾期間氣溶膠光學特性[J].應用氣象學報,2010,21(3):257-265.
[8] Mei S W,Zhu J Q.Mathematical and control scientific issues of smart grid and its prospects[J] .ACTA Automatica Sinica,2013,39(2):119-131.
[9] 田冠亞,程 佳,李文軍,等.150 mL活塞式液體微小流量計量標準裝置的研究[J].傳感器與微系統,2011,30(12):21-24.