任榮榮 , 肖 群
(1.四川信息職業技術學院,四川 廣元 628040;2.國網廣元供電公司,四川 廣元 628040)
光伏發電是目前效率最高、應用最廣泛的可再生能源發電方式。與傳統的水力發電形式相比,這種發電方式更加穩定、快速,在一定程度上更有效地緩解了不可再生能源的危機,并逐步形成了自動化、智能化的發電模式。太陽能因具有普遍、無污染等特點而成為可再生能源中最豐富、發展潛力最大的清潔能源,其開發與利用已經成為我國能源結構調整的重要方向[1]。在“碳達峰”“碳中和”的戰略背景下,我國電力結構清潔化趨勢將更加凸顯,光伏并網對電網的影響也越來越顯著。然而,光伏能源易受天氣情況、太陽輻照度、溫度、云量等因素影響,具有波動性強、間歇性、隨機性強等特征。
據統計,截至2023 年1 季度末,全國光伏發電裝機容量達到4.25億kW;2023年1季度,全國光伏發電量1 135億kW·h,同比增長34.9%[2]。為提高光伏預測精度,對變化相似的天氣進行聚類劃分,這樣能有效提升光伏發電功率的預測精度[3]。由于預測對象的不同,可將其分為直接預測法和間接預測法,根據歷史的光照強度、溫度等因素,利用支持向量機的方法來預測光照強度及溫度,再通過數學模型可以得出光伏發電功率,但是未對天氣類型分類,精度不高[4]。預測精度主要取決于地表輻照度預測值的準確度,對地表輻照度波動狀況描述得越細致,其功率的預測精度就越高。與直接預測相比,間接預測的模型較多、過程復雜,但能在一定程度上提高預測功率的準確性[5]。無論采用何種方法,都需要采集數據,對數據進行預處理,最后得到預測功率。為了保證預測的準確性,通常需要先對預測數據進行預處理。目前,預處理分為三個步驟:一是分析預測功率數據的相關性;二是識別異常數據并對異常數據進行處理;三是對不同類型的預測數據進行歸一化處理[6]。隨著新型電力系統的建立,電網建設滯后于光伏電力的生產,“棄光”“限電”問題加重,可能降低原始數據在預測模型中的可信度,從而進一步增加預測難度。
課題組首先分析影響光伏發電功率的因素,主要有氣象因素、輻照度、溫度、濕度、氣壓、風速、風向、云層、季節等;其次,利用皮爾遜相關系數公式計算得到對光伏發電影響較大的因素為光照幅值、溫度、風向、風速氣象因素,將它們作為輸入數據,光伏電站的發電功率作為輸出數據,并對輸入輸出數據進行歸一化處理;最后,通過算例分析,采用本課題組提出的預測模型,使得晴天與非晴天天氣的光伏發電預測精度顯著提高,減小了預測誤差。
由于光伏發電輸出功率主要由光照幅值決定,而氣溫、天氣的劇烈變化會直接影響到太陽輻照度的強弱,從而會給電網的穩定運行帶來威脅。因此,對影響光伏發電的氣溫、天氣等氣象因素進行分析是十分有必要的[7]。
通過新疆某光伏電站數據分析可知,一年中晴天天氣占比62%,多云天氣占比33%,陰天天氣占比3%,陣雨天天氣占比2%,每類氣象條件都具有一定的變化趨勢(例如光照幅值都具有相似性)。因此,可以用各類氣象中的典型日代替該類氣象日。為分析出四種天氣光照幅值與實際功率之間的關系,選取四種天氣的典型日數據作為研究基礎,其光伏發電功率與實際光照幅值間的關系曲線如圖1所示。

圖1 各天氣類型下光照幅值與實際功率對比曲線
由圖1 可知,四種天氣(晴天、多云、陰天、陣雨天)的典型日光伏發電功率與光照幅值具有相同的趨勢,光伏發電輸出功率隨著光照幅值的增加而增加,且兩者曲線變化基本一致,表明光照幅值的變化與光伏發電輸出功率的增減密切相關。
氣溫對光伏輸出功率的影響不可忽視。選擇新疆某光伏電站連續兩個晴天的相關記錄數據,在季節類型、天氣類型一定,不同溫度條件下,溫度與功率的關系曲線如圖2所示。

圖2 溫度與功率曲線
由于選取了夏季連續兩個晴天,氣溫變化相當接近,可以認為這兩天的光照幅值基本相同。從圖2 可以看出,隨著溫度的不斷升高,光伏發電的出力也相應增加,并表現出正相關的趨勢,表明溫度對光伏發電功率影響很大,由此,應將溫度考慮在內。
選取相同季節,不同天氣類型條件下的典型日光伏出力數據,晴天、多云、陰天、陣雨天天氣光伏發電出力特性曲線如圖3所示。

圖3 不同天氣的光伏出力曲線
從圖3 可以看出,當季節類型不變,天氣類型對光伏發電系統輸出功率的影響非常顯著,發現天氣為晴天時的光伏發電功率波動比較平緩,因光照強度很大,所以其光伏出力也比較大;當天氣晴轉多云時,光伏出力相對于晴天減少;轉為陰雨天時,由于光照強度很弱,光伏出力一直在降低。由此可見,晴天與非晴天天氣相比,光伏發電的輸出功率值差距很大,表明了天氣也是影響光伏出力的重要因素,因此,需要將天氣考慮在內。
光伏發電的短期預測需要歷史數據的高度完整性和準確性。若將未處理的多維歷史數據序列用作預測變量,則模型的輸入維數將過高,并且將引入大量冗余信息,造成建模困難[8]。同時,由于四種氣象因子均有很強的波動性,因此本課題組需要對不同氣象的特征進行相關性分析,從而選取相關性高的影響因素作為預測的輸入值,提高預測精度。
兩個連續變量之間的線性相關程度需要通過皮爾遜相關系數來檢測。取值范圍為[-1,1],正值表示正相關,負值表示負相關。因此,本課題組采用皮爾遜相關系數方法(Pearson Correlation Coefficient)快速得出多組數據之間的相關性[9],然后選擇相關性最高的數據進行計算。兩個變量之間的協方差和標準差的商由兩個變量之間的皮爾遜相關系數定義,如式(1)所示:
式中,ρx,y表示總體相關系數;cov(x,y)表示協方差;E表示數學期望;δxδy表示標準差乘積;x-μx表示x值與其均值之差;y-μy表示y值與其均值之差。
樣本皮爾遜相關系數如公式(2)所示:
式中,?表示樣本皮爾遜相關系數;和表示對變量x和y進行零均值化,則實際上x和y的Pearson 相關系數就是x'和y'的cosine 相似度:。
本課題組以某光伏電站氣象數據為例,采用皮爾遜相關系數對氣象因素進行特征分析,對數據進行預處理后,分別計算晴天、多云、陰天與陣雨天四種天氣下的輻照度(Ir)、溫度(Ta)、風向(wd)、風速(ws)與輸出功率(P)的距離。晴天和多云天氣下輻照度、溫度、風速與光伏輸出功率的距離較小,對光伏輸出功率影響較大;而陰天和陣雨天天氣下輻照度、溫度、風向與光伏輸出功率的距離較小,對光伏輸出功率影響較大。選取主要影響因子作為預測模型輸入,使預測模型數據輸入得以簡化,減少了一定的預測誤差。光照幅值、氣溫、風向、風速的變化均對不同天氣的光伏發電功率產生影響,但由于數據的維度較多,需要對其主要因素進行相關性分析,對不同天氣各特征之間的相關性進行定量分析。
各特征與功率的皮爾遜相關系數為正值,表明相關性越強;反之,則相關性越弱。通過對不同天氣各特征之間的相關性進行定量分析可以得出,輻照度與功率的相關性接近1,對光伏發電的影響比較大。因此,晴天和多云天氣選取輻照度、溫度、風速主要影響因子作為預測輸入值;陰天和陣雨天選取輻照度、溫度、風向作為預測輸入值進行研究。
由于光伏自身具有不確定性、隨機性等特點,所以全面分析了影響光伏發電輸出的主要因素,又因其極限學習機(Extreme Learning Machine, ELM)易陷入局部最小值,因此針對ELM 存在的不足,本課題組采用天牛須-極限學習機算法(Beetle Antennae Search Algorithm-Extreme Learning Machine, BASELM)對光伏功率進行預測,采用均方根誤差作為模型性能評價指標,以提高預測精度[10]。
由于光伏發電自身具有隨機性和不均勻性,容易受外界因素的影響,導致輸出功率波動劇烈,極不穩定,且隨著光照強度的提高,其波動性也會相應地增強。本課題組采用均方根誤差(RMSE)作為模型性能評價指標,計算如式(3)所示[11]:
式中,M表示樣本點個數;yj表示實際測量光伏功率;表示對應的預測值。誤差越小,表明模型預測精度越高;誤差越大,表明模型預測精度越低。
基于光伏出力影響因素以及相關性的分析,本課題組以新疆某光伏電站典型日歷史發電數據和相關天氣預報信息來分析BAS-ELM 算法預測模型在晴天、多云、陰天、陣雨天四種天氣下的預測精度。考慮到光伏發電集中在白天,為此,消除了在其他時刻趨向于0 的發電,時間間隔為15 min,預測未來四種天氣典型日的光伏發電量。
通過分析發現,不同天氣光伏發電預測出力值最大分別在180 MW~200 MW、160 MW~180 MW、80 MW~90 MW。根據光伏電站實際和預測出力功率曲線可知,真實值和預測值之間存在著一定的誤差。通過均方根誤差公式,計算得到晴天、多云、陰天、陣雨天天氣預測均方根誤差分別為0.98、1.15、1.23、1.30,其預測精度分別為97%、95%、94%、93%,但仍存在一定的波動性,若將這種波動功率并入到電網,則會威脅到電網的安全穩定運行,使得原本功率曲線的波動極其劇烈。因此,需要采取合理的措施來控制光伏電站輸出功率,使其輸出較為平穩的光伏功率,從而減少電網安全穩定運行的威脅。
課題組通過對光伏發電功率數據與輻照度、氣溫、天氣等相關因素進行光伏出力研究,利用皮爾遜相關系數法篩選出影響光伏發電的氣象特征因素,建立相關預測特征集,基于BAS-ELM 算法建立光伏發電預測模型,并將均方根誤差作為模型性能評價指標,將相關性最高的因素作為預測輸入變量,功率作為輸出值,跟蹤預測一天中的氣象類型變化。通過計算分析,該模型在晴天與非晴天天氣中的預測精度提升效果明顯,其中晴天天氣的預測準確率達到了97%,且晴天、多云天氣預測精度高于陰天及陣雨天氣。結果表明,本研究能夠為光伏發電功率預測提供一定的參考。