













摘要:光伏發(fā)電作為可再生能源在實(shí)現(xiàn)能源轉(zhuǎn)型和減緩氣候變化方面具有重要意義,然而光伏發(fā)電預(yù)測面臨諸多挑戰(zhàn),包括天氣不確定性、數(shù)據(jù)質(zhì)量問題、復(fù)雜的影響因素以及模型復(fù)雜度和計(jì)算成本等,并且往往只考慮單個(gè)站點(diǎn)的相關(guān)因素,并沒有考慮多個(gè)站點(diǎn)之間的相互影響。傳統(tǒng)預(yù)測方法泛化能力有限,不能很好地捕捉復(fù)雜的非線性關(guān)系,缺乏足夠的靈活性。為解決這些問題,提出基于混合深度學(xué)習(xí)的光伏集群發(fā)電預(yù)測框架,利用站點(diǎn)歷史發(fā)電數(shù)據(jù)計(jì)算互信息并形成集群網(wǎng)絡(luò)結(jié)構(gòu),然后構(gòu)建具有不同特征的經(jīng)典深度學(xué)習(xí)模型進(jìn)行預(yù)測,包括長短期記憶網(wǎng)絡(luò)(LSTM)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、時(shí)序卷積網(wǎng)絡(luò)(TCN)以及極端梯度提升(XGBOOST),最后通過自適應(yīng)權(quán)重計(jì)算實(shí)現(xiàn)模型集成學(xué)習(xí)并完成預(yù)測。對國家可再生能源實(shí)驗(yàn)室(NREL)真實(shí)光伏發(fā)電量數(shù)據(jù)進(jìn)行預(yù)測,實(shí)驗(yàn)結(jié)果表明:集成模型具有更好的泛化能力并且在預(yù)測精度上相較單一模型也有顯著提升。
關(guān) 鍵 詞:混合深度學(xué)習(xí);光伏集群發(fā)電預(yù)測;自適應(yīng)權(quán)重;
互信息
中圖分類號:TM615;TP183 文獻(xiàn)標(biāo)志碼:A
文章編號:1673-9868(2025)03-0200-11
Photovoltaic Cluster Power Generation Prediction Based on Hybrid Deep Learning
LUO Xing, HU Zijian, MA Zhoujun, LYU Zhan
Nanjing Power Supply Company,State Grid Jiangsu Electric Power Co. Ltd.,Nanjing 210024,China
Abstract:Photovoltaic (PV) power generation,as a renewable energy source,is considered significant in achieving energy transformation and mitigating the impacts of climate change.Despite its potential,the prediction of photovoltaic power generation faces several challenges,including weather uncertainty,data quality issues,complex influencing factors,model complexity and computational costs.Moreover,existing prediction methods often only consider relevant factors at a single site,neglecting the interactions between multiple sites.These traditional approaches have limited the generalization ability and struggled to capture the complex nonlinear relationships effectively,lacking the necessary flexibility.To address these issues,a hybrid deep learning-based photovoltaic cluster power generation prediction framework was proposed in this paper.Firstly,historical power generation data from stations were utilized to calculate mutual information for forming a cluster network structure.Subsequently,classic deep learning models with different features were constructed for prediction,including the Long Short-Term Memory Network (LSTM),Convolutional Neural Network (CNN),Time Series Convolutional Network (TCN),and Extreme Gradient Boosting (XGBOOST).Finally,model ensemble learning was achieved through adaptive weight calculation to complete the prediction.Real photovoltaic power generation data from the National Renewable Energy Laboratory (NREL) were utilized in this study for prediction.The experimental results demonstrate that the integrated model exhibits superior generalization ability and significantly improves the prediction accuracy compared to individual model.
Key words:hybrid deep learning;photovoltaic cluster power generation prediction;adaptive weight;mutual information
近幾十年來,由于化石燃料的過度消耗,人類面臨著全球變暖和能源危機(jī)的問題,這些問題對全球經(jīng)濟(jì)政策、氣候狀況以及能源安全都產(chǎn)生了巨大影響。然而隨著工業(yè)化和城市化的加速發(fā)展,能源需求持續(xù)增長。傳統(tǒng)的化石燃料發(fā)電方式不僅昂貴,而且對環(huán)境造成了嚴(yán)重的污染和破壞,加劇了全球變暖的問題,導(dǎo)致氣候變化引發(fā)的自然災(zāi)害頻頻發(fā)生[1]。為了應(yīng)對這一挑戰(zhàn),全球各地開始尋求清潔、可持續(xù)的替代能源,其中包括太陽能、風(fēng)能、生物質(zhì)能、水力能以及地?zé)崮艿取T谶@些替代能源中,太陽能光伏發(fā)電被認(rèn)為是最具前景和可行的選擇之一[2],并且對我國2030年前實(shí)現(xiàn)“碳達(dá)峰”,2060年前實(shí)現(xiàn)“碳中和”的目標(biāo)具有重大意義[3]。太陽能光伏發(fā)電具有諸多優(yōu)勢,例如可再生性和環(huán)保性。然而光伏發(fā)電的一個(gè)關(guān)鍵挑戰(zhàn)在于其發(fā)電量受到天氣等多種因素的影響,這使得光伏發(fā)電量難以準(zhǔn)確預(yù)測。同時(shí)傳統(tǒng)光伏發(fā)電預(yù)測很少考慮多站點(diǎn)之間的關(guān)聯(lián)性,為了更好地規(guī)劃能源供應(yīng)、電網(wǎng)管理和降低能源成本,對光伏集群發(fā)電預(yù)測的研究和應(yīng)用具有重要的現(xiàn)實(shí)意義。
光伏發(fā)電預(yù)測方法主要有統(tǒng)計(jì)方法和機(jī)器學(xué)習(xí)方法。其中統(tǒng)計(jì)方法包括自回歸移動(dòng)平均模型(Auto Regressive and Moving Average,ARMA)、自回歸積分移動(dòng)平均模型(Auto Regressive Integrated Moving Average,ARIMA)和多元線性回歸(Multiple Linear Regression,MLR)。ARMA模型在時(shí)間序列分析領(lǐng)域應(yīng)用廣泛,常用于處理平穩(wěn)序列,進(jìn)行短期負(fù)荷預(yù)測[4-5],但針對非線性數(shù)據(jù)等復(fù)雜情況時(shí)很難取得較好效果。MLR模型能夠有效地應(yīng)對非線性數(shù)據(jù),并能通過多因素考慮來進(jìn)行預(yù)測[6],但是存在過擬合風(fēng)險(xiǎn)并且不能捕捉時(shí)序數(shù)據(jù)的時(shí)間特征。而機(jī)器學(xué)習(xí)方法能夠更好地處理復(fù)雜的非線性關(guān)系以及大量數(shù)據(jù),能夠更好地適應(yīng)不同的環(huán)境變化和數(shù)據(jù)特征,具有更強(qiáng)的泛化能力和靈活性。通過機(jī)器學(xué)習(xí)方法進(jìn)行光伏發(fā)電預(yù)測的準(zhǔn)確率也高于利用統(tǒng)計(jì)方法所得的準(zhǔn)確率[7]。常用的機(jī)器學(xué)習(xí)方法包括深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)、支持向量機(jī)(Support Vector Machine,SVM)、隨機(jī)森林(Random Forest,RF)[8]等。在文獻(xiàn)[9-10]中,分別使用了支持向量回歸模型(Support Vector Regression,SVR)與RF模型、LSTM模型與RF模型來完成光伏發(fā)電預(yù)測,說明了機(jī)器學(xué)習(xí)模型在此方面能夠有效提高預(yù)測的準(zhǔn)確率。但單一的機(jī)器學(xué)習(xí)模型存在過擬合問題,對數(shù)據(jù)分布也比較敏感,并且存在較多不確定性,導(dǎo)致不能在較多數(shù)據(jù)集情況中表現(xiàn)良好,達(dá)不到較好的綜合性能。集成模型能夠降低過擬合的風(fēng)險(xiǎn),對數(shù)據(jù)分布也不敏感,具有較強(qiáng)的抗噪能力,以此來獲得更好的性能。
因此,本文提出集成LSTM、CNN、TCN和XGBOOST單一模型的集成模型,集成模型可以聚合不同單一模型的各自特點(diǎn),并結(jié)合互信息(Mutual Information,MI)集群網(wǎng)絡(luò)結(jié)構(gòu),實(shí)現(xiàn)更精準(zhǔn)的光伏集群發(fā)電預(yù)測。所提出的方法利用國家可再生能源實(shí)驗(yàn)室(National Renewable Energy Laboratory,NREL)的光伏發(fā)電數(shù)據(jù)集[11]作為模型輸入,利用歷史數(shù)據(jù)計(jì)算站點(diǎn)之間的互信息,形成互信息集群網(wǎng)絡(luò)結(jié)構(gòu),再構(gòu)建具有不同特點(diǎn)的4個(gè)經(jīng)典機(jī)器學(xué)習(xí)模型,使用自適應(yīng)加權(quán)策略來對單一模型進(jìn)行集成,從而實(shí)現(xiàn)更加精準(zhǔn)的預(yù)測以及獲得更強(qiáng)的泛化能力。
1 相關(guān)研究工作
在統(tǒng)計(jì)方法方面,Chen等[4]利用ARMA模型來預(yù)測平穩(wěn)的殘差序列,以提高預(yù)測精度。Colak等[12]使用ARMA模型和ARIMA模型進(jìn)行多周期預(yù)測,對2個(gè)模型結(jié)果進(jìn)行比較,作為確定多周期預(yù)測中最佳統(tǒng)計(jì)模型的結(jié)果。然而傳統(tǒng)的統(tǒng)計(jì)方法對于具有復(fù)雜非線性結(jié)構(gòu)的光伏發(fā)電數(shù)據(jù)不適用,于是Chen等[13]將ARIMA模型和LSTM模型進(jìn)行結(jié)合,實(shí)現(xiàn)線性和非線性預(yù)測,可以更全面地從歷史數(shù)據(jù)中提取模式,有效地減少了預(yù)測誤差。
在機(jī)器學(xué)習(xí)方法方面,VanDeventer等[14]提出了一種基于遺傳算法的支持向量機(jī)(GASVM)模型,用于住宅規(guī)模光伏系統(tǒng)的短期功率預(yù)測,先利用SVM模型對歷史數(shù)據(jù)進(jìn)行分類,再利用遺傳算法進(jìn)行優(yōu)化。Pan等[15]提出了一種改進(jìn)的蟻群優(yōu)化(Ant Colony Optimization,ACO)算法,使用ACO算法的全局優(yōu)化函數(shù)來優(yōu)化SVM模型的參數(shù),完成光伏發(fā)電預(yù)測。但SVM模型處理大規(guī)模數(shù)據(jù)集和高維特征空間的能力較弱,并且對核函數(shù)參數(shù)或懲罰參數(shù)的選擇十分敏感,需要較大計(jì)算量才能確定對應(yīng)參數(shù)。RF模型在文獻(xiàn)[16]中被用來提高光伏發(fā)電預(yù)測的穩(wěn)健性,研究者運(yùn)用了該算法來降低特征空間的維度,并通過對多個(gè)決策樹的集成來提高預(yù)測的準(zhǔn)確性,在缺乏數(shù)據(jù)的情況下也能取得良好的效果。Abuella等[9]和Roy 等[10]采用RF模型進(jìn)行預(yù)測,其預(yù)測輸出是單個(gè)樹的預(yù)測平均值,因此提供了具有較小誤差的預(yù)測結(jié)果。Izzatillaev等[17]使用人工神經(jīng)網(wǎng)絡(luò)模型(Artificial Neural Network,ANN)進(jìn)行預(yù)測,并得到了更高的精度。但上述機(jī)器學(xué)習(xí)方法不能有效地探索和捕捉與預(yù)測目標(biāo)密切相關(guān)的各種特征之間的深層潛在關(guān)聯(lián)。
深度學(xué)習(xí)技術(shù)通過擴(kuò)展神經(jīng)網(wǎng)絡(luò)的深度,能夠更有效地挖掘復(fù)雜數(shù)據(jù)中的非線性結(jié)構(gòu),并從中學(xué)習(xí)到更具性能的特征表示。Kong等[18]使用遞歸神經(jīng)網(wǎng)絡(luò)模型(Recurrent Neural Network,RNN)來減輕負(fù)荷預(yù)測的不確定性。但由于梯度消失或爆炸問題,RNN模型難以維持中長期依賴性。針對此問題,LSTM模型通過引入門控機(jī)制來解決,利用存儲(chǔ)單元來保持時(shí)間相關(guān)性,其能夠有效地捕捉長期依賴關(guān)系,并且對序列數(shù)據(jù)的建模能力更加強(qiáng)大。在文獻(xiàn)[10,13,19-22]中都使用了LSTM模型。此外,Deng等[23]提出了一種具有時(shí)間認(rèn)知的多尺度卷積神經(jīng)網(wǎng)絡(luò)模型(Multi-Scale Convolutional Neural Network with Time-Cognition,TCMS-CNN),該模型基于多尺度卷積的深度卷積神經(jīng)網(wǎng)絡(luò)模型(Multi-Scale Convolutional Neural Network,MS-CNN)提取不同層次的特征,并將其融合到網(wǎng)絡(luò)中。同時(shí)還設(shè)計(jì)了一種創(chuàng)新的時(shí)間編碼策略,有效地增強(qiáng)了序列模型的時(shí)間認(rèn)知能力[24]。
然而,單一機(jī)器學(xué)習(xí)模型泛化能力有限,不能很好地捕捉復(fù)雜的非線性關(guān)系,缺乏足夠的靈活性。針對此問題,利用集成學(xué)習(xí)的方法,能夠有效實(shí)現(xiàn)更加穩(wěn)健、精準(zhǔn)的預(yù)測。在電力方面,Wang等[25]使用了集成學(xué)習(xí)方法來提高用電量預(yù)測的精準(zhǔn)度。集成學(xué)習(xí)方法能夠增強(qiáng)模型的泛化能力,面對復(fù)雜的非線性關(guān)系數(shù)據(jù)也能較好地捕捉其中的特征,面對噪聲和異常值也有較強(qiáng)的容忍性、良好的穩(wěn)健性和更高的預(yù)測精度。同時(shí),傳統(tǒng)的電力預(yù)測模型一般僅考慮單個(gè)站點(diǎn)的相關(guān)影響因素,例如發(fā)電量、天氣及地理位置等,并未考慮多個(gè)發(fā)電站之間的相關(guān)性。多站點(diǎn)間發(fā)電量的相關(guān)性揭示了不同發(fā)電站之間發(fā)電量變化的相互影響和依賴關(guān)系,這種相關(guān)性不僅可以用于預(yù)測特定站點(diǎn)的發(fā)電量,還可以優(yōu)化發(fā)電站的運(yùn)營策略,降低風(fēng)險(xiǎn),為新能源發(fā)電系統(tǒng)的規(guī)劃和建設(shè)提供參考依據(jù),對提高發(fā)電系統(tǒng)的效率和可靠性具有重要意義。
2 模型方法
圖1對本文集成模型總體結(jié)構(gòu)進(jìn)行了說明。該模型將發(fā)電量數(shù)據(jù)作為輸入,首先分析發(fā)電站站點(diǎn)之間的網(wǎng)絡(luò)結(jié)構(gòu),利用歷史發(fā)電量來計(jì)算發(fā)電站之間的互信息,衡量站點(diǎn)之間的相關(guān)性,借此構(gòu)成具有不同集群的網(wǎng)絡(luò)結(jié)構(gòu),然后再構(gòu)建具有不同特征的4個(gè)單一深度學(xué)習(xí)模型進(jìn)行預(yù)測,根據(jù)預(yù)測結(jié)果完成權(quán)重自適應(yīng)計(jì)算并實(shí)現(xiàn)模型集成,最后輸出最終預(yù)測結(jié)果。接下來將先對真實(shí)數(shù)據(jù)集進(jìn)行分析,再介紹4種單一模型以及集成模型。
2.1 數(shù)據(jù)分析
數(shù)據(jù)來源于美國國家可再生能源實(shí)驗(yàn)室網(wǎng)站(www.nrel.gov)所提供的光伏發(fā)電量數(shù)據(jù),選取美國東部阿拉巴馬州137個(gè)站點(diǎn)在2006年的光伏發(fā)電量作為實(shí)驗(yàn)數(shù)據(jù)。
傳統(tǒng)發(fā)電預(yù)測一般考慮單個(gè)發(fā)電站的相關(guān)影響因素,未考慮多個(gè)發(fā)電站之間的相關(guān)性。因此,本文利用互信息構(gòu)建網(wǎng)絡(luò)結(jié)構(gòu)。所有發(fā)電站之間的互信息網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示,節(jié)點(diǎn)代表發(fā)電站,利用歷史發(fā)電量數(shù)據(jù)計(jì)算互信息來衡量發(fā)電站之間的相關(guān)性并作為邊的權(quán)重?;バ畔⒌挠?jì)算公式為:
I(X;Y)=∑x∈X∑y∈YP(x,y)logP(x,y)P(x)P(y)(1)
式中:X和Y為2個(gè)離散的隨機(jī)變量;P(x,y)為X和Y的聯(lián)合概率分布;P(x)和P(y)分別為對應(yīng)的邊緣概率分布。
得到所有發(fā)電站之間的互信息網(wǎng)絡(luò)結(jié)構(gòu)后,通過分析對應(yīng)互信息熱力圖(圖3),能夠根據(jù)互信息將發(fā)電站分為多個(gè)集群(如圖2中虛線圈代表一個(gè)集群),并從中選取站點(diǎn),利用與其相關(guān)性較高的站點(diǎn)發(fā)電量作為特征來進(jìn)行集群發(fā)電預(yù)測。
2.2 卷積神經(jīng)網(wǎng)絡(luò)(CNN)
CNN已經(jīng)在諸如圖像和視頻識(shí)別、圖像分類、圖像處理、醫(yī)學(xué)圖像分析和自然語言處理等領(lǐng)域取得了巨大成功。除了這些領(lǐng)域之外,CNN在基于時(shí)間序列數(shù)據(jù)領(lǐng)域也日益受到青睞,這主要?dú)w因于它具備處理多通道輸入數(shù)據(jù)的能力[26]。其中輸入數(shù)據(jù)f和卷積核g的卷積運(yùn)算數(shù)學(xué)表達(dá)式如下:
S(i,j)=(g*f)(i,j)=∑m∑ng(m,n)·f(i-m,j-n)(2)
式中:S(i,j)為卷積運(yùn)算的結(jié)果;m,n為卷積核的尺寸。通過卷積操作能夠?qū)崿F(xiàn)對輸入數(shù)據(jù)的特征提取,從而在時(shí)間序列分析、行為識(shí)別、交通流量預(yù)測等任務(wù)中展現(xiàn)出優(yōu)越的性能。
2.3 極端梯度提升(XGBOOST)
XGBOOST[27-28]是一種迭代訓(xùn)練多個(gè)決策樹的梯度提升樹算法。在每一輪迭代中XGBOOST訓(xùn)練一棵新的決策樹,該決策樹校正前一棵樹的殘差,然后將它們的輸出進(jìn)行聚合以進(jìn)行預(yù)測。模型的最終輸出是多個(gè)決策樹輸出的累積和,每個(gè)決策樹的貢獻(xiàn)由學(xué)習(xí)率控制。這種策略使其能夠通過集成多個(gè)決策樹來提高預(yù)測性能,并且具有較高的泛化能力。對于第i個(gè)樣本的預(yù)測值,它可以表示為所有樹的輸出累積:
y∧i=∑Kk=1fk(xi)(3)
式中:K為樹的數(shù)量;fk(xi)為樣本xi的第k棵樹的輸出。在訓(xùn)練模型方面,定義了損失函數(shù)和正則化項(xiàng),旨在使得損失函數(shù)最小化,以下是目標(biāo)函數(shù)表達(dá)式:
L(φ)=∑il(y∧i,yi)+∑kΩ(fk)(4)
式中:l為損失函數(shù),計(jì)算預(yù)測值和真實(shí)值之間的誤差;Ω(fk)為正則化項(xiàng),控制每棵樹的復(fù)雜度。
2.4 長短期記憶網(wǎng)絡(luò)(LSTM)
作為RNN的一種變體,LSTM于1997年被提出[29]。LSTM的結(jié)構(gòu)包括1個(gè)輸入門、1個(gè)遺忘門和1個(gè)輸出門,通過控制這3個(gè)門的開閉程度,LSTM能夠?qū)W習(xí)需要存儲(chǔ)、丟棄和讀取的信息。輸入門負(fù)責(zé)確定新信息的重要性,遺忘門決定舊信息的保留程度,而輸出門則控制當(dāng)前單元狀態(tài)的輸出。通過這種機(jī)制,LSTM能夠有效地長期記憶序列中的重要信息,并同時(shí)提取短期特征,使得網(wǎng)絡(luò)更加適應(yīng)序列數(shù)據(jù)的處理需求[30]。LSTM的數(shù)學(xué)表達(dá)式如下:
f(t)=σ(wTf·[h(t-1),x(t)]+bf)(5)
i(t)=σ(wTi·[h(t-1),x(t)]+bi)(6)
g(t)=tanh(wTg·[h(t-1),x(t)]+bg)(7)
c(t)=f(t)·c(t-1)+it·g(t)(8)
o(t)=σ(wTo·[h(t-1),x(t)]+bo)(9)
其中:f(t)為遺忘門的輸出;i(t)為輸入門的輸出;o(t)為輸出門的輸出;g(t)為候選記憶細(xì)胞的輸出;c(t)為該時(shí)刻的細(xì)胞狀態(tài),其根據(jù)輸入門的輸出和遺忘門的輸出,更新細(xì)胞狀態(tài),新的細(xì)胞狀態(tài)由當(dāng)前輸入和上一時(shí)刻的細(xì)胞狀態(tài)加權(quán)求和得到;σ為激活函數(shù);w,b為相應(yīng)門的權(quán)重矩陣和偏置。
2.5 時(shí)序卷積網(wǎng)絡(luò)(TCN)
TCN[31]是一種專為序列建模而設(shè)計(jì)的深度學(xué)習(xí)架構(gòu)。不同于傳統(tǒng)的RNN,TCN采用CNN來捕捉序列中的長期依賴關(guān)系。每層卷積層包含激活函數(shù)以及殘差連接,以下是其運(yùn)算表達(dá)式:
Yi=H(Xt)+Xt(10)
式中:Xt=(x1,x2,…,xT)為輸入序列;Yi=(y1,y2,…,yT)為輸出序列;H(Xt)為卷積層輸出。TCN中使用的殘差連接機(jī)制有助于緩解梯度消失和爆炸問題,提高了模型的穩(wěn)定性和收斂速度。
2.6 集成模型
自適應(yīng)聚合集成學(xué)習(xí)[31]通過自適應(yīng)地調(diào)整每個(gè)基礎(chǔ)模型的權(quán)重,可以有效地提高模型的泛化能力和靈活性,并能夠很好地平衡各個(gè)模型的性能,在降低過擬合風(fēng)險(xiǎn)的同時(shí)也能提升預(yù)測效果。自適應(yīng)聚合權(quán)重的計(jì)算表達(dá)式為:
Alt(n)=∑nh=1Ert(h)(11)
εt(n)=e-δAlt(n)∑4t=1e-δAlt(n)(12)
其中:Ert(h)為第n次迭代時(shí)第t個(gè)基本模型的單獨(dú)損失;Alt(n)為到第n次訓(xùn)練迭代時(shí)第t個(gè)基本模型的累積損失;εt(n)為第t個(gè)基本模型的集成權(quán)重;δ=1/lnT為在訓(xùn)練過程中控制集合的聚合權(quán)重的平衡因子;T為最大訓(xùn)練迭代次數(shù)。
3 實(shí)驗(yàn)部分
3.1 數(shù)據(jù)集處理
根據(jù)發(fā)電站互信息集群網(wǎng)絡(luò)結(jié)構(gòu),從4個(gè)集群中選取4個(gè)發(fā)電站進(jìn)行光伏集群發(fā)電預(yù)測,將與被選擇站點(diǎn)相關(guān)性高的站點(diǎn)發(fā)電數(shù)據(jù)作為其特征來完成預(yù)測。首先對數(shù)據(jù)集進(jìn)行歸一化處理,再利用滑動(dòng)窗口方法將數(shù)據(jù)集構(gòu)造成相應(yīng)的訓(xùn)練數(shù)據(jù)和對應(yīng)標(biāo)簽,最后將數(shù)據(jù)集按照8∶1∶1的比例劃分成訓(xùn)練集、驗(yàn)證集和測試集。
3.2 模型參數(shù)
選擇CNN、TCN、LSTM和XGBOOST模型來進(jìn)行集成學(xué)習(xí),所有模型參數(shù)如表1所示。
3.3 實(shí)驗(yàn)設(shè)置
3.3.1 實(shí)驗(yàn)設(shè)計(jì)
為了評估所提出的集成方法,設(shè)計(jì)了以下2組實(shí)驗(yàn):
1) 單一模型與集成模型的比較。
2) 預(yù)測模型的超參數(shù)分析。
3.3.2 評價(jià)指標(biāo)
實(shí)驗(yàn)利用均方誤差(Mean Square Error,MSE)和平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)評估模型的預(yù)測能力,這些評價(jià)指標(biāo)被廣泛應(yīng)用于時(shí)間序列預(yù)測方面,都具有較為直觀的解釋性,以下是其計(jì)算公式:
EMSE=1n∑ni=1(y∧i-yi)2(13)
EMAPE=1n∑ni=1yi-y∧iyi×100%(14)
其中:n為樣本總數(shù);yi為第i個(gè)真實(shí)值;y∧i為第i個(gè)預(yù)測值。EMSE和EMAPE的值越小,說明預(yù)測值與真實(shí)值越接近,對應(yīng)模型預(yù)測精度越高。
3.4 單一模型與集成模型的比較
在此實(shí)驗(yàn)環(huán)節(jié),將單一模型即CNN、XGBOOST、LSTM和TCN與集成模型的預(yù)測能力進(jìn)行對比,實(shí)驗(yàn)結(jié)果如表2和表3所示。其中表2是基于評價(jià)指標(biāo)EMSE得到的,表3是基于評價(jià)指標(biāo)EMAPE得到的。根據(jù)實(shí)驗(yàn)結(jié)果,本文還通過Wilcoxon符號秩檢驗(yàn)和Friedman檢驗(yàn)進(jìn)行了統(tǒng)計(jì)分析[32-33],以下是分析結(jié)果:
1) 集成模型針對2個(gè)指標(biāo)都表現(xiàn)出較好的預(yù)測結(jié)果,在4個(gè)站點(diǎn)的單步預(yù)測指標(biāo)都優(yōu)于其余4個(gè)單一模型的指標(biāo)。
2) 集成模型在4個(gè)站點(diǎn)的預(yù)測中,指標(biāo)EMSE始終低于10.00,最低可至0.000 2,指標(biāo)EMAPE始終低于112.06,最低可至0.19。
集成模型在預(yù)測精度上相較單一模型有明顯提升,針對不同光伏發(fā)電站的發(fā)電量預(yù)測也有較強(qiáng)的泛化能力。
3.5 集成模型分析
本實(shí)驗(yàn)環(huán)節(jié)對集成模型的集成過程和性能進(jìn)行了可視化,圖4和圖5分別是集成模型對4個(gè)站點(diǎn)發(fā)電量預(yù)測的收斂曲線圖和權(quán)重圖,根據(jù)以下可視化信息,可以得出以下結(jié)論:
1) 所有模型在不同站點(diǎn)的數(shù)據(jù)下均能夠隨著訓(xùn)練次數(shù)的增加逐漸收斂,并得到最優(yōu)預(yù)測結(jié)果,但單一模型不能在所有情況下都具有較好的預(yù)測結(jié)果。
2) 集成模型能夠根據(jù)誤差自適應(yīng)調(diào)整權(quán)重,在4個(gè)發(fā)電站的發(fā)電量預(yù)測中獲得良好的預(yù)測結(jié)果。
3) 集成模型相較單一模型,通過自適應(yīng)權(quán)重計(jì)算,不僅在多種情況下能夠擁有較好的性能,并且具備良好的靈活性。
4 結(jié)論
本文提出了一種基于混合深度學(xué)習(xí)的光伏集群發(fā)電預(yù)測模型。該模型首先根據(jù)歷史數(shù)據(jù)構(gòu)建互信息集群網(wǎng)絡(luò)結(jié)構(gòu),基于此對經(jīng)典單一深度學(xué)習(xí)模型CNN、TCN、LSTM和XGBOOST進(jìn)行構(gòu)建并完成初步預(yù)測。然后再根據(jù)其預(yù)測結(jié)果實(shí)現(xiàn)自適應(yīng)權(quán)重計(jì)算,完成集成學(xué)習(xí)得到最終預(yù)測結(jié)果。集成模型相較單一模型擁有良好的靈活性和泛化能力。通過實(shí)驗(yàn)證明,該集成模型在不同光伏發(fā)電站的發(fā)電量預(yù)測中,其預(yù)測精度較單一模型都有顯著提升。本文主要集中在利用多個(gè)發(fā)電站的發(fā)電量數(shù)據(jù)進(jìn)行預(yù)測,并沒有考慮氣象等因素對發(fā)電量的影響。在之后的研究中,將考慮地理位置或氣象等因素對發(fā)電量的影響,以提高模型在各種復(fù)雜環(huán)境條件下的準(zhǔn)確性和靈活性,為實(shí)際應(yīng)用提供更可靠的預(yù)測結(jié)果。
參考文獻(xiàn):
[1]WANG G C,SU Y,SHU L J.One-Day-Ahead Daily Power Forecasting of Photovoltaic Systems Based on Partial Functional Linear Regression Models [J].Renewable Energy,2016,96:469-478.
[2] LI Y T,HE Y,SU Y,et al.Forecasting the Daily Power Output of a Grid-Connected Photovoltaic System Based on Multivariate Adaptive Regression Splines [J].Applied Energy,2016,180:392-401.
[3] 孫凡,李興隆,肖強(qiáng),等.渝東南山地風(fēng)能資源及風(fēng)切變研究 [J].西南大學(xué)學(xué)報(bào)(自然科學(xué)版),2023,45(4):226-230.
[4] CHEN J F,WANG W M,HUANG C M.Analysis of an Adaptive Time-Series Autoregressive Moving-Average (ARMA) Model for Short-Term Load Forecasting [J].Electric Power Systems Research,1995,34(3):187-196.
[5] JI W,CHEE K C.Prediction of Hourly Solar Radiation Using a Novel Hybrid Model of ARMA and TDNN [J].Solar Energy,2011,85(5):808-817.
[6] SABER A Y,ALAM A K M R.Short Term Load Forecasting Using Multiple Linear Regression for Big Data [C] //2017 IEEE Symposium Series on Computational Intelligence (SSCI),November 27-December 1,2017,Honolulu,HI,USA.IEEE,2017:1-6.
[7] LEVA S,DOLARA A,GRIMACCIA F,et al.Analysis and Validation of 24 Hours Ahead Neural Network Forecasting of Photovoltaic Output Power [J].Mathematics and Computers in Simulation,2017,131:88-100.
[8] GABOITAOLELWE J,ZUNGERU A M,YAHYA A,et al.Machine Learning Based Solar Photovoltaic Power Forecasting:A Review and Comparison [J].IEEE Access,2023,11:40820-40845.
[9] ABUELLA M,CHOWDHURY B.Random Forest Ensemble of Support Vector Regression Models for Solar Power Forecasting [C] //2017 IEEE Power amp; Energy Society Innovative Smart Grid Technologies Conference (ISGT),April 23-26,2017,Washington,DC,USA.IEEE,2017:1-5.
[10]ROY N,TRIPATHY P,DE S C,et al.Day-Ahead Solar Power Generation Forecasting Using LSTM and Random Forest Methods for North Eastern Region of India [C] //2022 22nd National Power Systems Conference (NPSC),December 17-19,2022,New Delhi,India.IEEE,2022:854-859.
[11]U.S.National Renewable Energy Laboratory.Solar Power Data for Integration Studies [DB/OL].(2006-12-31) [2024-03-15].https://www.nrel.gov/grid/solar-power-data.html.
[12]COLAK I,YESILBUDAK M,GENC N,et al.Multi-Period Prediction of Solar Radiation Using ARMA and ARIMA Models [C] //2015 IEEE 14th International Conference on Machine Learning and Applications (ICMLA),December 9-11,2015,Miami,F(xiàn)L,USA.IEEE,2015:1045-1049.
[13]CHEN X B,XIE B,ZHANG P F,et al.Research on Wind and Solar Power Generation Forecasting Based on SARIMA-LSTM Model [C] //2023 3rd International Conference on New Energy and Power Engineering (ICNEPE),November 24-26,2023,Huzhou,China.IEEE,2023:695-699.
[14]VANDEVENTER W,JAMEI E,THIRUNAVUKKARASU G S,et al.Short-Term PV Power Forecasting Using Hybrid GASVM Technique [J].Renewable Energy,2019,140:367-379.
[15]PAN M Z,LI C,GAO R,et al.Photovoltaic Power Forecasting Based on a Support Vector Machine with Improved Ant Colony Optimization [J].Journal of Cleaner Production,2020,277:123948.
[16]ZHOU M J,LI X F,ZHONG Z Y.Research on Photovoltaic Power Generation Power Prediction Based on RF-XGBoost Model [C] //2023 IEEE 6th International Conference on Information Systems and Computer Aided Education (ICISCAE),September 23-25,2023,Dalian,China.IEEE,2023:544-549.
[17]IZZATILLAEV J,YUSUPOV Z.Short-Term Load Forecasting in Grid-Connected Microgrid [C] //2019 7th International Istanbul Smart Grids and Cities Congress and Fair (ICSG),April 25-26,2019,Istanbul,Turkey.IEEE,2019:71-75.
[18]KONG W C,DONG Z Y,JIA Y W,et al.Short-Term Residential Load Forecasting Based on LSTM Recurrent Neural Network [J].IEEE Transactions on Smart Grid,2019,10(1):841-851.
[19]GAO M M,LI J J,HONG F,et al.Day-Ahead Power Forecasting in a Large-Scale Photovoltaic Plant Based on Weather Classification Using LSTM [J].Energy,2019,187:115838.
[20]TAN M,YUAN S P,LI S H,et al.Ultra-Short-Term Industrial Power Demand Forecasting Using LSTM Based Hybrid Ensemble Learning [J].IEEE Transactions on Power Systems,2020,35(4):2937-2948.
[21]SONG H Y,HUANG X G,LI D Y,et al.Short-Term Prediction Method of Distributed Photovoltaic Power Generation Based on LSTM Network [C] //2023 3rd International Conference on Intelligent Power and Systems (ICIPS),October 20-22,2023,Shenzhen,China.IEEE,2023:348-353.
[22]談玲,康瑞星,夏景明,等.融合多源異構(gòu)氣象數(shù)據(jù)的光伏功率預(yù)測模型 [J].電子與信息學(xué)報(bào),2024,46(2):503-517.
[23]DENG Z F,WANG B B,XU Y L,et al.Multi-Scale Convolutional Neural Network with Time-Cognition for Multi-Step Short-Term Load Forecasting [J].IEEE Access,2019,7:88058-88071.
[24]TZIOLIS G,LIVERA A,MONTES-ROMERO J,et al.Direct Short-Term Net Load Forecasting Based on Machine Learning Principles for Solar-Integrated Microgrids [J].IEEE Access,2023,11:102038-102049.
[25]WANG Z Y,WANG Y R,SRINIVASAN R S.A Novel Ensemble Learning Approach to Support Building Energy Use Prediction [J].Energy and Buildings,2018,159:109-122.
[26]RUBASINGHE O,ZHANG X N,CHAU T K,et al.A Novel Sequence to Sequence Data Modelling Based CNN-LSTM Algorithm for Three Years Ahead Monthly Peak Load Forecasting [J].IEEE Transactions on Power Systems,2024,39(1):1932-1947.
[27]CHEN T Q,GUESTRIN C.XGBoost:A Scalable Tree Boosting System [C] //Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,New York,NY,USA,2016:785-794.
[28]劉翠玲,胡聰,王鵬,等.基于營銷大數(shù)據(jù)的電力客戶多維度信用評價(jià)模型研究 [J].西南大學(xué)學(xué)報(bào)(自然科學(xué)版),2022,44(6):198-208.
[29]ZHEN Z,LIU J M,ZHANG Z Y,et al.Deep Learning Based Surface Irradiance Mapping Model for Solar PV Power Forecasting Using Sky Image [J].IEEE Transactions on Industry Applications,2020,56(4):3385-3396.
[30]宋毅,張晗奕,孫豐,等.PPNet:基于預(yù)先預(yù)測的降雨短時(shí)預(yù)測模型 [J].電子與信息學(xué)報(bào),2024,46(2):492-502.
[31]HEWAGE P,BEHERA A,TROVATI M,et al.Temporal Convolutional Neural (TCN) Network for an Effective Weather Forecasting Using Time-Series Data from the Local Weather Station [J].Soft Computing,2020,24(21):16453-16482.
[32]LIANG C,WU D,HE Y,et al.MMA:Multi-Metric-Autoencoder for Analyzing High-Dimensional and Incomplete Data [M] //Lecture Notes in Computer Science.Cham:Springer Nature Switzerland,2023:3-19.
[33]WU D,SUN B,SHANG M S.Hyperparameter Learning for Deep Learning-Based Recommender Systems [J].IEEE Transactions on Services Computing,2023,16(4):2699-2712.
責(zé)任編輯 柳劍