中圖分類號:TM615 文獻標志碼:A
0引言
近年來,太陽能憑借在環保性、可再生性和安全可靠性等方面的優勢,成為全球關注的焦點,并成為眾多國家廣泛推廣和應用的主要能源。2022年,中國新增光伏發電并網容量高達8740.8萬 kW ,光伏發電累計并網容量已達39204萬
。隨著中國對光伏發電的大力推進,光伏發電系統在建筑物中的應用日益廣泛。輸出功率作為衡量光伏發電系統運行狀態的重要指標,可運用于光伏發電電力調度、光伏發電系統的故障診斷及運行維護當中[2]。準確預測光伏發電輸出功率,對光伏發電系統安全、平穩運行具有重要意義。
目前,常用的光伏發電輸出功率預測方法包括物理模型法、統計模型法和機器學習方法[3]。物理模型法基于太陽輻照量、溫度、大氣質量等因素建立數學模型,并計算得到光伏發電輸出功率[4。統計模型法通過分析輸出功率歷史數據和氣象數據的關系,建立光伏發電輸出功率與氣象變量的統計模型,例如:回歸分析模型、時間序列模型等[5]。機器學習方法通過訓練樣本數據和特征工程,建立光伏發電輸出功率與氣象變量之間的非線性映射關系[。常用的機器學習方法有隨機森林法、神經網絡等。
神經網絡作為1種模仿生物神經系統工作原理的機器學習模型,可以通過多層神經元之間的連接來預測光伏發電輸出功率。常用于光伏發電輸出功率預測的神經網絡模型包括:前饋神經網絡(feed-forward neural network,FNN)、遞歸神經網絡(recurrentneural network,RNN)、長短期記憶網絡(longshort-termmemory,LSTM) 和卷積神經網絡(convolutional neural network, CNN)[7-10]。
光伏發電輸出功率與氣象因素緊密相關,并且受到特定時間點下氣象數據的過去數據的和未來數據共同影響。LSTM作為遞歸神經網絡的1種重要變體,可以捕捉到時間序列數據中的長期依賴關系,通過其獨特的記憶單元和門控機制,其可以有效學習和利用過去時間點下的信息,從而實現對未來光伏發電輸出功率的準確預測[1-12]。然而,傳統的LSTM在處理長期依賴關系時,仍存在一定的局限性,雖然其引入了門控機制來捕捉長期記憶,但對于非常長的序列,梯度消失或梯度爆炸的問題難以避免,梯度消失或梯度爆炸導致LSTM無法有效捕捉長期依賴關系[13]。
本文提出1種基于Inception-CNN-LSTM的光伏發電輸出功率預測模型(下文簡稱為“本預測模型”),對該模型的建立方式進行介紹,并將其與其他3種模型進行對比,以驗證其預測精度。
1理論研究
1.1 CNN
CNN主要用于處理類似網格結構的數據,能夠自動從原始數據中學習高階特征,其通過一系列層級結構(包括:卷積層、池化層和全連接層)對輸入數據進行處理和提取特征[14]。具體來說,卷積層使用1組可學習的濾波器對輸入數據進行卷積操作,從而提取輸入數據的局部特征;池化層對卷積層的輸出進行降維和特征選擇;全連接層將池化層的輸出進行扁平化。CNN的結構示意圖如圖1所示。

1.2 Inception 網絡
Inception網絡是由Google公司提出的1種改進型CNN,旨在解決深度神經網絡中的梯度消失和參數過多的問題[15]。因此,在CNN-LSTM中引入Inception可以提高模型的特征提取和表征能力,該方法的核心思想是使用多個不同尺寸的卷積核并行操作,將不同層級的特征進行融合,以提取不同大小的特征。使用Inception網絡作為特征提取器,通過堆疊并行的卷積層和匯聚層來提取特征。在Inception-CNN-LSTM中,LSTM網絡層可對從Inception網絡中提取的特征進行序列建模和預測。
1.3 LSTM
LSTM是1種特殊的RNN架構,通過引入門控機制,有效解決了傳統RNN的處理長期依賴性;其通過使用特殊的記憶單元和一系列門控單元來控制信息的流動,從而允許信息在網絡中流通和保持[1],其結構示意圖如圖2所示。圖中:
為上一時刻的細胞狀態;
為更新后的細胞狀態;
為上一時刻的隱藏狀態;
為更新后的隱藏狀態; σ 為非線性激活函數;
為輸入特征向量;
為輸出值。

通過將CNN和LSTM結合,可以實現模型在處理序列數據時,不僅能利用CNN對局部特征進行提取,還能利用LSTM對時間依賴關系的建模能力。此種結合方式能同時感知到序列中的局部和全局信息,從而提高對序列數據的理解和處理能力。
2模型的建立與預測
2.1數據預處理
本文使用的氣象數據來源于中國氣象數據網,氣象數據包括氣溫、濕度、風速、太陽輻照度和降水量,數據采樣間隔為1h。光伏發電輸出功率數據取自上海市某分布式光伏發電項目,該項目采用126塊額定功率為 420W 的柔性光伏組件,光伏發電系統總裝機容量為 $52.92\mathrm{\kW}$ ,配置1臺50kW 的逆變器(本次模型訓練采用的輸出功率數據源自該逆變器),數據的時間跨度為2023年1月1日至2024后1月1目。上海市2023年逐時氣溫、逐時濕度和逐時太陽輻照度如圖3所示。

光伏發電輸出功率的數據采樣間隔為
采集到的數據的預處理過程如下。
1)數據清洗:對氣象數據和輸出功率數據進行初步篩選,剔除明顯錯誤的記錄,特別是對于輸出功率,若其值為負或超出光伏發電系統最大裝機容量,則相應數據將被剔除。
2)異常值處理:通過箱線圖分析和3倍標準差法對異常值進行識別和處理,對于檢測到的異常值,使用其鄰近時刻的平均值進行替換。
3)數據標準化:為提升模型的收斂速度和預測精度,對所有輸入數據進行標準化處理。使用標準分數(Z-score)方法將數據標準化,將數據轉換為均值為“0”、標準差為“1”的標準化數據。
4)數據集劃分:將數據集劃分為訓練集和測試集,其中,訓練集占比為 80% ,測試集占比為20% 。在劃分過程中,采用隨機打亂順序的方法,以確保訓練集和測試集的數據分布具有一致性。
2.2本預測模型的建立
本文的模擬環境基于Python3.10語言,神經網絡框架通過TensorFlowv2.16.1實現,代碼由筆者自行編寫,所使用的環境庫包括Pandas2.1.3、NumPy1.26.2等。訓練用計算機配置為Windows10操作系統,CPU為AMDRyzen74800U。
本預測模型預測流程如圖4所示。

本預測模型的構建過程為:
1)Inception網絡作為特征提取器,在完成數據標準化處理后,通過3個大小不同的卷積層(卷積核尺寸分別為 1×1 、 3×3 和 5×5 捕捉輸入數據中不同層次和尺度的特征。每個卷積層配置32個不同的卷積核進行計算。同時,采用最大池化層,使用 3×3 大小的池化窗口對輸入特征進行池化,進一步降低特征維度,并保留關鍵信息。最后,使用concatenate函數將之前得到的特征按照最后1個維度拼接在一起。
2)在完成Inception網絡特征提取后,引入CNN卷積模塊進一步提取更高層次、更抽象的特征。該模塊包含2個卷積層和1個池化層,每個卷積層使用128個尺寸為 3×3 的卷積核對拼接后的特征圖進行卷積操作,池化層采用 1×1 大小的池化窗口對輸入特征進行池化。在完成池化后,將池化層展平為1維向量,為LSTM層做準備。
3)LSTM用于處理展平后的序列數據,輸出維度設置為128,并最終通過全連接層輸出模型預測結果。
2.3模型對比
為了全面評估不同模型在光伏發電輸出功率預測中的性能,本文還采用了傳統LSTM模型、CNN-LSTM模型和隨機森林模型與本預測模型進行對比分析。通過對比4種模型的預測結果誤差,可以更清晰地了解各模型的優勢與局限性。
1)傳統LSTM模型中的LSTM層數為1層,輸出維度為128,門控機制內部使用Sigmoid算法激活;全連接層輸出維度為1,采用線性函數激活;優化器采用Adam算法,學習率為0.001,批量大小為32,訓練輪數為100輪。
2)CNN-LSTM模型采用2個卷積層和1個池化層,運用LSTM處理CNN提取的特征序列,輸出維度、門控機制、優化器等參數參照傳統LSTM模型。
3)隨機森林模型中樹的數量為100,采用無約束最大深度,最小樣本分裂數為2,最小葉子節點樣本數為1,進行樹劃分時特征數量默認選擇“特征數的平方根”。
為了更全面地評估模型的預測性能,對比4種模型預測結果的平均絕對百分比誤差、均方根誤差變異系數和模型擬合度指標,從不同角度評估模型的預測精度和穩定性[17-18]。
平均絕對百分比誤差
是用于衡量預測值與實際值偏差程度的指標,其計算式為:

式中: i 為第 i 個樣本;
為樣本第 i 個實際值;
為第 i 個樣本的預測值; n 為樣本總數量。
均方根誤差變異系數
用于衡量均方根誤差
與均值的相對偏差,其計算式為:

式中:
為預測值的平均值。
模型擬合度指標
表示總平方和中由自變量解釋的平方和所占的比例,其值越接近1,表示模型擬合得越好,其計算式為:

3預測結果分析
為驗證不同模型的預測效果,本文采用相同的數據集對4種模型進行訓練和驗證,光伏發電輸出功率預測結果如圖5所示。


從圖5可以看出:本預測模型和傳統LSTM模型預測得到的輸出功率與實際值的偏離度較小,而隨機森林模型得到的預測輸出功率和實際值的偏離度較大。
4種模型的預測性能對比如表1所示。
從表1可以看出:4種模型中,本預測模型的平均絕對百分比誤差和均方根誤差變異系數最低,表明該模型具備很好的預測精度;此外,該模型的模型擬合度指標最接近于1,說明其擬合度最好、預測效果最佳。結合傳統LSTM模型和CNN-LSTM模型的表現結果,可以看出:這兩種模型均能夠捕捉時間依賴,但其平均絕對百分比誤差相對較高,表明二者在預測精度上略遜于本預測模型。Inception網絡在處理多尺度特征上的優勢,使其能夠從時空特征中學習到豐富的信息,從而顯著提升其預測精度。隨機森林模型雖然在處理高維特征和非線性問題方面有優勢,但其在具備時間序列特征的數據預測中表現不佳,這可能由于其無法有效捕捉數據中的時間依賴特征。

4本預測模型的應用場景
未來,本預測模型可在以下場景中進行應用。
1)電網的電力調度:通過對光伏發電系統輸出功率進行預測,可以更好地進行電網的電力調度和管理,對于采用“光-儲-直-柔”技術的光伏發電項目,光伏發電輸出功率預測的準確性直接影響到儲能系統的充放電策略和經濟效益。
2)故障診斷:通過對比輸出功率的實際值與預測值,可以快速識別出光伏組串的異常情況,縮短故障排查和修復時間,減少能源損失。
3)光伏組件的運維:幫助運維人員安排光伏組件的清潔維護工作,選擇最佳的清潔時機和頻率,從而提高光伏發電系統的發電效率。
5結論
為了更精確地預測光伏發電系統輸出功率,本文提出了Inception-CNN-LSTM光伏發電輸出功率預測模型,并將其預測結果與傳統LSTM模型、CNN-LSTM模型、隨機森林模型的預測結果進行了對比。研究結果顯示:相較于傳統LSTM模型、CNN-LSTM模型、隨機森林模型,Inception-CNN-LSTM光伏發電輸出功率預測模型在平均絕對百分比誤差、均方根誤差變異系數和模型擬合度指標方面均最優,具有較高的預測精度,能夠有效捕捉時空特征,未來可為電網的電力調度、故障診斷和光伏組件運維提供可靠的預測支持。
[參考文獻]
[1] 劉夢月,彭佳強,肖睿,等.基于深度學習的城市屋頂光伏面積識別及光伏發電潛力研究[J].建筑科學,2023,39(6):151-158.
[2] LEED H,KIMK.Recurrent neural network-based hourlyprediction of photovoltaic power output using meteorologicalinformation[J].Energies,2019,12(2):215.
[3] 吳碩.光伏發電系統功率預測方法研究綜述[J].熱能動力工程,2021,36(8):1-7.
[4] 戴錦,肖文波,胡芳雨,等.光伏發電性能物理預測模型的研究[J].電源技術,2018,42(2):262-266.
[5] 唐圣學,宋曉,李明,等.光伏組件壽命衰退建模與壽命預測高斯隨機過程回歸方法研究[J].太陽能學報,2022,43(12): 41-49.
[6] 李爭,徐若思,曹欣,等.基于小波變換和IAGA-BP神經網絡的光伏功率短期預測方法[J].可再生能源,2023,41(7):883-890.
[7] 喬楠.基于SSA-FNN的光伏功率超短期預測研究[J].光源與照明,2022(10):98-100.
[8] 黃浚哲,印宇涵,湯明軒,等.基于CEEMDAN與改進LSTM的短期光伏出力預測[J].電器與能效管理技術,2023(10): 36-43.
[9] 易龍強.基于多級CNN的光伏組件智能IV診斷方法[J].電氣應用,2023,42(11):70-75.
[10] 朱潤澤,王德軍.基于LSTM神經網絡的光伏系統功率預測[J].電力科技與環保,2023,39(3):201-206.
[11] 朱坤,付青.基于EEMD-Kmeans-ALO-LSTM的短期光伏功率預測[J].電源技術,2023,47(1):103-107.
[12]徐柔,章杰,賴松林,等.結合改進的DCGAN和Attention-LSTM的光伏功率預測[J].福州大學學報(自然科學版),2023,51(4):498-504.
[13] 李樹嫻,張曉駿,胡成雨.基于LSTM的政策效應預測模型及其應用[J].統計與決策,2023:1-6.
[14] RAMASAMY S,PERUMAL M.CNN-based deeplearning technique for improved H7TLI with grid-connectedphotovoltaic systems[J]. International journal of energyresearch,2021,45(14):19851-19868.
[15]李冬輝,劉功尚,高龍.基于 Inception-LSTM-Attention的冷水機組傳感器偏差故障診斷方法[J].中南大學學報(自然科學版),2023,54(1):102-112
[16] ABDEL-NASSERM,MAHMOUDK.Accuratephotovoltaic power forecasting modelsusing deepLSTM-RNN[J].Neural computing and applications,2019,31(7):2727-2740.
[17]TORRES-HUITZILC,GIRAUB.Faultanderrortolerance in neural networks:areview[J].IEEE access,2017,5:17322-17341.
[18] 柯子桓,羅楚楠,黎少凡.基于循環神經網絡的配網電壓異常數據檢測方法[J].電子設計工程,2024,32(1):106-110.
RESEARCHONPREDICTIONMODEL OFPVPOWERGENERATION OUTPUTBASED ONINCEPTION-CNN-LSTM
Zhang Yunyun12,Chen Jiale1,Li Zhengwei2 (1.ShanghaiDongfang Yanhua EnergySaving Technology ServiceCo.,Ltd.,Shanghai200333,China; 2.SchoolofMechanical Engineering,Tongji University,Shanghai2ooooo,China)
Abstract: Output power, as an important indicator for the operation and maintenance of PV power generation systems,is an important way to understand the power generation capacity and operating conditions of PV power generation systems.This paper combines the multi-scale feature extraction ability of Inception network,the local feature capture ability of convolutional neural network (CNN),and the time series modeling ability of long short term memory network (LSTM) to propose a PV power generation system output power prediction model based on Inception CNN-LSTM,and compares its prediction accuracy with the other three models.The research results show that the Inception-CNN-LSTM model outperforms traditional LSTM models, CNN-LSTM models, and random forest models in terms of average absolute percentage error,root mean square error coefficient of variation,and model fiting index.This model has broad application prospects in power dispatching,fault diagnosis,and PV module operation and maintenance,and can provide strong support for the effcient operation of PV power generation systems.
Keywords: PV power; output power forecasting; CNN; LSTM; neural network