杜仲耀,陳曉英,鄧 宇,孫麗穎
(遼寧工業大學電氣工程學院,遼寧錦州 121001)
隨著大規模具有不確定性的光伏發電機組接入電網,電力系統調度運行的難度也在不斷增加[1]。2020 年12 月我國發布IEC 首個可再生能源功率預測國際標準——《可再生能源發電功率預測》(IEC TR 63043:2020),標志著可靠的光伏發電功率預測(PVPF)將成為智能電網建設至關重要的組成部分。
由于受太陽運動、環境條件、季節變化和地理位置等因素影響,光伏發電功率會有很大波動,融合深度學習建模和時間相關原理的日前光伏功率預測可以解決傳統人工智能方法對復雜非線性系統存在過擬合、泛化能力差的弊端[2]。由于深度學習對大量歷史數據的依賴性,在新建光伏電站數據不足的情況下,預測模型無法滿足調度機構對預測精度的要求。
針對上述問題,本文研究日輻照度特征分析,引入t-SNE流形學習對氣象數據進行特征提取,構建基于日輻照度特征、光伏電池溫度、氣象數據特征的預測模型特征矩陣;建立遷移學習的GRU 神經網絡,使用長期運行電站的歷史數據作為源域數據集進行預測模型預訓練,以新建光伏電站少量運行數據作為任務域數據集,對光伏電站出力預測模型微調,實現預測模型本地化。
光伏發電系統輸出功率受太陽輻照度、環境溫度、濕度等氣象因素的影響,面向太陽能資源的氣象數據集可為光伏功率預測提供多種可靠的數據支撐。由于太陽輻照度是影響光伏電站發電功率最重要的因素,精確地識別輻照度的數據特征對于時間序列的預測至關重要[3]。另一方面,氣象數據維數過高會增加預測特征的識別難度[4]。為降低歷史數據復雜度,本文構建包括日輻照度特征、光伏電池溫度和氣象數據特征的預測特征矩陣F。
根據太陽輻照度隨天氣和季節變化波動的特點[5],在預測模型預訓練和遷移學習過程中,使用天氣特征系數ME、季節特征系數SE和C.V日離散系數提取總輻照度GHI 數據特征,實現對源域和任務域數據的日輻照度特征輔助識別功能。
1.1.1 天氣特征系數
天氣特征系數描述的是預測日實際輻照度與理想輻照度的相關性,該系數越小輻照度受當前工況氣象因素影響越明顯,實際輻照度波動性越強。天氣特征系數ME如式(1)所示:

式中:Xi為當日第i時刻實際輻照度;X為當日平均實際輻照度;Ci為當日第i時刻實際輻照度;C為當日平均理想輻照度,理想輻照度根據“晴空模型”計算[6]。
1.1.2 季節特征系數
季節特征系數對季節變化進行量化,該系數越大越接近下一季節。季節特性系數SE如式(2)所示:

式中:Ni為不同季節平均輻照度等級,將不同季節平均輻照度從小到大分別取1 到4 級;Cimax為當前季節理想最大輻照度。
1.1.3 日離散系數
為對不同日輻照度時間序列離散程度進行區別,采用離散系數進行度量而不是常見的標準差。離散系數C.V即標準差與平均值的比值,如式(3)所示:

光伏電池溫度的物理模型將神經網絡的特征識別簡化[7],最大程度地發揮弱相關變量作用的同時降低了輸入變量復雜性。光伏電池組件溫度τ 如式(4)所示:)

式中:τ 為光伏電池組件溫度,℃;τair為環境溫度,℃;τNOCT為標稱工作電池溫度,℃,在20 ℃,800 W/m2下確定;E為環境溫度下的輻照度,W/m2,此處視為總輻射GHI。
對于處理非線性強、弱相關變量多的問題[8],對光伏電站歷史運行數據使用t 分布隨機近鄰嵌入(t-SNE)算法[9]進行特征提取,通過降低數據特征復雜性,提高預測模型對數據特征的識別能力。t-SNE 算法提取氣象數據特征的具體步驟如下:
(1)設n個高維系統運行數據集合S={x1,x2,…,xn},高維空間的數據點兩兩之間服從高斯分布,描述高斯中心相似的條件概率為Gj|i,如式(5)所示:

式中:σi為數據點xi的高斯分布方差。
(2)根據式(5)計算空間中任意兩個數據點的聯合概率分布Gij,如式(6)所示:

(3)設T={α1,α2,…,αm}為集合S在低維空間中服從自由度為l的t 分布的映射,則系統運行數據任意兩個特征矩陣聯合概率分布Qij,如式(7)所示:

(4)t-SNE 將映射正確性用Kullback-Leibler 離散度DKL表示,如式(8)所示:

(5)利用梯度下降法迭代求最小離散度,使氣象特征矩陣T正確率最高。設最大迭代次數為S,則基于t-SNE 算法對高維數據區分數據特征的流程,如圖1 所示。

圖1 利用t-SNE算法進行高維數據降維流程
長短期記憶神經網絡(LSTM)作為時間序列預測領域最受關注的方案,由于其模塊參數多、結構復雜、計算速度慢且處理大數據問題容易過擬合。門控循環單元(GRU)[9]只有更新門和重置門,保持LSTM 基本性能的同時具有更簡單結構,這在大數據預測領域具有重要意義。GRU 單元結構如圖2所示。

圖2 門控循環單元結構
GRU 單元傳遞方程如下:
令Zt為t時刻GRU 的更新門,Rt為t時刻GRU 的重置門,如式(9)和(10)所示:

式中:σ 為激勵函數Sigmoid;Xt和ht-1分別為當前時刻輸入和上一時刻隱藏狀態;Wr為輸入權重矩陣;Ur為回路連接的權重矩陣。
令ht為t時刻GRU 的當前隱藏狀態,如式(11)所示:

式中:⊙表示Hadamard 積。
上一時刻隱藏狀態ht′如式(12)所示:

式中:tanh 為雙曲正切函數。
綜上所述,當更新門Zt=0 時完全遺忘上一時刻狀態,當Zt=1 時不再學習新數據,即更新門的激活控制神經網絡的長時期記憶能力。當Rt=0 時只與當前輸入有關,當Rt=1 時失去遺忘能力,即重置門的頻繁激活來控制短期記憶能力。
為解決新建光伏電站本地數據(目標任務域)DT匱乏的問題,使用遷移學習將長期運行的光伏電站歷史數據(源域)DS對新建電站預測模型預訓練,本地數據完成預測模型的微調,克服了傳統機器學習需滿足相同數據分布的問題。遷移學習的GRU 神經網絡(TL-GRU)結構如圖3 所示。

圖3 遷移學習的神經網絡結構
GRU 神經網絡的遷移學習主要分為2 個階段:
(1)模型預訓練?;赥L-GRU 的預測模型,由1 個輸入層、2 個隱藏層和2 個全連接層(FC)組成;隨機初始化輸入權重和閾值;使用源域進行預訓練,產生初始網絡中隱藏狀態ht并在源域和目標域之間共享。
(2)遷移學習。在預訓練的神經網絡基礎上,根據目標域對FC 層進行微調(Fine-tune)以限制遷移學習過擬合[10],完成模型本地化?;赥L-GRU 的預測輸出Pt如式(13)所示:

式中:Pt為目標任務域中預測發電功率;Whj為隱藏層與第一層FC 的權重矩陣;W1i為第一層FC 與輸出層的權重矩陣;b1為第一層FC 的偏置量;b2為輸出層的偏置量。
本文研究的特征提取和遷移學習的GRU 神經網絡預測模型(FTL-GRU)具體實現步驟總結,基于特征遷移的光伏發電功率短期預測流程如圖4 所示。

圖4 光伏電站出力預測模型
基于特征遷移的光伏功率短期預測具體步驟如下:
(1)模型特征構建:根據式(1)~(4)計算太陽輻照度的日天氣特征ME、季節特征SE、日離散系數C.V和光伏電池組件溫度τ;將氣象數據使用t-SNE 算法進行特征提取,得到氣象特征矩陣T以提取源域和任務域公共特征。綜上確定基于特征遷移的GRU 神經網絡預測模型的輸入特征矩陣F,如式(14)所示:

(2)訓練樣本選?。涸慈蝿仗卣骷疐S作為預訓練數據集。
(3)預訓練模型:根據FS對預測模型進行預訓練,學習率設置為0.9;建立基于遷移學習的GRU 神經網絡。
(4)遷移學習樣本選?。焊鶕繕颂卣骷疐T對預訓練預測模型進行遷移學習。
(5)參數微調:根據式(13)對GRU 神經網絡參數進行微調,學習率設置為0.01。
(6)功率預測:使用自適應矩估計(Adam)作為求解優化器,根據標準化輸出與實際功率計算損失函數MSE,利用完成遷移學習的預測模型,根據未來24 h 數值天氣預報數據,預測未來24 h 光伏發電功率。
光伏電站出力預測誤差對于評估模型的預測精度至關重要,本文選用NRMSE和NMAPE作為光伏功率預測評價指標,如式(15)(16)所示:

式中:yi和pi為光伏功率的實際測量值和相應的預測值。
為驗證基于FTL-GRU 的光伏功率短期預測模型性能,首先選用DKA 太陽能研究中心數據作為DS[11]共35 136 個數據點366 d,使用我國中部某光伏電站歷史數據為DT共2 880 個數據點30 d。時間分辨率為15 min,預測時間為日前24 h,預測數據集DP?DT共96 個數據點,代碼編輯器采用PyCharm。
為消除變量間數量級差異對神經網絡學習增益的影響,將數據歸一化,以保持發電功率與各變量之間的相關性。除發電功率外其他變量均使用一般歸一化公式,標準發電功率PNormal如式(17)所示:

式中:P為功率值;PCapacity為當前在線光伏裝機容量。輻照度過低而功率倒灌時P為0。
為量化t-SNE 算法特征提取的性能,引入Spearman 相關性系數對氣象特征矩陣T與原始數據S=DS∪DT各向量相關性進行比較。原始數據S包括:光伏電站實際發電功率(Power)、風速(WS)、環境溫度(WT)、環境濕度(WRH)、地面水平輻照度(GHI)、散射輻照度(DHI)、風向(WD)、和日降水量(WDR)共8 個向量。
將傳統主成分分析(PCA)和t-SNE 算法特征提取能力進行比較,如表1 所示。

表1 特征提取能力對比
由表1 可知,與原始數據相比,特征提取后各變量與功率的相關性明顯加強,且t-SNE 算法性能明顯優于PCA。t-SNE算法所構建特征矩陣T和原始數據各變量相關性系數如表2。

表2 相關性系數
在原始數據S 中,GHI 與發電功率相關性系數為0.991,對功率具有決定性作用,其他因素相關性不明顯且變量較多,不利于神經網絡預測模型的特征識別。氣象特征矩陣T各向量與功率輸出相關性分別為-0.498、0.582 和0.641,均呈現強相關且復雜性更低。
為精確對比預測性能,本文將特征遷移的GRU 神經網絡預測模型(FTL-GRU)與其他預測模型進行比較,如圖5 所示。

圖5 各預測模型對照
其中,LSTM 和GRU 模型表示使用DS對神經網絡進行訓練及預測;F-GRU 模型表示使用FS對GRU 網絡訓練及預測;FN-GRU 模型表示使用FS完成訓練并對DP進行預測。
由圖5(a)和表3 可知,相比于LSTM,由于GRU 神經網絡結構較為簡單,在處理光伏功率預測這類復雜問題時,能夠對數據波動特征更精準地捕捉。

表3 不同模型性能指標對比 %
GRU 與F-GRU 模型進行比較如圖5(b),F-GRU 預測精度NMAPE為8.772%,NRMSE為11.012%,均優于單獨的GRU 網絡模型。據此可知,建立特征矩陣能有效提高預測模型的特征識別精度,提高預測性能。
FN-GRU 模型的NMAPE為15.291%,NRMSE為15.223%,預測精度和穩定性都低于其他模型。這表明,直接使用其他光伏電站預測模型用于DP的預測任務,其泛化能力不足以滿足預測要求。
如圖5(c)及表3 所示,本文所研究的FTL-GRU 預測模型,NMAPE為6.236%,NRMSE為9.325%。遷移學習的預測模型能夠在缺乏歷史數據的新任務上微調預訓練的網絡,預測模型具有較好的適應能力。不同預測模型可靠性誤差如表3 所示。
本文使用日輻照度特征、光伏電池溫度和t-SNE 算法對氣象數據進行特征提取,構建光伏功率預測特征矩陣。相比于直接輸入光伏電站歷史運行數據,構建預測特征矩陣F可以更好地捕捉氣象特征,降低數據復雜度以提升模型對高維數據特征的識別能力。為解決新建光伏電站時神經網絡預測模型所需訓練數據不足的問題,采用遷移學習對GRU 神經網絡進行訓練,使用長期運行光伏電站數據完成預訓練,少量新建光伏電站數據對預訓練模型進行微調,完成預測模型本地化。仿真結果表明,采用該方案的新建光伏電站預測精度與基于本地大數據的預測模型精度相當,達到預訓練模型本地化的目標,為調度機構提供可靠信息。