竇麗霞 周其龍
(河南師范大學新聯學院 河南 鄭州 450000)
由于風電本身的隨機性,風電的大規模并入對電力系統[1]和電力市場[2]都提出了挑戰。因此,高比例風接入下的電力系統的可靠和經濟運行較大程度取決于風電預測值,尤其是在分布式和高度互聯發電的智能電網模式中。短期預測的應用包括功率平衡和最佳備用以及風電場控制[3]。此外,風能的隨機性和問題的復雜性要求進行時空概率處理,以便做出最優決策。
文獻[4]和文獻[5]對短期風電預測進行了回顧,其中對于小于約6 h的預測水平,通常使用位置信息的統計方法優于物理模型,它需要數小時的計算時間,并通過空間插值而引入不確定性。這些統計方法通常是非空間的,例如,自回歸建模[6]、馬爾可夫鏈[7]、數據挖掘[8],以及各種混合方法[9]。超短期預測的方法包括馬爾可夫切換[10]和參數概率預測[11],兩者都屬于自回歸技術。目前已有研究提出了空間預測方法來探索小區域中幾個風電場的出力之間的時空關系。文獻[12]通過風向對不同的空間信息進行回歸模擬。文獻[13]通過擬合向量自回歸模型,分析風速和風向之間的空間相關性,并利用多個風力發電場作為空間傳感器提高對風電的預測能力。近期的研究則試圖建立具有稀疏高斯隨機場的有效概率空間模型,但僅限于適度的空間維度[14-15]。隨著當今許多電力系統中風力發電場的豐富,人們期望為數十個或數百個風力發電場建立一個空間預測因子,從而使得計算成本和自動化模型更契合現實。
本文提出一種預測方法,用于在以前難以處理的大型空間尺度上進行超短期的概率預測。模型擬合程序完全是由數據驅動的,因此非常適用于智能電網。多個發電機共享一個高度互聯的電力系統,并且需要捕獲空間依賴性。本文基于logit-normal分布的參數概率框架以及將該分布的位置參數建模為稀疏向量自回歸過程(sVAR),并提出一種具有動態遺忘因子的指數平滑方案來跟蹤尺度參數,將其與邊界加權(Boundary Weighted,BW)方法進行比較。實驗結果顯示了本文算法的優越性。
本文數據通過相應的標稱功率進行歸一化,使其分布于區間[0,1]。假設風電遵循logit-normal分布。相應的變換由式(1)給出。
(1)
其逆變換為:
x=γ-1(y)=(1+e-y)-1y∈R
(2)
式中:X服從logit-normal分布,則變換后的變量Y=γ(X)為正態分布,其中X、Y分別表示x、y的集合。logit-normal分布的密度函數如下:
(3)
式中:參數μ和σ2為Y~N(μ,σ2)的均值和方差。 現在分別采用{xt}和{yt}來考慮隨機過程{Xt}及其轉換{Yt}。其表述如下:
(4)
(5)

為了計算未來某時刻風力密度預測{Xt+k},需要預測分布的位置和比例參數,即{Yt+k}變換過程的均值和方差。因此,通過將{Yt+k}建模為自回歸過程(Autoregressive Process, AR)或向量自回歸過程(Vector Autoregressive Process,VAR)來進行。將來自多個風電場的測量值進行對數正態變換并嵌入向量值時間序列中,并且由每個向量元素的未來值提供對應位置參數的預測。由此,可以近似地對比例參數建模。為了簡單起見,假定它是緩慢變化的,并由指數平滑方案逐點跟蹤。對于向量賦值過程,例如在多個位置進行的一系列測量,向量元素之間的依賴關系可能存在于一個范圍的尺度上。VAR模型可以捕獲這種時空依賴性,并且比獨立的AR模型產生更優的預測。然而,隨著空間維度變大,參數數量隨著維數的平方增加,VAR模型會變得難以估計,并且有用的空間信息越來越少。因此需追求VAR模型的稀疏參數化,即在模型中保留了連接具有空間相關性的站點的系數,而不忽略那些站點的系數。由此得到的sVAR是完整VAR模型的一種精確參數化,且與完整的VAR等價相比,所需訓練數據更少。
首先考慮單個風電場風力發電預測密度問題。時間序列xt為t時刻風電場出力。{xt}的logit-normal轉換為{yt},并且將其建模為AR(p)。將未來觀測值yt+k與先前測量值相關的表達式寫為:
(6)
式中:aτ是第τ次滯后的自回歸系數;εt+k是具有有限方差σ2的加性高斯噪聲。yt+k的期望值如下:
(7)
與σ2一起參數化{Yt+k}~N(μt+k,σ2)的預測分布。接下來考慮在M個空間分離的風電場計算風電的預測密度。序列{xt}為t時刻在每個風電場測量的功率,其中每個xt∈[0,1]M。{xt}的logit-normal變換和預測分布都是通過式(1)-式(5)來計算。然后就可以使用變換所得的時間序列{yt},其中yt∈RM。
VAR(p)為p階段新時間序列,其自回歸過程可表示為:
(8)
式中:矩陣Aτ∈RM×M包含VAR系數。零均值高斯噪聲t∈RM具有非奇異協方差矩陣Σε。yt+k的期望值由式(9)給出。
(9)
通常,VAR系數和噪聲協方差矩陣由最大似然估計(Maximum Likelihood Estimation, MLE)確定,當VAR(p)為高斯過程且對參數沒有約束時,生成Yule-Walker方程。然而對于大空間維度的模型,快速估計所有pM2VAR系數不切實際,并且可能產生噪聲和不確定預測(特別是當可用的訓練數據不足時)。因此本文提出稀疏估計方法克服這些缺點。
擬合稀疏向量自回歸模型的兩階段程序中,第一階段基于對應的時間序列對條件依賴性選擇要包括在稀疏模型中的對稱系數對。第二階段通過其t統計量對各個系數進行排序來細化初始選擇。在每個階段,所選擇的系數集合是最小化貝葉斯信息準則(Bayesian Information Criterion,BIC)的系數。先對兩個階段進行展開如下。
(1) 階段1:該階段目標是確定時間回歸的階數p,并選擇要在稀疏模型中保留的N對非對角線系數。這是通過消除被確定為條件不相關的系列對并將相應的VAR系數設置為零來實現的。 所有對角線系數,即包含自動協變量信息的系數,都保留在階段1中。設{yt,i}表示過程{yt}的第i個邊緣序列。 如果兩個不同的時間序列{yt,i}和{yt,j}(i≠j)有條件地不相關,則它們的部分光譜相干性PSCij(ω)=0表示ω∈(-π,π)。PSC為從過程{yt}的譜密度矩陣fY(ω)有效地計算得出,其中fY(ω)的第(i,j)個元素為{yt,i}和{yt,j}之間的常用頻譜。PSC是譜密度矩陣的負重新縮放逆。讓gY(ω)=fY(ω)-1,然后有:
(10)


(11)



(12)
式中:[Aτ]ij的標準誤差s.e.(·)是根據第1階段模型的最大似然估計值的漸近分布來進行計算的。
BIC是參數估計數的光滑凸函數,它可以有效地實現sVAR過程:一旦找到了函數的轉折點,就可以獲得最小值,從而改進擬合算法。有充分證據表明,隨著季節和氣候的變化,氣象時間序列的特性(包括風速)會隨著時間的推移而緩慢變化。因此,如果未直接建模,則允許時間序列模型的參數跟蹤此變化是適當的。風力作為依賴天氣的過程也是如此。實施遞歸更新AR參數,并且可以容易地擴展到VAR模型, 但通常不可能以簡單的方式修改所提出sVAR模型的稀疏性結構。實際上,緩慢變化參數的方法與突然選擇納入或移除系數是沖突的。
為了捕捉這些緩慢的變化,將sVAR在最近測量的一個時間窗上進行訓練,然后以同樣的方式定期進行再訓練,即在任何時間t,模型是根據t-L和t-1之間的觀察值進行訓練的,其中L是訓練窗口長度。為了進行比較,AR和VAR以相同的方式進行訓練。其中sVAR的參數可以在遞歸框架中以與傳統AR或VAR模型相同的方式進行更新。此外,尺度參數也應該能夠跟蹤動態變化導致的氣象變化。

(13)
(14)


(15)
將本文方法在澳大利亞能源市場運營商提供的5分鐘平均風力發電數據上進行了測試,該數據包括澳大利亞東南部22個風力發電場的風力發電記錄。2012年和2013年的數據可在每個現場獲得,包括210 528次測量。所有數據都歸一化至區間[0,1]。風電場位置如圖1所示。以2012年數據為訓練集,通過交叉驗證優化擬合過程的實現,并選擇指數平滑方案的參數。然后,利用2013年的數據評估預測值的性能。優化結果包括對230多萬個單獨預測的分析。

圖1 風電場位置
通過使用訓練數據集進行交叉驗證,以啟發式方法確定用于訓練AR、VAR和sVAR的數據窗口L的大小。選擇的窗口長度是最小化點預測的均方根誤差(Root-Mean-Squared Error,RMSE)的窗口長度。新的模型適合每月進行預測,以跟蹤時間序列動態變化。窗口長度選擇程序的結果如圖2所示。AR模型的最佳窗口長度為90天,sVAR的最佳窗口長度為150天。如前所述,傳統的VAR模型極度依賴于數據,而且計算成本非常高,因此VAR模型不能適用于超過270天的訓練數據。

圖2 AR、VAR和sVAR模型RMSE值 隨訓練窗長度的變化
最佳窗口長度與三個模型中每個模型的參數估計數直接相關。AR具有pM參數,因此只需要少量的訓練數據,而VAR具有pM2參數,因此需要更多的訓練數據來生成可靠的參數估計。sVAR則提供了一個折衷方案:增加參數數量以利用空間信息,但只包括部分重要的參數。此外,另選擇兩種指數平滑方案的基本遺忘因子,使有效內存為2 000個樣本(λ=0.999 5)。


圖3 sVAR系數矩陣疊加


(a) 點和概率預測值

(b) 動態遺忘因子圖4 概率預測和動態遺忘因子值
分布預測的技巧由連續秩概率分數(Continuous Rank Probability Score,CRPS)和對數分數來進行量化。CRPS由式(16)給出。
(16)
式中:F是預測分布的累積形式;l(·)是指標函數。點概率預測情況見表1,預測每月情況見表2。點預測分數表明,sVAR在RMSE方面比所有基準都有所改善。而對于MAE,除了持久性以外,其他都有所改善。持久性不提供概率信息,這是在不確定性條件下進行最優決策所必需的,因此,轉向采用更復雜的方法。

表1 點概率預測情況

表2 每月預測情況
通過對尺度參數的BW跟蹤,sVAR在CRPS方面表現得很好,但與其他模型相比評分很低。較高的評分是一個非常關鍵的預測分布影響因素,其通常會接近上限和下限,在分布的尾部更有可能發現測量值。AR和VAR模型則具有更高的方差和更廣泛的預測分布,一般不經常受到這種因素影響。
當采用所提出的動態遺忘因子方案跟蹤尺度參數時,三個模型的CRPS和評分均較BW方案有顯著改善。值得注意的是,預測分布接近邊界的改進為使sVAR的評分與AR和VAR模型一致。在這種情況下,sVAR的效果略好于兩個基準。此外,概率預測的可靠性(或校準)是至關重要的,可以用如圖5所示的可靠性圖進行評估。sVAR采用BW比例因子平滑法進行預測是可靠的,是六種預測中最準確的,其次是sVAR采用動態平滑法。對于sVAR和AR模型,BW平滑方案的校正效果比動態平滑方案好,但是對于傳統的VAR,情況恰恰相反。由AR模型生成的預測與動態平滑的校正效果特別差。

圖5 AR、VAR和sVAR模型可靠性評估
綜上,本文方法在多個評分和可靠性方面對兩個基準進行了明顯的改進,同時通過稀疏參數化提供了具有吸引力的數值特性。sVAR使得用傳統的VAR方法對高維度空間的數據統計建模成為可能。此外,數據驅動的依賴結構檢測意味著空間處理可以在不知道精確位置的情況下實現,或者在許多發電機位于小區域的情況下實現。該技術同樣適用于已使用VAR的其他預測問題。
此外,保持完全的協方差信息可能為未來的發展提供機會。本文所描述的預測方法的確定性部分利用了空間信息,而尺度參數和擴展的預測分布是獨立計算的。更一般的概率預測可以考慮觀測的完全協方差結構的全聯合預測分布。
本文提出一種空間預測技術,能夠對多個地點的風力發電進行短期概率預測。將基于logit-normal變換和分布預測參數框架與分布位置參數的時空模型相結合,提出兩種尺度參數的競爭平滑方案。將位置參數建模為VAR,并進一步改進為sVAR,大大減少了所需系數的數量,并通過擴展模型擬合的計算費用和所需的體積訓練數據算例將sVAR的性能與傳統的VAR和AR模型進行比較,在確定性和概率性技能得分方面以及分布預測的可靠性方面都有改進。