余忠澤, 劉震卿, 馬馳
(1. 華中科技大學土木與水利工程學院, 湖北 武漢 430074;2. 中國廣核新能源控股有限公司, 北京 100084)
風能作為一種新興的清潔能源, 已成為全球能源發展的重要組成部分。 2018 年, 中國風電累計并網裝機容量占全國總發電裝機容量的9.7%, 風電新增裝機容量達到2 127 萬kW, 占全國新增裝機容量的16.6%[1]。 隨著風能在電網中所占比重的增加, 風能對電網計劃和調度造成的壓力也在不斷升高[2]。 準確、 快速的風電預測可有效減少或避免風電場對電網的不利影響, 對于風能的開發利用和電力系統的安全穩定運行具有重要意義[3-5]。但是由于風能的波動性和隨機性[6-7], 目前短期風功率預測精度有待提高。 因此, 提高風能預測的準確性已成為風能開發利用的關鍵, 同時也成為各國風能開發研究的重點。
主流風功率預測方法有基于大氣動力學方程和熱力學方程的物理方法、 基于曲線擬合和參數估計的統計方法, 以及基于對歷史數據集訓練預測模型的機器學習方法[8]。 機器學習方法相比于另外兩種主流方法, 更簡單且具有學習能力, 因此成為了當下風功率預測熱門的研究方向。 目前基于機器學習方法的短期風功率預測研究, 普遍集中在模型預測準確性的提高上, 提高的方法主要基于對算法的改進或不同模型的組合, 如Shan 等人利用改進后的人工蜂群算法結合極限學習機的風電功率預測方法[9], Yu 等人考慮時空耦合性的WPP 方法[10]。少部分研究從輸入數據的預處理著手, 例如Wang和Zhang 等人采用的“剔除異常值”[11]和“補齊缺失值”[12]兩種處理方法, 實現對輸入數據的優化;部分研究從數據特征提取著手, 如Sahra 等人對風速序列進行小波變換提取特征[13]。 少數研究著眼于利用預測誤差修正, 即利用模型風功率預測值與實測值之間的差值, 返回模型進行優化, 如Lin 等人提出的每日滾動修正方法[14]。 部分研究著手于提取特征相關性分析, 選擇部分特征進行分析與訓練, 達到提高模型預測性能的目的, 例如對風速、風向、 溫度、 濕度、 氣壓等多維數據與風功率進行相關性分析, 挑選部分物理量作為有效特征用于模型訓練, 如Zhang 等人考慮時空相關性, 并根據相關系數進行加權選取特征進行訓練[15]。 但是目前各種研究中模型訓練所用的氣象數據一般直接來自當地氣象局, 空間尺度較大, 不適合作為風機處的預測風速, 例如Farah 等人考慮尾流效應的風功率預測方法中使用中尺度氣象預測數據[16]。
目前用于風功率預測的機器學習方法存在氣象信息尺度較大的問題, 且普遍不考慮尾流、 地形等物理效應的影響。 但是物理效應往往會嚴重影響空間中的風速分布, 進而影響風機輸出功率。 尾流效應是其中最顯著的一種。 尾流效應是指風機從風中獲取能量的同時在下游形成風速下降的尾流區, 它的存在顯著影響著風場內的風速分布, 從而影響風機的輸出功率。 近年來考慮尾流效應的風功率預測研究中, 基于Jensen 尾流解析模型提出的考慮尾流效應的短期風功率預測模型僅使用氣象預測數據作為模型輸入, 而且預測效果優于未考慮尾流效應的常用機器學習模型, 證明了尾流效應在風功率預測研究中的重要性[17]。 但是Jensen 尾流解析模型未考慮上游風機所帶來的附加湍流強度對下游風速恢復的影響, 嚴重高估了尾流區的風速損失。 因此, 在考慮尾流效應方面, 機器學習模型的預測精度還有一定的提升空間。 對此, 提出考慮環境湍流強度和風機推力系數的模型, 即高斯尾流模型, 作為預測風速的物理修正依據。 高斯尾流解析模型在尾流效應計算時對風速損失采用高斯分布假設, 將環境湍流強度和風機推力系數作為變量參與計算,已被證明能更加真實、 精確地模擬風機尾流[18-20]。因此, 本研究將高斯尾流解析模型與機器學習方法相結合, 通過對比實際風電場整場的短期風功率預測效果, 驗證該方法的有效性。
采用高斯尾流解析模型作為考慮尾流效應的依據, 建立一個用于短期風功率預測的神經網絡模型。 考慮到高斯尾流模型可細分為單高斯尾流解析模型(Ishihara 尾流模型) 與雙高斯尾流解析模型, 分別用SG 與DG 表示。 與現有預測模型中采用的Jensen 尾流解析模型(用JS 表示) 不同的是, 高斯尾流解析模型考慮環境湍流強度, 且雙高斯尾流解析模型在遠尾流區和近尾流區都能較準確地預測風速分布, 進而修正預測風速。 本文通過以下四個部分介紹模型的構建, 包括短期風電功率預測問題的數學建模、 神經網絡模型、 尾流解析模型和尾流影響的判定與計算。
短期風電功率預測屬于多變量非線性回歸問題。 使用風電場預測的風速、 風向作為尾流解析模型輸入, 預測數據的時間間隔為10 min, 對應時刻的整場發電量作為模型輸出。 借助尾流解析模型,可以估計任意風機處的考慮尾流效應后的風速, 即修正風速。 借助風機的風速-風功率曲線, 獲得該時刻任意風機的預估輸出功率。 將每臺風機預估輸出功率相加, 可獲得整場預測風功率。 利用修正后的風機處預測風速與風機預估風功率作為神經網絡的輸入, 進行模型訓練, 依據評估指標進行模型參數的更新, 最終選出預測性能最佳的模型作為短期風功率預測模型。 以上描述可用公式(1) — (3)進行表示。
式中,i代表第i個上游風力渦輪機;Ui、Vi、θi分別為單機修正后預測風速、 修正前預測風速及預測風向;W是尾流解析模型;PWT,i、Pfarm分別是根據風機的風速-風功率曲線得到的單機預估輸出功率和整場預估輸出功率;NWT是風機總數;Pfarm,NN是神經網絡模型預測整場風功率;F是建立的短期風功率預測模型。
神經網絡是一種常用于構建多變量非線性模型的方法。 在給定的數據集中, 神經網絡可以從歷史數據中學習并對未來數據做出預測。 一個神經網絡包括一個輸入層、 隱藏層和一個輸出層, 每層的節點連接不同的權重, 節點的值由上層節點決定, 如式(4) 所示:
式中,f(x) 為待確定節點的值;xj是上一層的第j個節點;wj是權重;b是偏置;φ是采用ReLU 的激活函數, 具體形式如式(5) 所示。
神經網絡通過反向傳播不斷調整每個節點之間的權重, 以便更準確地預測測試數據。 圖1 顯示了用于短期風電功率預測的傳統神經網絡結構。

圖1 傳統風功率預測神經網絡結構
1.3.1 Ishihara 尾流模型
Ishihara 和Qian 學者提出了一種新型的考慮環境湍流強度和推力系數影響的基于高斯分布的風機解析式尾流模型。 Ishihara 尾流模型中假設轉子引起的沿流向的速度損失相對于轉子軸線為軸對稱,且在尾跡截面上具有自相似的分布[18-19]。 圖2 所示為Ishihara 模型的速度損失高斯分布示意圖[20]。與大渦模擬(large eddy simulation, LES) 數據相比, 盡管在近尾流區域存在輕微的不對稱性, LES數據顯示與高斯分布具有良好的一致性。

圖2 速度損失的高斯分布示意圖
尾流區平均速度U(x,y,z) 可由式 (6)確定:
式中,x、y代表水平方向,z代表豎直方向;U0(y,z) 是上游風速;UL是風機尾流導致的速度損失, 并且是x和r的函數;r是距尾跡中心的徑向距離, 且,H為輪轂中心高度。 由于速度損失具有自相似性質, 因此可以表示為流向函數與自相似形狀函數的乘積, 即式(7):
Ishihara 模型假設尾流區域沿流向為線形膨脹,所以將σ/D定義為式(8) — (10):
a、b、p是模型參數, 如式 (11) — (13)所示:
F(Ct,Ie,x/D) 和?(r/σ) 分別被稱為流向函數和跨向函數, 具體形式如式(14) — (15):
1.3.2 改進雙高斯尾流模型
Ishihara 尾流模型中采用單高斯曲線進行尾流區風速損失的計算時, 計算結果在遠尾流區與LES計算結果具有良好的一致性, 但在近尾流區存在輕微的不對稱性。 Ishihara 尾流模型中采用雙高斯曲線擬合尾流區的附加湍流強度變化, 對單高斯風速損失模型進行改進, 采用雙高斯曲線進行建模, 在近尾流區和遠尾流區同樣具有較高的精度。 改進雙高斯尾流模型的計算如式(16) — (19) 所示:
在實際風電場中, 下游風機往往處于一個乃至多個上游風機的尾流中。 多個風機尾流的疊加作用使得下游風機功率進一步降低。 當滿足以下條件時, 認為下游風機受到上游風機尾流影響, 需要計算風速損失。
式中,θ是來風方向;xθ是兩風機在來風方向投影的距離;yθ是兩風機在垂直來風方向投影的距離;kw是尾流擴展率, 用于描述尾流的線性擴展率。kw的值通常由環境特征決定, 在陸上風電場設定為0.075, 在海上風電場設定為0.050。
對于單一風機的風速虧損, 需要考慮多個上游風機尾流的疊加。 尾流疊加中的風速虧損可以按如下公式計算:
式中,Uj是考慮n個上游風力渦輪機尾流的速度;U是輪轂高度處的流入速度;Uw,i是第i個上游風力渦輪機引起的速度。
以某實地風電場為實例, 風電場額定功率為69.5 MW。 風電場中安裝了33 臺1.5 MW (記為WT1) 和10 臺2 MW (記作WT2) 風力渦輪機。圖3 展示了風電場中風機的布局, 方形點為WT1(wt1—wt33), 圓形點為WT2 (wt34—wt43)。 風機參數見表1。

表1 風機參數

圖3 風電場中風機點位圖
由于WT1 與WT2 參數不同, 且WT2 數量較少, 為簡化尾流效應計算, 僅考慮WT1 尾流的相互影響, 而不將WT2 納入考慮范圍。 WT1 風機的推力系數曲線與風速-風功率曲線如圖4 所示。

圖4 WT1 風機的推力系數曲線與風速-風功率曲線
選用2021 年9 月1 日至2022 年8 月1 日的歷史實測風電數據, 驗證風功率預測方法。 在歷史風電數據中, 每個風力渦輪機的10 min 實測風速與輸出功率記錄在監控和數據采集系統中。 通過將輸出功率累加, 可以獲得整個風電場在每個時刻的輸出。
歷史風電數據往往存在部分異常點, 異常點的輸出功率與實測風速的對應關系與風速-風功率曲線描述相差甚遠, 若引入會對模型訓練形成很大的干擾, 故不能作為有效數據使用。 假定異常點的實測風速記錄無誤, 僅認為實測風功率有誤。 故利用風速-風功率擬合曲線(圖4), 將實測風功率與風速-風功率擬合曲線預估值偏差大于60 kW (4%額定功率) 標記為異常點并進行修正。 同時, 由于實際風場中風機并非一直處于工作狀態, 存在停機、 檢修等非工作狀態, 故原始數據集存在部分時刻的缺失。 本文采用的神經網絡不依賴于時間序列, 僅使用單一時刻的預測數據進行訓練, 故理論上數據集的缺失不會對模型性能產生顯著影響, 僅需要將缺失時刻進行剔除。
對于預測數據, 即風電場預測的風速、 風向數據, 來源于風電場提供的歷史預測數據, 往往不存在數據缺失問題, 可直接作為尾流解析模型的輸入使用, 獲取考慮尾流效應后的修正風速與預估功率, 并進行歸一化處理, 如式(23) 所示:
式中,xnorm是單風機修正風速或預估功率歸一化后的值;xmax、xmin分別是單風機修正風速或預估功率序列中的最大值與最小值。
處理后的數據產生的輸入輸出形式分別如式(24)、 式(25) 所示:
式中,i=1, …,n;Ui代表第i臺風機修正后的預測風速;PWT,i代表第i臺風機的預估輸出功率;Pfarm,NN代表神經網絡模型預測的整場風功率。
數據集按照72%、 18%、 10%的比例劃分為訓練集、 驗證集、 測試集, 分別用于模型訓練、 模型選擇和模型泛化性能驗證。
得到上述數據集后, 利用設置的神經網絡進行風功率預測。 考慮尾流效應的短期風功率預測神經網絡模型結構, 如圖5 所示。
山東省某三甲綜合醫院2012~2016年全部住院患者的費用明細及構成情況如表1所示。5年來,患者住院次均費用逐年增加,從13723.51元增加至15375.43元,年均增長速度為2.88%;費用構成中藥品費占比雖每年呈下降趨勢但仍高居首位,占47.81%;至2016年,診療費、檢查費、手術費、護理費四項構成比較之前均有明顯的上升之勢。其中,檢查費構成比逐年上升,從6.79%上升至8.12%。

圖5 考慮尾流效應短期風功率預測神經網絡結構
輸入層、 隱藏層和輸出層的節點數分別設置為66、 66、 1。 為證明高斯尾流模型的有效性, 對Jensen 尾流模型進行同樣的實驗設置, 相關數據處理方法均參照上述方法進行。
通過設定評估指標, 可以選擇并更新預測模型, 也可以進行基于不同尾流解析模型的預測性能對比, 但是單一的評估指標無法對模型的預測性能進行綜合評價。 使用三個性能指標來評估模型的預測性能及證明高斯尾流模型的有效性, 包括平均絕對誤差(MAE)、 均方誤差(MSE)、 均方根誤差(RMSE)。 指標對應公式如下:
整場風功率預測精度決定該風電場能否正常并網。 在此介紹基于高斯尾流解析模型的風電預測模型(SG、 DG) 在整場風功率預測方面的性能, 并分別與不考慮尾流效應的風電預測模型(NN)、基于Jensen 尾流解析模型的風電預測模型(JS)進行整場預測性能對比。 同時還將風機按照點位的密集程度分為密集區與稀疏區, 分別代表尾流效應強和尾流效應弱的區域, 以此驗證尾流解析模型在不同尾流效應區的性能。
圖6 為基于不同尾流解析模型得到的風功率預測模型在測試集上的性能。 四種模型中, NN 預測性能最差, 其次是JS 和SG, 預測性能最佳的是DG。 DG 與NN 結果相比, 三類評估指標都呈現出不同程度的降低:yMSE、yMAE、yRMSE分別降低15.9%、 11.5%、 8.3%。 這表示尾流效應的存在嚴重影響了風電場區域內的風速分布, 考慮尾流效應能有效降低短期風功率的預測誤差。

圖6 基于不同尾流模型的神經網絡模型性能對比
三種尾流解析模型中, SG 與DG 相較于JS,三種評估指標都得到了不同程度的降低, 即預測精度得到了提高。 相較于JS, DG 的yMSE、yRMSE、yMAE降低幅度分別達7.4%、 3.8%、 3.5%。 這是由于高斯尾流模型采用的非線性假設, 以及考慮環境湍流強度, 能夠更有效地還原尾流區的風速分布情況, 使得預測性能得到提高。
兩類高斯尾流解析模型中, DG 比SG 表現出更優的效果。 這是由于DG 對風速損失采用雙高斯分布假設, 而非單高斯分布。 相比于單高斯尾流解析模型, 雙高斯尾流解析模型已經被證明能更好地模擬風機近尾流區的風速分布。 因此, DG 擁有更佳的預測性能。
隨著氣象預測區域面積的增大, 氣象數據的預測精度不斷降低。 完整風電場實際覆蓋地表區域廣泛, 預測風速難以對整個風電場中各個風機點位處的風速進行有效描述。 同時, 當風機點位的排布不規則時, 在相同的風速、 風向條件下, 不同區域的尾流效應差異顯著。 按照尾流效應的相對強弱, 將風電場劃分出A、 B 兩塊局部區域進行短期風功率預測, 每塊區域內有12 臺WT1 風機, 用于驗證高斯尾流解析模型的優越性。 具體劃分為如圖7所示。
A 區域內風機大致沿直線波動排布, 且相對分散, 尾流效應相對較弱; B 區域內風機點位相較A區域成聚集狀, 尾流效應相對更強。 取1—12 號風機和20—31 號風機, 分為兩個各有12 臺風機的實驗組, 利用歷史風電數據與風電場氣象預測數據進行訓練, 并在測試集上對比模型預測性能, 結果如圖8 所示。
在A 區域, JS、 SG 和DG 的三種評估指標都十分接近, 意味著三種模型得到的預測精度接近,模型在預測性能上沒有體現出優越性; 在B 區域,JS、 SG 和DG 的三種評估指標相較于A 區域都有了較大幅度降低, 以JS 為例,yMSE、yMAE和yRMSE分別下降了18.2%、 15.6%和9.6%。 這意味著在尾流效應較弱的區域, 不同的尾流解析模型不能顯示出差異, 但在尾流效應較強的區域, 引入尾流解析模型能夠有效提高預測性能, 具有應用價值。 這是由于在尾流效應較弱的區域, 風速受尾流效應影響較小, 尾流解析模型對風速的修正很微小, 導致機器學習模型使用的修正風速訓練數據差別很小, 最終模型預測性能接近。
在B 區域, SG 和DG 的評估指標都明顯低于JS, 相比于JS, SG 的yMSE、yMAE和yRMSE分別下降了3.9%、 2.6%、 2.0%。 這意味著, 在尾流效應較強時, SG、 DG 相比于JS 有更高的預測精度。這是由于SG、 DG 采用的風速損失高斯分布假設與實際風速損失情況更加吻合, 使得修正后的預測風速能夠更接近實測風速。 DG 的三類評估指標略低于SG, 這是由于相比于SG, DG 在風速損失分布采用的雙高斯分布假設在近尾流區有更高的模擬精度。 總風功率受累加效應影響, 在風機數量較少時, DG 的預測精度提升并不顯著。
尾流效應對風電場的風速分布具有顯著的影響, 研究不同尾流解析模型對短期風功率預測模型預測性能的提升, 發現Jensen 模型提升幅度不明顯, 而Ishihara 尾流模型(單高斯尾流模型) 與改進雙高斯尾流模型均能使得模型的預測性能得到較大的提高。 分析在不同尾流效應區域短期風功率預測模型的預測性能, 發現高斯尾流解析模型在尾流效應顯著區域能有效降低預測誤差, 且相較于Jensen 尾流解析模型在預測精度方面有一定提高,因此高斯尾流解析模型更加適合在尾流效應顯著且復雜的風電場進行短期風功率預測。