陶玉波, 陳 昊, 秦曉輝, 孟昭軍
(1. 國網江蘇省電力有限公司檢修分公司, 江蘇 南京 211102;2. 中國電力科學研究院有限公司, 北京100192;3.南瑞集團有限公司,江蘇 南京 211106)
當今能源危機、環境污染及氣候變化等問題日益凸顯,各國政府越來越關注以風力發電為代表的新能源發電技術的發展。如何立足長遠,謀劃確保能源供應的可持續發展之道,搶占未來科技創新和經濟發展的制高點,已成為世界各國重點考慮的戰略問題[1]。以風力發電為代表的新能源發電技術具有清潔、低碳、可再生等優點,為各國開展節能減排與環境保護工作提供了強大的支撐,其規模化發展已成為世界各國政府努力研究的方向[2]。風力發電技術在我國發展尤其迅猛,根據國家能源局2017年發布的數據顯示,新增并網風電裝機容量為15 030 MW,累計并網裝機容量達到164 GW,占全部發電裝機容量的9.2%。風電年發電量為3057 億kW·h,占全部發電量的4.8%,比2016年提高了0.7%[3]。
電力系統的調控目的是保證發電量和負荷量的動態平衡,通過火電、水電等出力穩定機組的組合、經濟調度和一次調頻等調控策略,使發電量追蹤可準確預測的負荷量,維持電網功率的動態平衡。隨著電力系統中風電規模的增加,風電具有的空間尺度分散性與時間尺度強隨機波動性,使風電機組發電量的可控性降低,影響了電力系統中發電量追蹤負荷量的能力,給電力系統運行的安全性、穩定性和經濟性帶來了新的挑戰。目前解決該矛盾的重要手段之一是及時準確地預測未來一段時間的風電出力,準確的預測結果可降低成本,提高風電并網的可靠性。
由風能的產生機理可知,風電場采集到的風速數據在時間上一定是關聯的。風是風力發電機的原動力,經過風力發電機的發電系統,還會保持風的強隨機性、強波動性和間歇性,風電功率數據在時間維度上也存在著一定的關聯,即前一時刻的風電功率采樣值與后一時刻的風電功率采樣值具有相關性[4]。
風電功率預測可以按照預測的不同時間尺度進行分類。按照預測時間尺度可以分為4類:超短期預測、短期預測、中期預測和長期預測。
超短期預測是時間間隔以不大于15 min為單位,提前預測未來0~4 h的風電功率變化,一般用于對風力發電機的控制與在線機組組合優化。
短期預測是時間間隔以分鐘或者小時為單位,提前預測未來1~3 d(1~72 h)的風電功率,一般用于制定電網調度計劃和優化常規電源的日發電計劃。
中期預測是時間間隔以天為單位,提前預測數周或者數月的風電功率,一般用于風電場內機組和線路檢修或者安裝調試新的風電機組。
長期預測是時間間隔以月為單位,提前預測整年或者數年的風電功率,一般用于風電場規劃選址及年度發電計劃制定等可行性研究。
通常風電場群所處地域分布比較廣闊,從風能產生的機理來看,同一風帶相鄰位置的風速一定具有關聯性。因此在同一風電場不同風電機組采集到的風電功率序列,或者在同一風帶相鄰風電場間采集到的風電功率序列,在空間上并非完全統計獨立,而是具有千絲萬縷的關聯。
風電功率的空間相關性除了受對風速影響較大的氣壓、溫度等自然條件環境的影響外,還受風電場所處的地形、地表粗糙度等地形條件的影響,也會受到風電場內風電機組的布置和尾流效應的影響。風電機組或者風電場之間連線越趨同于風向,則風電機組之間或風電場之間的空間相關性就越顯著,因為處在同一風向上的風電機組或風電場輸出的風電功率將會趨于一致,處在下風處的風電機組輸出的功率與在其上風處的風電機組輸出的功率時間序列相比表現出相似的波動規律,但具有一定的延時性。所以風電場上2個相鄰點測得的功率時序曲線會有相似性和延時性。
文獻[5]指出,隨著風電場規模增大,風電場內風電機組之間距離以及數量增加,不同位置風資源的波動性相互抵消,因此風電場總出力的波動性減弱。對風電場群進行風功率預測,為了獲得高精度的預測結果,須要考慮風電功率的空間相關性。
確定性預測是指運用某種預測模型依據當前時刻的各種測量值,計算未來某時刻風電功率預測具體值。按照預測模型的不同,可以分為3類:物理預測法、統計學習預測法和混合集成預測法[6-7]。
2.1.1 物理預測法
物理預測法本質上是數值天氣預報(numerical weather prediction, NWP),基于制定風電場高精度的數值天氣預報的物理模型,主要依據大氣層空氣運動的情況提煉出風速的影響因素,例如:風向、空氣壓強、空氣溫度、空氣濕度等作為預測模型的參考輸入變量,采用數值計算方法,通過設置計算初值和計算邊界條件,以實現求解出反映空氣運動過程的流體力學方程組合熱力學方程組的計算目標,進一步計算出各參考變量的分布,最終制成數值天氣預報結果,換算至風力發電機輪轂處的等效風速,利用功率曲線得到風機的輸出功率。
物理預測法的優點在于不需要長期大量的歷史數據就能得到預測結果,特別適用于新建風電場的預測和中長期風電功率的預測,短期預測和超短期預測不適用單純的物理方法進行預測,因為氣象條件是不穩定系統,演變需要數小時才能被監測到,并且NWP需要進行大量的耗時計算,目前較少單純使用該方法進行超短期預測。
提升NWP精度須要提高偏微分方程組建模的準確性,提高物理網格劃分密度和提高計算初值和計算邊界條件的準確性[8]。
2.1.2 統計學習預測法
統計學習預測法本質上是通過歷史風電功率、歷史風速、風向、氣壓、溫度等數據與風電場的風電功率或者風速建立一定的關系來進行推斷,要求預測對象演化速度較為緩慢,其建模方法簡單有效,被廣泛應用于超短期和短期預測。風電功率序列是典型的非線性時間過程,風電場中多臺風機由于尾流效應等影響的存在,風電功率序列間還包含著一定的空間信息,通過深入挖掘數據序列中時間和空間的信息有助于提高預測精度。近年來,基于統計學習的方法發展迅速,這種方法采用“黑箱”的建模思路,模型函數不是以解析的形式顯示描述,而是用人工智能的方法找出輸入與輸出的對應關系,通過對長期積累的歷史數據的學習,建立輸入與輸出的關系,進而采用這種方式建立的模型進行預測,具有適應性強,便于推廣等優點。常見的統計學習預測方法有時間序列分析法、人工神經網絡法(artificial neural network, ANN)、支持向量機法(support vector machine, SVM)、卡爾曼濾波法、考慮時空相關性法等方法。
(1) 時間序列分析是對大量的時間數據序列進行參數估計、模型識別、檢驗等過程后確定一個數學模型進行預測。目前文獻中主要有經典時間序列分析模型和現代時間序列分析模型兩大類,經典時間序列分析模型有自回歸模型、滑動平均模型、自回歸積分滑動平均模型、分數自回歸滑動平均模型;現代時間序列分析模型有廣義自回歸條件異方差模型、隨機波動模型、平滑轉換自回歸模型等。風電功率和風速數據通常是非平穩時間序列,應用時間序列分析模型前一般需要經過差分之后才能變為平穩時間序列[9-11]。文獻[12—13]研究了風電功率序列的二階矩,提出了基于廣義自回歸條件異方差模型的風電功率預測方法,使用條件最大似然估計法辨識參數,預測結果優于經典時間序列分析模型。文獻[14]基于廣義自回歸條件異方差偏度峰度模型的風電功率預測新方法,針對風電時間序列高階條件矩時變性的檢驗問題,提出鏈式檢驗新方法,結合提出的實用化參數約束處理方法,提升了預測效果。
(2) ANN是通過復制人類大腦工作過程的方法,用某種結構連接需要處理的大量元件,有較強的自學習、自組織、自適應的能力,可以處理復雜的非線性問題。如何防止人工神經網絡算法陷入局部最優和過學習的問題,是其改進的研究方向。在1996年就有學者將ANN用于風功率的超短期預測[15]。后來,眾多學者將ANN模型進行了不同的改進,預測精度不斷提高[16-17]。
(3) SVM是在統計學習理論的基礎上發展的一種學習方法,基于結構風險最小化原則,適用于小樣本情形下模型的建立。SVM預測方法通過核函數,將樣本空間的輸入映射到高維特征空間,解決了傳統方法中的維數災難、學習時間長、模型適應性弱等問題。文獻[18]提出了一種新的N-SVM回歸模型,對傳統的SVM核函數進行了修正,進一步提高了預測精度。
(4) 卡爾曼濾波法通過建立狀態空間方程,需要已知噪聲的統計特征,將預測對象作為狀態變量。卡爾曼濾波具有穩定性高、無偏性等特點,但如何得到噪聲的統計特征是其方法的難點。卡爾曼濾波在預測過程中不斷地進行修正,不需要存儲大量數據,其計算速度非常快。文獻[19]通過卡爾曼濾波法對NWP的結果進行修正,取得了較好的預測結果,使預測的均方根誤差從未修正的17.73%降低至11.32%。
(5) 考慮時空相關性的方法基于多個相互關聯的風電場信息共享的數據平臺,風電功率時間序列在不同空間點之間有很強的關聯性,根據由風電場內風電機組間空間排布關系推導出的空間相關矩陣,得到其他風電機組的風速、風向,進一步可得到風電功率預測值。文獻[20]分析了新西蘭不同地形條件下風速數據,發現不同地表粗糙度下風速的相關性不同。將不同地形特征的影響分為4類:第一類為地勢平坦區域,不同點的風速相關性較強;第二類為峽谷地區,不同點的風速相關性根據不同地形條件不同;第三類為山區,地表粗糙度較高,遮擋物多,風速相關性較弱;第四類為不規則地形區,風速相關性不確定。文獻[21]得出了月份、季節的不同,風速表現出的特征模式不同的結論。
2.1.3 集成預測法
集成預測法是目前風電功率研究的熱點方法之一,一般分為多模型組合和多算法混合。多模型組合由于它結合各個單一模型的有用信息,所以預測精度有一定的提高,其主要目的是對各種單一模型取長避短,利用每種模型的優點組合起來超越單一模型的預測精度。其研究難點在于如何穩定的發揮某一種模型的優點和各個單一模型之間如何組合。文獻[22]基于最大信息熵的原理,建立了基于多種預測模型的風電功率組合模型,相對于單一的模型來說,文中提出的方法提高了預測精度。文獻[23]建立基于支持向量機和人工神經網絡的預測模型,通過采用不同確定性權重因子來對預測模型進行混合。研究結果表明,這種組合方法雖然與權重的選擇有一定的關系,但是不同的權重下均能夠降低預測誤差。多算法混合是針對風電功率的數據特點,針對算法本身的優勢,將多種算法進行混合,以便在一次預測過程使用,提高預測精度。文獻[24]采用經驗模態分解和人工神經網絡進行混合,首先對風電功率序列進行分解,進而針對分解后的子序列分別使用人工神經網絡進行預測,再將各個子序列的預測結果進行重構,最終得到功率預測結果,研究結果表明效果較好。
風電功率預測的最大挑戰是存在預測誤差。電力系統高效安全穩定運行需要電網功率時刻與負荷平衡,風電功率預測的不確定性給這一目標的實現帶來了困難,為了更有效保證電力系統運行,需要預測模型能在一定程度上描述預測結果的不確定性。概率預測方法是確定性預測方法的拓展,風電功率的數據序列可以看作是隨機過程,可以在隨機優化的框架下進行研究,使用概率密度函數和概率分布函數來描述風電功率的不確定性。與風電功率的確定性單點預測相比,概率性風電功率預測方法不僅能提供預測結果變動范圍,還能估計出確定性預測值出現的概率,相比于確定性預測方法,能提供更多的量化信息表征不確定性,有助于發電計劃的提前安排,確保電力系統安全穩定運行。概率性風電功率預測方法可以預測風電功率按照多大的概率落在某個區間內,預測方法一定時,預測的區間越大,預測值落在區間內的概率越大。
概率性預測方法繁復多樣[25-26],根據建模時是否適用確定性預測結果,可以分為風電功率概率預測和確定性風電功率預測誤差概率預測。前者直接在建模時根據實測數據得到風電功率概率分布;后者根據確定性預測誤差為研究對象,得出誤差的概率分布,迭代回確定性預測結果中,得到概率預測區間。
如何求得研究對象的概率分布,可以根據研究對象概率分布的已知情況,分為參數估計、非參數估計和半參數估計。
(1) 參數估計即風電功率或預測誤差概率分布可以用已知的概率密度函數來描述,由此可以將概率性風電功率預測問題轉化為參數估計的問題,計算復雜度較低,但是由于假設了已知的概率分布,當實際情況與假設不一致時,預測結果將不理想。
(2) 非參數估計即不假設風電功率或預測誤差概率分布已知,通過數據挖掘的方法,比如核密度估計法[27]來計算分布函數。由于不存在假設不合理的情況,預測效果比參數估計的效果好,但是計算復雜度高。
(3) 半參數估計利用某種理論或先驗知限制識對風電功率或預測誤差概率分布的具體形式進行限制。如運用得當,有望改善預測精度,且計算復雜度顯著低于非參數估計。
概率性風功率預測方法與確定性預測中統計學習方法相結合,可以將確定性預測結果拓展到區間預測。文獻[28]提到的極限學習機(extreme learning machine, ELM)就是其中一種,以廣義逆矩陣理論為基礎提出的新單隱層前向網絡,與傳統的ANN相比,具有較好的非線性擬合能力,可以通過非線性映射直接計算出風電功率區間預測結果,計算復雜度也不高。
風電爬坡事件是指風電功率在較短的時間尺度內發生較大變化,嚴重影響電力系統安全穩定運行。一般使用爬坡方向、爬坡時間、爬坡率、爬坡幅度和起始時間這5個量來描述風電爬坡事件[29]。將風電功率突然增大的事件稱為上爬坡事件,主要由于大氣低空急流、低壓氣旋、雷雨等極端氣象事件引起;將風電功率突然變小的事件,稱為下爬坡事件,主要由于風機風速過大,超出了切出風速閾值,機組被迫退出運行引起。風電爬坡事件是風電功率強隨機性、強波動性和間歇性的極端體現,美國曾在2008年2月發生過由于風電場發生爬坡事件,造成頻率下降至59.85 Hz,切除負荷1150 MW的事件。進行爬坡事件預測,可以提前從風電機組本體和電網控制角度來調節爬坡事件,降低危害。爬坡事件預測有直接預測和間接預測兩種方法:
(1) 直接預測法是從風電場歷史數據中挑選出爬坡數據,使用機器學習模型進行學習,直接預測爬坡事件。此方法需要大量爬坡數據,但實際上爬坡事件是小概率極端事件,發生次數有限,故訓練集缺失比較嚴重。
(2) 間接預測法是先進行風功率預測,再根據爬坡事件的定義進行識別。目前間接預測法為爬坡事件預測的熱點內容。常用的預測方法有基于統計學習模型、基于NWP的物理模型和混合集成預測方法。
文獻[30]采用改進旋轉門算法對爬坡事件檢測方法,使用動態規劃算法對傳分段時間區間進行優化整合,表明改進旋轉門算法能夠有效地檢測出風電功率爬坡事件,并且比傳統旋轉門算法的表現效果更好,同時該算法比L1滑窗算法消耗更少的計算時間。文獻[30]提出了采用多個NWP模型的風電爬坡預測結果較好。文獻[32]利用原子稀疏分解對原始數據進行分解后分別采用自預測和BP神經網絡進行預測,提高了爬坡預測的精度。
深度學習是機器學習的一個分支。主要特點是通過多層次的學習而得到對于原始數據的不同抽象層度的表示,進而提高分類和預測等任務的準確性。深度學習的一個重要特點是不需要人工輸入或標注特征(標簽),而是通過海量數據自動學習特征,也就是無監督學習,所以深度學習常常和大數據聯系在一起[33-35]。深度學習具有強大的搜索計算能力,為提高風電功率預測的準確性增加了一種可行的方法。目前深度學習已在電力系統的靜、動態安全評估、故障診斷、負荷預測、線損計算、經濟調度控制策略等方面開展應用。
與傳統前饋人工神經網絡相比,深度學習使用多個隱含層,前一層可使用無監督學習算法獲得數據特征,輸入到下一個隱含層,從而通過多個隱含層逐步抽象出數據特征。所以深度學習算法有強大的處理非線性問題和特征提取的能力,適合處理具有非線性和非平穩特征的風電功率時間序列。
大數據是深度學習應用的基本條件。大數據理論可以對全時空數據集合內關聯關系進行有效識別和提取,一定程度上彌補物理因果關系分析的不足,但當前電力系統已有的數據采集系統還難以完全滿足應用需求,如何獲取高質量的全時空數據集,仍然制約著這一技術的應用。
文獻[36]將層疊受限玻爾茲曼機深信度網絡用于風電功率預測,取得了不錯的預測效果。
投入商業運行的風電場需要接受國家能源部門的監管,滿足電網的調度要求,對風電場運行是否滿足調度并網要求進行獎懲。對常規風功率點預測的評價標準主要有平均絕對誤差(average absolute error,MAE)、均方誤差(mean square error, MSE)、均方根誤差(root mean square error ,RMSE)、標準差(standard deviation error, SDE)等。MAE表示預測誤差的實際情況;MSE和RMSE表示誤差的分散程度;SDE表示誤差分布的標準差估計。國家能源局發布的《風電場功率預測預報管理暫行辦法》中要求,風電場功率預測系統提供的日預測曲線最大誤差不超過25%,實時預測誤差不超過15%,全天預測結果的RMSE應小于20%。
概率性風功率預測的評價標準主要從概率性預測結果的可靠性和預測區間應盡量窄兩方面考量。即要求風功率落在預測區間的概率應盡可能接近置信度,且不確定性盡量集中,若預測區間過大,將對決策沒有任何意義。
當前風電預測模型理論高精度和應用時的實際精度之間存在著一條鴻溝,該問題影響了風電預測模型的工程實際應用。對風電預測方法的正確評價,是彌合這條鴻溝的重要手段。當前文獻中最常見的MAE、MSE比較法,可能存在著受結果隨機性干擾、透支使用建模以外數據、不能評價不對稱損失等問題。
IEEE PES能源預測工作組長期致力于預測評價方面的研究,結合三屆(2012,2014和2017)具有廣泛影響力的全球能源預測競賽對該問題進行了一系列有價值的探索[37-38]。
CIGRE C1.32工作組針對包括預測評價在內的能源預測技術開展了廣泛的國際調研工作,通過深入分析調查問卷后發現:風電等新能源發電技術的大量應用將對能源預測帶來深遠的影響[39]。
文中從風電功率的特點出發,對風電功率預測進行了分類歸納,對不同預測方法的發展水平進行了梳理和總結,對風電功率預測的研究熱點進行了探討,得出以下結論:
(1) 風功率預測的主要目標是盡可能快速準確的提供預測值,減少棄風,優化調度計劃和機組組合,使風電機組盡可能多的并網。
(2) 統計學習預測方法在超短期、短期預測風功率預測領域廣泛使用,但在某些復雜地形、范圍較大風電場的預測中,與物理預測方法結合使用,預測效果會更優。
(3) 概率性風電功率預測是未來風電預測的重點研究方向,該方法能對風電功率預測不可避免的預測誤差提供較為詳細的描述,為電力系統運行控制提供更加全面的風電功率信息支撐。
(4) 風電功率爬坡事件預測能降低發生爬坡事件時對電力系統的影響,在對風電功率進行預測的同時,也要對爬坡事件進行識別。目前爬坡預測研究處于起步階段,是需要關注的重要研究方向。
(5) 大數據技術和深度學習的發展對提高風電在不同時間尺度和空間的預測精度有積極作用。
(6) 提高預測精度一直是風電預測領域追求的目標。隨著預測模型的逐漸完善和新模型的提出,預測精度逐步提高,RMSE從30%以上降到10%以下,但精度提高的程度日漸式微,風能本身具有的強隨機性、強波動性和間歇性是實現這一目標的主要困難,也是未來一段時間研究的重點。