武峰雨,樂秀璠,南東亮
(河海大學能源與電氣學院,南京 210098)
開發與利用新能源是21世紀的重要能源戰略。風力發電因具有環保可再生、全球可行、成本低且規模效益顯著等優點,已經受到了廣泛的重視,并成為發展最快的新型能源[1]。由于風速受許多因素影響,具有很大的持續波動性,因此對風速的準確預測變得至關重要[2]。
風速被認為是最能準確預測的氣象參數之一。目前關于風速預測的方法有很多,時間序列預測法是應用較多的一種方法。該方法中的因變量和自變量均可以是隨機變量,且風速是一個隨機性的序列,因此可設定因變量為待預測風速,自變量為風速自身的歷史值[3,4]。與神經網絡等方法相比,該方法更適用于短期風速預測,但由于模型的階數不好確定,所以受氣候變化影響較大。人工神經網絡是用于風速預測較早的機器算法之一,使用非常廣泛。該方法具有并行處理、分布式存儲與容錯性等特征,具有自學習、自組織和自適應能力,可以實現聯想記憶、分類與識別等功能,對于求解復雜問題十分有效,文獻[5,6]分別采用BP神經網絡和徑向基神經網絡進行風速預測,但其算法容易陷入局部最小問題而得不到最優解,算法收斂慢。文獻[7,8]將最小二乘支持向量機應用到風速預測中,較之神經網絡,該方法具有更高的精度和更強的魯棒性??臻g相關性法的發展還不是很成熟,與上述方法不同,它需要考慮所預測地點以及與之相近幾個地點的風速序列,運用幾個地點風速之間的空間相關性進行預測。然而該方法需要很大的數據量,輸入信息豐富,可能會在一定程度上提高預測精度[9]。
通過Lyapunov指數可以證明風速時間序列具有混沌特性,而混沌序列短期是可以預測的。因此,利用相空間重構理論可以還原風速時間序列的非線性動力特性,然后利用一定的預測模型可以進行短期風速預測。本文利用相空間重構獲得一組最佳的嵌入維數和延遲時間,最后利用極端學習機對重構后的樣本進行建模預測,對某風電場的風速時間序列進行短期預測。實例表明,該方法的預測速度快,泛化性能好。
Takens定理認為系統中任一分量的演化均由與之相互作用的其他分量所決定。因此,這些分量的信息隱含在任一分量的發展過程中,重構系統相空間只需考察一個分量,通過某些固定的延時點上的觀測值重構出原系統,重構空間與原動力系統拓撲等價[10-12]。
對于實際測得一組時間序列

如果嵌入維數和時間延遲為m和τ,則相空間中的相點個數為

重構后構造出的相空間向量Xi(i=1,2,…,N)為

相空間重構是混沌預測的關鍵,而重構相空間的關鍵是嵌入維數m和延遲時間τ的選取。
相空間重構參數的同步計算法能夠同時估計出延遲時間τ和嵌入窗寬τw,根據

可以求出嵌入維數m。
將時間序列{X(i)}(i=1,2,…,N),分成t個不相交的時間序列,長度為int(N/t),int為取整函數。計算每個子序列的統計量 S(m,N,r,τ)和差量 ΔS(m,N,t),具體過程及符號含義詳見文獻[11]。隨后,得方程

單隱含層前饋神經網絡以其良好的學習能力在許多領域中得到廣泛應用,然而傳統的學習算法(如BP算法)固有的一些缺陷,成為制約其發展的主要問題。傳統的網絡大多采用梯度下降法,該方法有以下缺點:①訓練速度慢。因為其計算過程需要多次迭代來修正權值和閥值,因此時間長。②容易陷入局部極小值,無法達到全局最優。③學習率選擇敏感。學習率對神經網絡性能影響較大,若學習率太小,則收斂速度慢,消耗時間長,若學習率太大,則訓練過程可能不收斂。探索一種速度快、具有良好泛化能力、獲得全局最優解的算法時近年來研究的熱點。Huang等[13]提出了極端學習算法,該算法隨機產生輸入層與隱含層間的連接權值及隱含層神經元的閾值,而且在訓練過程中無霜調整,放棄梯度下降法的迭代調整策略,只需要設置隱含層的個數,便可以獲得唯一的全局最優解。極端學習機極大地提高了網絡學習速度和泛化能力。
給定Q個不同樣本的集合,

則具有L個隱含層神經元的ELM網絡輸出[14-16]為

式中:wj=[w1j,w2j,…,為輸入節點與第 j個隱含層神經元之間的連接權值向量;bj為第j個隱含層神經元的閾值;βj=[βj1,βj2,…,為第 j個隱含層神經元與輸出節點之間的連接權值向量;g(x)為隱含層神經元激活函數。
式(7)可用一個含個方程的線性方程組表示為

式中:H為神經網絡隱含層輸出矩陣,具體形式為

若隱含層神經元個數與訓練集樣本個數相等,則對于任意的w和b,單隱含層前饋神經網絡都可以零誤差逼近訓練樣本。然而,當訓練集樣本個數Q較大時,則隱含層神經元個數通常取比Q小的數。
當激活函數g(x)無限可微時,單隱含層前饋神經網絡參數不需要全部進行調整,w和b在訓練前可以隨機選擇,而且在訓練中保持不變。隱含層與輸出層連接權值β可以通過解方程組的最小二乘解獲得

其解為

式中,H+為隱含層輸出矩陣H的Moore-Penrose廣義逆。
ELM學習算法主要有以下幾個步驟:
(1)確定隱含層神經元個數,設置隱含層閥值b和輸入層與隱含層間的連接權值w。
(2)選擇隱含層神經元的激活函數,進而計算隱含層輸出矩陣H。
(3)計算輸出層權值

因此,相比于傳統方法,ELM訓練過程不需要調整w和b,只需要計算調整β值,這樣參數選擇過程更加容易,同時可以獲得全局最優解,訓練速度顯著提高。
風速數據是一組隨時間變化的序列,記為{xt|t=1,2,…,n}需要利用 Takens理論[17]進行相空間重構,將一維時間序列轉化成矩陣形式,以獲得數據的關聯信息。相空間重構中嵌入維數m和延遲時間τ的大小選取很重要,本文采用上述同步計算法求取嵌入維數和延遲時間。對原數據序列進行相空間重構,構造樣本對{Xt,Yt},其中 Xt={xt-m,xt-m+1,…,xt-1},Yt=xt,xi為第 i個風速值,m 為輸入向量維數。
數據預處理[18]可以加快模型的訓練速度和收斂速度,提高預測精度,因此預測之前需要對原始數據進行處理。樣本數據處理的方法很多,本文采用歸一化方法,即

ELM預測模型的主要參數是隱含層神經元的數目,它與輸入層和輸出層神經元的數目有關。據現在的資料表明,對于隱含層神經元數目的確定還沒有一個好的方法。極限學習機算法快捷方便,本文研究時,將隱含層神經元初始設為10,再根據訓練網絡的誤差來適當增加,尋找合適的隱含層節點數。誤差大于允許范圍的增加隱含層節點數,反之,則減少節點數。激活函數選擇Sigmoid函數為

ELM預測模型的預測效果采用均方誤差和平均絕對百分比誤差(eMAPE)和來評價,其表達式為

式中,Yi、分別為第i個實際風速值與預測風速值。
為了驗證模型的預測能力,本文利用Matlab編制基于ELM的短期風速預測程序,并進行算例仿真和分析,計算流程如圖1所示。
本文采用某風電場前7天的384個實測風速值作為訓練樣本,數據采樣間隔為15 min,建立ELM風速預測模型,對第8天的96個風速值做提前1點(即15 min)的預測。建立模型前對數據進行預處理,選取合理的參數。通過Wolf法估計了最大Lyapunov指數,求得的最大Lyapunov指數為0.239 2,大于0,因此數據具有混沌特性。ELM風速預測模型的輸入輸出數據采用相空間重構法獲得,本文嵌入窗寬為12,延遲時間為2,嵌入維數取7。初始隱含層節點設為10,并且逐漸增加,每個隱含層節點實驗20次,查看不同隱含層數的預測效果,仿真結果見表1。

圖1 相空間重構的ELM算法流程Fig.1 Flow chart of ELM algorithm with phase space reconstruction

表1 不同數目的隱含層節點對應的預測均方差Tab.1 Predicted standard deviation in accordance with hidden nodes of different number
由表1可得,隱含層節點數目若過少,ELM模型不能很好地學習樣本,即均方差很大;隱含層數目過多,泛化能力將變差,而且隱含層節點在14以后均方差都保持在0.103 7左右,因此本文選擇隱含層節點數目為14。
ELM預測模型的預測風速值的分布如圖2所示,預測結果如表2所示(由于數據較多,篇幅有限,只列取24個點數據)。

圖2 實際風速與預測風速分布Fig.2 Distribution of forecasted and observed wind speed

表2 ELM預測模型預測結果Tab.2 Forecasting results of ELM model
從圖2和表2可以看出,ELM預測模型對風速提前15 min的預測只有少數點的相對誤差較大,大部分預測點的預測較為準確,預測的最大誤差、平均相對誤差和均方誤差分別為15.57%、7.201%和2.52%,結果比較理想,從而驗證ELM理論在風速預測中的可行性。
將ELM模型與BP神經網絡模型、支持向量機(support vector machine,SVM)模型的預測結果進行相應的比較,這些模型在數據處理上基本一樣,這些模型得到的提前15 min的預測風速分布如圖3所示,預測結果如表3和表4所示。

圖3 不同模型的預測結果Fig.3 Distribution of wind speed forecasted by different model

表3 不同模型預測風速值Tab.3 Forecasting wind speed results of different forecast model

表4 不同模型預測結果Tab.4 Forecasting results of different forecast model
表3和表4分別列出不同預測模型的預測結果和預測誤差。由不同模型得到的預測結果可以看出,SVM網絡在風速預測中精度較高,預測效果較好,但是比ELM網絡其優勢并不是非常明顯。從表3中的收斂時間可以看出,ELM網絡幾乎瞬間可以完成預測,而SVM網絡所需要的時間約是它的37倍,BP網絡需要的時間更多,因此ELM有明顯的優勢,所以在風速快速預測時,該方法可以達到更好的效果。然而,在實際應用中,不同的風電場有各自的特點,因此根據具體的情況來選擇相應的方法才能取得理想的效果。
本文運用混沌相空間重構理論,重構樣本空間,使新的樣本能夠表征原始時間序列動態特性,更能反映風速變化特性,采用極端學習機進行了短期風速預測,并與BP網絡和SVM網絡進行對比,驗證了極端學習機在風速預測中的優越性。極端學習機需要設置隱含層節點個數,參數選擇容易,且在算法執行過程中不需要調整輸入層與隱含層間的連接權值和隱含層神經元閥值,因此學習速度快、泛化性能好,為風速預測提供一種新方法。
[1]尹明,王成山,葛旭波(Yin Ming,Wang Chengshan,Ge Xubo).風電并網經濟技術評價研究綜述(Review of economic technical assessment of wind power integration)[J].電力系統及其自動化學報(Proceedings of the CSUEPSA),2010,22(5):102-108.
[2]Abdel-Aal R E,Elhadidy M A,Shaahid S M.Modeling and forecasting the mean hourly wind speed time series using GMDH-based abductive networks[J].Renewable Energy,2009,34(7):1686-1699.
[3]丁明,吳義純,張立軍(Ding Ming,Wu Yichun,Zhang Lijun).風電場風速概率分布參數計算方法的研究(Study on the algorithm to the probabilistic distribution parameters of wind speed in wind farms)[J].中國電機工程學報(Proceedings of the CSEE),2005,25(10):107-110.
[4]陳國初,楊維,張延遲,等(Chen Guochu,Yang Wei,Zhang Yanchi,et al).風電場風速概率分布參數計算新方法(New computation method of wind speed probability distribution parameters in wind farm)[J].電力系統及其自動化學報(Proceedings of the CSU-EPSA),2011,23(1):46-51.
[5]蔡凱,譚倫農,李春林,等(Cai Kai,Tan Lunnong,Li Chunlin,et al).時間序列與神經網絡法相結合的短期風速預測(Short-term wind speed forecasting combing time series and neural network method)[J].電網技術(Power System Technology),2008,32(8):82-85,90.
[6]李文良,衛志農,孫國強,等(Li Wenliang,Wei Zhinong,Sun Guoqiang,et al).基于改進空間相關法和徑向基神經網絡的風電場短期風速分時預測模型(Multi-interval wind speed forecast model based on improved spatial correlation and RBF neural network)[J].電力自動化設備(Electric Power Automation Equipment),2009,29(6):89-92.
[7]杜穎,盧繼平,李青,等(Du Ying,Lu Jiping,Li Qing,et al).基于最小二乘支持向量機的風電場短期風速預測(Short-term wind speed forecasting of wind farm based on least square-support vector machine)[J].電網技術(Power System Technology),2008,32(15):62-66.
[8]曾杰,張華(Zeng Jie,Zhang Hua).基于最小二乘支持向量機的風速預測模型(A wind speed forecasting model based on least squares support vector machine)[J].電網技術(Power System Technology),2009,33(18):144-147.
[9]Damousis I G,Dokopoulos P.A fuzzy expert system for the forecasting of wind speed and power generation in wind farms[C]//International Conference on Power Industry Computer Applications.Sydney,Australia:2001.
[10]張智晟,馬 龍,孫雅明(Zhang Zhisheng,Ma Long,Sun Yaming).混沌理論和支持向量機結合的負荷預測模型(Load forecasting model using chaos theory and support vector machine)[J].電力系統及其自動化學報(Proceedings of the CSU-EPSA),2008,20(6):31-35.
[11]韓敏.混沌時間序列預測理論與方法[M].北京:中國水利水電出版社,2007.
[12]鄭永康,陳維榮,蔣剛,等(Zheng Yongkang,Chen Weirong,Jiang Gang,et al).一種模糊支持向量的負荷混沌時間序列預測法(Chaotic time series method for load forecasting based on fuzzy support vector)[J].電力系統及其自動化學報(Proceedings of the CSU-EPSA),2007,19(6):48-52.
[13]Huang Guang-Bin,Zhu Qin-Yu,Siew Chee-Kheong.Extreme learning machine:theory and applications[J].Neurocomputing,2006,70(1-3):489-501.
[14]劉學藝,李平,郜傳厚(Liu Xueyi,Li Ping,Gao Chuanhou).極限學習機的快速留一交叉驗證算法(Fast leave-one-out cross-validation algorithm for extreme learning machine)[J].上海交通大學學報 (Journal of Shanghai Jiao Tong University),2011,45(8):1140-1145.
[15]潘華賢,程國建,蔡磊(Pan Huaxian,Cheng Guojian,Cai Lei).極限學習機與支持向量機在儲層滲透率預測中的對比研究(Comparison of the extreme learning machine with the support vector machine for reservoir permeability prediction)[J].計算機工程與科學(Computer Engineering&Science),2010,32(2):131-134.
[16]Huang Guang-Bin,Chen Lei,Siew Chee-Kheong.Universal approximation using incremental constructive feedforward networks with random hidden nodes[J].IEEE Trans on Neural Networks,2006,17(4):879-892.
[17]Takens F.Detecting strange attractors in turbulence[J].Lecture Notes in Math,1981,898(29):366-381.
[18]張永明,齊維貴,王軍棟(Zhang Yongming,Qi Weigui,Wang Jundong).基于支持向量機的時間序列交叉負荷預報方法(Time series crossover load forecasting approach based on support vector machines)[J].電網技術(Power System Technology),2007,31(S2):207-210.