解 坤, 張俊芳
(南京理工大學 自動化學院, 南京 210094)
?
基于KMO-Bartlett典型風速選取的PCA-WNN短期風速預測
解 坤, 張俊芳
(南京理工大學 自動化學院, 南京 210094)
針對風電功率預測時風速信息冗余,導致神經網絡難以把握內在規律而影響訓練效率的問題,選取最佳風速數據進行主成分分析,采用改進小波-BP神經網絡對風速進行預測。通過KMO和Bartlett球度雙檢驗選取最佳風速數據,從而充分利用主成分分析法對風速數據進行提取以優化神經網絡的輸入,提高網絡收斂速度和預測精度。通過某風電場風速數據仿真分析,與其他預測方法進行對比,結果表明該模型預測精度高、泛化性能好,驗證了該預測方法的正確性和有效性。
風速預測; KMO檢驗; Bartlett球度檢驗; 主成分分析; 小波-BP神經網絡
全球范圍內環境問題日益嚴重以及資源日漸匱乏,各國都將開發和利用可再生能源作為應對能源緊缺問題的重要手段。風力發電作為一種清潔高效的技術,因獨特的自然優勢、良好的產業基礎和明顯的經濟優勢,得到了廣泛應用和發展[1-2]。風電裝機容量不斷增加,帶來一定的環境和經濟效益,但是風能存在間歇性、波動性和不確定性,影響電力系統的安全穩定運行,而解決該問題的有效途徑之一就是對風電功率進行準確預測[3]。
風電功率預測按時間尺度不同,分為超短期預測、短期預測和中長期預測,預測模型對象分為基于風速的間接預測法和基于功率的直接預測法[4]。常用的預測方法有空間相關法[5]、卡爾曼濾波[6]、支持向量機法[7-8]、神經網絡法[9]等以及一些組合方法[10-11]。由于神經網絡具有突出的非線性映射、自學習和自適應能力而得到廣泛應用與發展,如BP神經網絡[12]、Elman神經網絡[13]、Hopfield神經網絡、RBF神經網絡[14]等。近年來,國內外學者對風電功率預測進行研究,并取得了一系列成果,但是對于風速數據選取和挖掘的研究較少,往往直接選取大量風速樣本數據進行預測,注重于預測精度的提高而忽略了預測所需時間成本問題。
筆者對歷史風速數據進行分析和挖掘,避免輸入數據信息冗余而導致預測效率低,將主成分分析法、小波分析與BP神經網絡相結合,建立短期風速預測模型。針對單一BP神經網絡存在學習效率低、收斂速度慢和易陷入局部最小狀態的問題進行改善。預測模型首先采用KMO和Bartlett球度檢驗,選取最佳風速樣本進行主成分分析,將主成分數據作為BP神經網絡的輸入,將小波基函數Morlet以“緊致型”方式嵌入至隱含層,對未來24 h風速進行預測。將該預測模型應用于某風電場風速數據進行仿真分析,并與相關預測方法進行對比,結果表明本方法能夠更加準確地對風速進行預測。
1.1 KMO和Bartlett球度檢驗
采用KMO和Bartlett球度檢驗對風速樣本進行相關性分析,選取適合主成分分析的樣本,以免造成風速數據信息丟失而無助于維度縮減。
1.1.1 KMO檢驗
KMO檢驗根據變量間簡單相關系數和偏相關系數的關系來檢驗變量數據。當所有變量的簡單相關系數平方和遠遠大于偏相關系數平方和時,變量間的相關性越強,越適合主成分分析;反之,則不適合主成分分析。
設(Xi,Yi)(i=1,2,……,n)為取自總體的樣本,則樣本的Pearson簡單線性相關系數計算公式為:
(1)

偏相關系數是在固定其余變量的影響下計算兩個變量之間的相關系數大小,可以反映任意兩個變量在固定其余變量的影響下的線性相關程度。偏相關系數的計算公式為:

式中:h為所固定的變量個數;z1z2…zh為所固定的變量;rxy是變量x和y之間的簡單相關系數。
設變量的簡單相關系數平方和為P,偏相關系數平方和為R,則KMO檢驗統計量的計算公式為:
(3)
1.1.2 Bartlett球度檢驗
Bartlett球度檢驗以原有變量的相關系數矩陣為出發點,其原假設是相關系數矩陣為單位矩陣,Bartlett球度檢驗的統計量Φ是根據相關系數矩陣O的行列式得到,統計量計算公式為:
Φ=det(O)=|O|
(4)
根據自由度和統計量觀測值查詢卡方分布表,可近似得到相應的相伴概率值。根據相伴概率p與顯著性水平α之間的關系來判定變量之間是否存在相關關系且適合主成分分析。
1.2 主成分分析
主成分分析是用盡可能少的信息來反映數據特征和規律,既保留原始數據的信息,又能夠實現降維處理,降低數據自身復雜程度[15-16]。
設原始變量所得到的p個變量的n組樣本值矩陣為:
(5)
1.2.1 變量數據標準化處理
計算各變量的均值和標準差,均值和標準差的計算公式分別為:

(6)

(7)

1.2.2 建立協方差矩陣并計算特征值和特征向量
采用標準化處理后的數據,得到協方差矩陣R的計算公式為:
(9)
將協方差矩陣R的特征值從大到小進行排序,假設特征值排列順序為λ1,λ2,…,λp,對應的特征向量為li=[li1,li2,…,lip]T。
1.2.3 計算方差貢獻率和累計方差貢獻率
第m個成分的方差貢獻率計算公式為:
(10)
前m個成分的累計方差貢獻率計算公式為:
(11)
1.2.4 獲取主成分信息
原始變量數據的主成分信息計算公式為:
Z=X·l
(12)
式中:主成分矩陣Z為原始變量矩陣X的主成分部分。通常累計方差貢獻率在75%~95%時,選取前m個成分便包含原始變量的絕大部分信息,主成分個數就是m個,后面其他成分則可以舍棄[17]。
采用“緊致型”結合方式,將神經網絡隱含層中神經元的傳統激發函數用小波函數來代替,充分利用小波變換良好的時頻局部化性質和聚焦特性以及神經網絡自學習、自適應的優點[18]。
設小波-BP神經網絡有m個輸入節點、N個輸出節點和n個隱含層節點。網絡的輸入和輸出數據分別用向量X和Y來表示,即X=(x1,x2,x3,…,xm)T,Y=(y1,y2,y3,…,yN)T。
假設xk(k=1,2,…,m)為輸入層的第k個輸入樣本,yi(i=1,2,…,N)為輸出層的第i個輸出值,ωij為連接輸出層節點i和隱含層節點j的權值,ωjk為連接隱含層節點j和輸入層節點k的權值,di是第i個輸出層節點閾值,dj是第j個隱含層節點閾值,aj是第j個隱含層節點的伸縮因子,bj是第j個隱含層節點的平移因子,則小波-BP神經網絡的模型可以表示為:
(13)
(14)
式中:yi(t)為小波-BP神經網絡模型的輸出值;ψa,b為小波基函數。
采用Morlet小波函數作為小波基函數,Morlet小波函數計算公式為:
ψ(t)=cos (1.75t)exp(-t2/2)
(15)
由Morlet小波函數ψ(t)通過尺度因子a和平移因子b進行變換,得到小波-BP神經網絡所采用的小波基函數為:

(16)
神經網絡的權值、伸縮因子和平移因子根據誤差目標函數進行調整,使誤差目標函數達到最小。誤差目標函數為:
(17)
式中:Yi為樣本實際值;Ti為小波-BP神經網絡預測值;N為輸出樣本數目。
針對神經網絡傳統修正方法存在學習效率低、收斂速度慢和易陷入局部最小狀態的缺陷,筆者對神經網絡結構修正方法進行改進,以提高小波-BP神經網絡的預測精度和計算效率。
根據誤差的變化情況自動對學習速率進行調整,以保證神經網絡總是以最大的可接受的學習速率進行訓練,改善收斂性能,提高訓練效率。自適應學習速率η的計算公式為:

(18)
為了進一步提高神經網絡的收斂速度,采用附加動量法對神經網絡參數進行修正,自適應動量因子c的計算公式為:

采用動量-自適應學習速率修正算法對神經網絡的權值、伸縮因子和平移因子進行修正的計算公式為:
Δωij(t+1)=(1-c)ηey+cΔωij(t)
(20)
Δωjk(t+1)=(1-c)ηey+cΔωjk(t)
(21)
(22)
(23)
式中:e為神經元節點的誤差值;y為神經網絡輸出層的輸出值;E為訓練誤差目標函數。
神經網絡模型評價指標采用平均百分比誤差(EMAPE)和均方根誤差(ERMSE),計算公式為:
(24)
(25)

基于主成分分析的小波-BP神經網絡模型預測流程見圖1,具體實現步驟如下:
(1) 對風速數據樣本總體進行KMO和Bartlett球度檢驗,根據各自的檢驗統計量來選取最佳風速數據樣本。
(2) 對最佳風速數據樣本進行主成分分析,得到風速主成分數據。
(3) 采用樣本主成分數據進行小波-BP神經網絡訓練,根據誤差目標函數進行網絡修正,直至滿足訓練終止條件。
(4) 使用訓練結束的小波-BP神經網絡模型進行預測,輸出風速預測結果。

圖1 基于主成分分析的小波-BP神經網絡預測流程
4.1 KMO和Bartlett球度檢驗以及主成分分析
以我國某風電場2015年的全年風速監測數據為例,日風速數據采樣間隔為30 min,日采樣點數目為48,總共選取12組風速數據,每組風速數據為共20日內的歷史風速數據,分別進行KMO和Bartlett球度檢驗,得到12組風速數據的雙檢驗結果(見表1)。

表1 KMO和Bartlett球度檢驗結果
KMO檢驗衡量標準是檢驗統計量在0.5以上就可以進行主成分分析,越接近于1,則越適合進行主成分分析。Bartlett球度檢驗相伴概率小于顯著水平0.05或者0.01時,則適合進行主成分分析。因此,根據表1的檢驗結果,選取第8組風速樣本數據進行主成分分析,用于神經網絡模型的訓練和預測。對第8組數據進行主成分分析,數據變量類型包括風速、風向、氣壓、相對濕度和溫度,計算數據主成分特征值及其對應的方差貢獻率,分析結果見表2。

表2 主成分特征值及方差貢獻率
通過對20日的最佳歷史風速數據進行主成分分析,根據累計方差貢獻率大于85%為選取依據,將風速預測影響因素降低為4個主要影響指標:風速、風向、氣壓和相對濕度。通過主成分分析對數據進行處理,既包含了原始數據樣本所提供的絕大部分信息,又避免了維數“災難”,使神經網絡的輸入維度降低,提高神經網絡的訓練和預測效率。
4.2 短期風速預測
為了對PCA-WNN模型預測結果的準確性和有效性進行評估,采用BP神經網絡、小波-BP神經網絡與其對比分析預測精度和預測運行時間。使用Matlab-R2013a仿真平臺,計算機CPU為Intel i3,主頻2.13 GHz。
PCA-WNN預測模型將主成分風速數據作為模型輸入,模型結構4-13-1,采用Morlet小波函數作為小波基函數,訓練迭代次數8 000,動量因子0.95,學習速率0.05,采用動量-自適應學習速率修正算法。未采用主成分分析法的BP預測模型和WNN預測模型結構6-13-1,訓練迭代次數10 000,動量因子0.95,學習速率0.05,采用動量-自適應學習速率修正算法。采用以上三種預測模型,對未來24 h風速進行預測,分別預測未來第1日、第2日、第3日三天的風速數據(見圖2~圖4)。

圖2 第1日的風速預測曲線

圖3 第2日的風速預測曲線

圖4 第3日的風速預測曲線
對以上三日的風速預測曲線結果以及預測誤差和運行時間進行分析,得到三種不同預測模型的預測誤差和預測運行時間的結果見表4和表5。

表4 三種模型的預測誤差和預測運行時間

表5 三種模型的平均預測誤差和預測運行時間
根據以上三種不同模型的預測誤差可以看出:PCA-WNN模型的預測精度明顯優于BP模型和WNN模型,綜合對未來三日的預測結果,PCA-WNN模型比BP模型和WNN模型平均百分比誤差分別降低了21.122 1%和8.475%,均方根誤差分別降低了0.752 8 m/s和0.422 5 m/s,運行時間分別降低了10.139 9 s和37.517 1 s。由于WNN模型和BP模型的模型結構一致,但是WNN模型比BP模型的修正訓練參數多了伸縮因子和平移因子,所以WNN模型預測運行時間長于BP模型,而PCA-WNN模型的模型結構較前兩者模型進行了簡化,所以PCA-WNN模型的預測運行時間短于BP模型和WNN模型。仿真結果表明:采用KMO和Bartlett球度檢驗來選取最佳日風速歷史數據,充分結合主成分分析后,小波-BP神經網絡能夠更加準確、快速地把握風速內在變化規律,能夠有效地對未來風速進行預測。
通過采用基于KMO-Bartlett典型風速選取的PCA-WNN短期風速預測模型進行測試和模擬計算,可以得到以下結論:
(1) 采用KMO-Bartlett雙檢驗對歷史風速數據進行挖掘分析,能夠有效選取最佳風速數據樣本,充分利用主成分分析對多維、互相關的風速數據樣本進行主成分提取,增強了數據間的相關性,簡化了神經網絡模型。
(2) 對小波-BP神經網絡的修正計算公式進行改進,在一定程度上提高了網絡的收斂速度,提高了神經網絡的訓練效率。
(3) 通過算例仿真表明,該方法優于傳統神經網絡預測模型,既提高了預測精度,又降低了預測運行時間,表明了該方法的有效性和實效性,能夠為風能資源評估、減少風電備用機組以及風電功率躉售提供相關依據,而且對風電場的規劃設計、開停機計劃安排等均具有重要意義。
[1] 鄭婷婷,王海霞,李衛東. 風電預測技術及其性能評價綜述[J]. 南方電網技術,2013,7(2): 104-109.
[2] KHALID M, SAVKIN A V. A method for short-term wind power prediction with multiple observation points[J]. IEEE Transactions on Power Systems, 2012, 27(2): 579-586.
[3] 劉瑞葉,黃磊. 基于動態神經網絡的風電場輸出功率預測[J]. 電力系統自動化,2012,36(11): 19-22,37.
[4] STATHOPOULOS C, KAPERONI A, GALANIS G, et al. Wind power prediction based on numerical and statistical models[J]. Journal of Wind Engineering and Industrial Aerodynamics, 2013, 112: 25-38.
[5] 陳妮亞,錢政,孟曉風,等. 基于空間相關法的風電場風速多步預測模型[J]. 電工技術學報,2013,28(5): 15-21.
[6] 楊明莉,劉三明,王致杰,等. 卡爾曼小波神經網絡風速預測[J]. 電力系統及其自動化學報,2015,27(12): 42-46.
[7] 林常青,上官安琪,徐箭,等. 基于樣本熵和支持向量機的短期風速預測模型[J]. 電力科學與技術學報,2014,29(4): 12-17.
[8] 王程,雷金勇,許愛東,等. 基于誤差分類的分布式光伏超短期功率預測[J]. 南方電網技術,2015,9(4): 41-46.
[9] 劉興杰,岑添云,鄭文書,等. 基于模糊粗糙集與改進聚類的神經網絡風速預測[J]. 中國電機工程學報,2014,34(19): 3162-3169.
[10] 馬斌,張麗艷,郭成. 一種變權重風電功率最優組合預測模型[J]. 電力系統保護與控制,2016,44(5): 117-121.
[11] 王愷,關少卿,汪令祥,等. 基于模糊信息粒化和最小二乘支持向量機的風電功率聯合預測建模[J]. 電力系統保護與控制,2015,43(2): 26-32.
[12] 師洪濤,楊靜玲,丁茂生,等. 基于小波-BP神經網絡的短期風電功率預測方法[J]. 電力系統自動化,2011,35(16): 44-48.
[13] 尹東陽,盛義發,蔣明潔,等. 基于粗糙集理論-主成分分析的Elman神經網絡短期風速預測[J]. 電力系統保護與控制,2014,42(11): 46-51.
[14] 馬斌,張麗艷. 一種基于徑向基神經網絡的短期風電功率直接預測方法[J]. 電力系統保護與控制,2015,43(19): 78-82.
[15] 何東,劉瑞葉. 基于主成分分析的神經網絡動態集成風功率超短期預測[J]. 電力系統保護與控制,2013,41(4): 50-54.
[16] 周松林,茆美琴,蘇建徽. 基于主成分分析與人工神經網絡的風電功率預測[J]. 電網技術,2011,35(9): 128-132.
[17] 王麗婕,冬雷,高爽. 基于多位置NWP與主成分分析的風電功率短期預測[J]. 電工技術學報,2015,30(5): 79-84.
[18] 肖遷,李文華,李志剛,等. 基于改進的小波-BP神經網絡的風速和風電功率預測[J]. 電力系統保護與控制,2014,42(15): 80-86.
Short-term Wind Speed Forecasting Using PCA-WNN Based on KMO-Bartlett Typical Wind Speed Selection
Xie Kun, Zhang Junfang
(School of Automation, Nanjing University of Science and Technology, Nanjing 210094, China)
Against the redundancy of wind speed information in wind power prediction that results in difficulties for neural network to get the inherent law and therefore affect the training efficiency, the optimal wind speed data were selected for principal component analysis (PCA), while improved wavelet-BP neural network (WNN) was adopted for wind speed prediction. Based on KMO and Bartlett’s test of sphericity, the optimal wind speed data were selected and then extracted using PCA to optimize the inputs of neural network, thus improving the convergence rate and prediction accuracy of the network. By comparing the simulation results on wind speed data of a wind farm with other methods, the wavelet-BP neural network model based on PCA is proved to have high prediction accuracy and good generalization performance, verifying the correctness and effectiveness of this method.
wind speed prediction; KMO test; Bartlett’s test of sphericity; principal component analysis; wavelet-BP neural network
2016-07-22;
2016-08-04
國家自然科學基金資助項目(51507080)
解 坤(1991—),男,在讀碩士研究生,研究方向為電力系統優化、運行與控制。
E-mail: 15062255164@163.com
TM614
A
1671-086X(2017)02-0086-06
新能源