王知芳, 楊 秀, 潘愛強
(1. 上海電力學院電氣工程學院,上海 200090;2. 國網上海市電力公司電力科學研究院,上海 200437)
隨著非線性負荷和電力電子設備的大量使用,電能質量問題日益嚴重,受到了社會各界的廣泛關注。深入挖掘電能質量監測數據,對電能質量的變化趨勢做出預測和預警,成為保證電力安全、穩定、經濟輸送的必要措施[1]。
電能質量問題分為穩態和暫態電能質量問題。穩態電能質量問題包括電壓偏差、頻率偏差、電壓波動與閃變、諧波及三相不平衡度[2]。其中電壓偏差的危害最為明顯,電壓過高造成設備過電壓,威脅絕緣,減少使用壽命;電壓過低使用戶設備不能正常使用。因此,預測電壓偏差變化趨勢并采取一定措施對于電力系統的安全穩定運行具有很高的應用價值。且不同的電能質量指標數據具有不同的特征,若用一個預測模型來預測5項穩態指標,會造成精度差的問題,因此文中對電壓偏差指標建立預測模型。
常用的預測方法有時間序列法、灰色預測法、支持向量機預測法等。但時間序列法注重數據的擬合,對影響電能質量的不確定性因素考慮不足;灰色預測法對數據的離散程度有要求,當數據離散程度較大時,預測精度較差;支持向量機在處理隨機波動性較強的數據時,精度較差,且數據集規模過大時,訓練時間長,速度慢[3]。
目前,對電能質量預測的研究文獻較少,而負荷預測方法已比較成熟,可參考負荷預測的方法來進行電能質量預測。文獻[4—6]采用基于小波分析的預測方法,將負荷數據進行分解,能夠改善預測精度,但預測精度過多依賴于歷史相似日的選取,預測結果不穩定。文獻[7—8]采用基于決策樹的負荷預測模型,模式簡單,易于理解,但在選取屬性進行擴展時,對各屬性間的相關性考慮較少,且對噪音敏感;文獻[9—11]采用綜合預測方法,結合多種預測模型的有效信息,優勢互補,改善預測精度,但是模型的權重確定困難,建模難度大;文獻[12—14]采用偏最小二乘回歸分析法進行負荷預測,通過對成分的提取,最大限度地利用了數據信息,但如何提高成分解釋能力仍然難度較大。
電能質量預測的方法尚不成熟,研究文獻極少。文獻[15]提出一種基于Monte Carlo抽樣的電鐵電能質量預測方法,即先用Monte Carlo抽樣方法對牽引負荷進行隨機波動處理,再對負序、諧波等指標進行預測,但是此方法預測對象有限制,適用性差,僅適用于具有單相獨立性、隨機波動性的電鐵一類的電能質量預測;文獻[16]先利用ARIMA時間序列算法對有功功率進行預測,又根據有功功率與電能質量穩態指標的相關性建立反向傳播(back propagation ,BP)神經網絡預測模型,但是此方法是間接預測方法,有功功率的預測結果較大程度影響最終電能質量的預測結果;文獻[17]采用神經網絡的預測模型對變電站和重點負荷用戶、風電、光伏等用戶電能質量進行短期預測,但是此預測方法過于單一,且對預測精度沒有做具體分析和說明。
文中針對電壓偏差非線性、周期性的特點并結合實時氣象數據提出一種基于聚類算法和BP神經網絡的電壓偏差預測方法,首先選擇與待預測點相似相近的歷史數據;然后采用聚類算法對氣象因素聚類,根據聚類結果提取與待預測點同類的歷史數據;最后選擇BP神經網絡建立電壓偏差預測模型。將本方法應用到上海市某電站電壓偏差數據,證明了文中提出的預測方法精度更高。
針對傳統K-means聚類的不足,文中引進親和力傳播(affinity propagation,AP)聚類算法,對經過主成分分析法(principal component analysis, PCA)降維處理之后的氣象數據主成分進行聚類,根據聚類結果提取與待預測點同類的歷史數據,最后選擇BP神經網絡建立電壓偏差預測模型。
由于氣象因素較多,在應用BP神經網絡進行電壓偏差預測時,若直接將這些因素作為輸入,會導致BP神經網絡學習速度慢,效率低,而且無關變量的引入會導致預測精度下降甚至不能完成學習,因此有必要對氣象數據進行降維處理。
PCA是一種數學降維算法,將原來眾多具有相關性的變量,重新組合成一組新的相互無關的綜合變量來代替原來變量[18],這些綜合變量即為主成分。
V=eigvec[cov(X)]
(1)
式中:X為歸一化的數據矩陣;cov(X)為協方差矩陣;V的列向量為cov(X)的正交單位特征向量。
將X降至L維后的數據矩陣為:
P=XVL
(2)
式中:VL為矩陣V的前L列。
AP聚類是Frey和Dueck 于2007年在Science雜志上提出的一種新的無監督聚類算法[19-20]。AP聚類過程是信息傳遞的過程,利用吸引信息矩陣R和歸屬信息矩陣A在數據點之間交換信息,不斷迭代更新2個信息矩陣,直到迭代結束。r(i,k)與a(i,k) 分別為i點與k點之間的吸引信息矩陣元素和歸屬信息矩陣元素,其值越強,則k點作為聚類中心的可能性就越大,并且i點隸屬于以k點為聚類中心的類簇的可能性也越大。r(i,k)與a(i,k)計算公式如下:

(3)

(4)
由于AP聚類算法迭代過程容易產生震蕩,所以每次迭代都加上一個阻尼系數λ,λ∈(0,1)。
(5)
式中:s(i,k)為i點與k點之間的相似度。
相對于傳統聚類,AP聚類算法有如下優點:
(1) 不需要事先指定聚類個數K;
(2) 多次執行得到的結果完全一樣,不需要隨機選取初值;
(3) 比其他單一聚類法的誤差平方和都要低;
(4) 通過輸入相似度矩陣來啟動算法,因此對距離矩陣的對稱性沒要求,數據適用范圍大。
AP算法的流程如圖1所示。

圖1 AP算法流程Fig.1 Flowchart of APalgorithm
針對電壓偏差非線性、周期性的特點,文中選取神經網絡算法建立預測模型。神經網絡具備很強的學習能力,能更好地適應數據空間的變化和各種復雜的數據關系。
BP神經網絡是一種多層前饋神經網絡,該網絡的主要特點是信號前向傳遞,誤差反向傳播。BP神經網絡廣泛應用于分類識別、逼近、回歸、壓縮等領域[21-24],其結構見圖2。

圖2 BP神經網絡結構模型Fig.2 BP neural network structure model
文中選取2012年4月10日至5月15日,2013年4月10日至5月15日,2014年4月1日至4月26日共2352個整時點氣象數據和電壓偏差數據作為歷史數據,對接下來的2014年4月27日、28日整時點的電壓偏差進行預測。文中氣象數據來自于上海浦東國際機場所使用的天氣數據,電壓偏差數據來自上海市某變電站的真實數據,組成如下的數據集記錄:整點時刻,氣溫,露點,濕度,氣壓, 風向,風速,狀況,電壓偏差。
2.2.1 PCA降維處理
由于影響電壓偏差預測精度的因素很多,為避免信息冗余現象,需對影響因素進行降維。分析數據集中數據的相關性,繪制相關性強度圖,如圖3所示。由圖可知,氣象因素中氣溫、濕度、風速、露點與電壓偏差的相關性較高,但同時氣象因素內部間的相關性也較高,若只提取與電壓偏差相關性較強的氣象因素,則會出現信息重復現象。

圖3 相關性強度Fig.3 Correlation strength
所以,將氣象數據進行PCA降維處理,得到一組相互獨立又信息量大的主成分,根據貢獻率,文中將原始氣象數據PCA降維為4維。
2.2.2 AP聚類
AP算法的輸入為數據點之間的相似度矩陣S,文中數據點i和j的相似度為s(i,j)=-(xi-xj)2。圖4為AP聚類迭代過程。

圖4 AP聚類迭代過程Fig.4 Iteration of AP clustering
將降維后的氣象數據進行AP聚類,由圖4可知,AP聚類迭代約10次便趨于穩定。
2.2.3 聚類評價指標SSE
誤差平方和(sum of squared errors,SSE)指標ISSE用一個子類到所在類簇的聚類中心的歐氏距離來表示,即:
(7)

傳統K-means聚類需事先給定聚類數K值,聚類結果受初始聚類中心的影響大,導致K-means聚類算法不穩定,SSE值為3 724.526 8;AP聚類算法不需要隨機選取初值,多次執行AP算法得到的結果相同,穩定性好,SSE值為2 537.064 9,克服了K-means聚類算法的不足,AP聚類算法的誤差平方和較小,類簇間的分散性高,類簇內的緊湊性好。
2.3.1 BP神經網絡設計
輸入向量為改進集成聚類得到的與待測點的氣象因素同類的歷史數據集,因此為一個4維向量;輸出向量為整點時刻的電壓偏差,為1維向量。BP神經網絡適合求解內部機制復雜的問題,但是初始權重敏感,文中取10次預測結果的均值作為最終預測結果。
2.3.2 預測結果
文中提出的改進方法,與傳統BP神經網絡預測方法、BP神經網絡結合PCA降維的預測方法程序均在MATLAB平臺上成功運行,將其結果進行對比,如圖5、圖6所示。并計算其平均相對誤差:
(8)

圖5 預測結果對比Fig.5 Comparison of forecasting results

圖6 預測誤差對比Fig.6 Comparison of forecasting errors
由圖5、圖6可知,文中改進方法比傳統BP神經網絡、PCA+BP神經網絡預測結果的平均相對誤差都低,說明該改進方法中PCA降維和AP聚類2個步驟均能夠提高預測精度,這是因為通過PCA降維處理,剔除了無關變量和冗余變量,得到相互獨立又信息量大的主成分;而通過AP聚類可以確定歷史數據之間的親疏關系,提取與待測點同類的數據對神經網絡進行訓練,減少了無關歷史數據的影響不良影響,進一步提高了預測精度。將4月27日、4月28日的3種方法預測結果的相對誤差落在某一范圍內的頻數用直方圖表示,得到圖7—9所示的3種方法的預測誤差分布直方圖。

圖7 傳統BP神經網絡法誤差分布Fig.7 Distribution histogram ofthe traditional BP model

圖8 PCA+BP神經網絡法誤差分布Fig.8 Distribution histogram ofthe BP model with PCA

圖9 本文改進方法誤差分布Fig.9 Distribution histogram ofthe proposed method
從圖7—9可以看出文中提出的改進預測方法相對誤差在0附近更為集中。最終預測方法誤差對比如表1所示,文中方法平均相對誤差為3.06%,比傳統神經網絡降低了10.82%,而且傳統神經網絡和PCA+BP神經網絡的預測結果相對誤差控制在3%以內的概率分別為12.5%和25%,而文中改進預測方法預測結果相對誤差控制在3%以內的概率達到54.17%,極端相對誤差只是小概率事件。綜上所述,文中改進預測方法在電壓偏差預測中效果更好,為下一步電壓偏差預警及電壓偏差問題策略制定提供可靠依據。

表1 預測方法誤差對比Tab.1 Comparison of forecasting errors %
文中針對電壓偏差非線性、周期性的特點,同時考慮氣象因素,通過將聚類算法與BP神經網絡結合,建立電壓偏差 預測模型。
(1) 由于影響電壓偏差預測精度的因素過多,為避免信息干擾和信息重復,將氣象數據進行PCA降維處理,得到一組相互獨立又信息量大的主成分,將氣象主成分進行聚類處理。
(2) 引入AP聚類算法,克服了傳統K-means聚類算法的不足,結果證明AP聚類算法效果更好。
(3) 選擇與待預測整時點同類的歷史數據集作為訓練樣本數據集,運用BP神經網絡進行訓練并預測,將其預測結果與傳統BP神經網絡、PCA+BP神經網絡預測結果相比較,證明了本文提出的方法整體預測指標更好。
雖然文中提出的預測模型能夠較好的預測短期電壓偏差,但模型仍有提高的空間。如:BP聚類算法樣本依賴性強且初始權重為隨機給定,導致BP神經網絡預測結果穩定性欠佳。因此可基于以上問題,對文中預測模型進一步改進。