馬玉鑫
(上海電氣集團股份有限公司中央研究院,上海 200070)
IT/通信/控制技術是現代微電網運營階段的核心技術,微電網的建設目標是使終端設備和電網調度互相協同工作,使系統的穩定性、可靠性最大化,同時,使投資和環境影響最小化[1-2]。由于微電網系統規劃與運行、收益估算、能源交易等功能都需要依賴精準的負荷預測,所以負荷預測在近年愈發受到人們的關注。根據預測時間間隔的不同,負荷預測被劃分為超短期負荷預測、短期負荷預測、中期負荷預測和長期負荷預測,一般的,這四類的分界為一天、兩周和三年[3-5]。
因為超短期負荷預測算法執行的間隔短,而且微電網的負荷波動明顯大于大電網的波動,這對預測算法的速度和精度提出了雙重高要求。在數據積累較理想的情況下,超短期負荷預測應用的算法一般為人工神經網絡(Artificial Neural Network, ANN)以及支持向量機(Support Vector Machine, SVM),其中SVM又因其引入了結構風險最小化的理論,而備受青睞[6-7]。然而,傳統的ANN容易陷入局部極值而SVM計算耗時較長,在微電網負荷預測的實際應用中均遇到了問題。極限學習機(Extreme Learning Machine, ELM)是一種結構簡單的單層前饋神經網絡,它的計算速度快,泛化性能優秀,已經被應用于電力負荷分析與預測[8-11]。
直接應用ELM確實可以有效提高超短期負荷預測的精度,獲得了比傳統的回歸算法更好的預測結果[12-16]。然而,隨著微電網系統設備種類增多、結構日趨復雜,采集的測點數和測點種類也在不斷增多,而且為了保證監測與控制的功效,采集頻率也逐步加快,所以超短期負荷預測模型在訓練過程中的干擾因素越來越多,對確保模型精度提出了更高的要求。而且,對于實際工程,影響模型精度的關鍵因素難以直觀辨識,所以僅選取相關性較大的部分變量進行建模,可能會造成預測模型精度較差的問題。但是,如果將采集到的全部變量都用于建模,反而會因維度增大而導致計算復雜度變高,影響模型的泛化能力[17]。
通過引入主成分分析(Principal Component Analysis, PCA)算法消除變量間的共線性特點,然后利用SVM建模,獲得了比傳統SVM更優秀的負荷預測結果[18-20]。然而,主成分分析的目標是為了將數據方差變化最大的方向保留下來,以此最大限度的“展開”數據,對于服從或接近服從高斯分布的數據集有較好的應用效果。但是,負荷數據具有較強隨機性,且電壓電流等變量明顯不服從高斯分布,所以PCA在負荷數據的特征提取中會丟失部分重要信息[21]。局部保持投影(Locality Preserving Projections, LPP)通過保持局部鄰域結構完整,可以克服上述問題的同時,實現特征提取[22]。
為解決電力負荷數據高維度、非高斯的特性造成預測模型精度降低的問題,本文提出了一種基于LPP-ELM的微電網超短期負荷預測算法。首先,選取具有相同天氣、溫度因素的歷史數據作為相似日,并根據負荷數據的時序相關性組成訓練數據集,然后,通過LPP進行特征提取,在訓練數據的特征空間中利用ELM訓練預測模型。最終,通過對某公司實際運行負荷的實驗,驗證了提出算法的有效性和優越性。
LPP算法通過計算得到一個保持數據局部結構的投影矩陣P∈Rm×P(p<m),將原始高維空間X=[x1,x2,…,xn]T∈Rn×m轉變為低維特征空間Y=[y1,y2,…,yn]T∈Rn×P,其中n 代表數據的樣本個數,m和p分別代表X和Y的維度。LPP算法的具體步驟如下:
(1)構建鄰接圖:根據歐式距離,為X中每個數據xi,xj∈X且i,j=1,…,n,選擇距離最近的k個數據點為近鄰。若樣本點xj屬于樣本點xi的k個近鄰中的任意一個,則在結點i與結點j之間連一條直線。否則,不連線。
(2)計算權重:假設W為待求取的權重矩陣,結點i與結點j之間權重為Wij。若結點之間無連線,則權重值為零。若結點之間有連線,則權重值使用式(1)進行計算:

其中,t為高斯核參數。
(3)特征映射:通過求解式(2),得到特征向量α∈ Rm×m,投影矩陣P∈ Rm×p(p <m)為最小的p個特征值λ對應的特征向量:

D為對角矩陣,其元素值為權重矩陣的列的和。最后,特征空間的向量可以表示為:

ELM是由黃廣斌教授提出的一種基于單隱含層前向神經網絡的機器學習算法[8]。將LPP提取的特征空間樣本的轉置為訓練樣本中的輸入,將原始空間中實際的負荷值,… ,t ]∈ R1×n作為輸出,隱含層神經元個n數為h,激勵函數為g(yT),則標準單隱含層前向神經網絡的數學模型為:

其中,wi是連接第i個隱含層節點與所有輸入節點的權值向量,βi是連接第i個隱含層節點與所有輸出節點的權值向量,bi是第i個隱含層節點的閾值。wi·yTj表示二者的內積。g(yT)可選為sigmoid、sine或RBF函數等。如要使得該模型能近似表征LPP特征空間,滿足則存在βi,wi,bi滿足以下等式:

因此,這n個等式可以被寫作Hβ=T,其中:

式中H被稱為神經網絡的隱含層輸出矩陣。根據文獻[8]所述,式(6)的優化問題最終被轉化為:

其中H?是H的Moore-Penrose廣義逆矩陣。
為了解決負荷數據高維度、非高斯的問題,本文提出了基于LPP-ELM的超短期負荷預測算法,其具體流程如下:
(1)根據被預測日的季節類型(第一類包含1、2、12月,第二類包含4、5、6月,第三類包含7、8、9月,第四類包含3、10、11月),匹配選取v天歷史數據作為總數據集。
(2)確定負荷預測的參考歷史樣本點數L,即預測T+1時刻的負荷功率,需要參考T,T-1,…,T-L+1共L個時刻的負荷功率值。
(3)構造LPP算法的輸入數據集X=[x1,x2,…,xn]T∈Rv(s-L)×(13+L),其中s為每天收集的樣本數,固定的13列分別為功率因數、電網頻率、三相相電流、相電壓、線電壓、每日最高溫和最低溫。
(5) 將 標 準 化 后 的 特 征 空 間Y∈Rv(s?L)×p和 負荷 曲 線F ∈Rv(s?L)×1輸 入ELM算 法 建 立 預 測 模 型
(6)對被測日數據Xt,首先構造Yt=Xt·P,輸入預測模型中,得到T+1時刻被預測值Fp =f( Y tT)。
實驗數據來源于上海某公司某幢辦公樓在2014年7月至2015年6月期間采集的負荷數據,采樣頻率為5分鐘/次,其中負荷數據主要從各電表處獲取,而每日天氣如最高溫、最低溫則參考天氣預報的信息。
選取ELM算法、PCA-ELM算法與本文提出的LPP-ELM算法進行對比。經過交叉驗證,選取特征提取維度p=6,LPP算法近鄰個數k=30,ELM隱含層個數h=50,ELM選用sigmoid函數作為激勵函數。

表1 三種算法在不同季節的MAPE值對比Table 1 MAPE values of three algorithms in different seasons
通過表1可以看出,本文提出的LPP-ELM算法在3-11月的負荷預測中,表現均優于ELM和PCA-ELM算法。夏季(7、8、9月)中,三個算法的MAPE值均高于其他季節,原因是夏季空調開啟后負荷波動比較劇烈,進行精準預測的難度變大。
通過圖1可以看出,2014年10月26日的負荷數據明顯不服從高斯分布,由于PCA算法自身的局限性,所以PCA在特征提取時會遺漏部分信息,使特征空間無法完整表達原始數據空間的結構。

圖1 2014年10月26日實際負荷曲線的高斯分布擬合結果Fig.1 The Gaussian distribution fitting result of the actual load data in 2014-10-26
針對上述負荷數據,圖2展示了ELM和LPP-ELM預測結果。從曲線趨勢可以看出,本日為非工作日,LPP-ELM的預測值可以更好的反映出負荷的波動情況,更接近實際的負荷曲線,所以取得了17.70%的MAPE值,相比ELM小3.09%,此時PCA-ELM取得的結果介于二者之間,為18.73%。

圖2 2014年10月26日負荷實際值與預測值曲線Fig.2 Actual and predicted load data in 2014-10-26
圖3展示了2015年6月10日的PCA-ELM、LPP-ELM預測值與實際值對比,可以看出兩種算法都能較好的預測負荷的波動,但是如圖中圈出部分所示,PCA-ELM在部分時刻會出現預測明顯失準的情況,其MAPE值只能達到16.77%,而LPP-ELM算法因為在訓練建模時通過保持局部鄰域結構,克服了數據的非高斯問題,完整表達了負荷數據的特征,MAPE值達到了15.42%。

圖3 2015年6月10日負荷實際值與預測值曲線Fig.3 Actual and predicted load data in 2015-06-10
負荷數據部分變量服從非高斯分布且預測模型的建立需要使用系統的多種被測量。此時直接使用傳統ELM算法,模型精度會因被測量中存在噪聲干擾而下降。然而先使用傳統PCA算法進行特征提取后再使用ELM建模,則會因為PCA的高斯分布假設無法得到滿足,導致其特征提取能力下降,最終同樣使得建立的預測模型精度降低。針對負荷數據的此種特性,本文提出了一種 LPPELM算法并將其應用在微電網超短期負荷預測中。LPP的引入可以保證由特征提取獲得的特征空間信息精度不會因為訓練數據包含復雜數學分布而受到影響。最后,通過對上海某公司某幢辦公樓的實際負荷數據的實驗,驗證了LPP-ELM算法的有效性。