馬玉鑫
上海電氣集團股份有限公司 中央研究院 上海 200070
在微電網中應用現代信息技術、通信技術與控制技術,已經成為全球化的趨勢。建立微電網,使發電設備、電網運營和終端設備互相配合,協同工作,在保證系統穩定性、可靠性的同時,使投資和對環境的影響最小[1]。負荷預測在近年來微電網的發展中扮演著極其重要的角色。系統規劃與運行、收益估計、能量交易等都需要精準的負荷預測。根據預測的時間間隔,負荷預測可以分為超短期負荷預測、短期負荷預測、中期負荷預測和長期負荷預測四類,分界線一般默認為一天、兩周和三年[2-4]。
由于超短期負荷預測間隔時間短,而且對于微電網而言,其負荷的波動性一般大于區域大電網,因此對預測算法的精度提出了更高要求。目前,在數據積累情況較為理想的條件下,超短期負荷預測普遍應用人工神經網絡(ANN)和支持向量機(SVM),其中SVM因為引入了結構風險最小化理論,不會陷入局部極值,所以備受青睞[5-6]。實際應用中,為規避SVM復雜且耗時的二次規劃求解問題,通常采用最小二乘支持向量機(LSSVM)。
早期直接應用LSSVM,可以有效解決超短期負荷預測問題,獲得了比傳統回歸算法更好的預測結果[7-10]。眾多學者為提高LSSVM的預測精度,在訓練模型的輸入矩陣中引入被預測日相似日的相關元素,使輸入和輸出矩陣間存在更強的相關性。隨著微電網系統、數據采集和通信技術的發展,微電網中可收集的變量種類越來越多,采樣頻率也越來越快,由此對超短期負荷預測模型的訓練提出了挑戰。而且,在實際工程中,影響模型輸出的因素并非都可以直觀辨識。
可見,僅選取部分相關性較高的變量用于建模,可能會降低模型的精度。但如果將系統采集到的全部變量都作為輸入用于建模,那么勢必會因維度增加而導致計算成本變大,從而進一步影響預測模型的泛化能力[11]。通過引入主成分分析(PCA)消除變量間的共線性特點,然后利用SVM建模,在電力系統短期負荷預測中獲得了比傳統SVM更準確的預測結果[12-14]。
PCA的目標是將數據方差變化最大的方向保留下來,以此最大限度地展開數據,對于服從或接近服從高斯分布的數據集有較好的應用效果。當然,負荷數據具有較強的隨機性,并且電壓電流等變量明顯不服從高斯分布,所以PCA在負荷數據的特征提取中會遇到信息丟失較多的問題[15]。局部保持投影(LPP)通過保持局部鄰域結構完整,可以在克服上述問題的同時實現特征提取[16]。
為了解決負荷數據非高斯、高維度的問題,筆者提出一種基于LPP-LSSVM的微電網超短期負荷預測算法。算法根據天氣、溫度等因素選取相似日組成訓練數據集,利用LPP進行特征提取,基于LSSVM訓練預測模型實施負荷預測。最終,通過對某公司實際運行負荷進行試驗,驗證算法的有效性和優越性。
LPP可以求取一個保持數據集局部結構的投影矩陣P∈Rm×p(p (1) 構建鄰接圖。根據歐幾里得距離,X中每個數據xi,xj∈X(i,j=1,…,n)選擇離其最近的k個數據作為鄰居。若數據xj屬于數據xi的k個近鄰中的一個,則在節點i與節點j之間連一條直線,否則不連線。 (2) 計算權重。W為待求的權重矩陣,節點i與節點j之間權重為Wij。若節點之間無連線,則權重值設置為0。若節點之間有連線,則權重值利用高斯核函數進行設置: (1) 式中:t為高斯核參數。 (3) 特征映射。投影矩陣P∈Rm×p(p XTLXα=λXTDXα (2) (3) L=D-W (4) 式中:λ、α分別為特征值和特征向量;D為對角矩陣,元素值為權重矩陣的列之和。 低維數據可以表示為: yi=xiPP=[a1,a2,…,ap] (5) 建立預測模型使用的技術手段為LSSVM,其核心內容是如何確立模型的輸入和輸出。 SVM的基本思想是Mercer核展開定理,通過非線性映射,將輸入控件的樣本映射到高維的特征空間中,將尋找最優線性回歸超平面的算法歸結為求解約束條件下的二次規劃問題,并可以求得全局最優解。設樣本為m維向量,給定n個樣本: (x1,y1),(x2,y2),…,(xn,yn)∈RmR 約束于: yi=Φ(xi)ω+b+ξii=1,…,n (6) 式中:xi為樣本輸入;yi為樣本輸出;ω為高維特征空間的權值向量;b為偏置量;ξi為松弛因子。 用非線性映射Φ(x)將樣本從原空間Rm映射到一個高維特征空間,在此高維特征空間中構造最優線性決策函數: y(x)=ωTΦ(x)+b (7) 利用結構風險最小化原則,確定ω、b等價于求解下面的優化問題: (8) 式中:c為懲罰因子,c>0;RE為誤差控制函數,屬于不敏感損失函數。 LSSVM在優化目標中的損失函數J為松弛因子ξi的二次項,故優化問題為: 約束于: yi=ωTΦ(xi)+b+ξii=1,…,n (9) 用拉格朗日法求解上述優化問題: (10) 式中:αi為拉格朗日乘子。 根據優化條件?L/?ω=0,?L/?b=0,?L/?ξ=0,?L/?α=0,有: 定義核函數Kij=K(xi,yi)=Φ(xi)Φ(yi)為高維特征內積運算,且K(xi,yi)是滿足Mercer條件的對稱函數,則以上優化問題轉化為求解線性方程: (15) 最后得到LSSVM的函數估計為: (16) 為了解決負荷數據非高斯、高維度的問題,筆者提出基于LPP-LSSVM的超短期負荷預測算法。 (1) 基于被預測日的季節類型,第一類包含1月、2月、12月,第二類包含4月、5月、6月,第三類包含7月、8月、9月,第四類包含3月、10月、11月,匹配選取h天歷史數據作為總數據集。 (2) 確定負荷預測的參考歷史樣本點數L,即為預測T+1時刻的負荷功率,需參考T,T-1,…,T-L+1共L個時刻的負荷功率值。 (3) 構造LPP的輸入數據集X=[x1,x2,…,xn]T∈Rh(s-L)×(13+L),s為每天收集的樣本數,固定的13列為功率因數、電網頻率、三相相電流、三相相電壓、三相線電壓、每日最高溫、每日最低溫。 (4) 使用LPP提取特征空間Y=XP,其中投影矩陣P=[a1,a2,…,ap]∈R(13+L)×p。 (5) 將標準化后的特征空間Y和負荷曲線F∈R(s-L)×(13+L)輸入LSSVM,建立預測模型F=f(Y)。 (6) 對于被測日數據Xt,首先構造Yt=XtP,輸入預測模型,得到T+1時刻被預測值FpT+1=f(Yt)。 (7) 計算LPP-LSSVM算法結果的平均絕對誤差百分比MAPE=|FT+1-FpT+1|/FT+1×100%。 試驗數據來源于上海某公司微電網示范工程。該工程配置了42 kW光伏和50 kW儲能,負荷類型主要是辦公樓宇和實驗室,負荷波動主要來自于幾個實驗室的高功率設備。為了更好地配合已有的能量算法,調度儲能,實現削峰填谷,擬采用筆者提出的算法代替傳統的LSSVM實現超短期負荷預測。數據來自 2014年7月至2015年6月間,采樣間隔為5 min,其中負荷數據主要根據各電表獲取,每日最高、最低溫度則參考天氣預報的信息。 經過交叉驗證,選取特征提取維度p為6,LPP近鄰個數k為30,LSSVM懲罰因子c為10,高斯核函數參數為100。LSSVM、PCA-LSSVM、LPP-LSSVM三種算法的MAPE對比見表1。 通過表1可以看出,筆者提出的LPP-LSSVM算法在3月至11月的負荷預測中,表現均優于LSSVM和PCA-LSSVM算法。在1月、2月、12月的負荷預測中,結果較PCA-LSSVM算法略差,但優于LSSVM算法。7月、8月、9月中,三種算法的MAPE均高于其它月份,原因是夏季空調開啟后負荷波動比較劇烈,進行精準預測的難度較大。 圖1所示為2014年10月12日實際負荷曲線和LSSVM、LPP-LSSVM預測曲線,可以看出,LPP-LSSVM算法可以更好地反映負荷的波動情況,更接近實際的負荷曲線。LPP-LSSVM算法得到的MAPE為18.88%,相比LSSVM減小了2%。 圖1 2014年10月12日負荷曲線 圖2所示為2015年4月25日實際負荷曲線的高斯分布擬合結果,可以看出負荷數據明顯不服從高斯分布。由于PCA自身的局限性,PCA在特征提取時會遺漏部分信息,使特征空間無法完整表達原始數據空間的結構。 圖2 2015年4月25日實際負荷曲線高斯分布擬合結果 圖3所示為2015年4月25日PCA-LSSVM、LPP-LSSVM預測曲線與實際負荷曲線,可以看出兩種算法都能較好地預測負荷波動,但是PCA-LSSVM算法的MAPE只達到14.15%,而LPP-LSSVM算法克服了數據的非高斯和高維度問題,完整表達了負荷數據的特征,MAPE達到12.43%。 當數據集中的某些變量服從非高斯分布時,傳統PCA的相應假設將無法得到滿足,于是其特征提取能力會下降,導致后續使用LSSVM建立的預測模型的精度會降低。針對這一問題,筆者提出了一種基于LPP-LSSVM的微電網超短期負荷預測算法。LPP的引入,可以保證由特征提取獲得的特征空間信息精度不會因為訓練數據包含復雜數學分布而受到影響。通過對上海某公司微電網實際負荷數據進行仿真試驗,驗證了筆者算法的有效性。 圖3 2015年4月25日負荷曲線3 LSSVM概述
4 超短期負荷預測算法
5 仿真試驗


6 結論
