(湖南工業(yè)大學(xué) 智能信息感知及處理技術(shù)湖南省重點(diǎn)實(shí)驗(yàn)室,湖南 株洲 412007)
電價(jià)是電力市場(chǎng)中的核心部分,國(guó)內(nèi)外研究者對(duì)于電價(jià)預(yù)測(cè)已經(jīng)開(kāi)展了較多工作,如使用經(jīng)典回歸分析方法基于數(shù)理統(tǒng)計(jì)知識(shí)對(duì)時(shí)間序列進(jìn)行回歸擬合,由于模型大多為線性,因此用于預(yù)測(cè)的特征量一般使用電價(jià)數(shù)據(jù)本身,如文獻(xiàn)[1]利用小波分析法聚焦電價(jià)信號(hào)中的無(wú)序特征,降低因?yàn)榉蔷€性因素帶來(lái)的誤差。隨著計(jì)算機(jī)性能的提升,機(jī)器學(xué)習(xí)的方法得到了大量應(yīng)用,也開(kāi)始嘗試進(jìn)行多特征輸入,如文獻(xiàn)[2-5]嘗試使用基于神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)方法進(jìn)行預(yù)測(cè),但也僅局限于關(guān)鍵時(shí)間點(diǎn)的價(jià)格作為特征輸入。隨著模型的復(fù)雜度提升,文獻(xiàn)[6-7]使用混合預(yù)測(cè)模型,開(kāi)始加入與電價(jià)相關(guān)性較高的特征為輸入。可以發(fā)現(xiàn),當(dāng)模型復(fù)雜度提升時(shí),需要選擇更多合適的特征量提取有效信息才能提升復(fù)雜模型的效果,而目前電價(jià)預(yù)測(cè)工作側(cè)重于模型結(jié)構(gòu)和預(yù)測(cè)算法的研究,對(duì)輸入特征的研究較少。
本文基于實(shí)時(shí)電價(jià)的形成機(jī)理,提出一種按實(shí)時(shí)電價(jià)各分量度量值提取特征的方法,并利用該特征群,選擇適合電價(jià)預(yù)測(cè)特點(diǎn)的Seq2Seq(sequence-tosequence)-Attention網(wǎng)絡(luò)進(jìn)行驗(yàn)證,數(shù)據(jù)取自美國(guó)PJM(Pennsylvania-New Jersey-Maryland)市場(chǎng)的公開(kāi)數(shù)據(jù),通過(guò)對(duì)僅采用電價(jià)和負(fù)荷特征進(jìn)行預(yù)測(cè)的方式進(jìn)行對(duì)比,準(zhǔn)確性有較大提升,驗(yàn)證了該方法的可行性。
實(shí)時(shí)電價(jià)理論由F.C.Schweppe 教授提出[8],按實(shí)時(shí)電價(jià)的物理和經(jīng)濟(jì)意義,主要將其分為3個(gè)部分:邊際燃料和維護(hù)分量、發(fā)電生產(chǎn)邊際價(jià)值分量、網(wǎng)絡(luò)運(yùn)行邊際價(jià)值分量。
λ(t)表達(dá)式為

式中:γF(t)為發(fā)電邊際燃料成本;γM(t)為發(fā)電邊際維護(hù)成本;
d(t)為時(shí)刻t(h)的系統(tǒng)總需求;
g(t)為t(h)全系統(tǒng)等值發(fā)電機(jī)的發(fā)電量;
GFM[g(t)]為全系統(tǒng)等值發(fā)電機(jī)的燃料和維護(hù)成本。
由式(1)可知,實(shí)時(shí)市場(chǎng)價(jià)格受系統(tǒng)邊際發(fā)電量和用電量的影響,忽略網(wǎng)損時(shí),發(fā)電量與用電量是相等的。當(dāng)系統(tǒng)總發(fā)電量波動(dòng)時(shí),邊際機(jī)組的成本差異將導(dǎo)致該分量的波動(dòng);當(dāng)系統(tǒng)總發(fā)電量趨于穩(wěn)定時(shí),因調(diào)用發(fā)電機(jī)組的機(jī)組類型差異帶來(lái)的燃料和維護(hù)成本差異也將導(dǎo)致該分量的波動(dòng)。因此該分量所代表的度量應(yīng)該是評(píng)判系統(tǒng)總發(fā)電量,以及機(jī)組類型的參數(shù)。
γ(t)分量與λ(t)分量的差異僅在于發(fā)電供電質(zhì)量分量γQS(t),發(fā)電供電質(zhì)量的定義是為使用戶減少用電量,直至發(fā)電量降低到基于發(fā)電可用容量和運(yùn)行備用要求的臨界發(fā)電容量所產(chǎn)生成本的值。其與用戶需削減的負(fù)荷量有關(guān)。在實(shí)際計(jì)算γQS(t)的值時(shí),缺供電能價(jià)值法在反映每小時(shí)發(fā)電供電質(zhì)量的形成原因上是依托于物理參數(shù)且概念最為清晰的,宜選擇該計(jì)算方法。其表達(dá)式為

式中GQS[g(t)]為t(h)的發(fā)電供電質(zhì)量成本。
由式(2)可見(jiàn)發(fā)電生產(chǎn)邊際價(jià)值分量與發(fā)電量有密切聯(lián)系,但由其定義可知,真正對(duì)其產(chǎn)生影響的因素是臨界發(fā)電容量(電量),該分量的度量主要應(yīng)反映發(fā)電量的邊際信息價(jià)值,電力系統(tǒng)中的需求響應(yīng)與調(diào)頻與該分量密切相關(guān)。
網(wǎng)絡(luò)運(yùn)行邊際價(jià)值分量包括網(wǎng)絡(luò)損耗和網(wǎng)絡(luò)供電質(zhì)量?jī)刹糠帧?/p>
1.3.1 網(wǎng)絡(luò)損耗分量ηL,k(t)
網(wǎng)絡(luò)損耗分量ηL,k(t) 與網(wǎng)絡(luò)的潮流相關(guān),用戶用的電量與其所處位置的不同,將影響該分量的值。該分量的度量應(yīng)能反映出網(wǎng)絡(luò)在運(yùn)行中的損耗情況。其表達(dá)式為

式中:ηL,k(t)為第k個(gè)用戶的在t時(shí)刻的網(wǎng)絡(luò)損耗;
Zi(t)為流經(jīng)線路i的電能數(shù)量;
Ri為取決于線路電阻的常數(shù)。
由于網(wǎng)絡(luò)結(jié)構(gòu)在短期內(nèi)可以認(rèn)為是基本不變的,由式(3)可知,該分量主要與系統(tǒng)用電量、各線路損耗相關(guān),其度量是線路分布結(jié)構(gòu)引起的損耗成本。由于網(wǎng)絡(luò)參數(shù)和潮流信息的數(shù)據(jù)量大、維度多且不易獲取,其對(duì)實(shí)時(shí)電價(jià)的影響也相對(duì)較小,如全部考慮將影響模型計(jì)算性能、增加模型復(fù)雜度,可考慮用系統(tǒng)高壓線路損耗近似代替。
1.3.2 網(wǎng)絡(luò)供電質(zhì)量分量ηQS,k(t)
網(wǎng)絡(luò)供電質(zhì)量分量ηQS,k(t)是當(dāng)輸送電量即將達(dá)到網(wǎng)絡(luò)的容量極限時(shí),將大幅增加的一個(gè)量,用于限制用戶對(duì)網(wǎng)絡(luò)的過(guò)度使用,該分量應(yīng)對(duì)網(wǎng)絡(luò)容量的使用情況進(jìn)行度量,并應(yīng)對(duì)網(wǎng)絡(luò)容量接近極限時(shí)有一定的敏感性。采用網(wǎng)絡(luò)投資年化成本法計(jì)算時(shí),其表達(dá)式為

式中:AQS,η為根據(jù)最優(yōu)網(wǎng)絡(luò)擴(kuò)容計(jì)劃每年新增1 kW網(wǎng)絡(luò)容量所需年度投資;
dcrit,η為受網(wǎng)絡(luò)容量限制的臨界需求電量。
對(duì)式(4)分析可知,用電需求超臨界用電量的值和概率將決定ηQS(t)值,考慮到年化投資對(duì)每小時(shí)的分?jǐn)傇谝孕r(shí)為顆粒度的實(shí)時(shí)電價(jià)中難以體現(xiàn)其波動(dòng)特征,而用電量超限在區(qū)域內(nèi)的物理影響為產(chǎn)生輸電阻塞,因此可以考慮輸電阻塞費(fèi)用進(jìn)行替代,由于阻塞費(fèi)用并不是博弈的結(jié)果,而是根據(jù)節(jié)點(diǎn)電價(jià)計(jì)算規(guī)則和網(wǎng)絡(luò)阻塞情況計(jì)算得出的值,可以在一定情況上反映網(wǎng)絡(luò)容量使用情況。
實(shí)時(shí)電價(jià)的相關(guān)分量及其對(duì)應(yīng)的特征參數(shù)匯總于表1。

表1 輸入特征參數(shù)Table1 Input characteristic parameter
Seq2Seq 用于處理序列到序列的問(wèn)題,是一種Encoder-Decoder結(jié)構(gòu)的網(wǎng)絡(luò)[9],使用LSTM(long short-term memory)作為其基本單元[10],其首先在機(jī)器翻譯領(lǐng)域取得了巨大成功,近年也在電力領(lǐng)域有諸多應(yīng)用,如電力負(fù)荷預(yù)測(cè)[11]和非侵入式負(fù)荷分解[12]。
Seq2Seq結(jié)構(gòu)的特點(diǎn)是可以解決輸入序列與輸出序列長(zhǎng)度不一致的問(wèn)題,是基于循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)的改進(jìn),由編碼層(encoder)、語(yǔ)義向量C、解碼層(decoder)組合而成,編碼層與普通RNN網(wǎng)絡(luò)并無(wú)區(qū)別,而解碼層的輸出關(guān)系變?yōu)?/p>

式(5)(6)中:st為解碼層t時(shí)刻的隱藏狀態(tài);
yt為解碼層t時(shí)刻的輸出值。
由式(5)(6)可知,Seq2Seq網(wǎng)絡(luò)的缺點(diǎn)在于其輸入序列的信息全部壓縮在最后的語(yǔ)義向量上,一旦輸入序列過(guò)長(zhǎng),有效信息被分配的權(quán)重一起降低,導(dǎo)致信息量被壓縮。通過(guò)引入Attention 機(jī)制,可以解決長(zhǎng)序列中信息壓縮的問(wèn)題[13],與Seq2Seq網(wǎng)絡(luò)相結(jié)合后的結(jié)構(gòu)如圖1所示。

圖1 Seq2Seq-Attention網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Seq2Seq-Attention network structure
Seq2Seq-Attention 原理是將語(yǔ)義向量推廣至每個(gè)時(shí)間步上,使每個(gè)時(shí)間步都擁有自己獨(dú)特的語(yǔ)義向量。通過(guò)這個(gè)語(yǔ)義向量,解碼層各時(shí)間步可以選擇自己最關(guān)注的編碼層序列內(nèi)容,由于每個(gè)時(shí)間步的語(yǔ)義向量都獨(dú)立出來(lái),故不存在信息壓縮問(wèn)題。新語(yǔ)義向量計(jì)算方式如下:

式(7)~(9)中:ci為Attention 機(jī)制下各時(shí)間步的語(yǔ)義向量;
αij為隱藏層的權(quán)重系數(shù);
hi為編碼層在相應(yīng)時(shí)刻的隱藏狀態(tài);
eij為輸出序列隱藏層i對(duì)輸入序列隱藏層j的相關(guān)系數(shù);
i取值為1,2,…,tx;
V、W、U與b為模型待訓(xùn)練參數(shù);
s為解碼層隱藏狀態(tài)。
本文采用美國(guó)PJM 電力市場(chǎng)的公開(kāi)數(shù)據(jù)作為數(shù)據(jù)集,以世界標(biāo)準(zhǔn)時(shí)作為時(shí)間標(biāo)簽選取2016年1月1日5時(shí)至2018年12月31日5時(shí)的數(shù)據(jù),即美國(guó)時(shí)間下的2016年至2018年共3 a的數(shù)據(jù)。以時(shí)間長(zhǎng)度為標(biāo)準(zhǔn),將數(shù)據(jù)集的80.0%,19.5%,0.5% 3部分,分別劃為訓(xùn)練集、測(cè)試集、驗(yàn)證集。使用表1內(nèi)的特征數(shù)據(jù)對(duì)24 h 節(jié)點(diǎn)邊際電價(jià)(locational marginal prices,LMP)進(jìn)行預(yù)測(cè)。
在輸入數(shù)據(jù)方面,由于輸入特征量較多,為便于分析,使用流形學(xué)習(xí)中的t-SNE 算法找出特征在高維空間的低維流形[14],求出相應(yīng)的嵌入映射,如圖2所示。

圖2 實(shí)時(shí)電價(jià)特征與其它特征對(duì)比Fig.2 Comparison of real-time electricity price features with other features
由圖2的二維平面(圖2a)中可見(jiàn),其總分布形狀圍繞中心點(diǎn)呈橢圓形廣泛分布,類與類之間的間隙較為明顯,說(shuō)明其所含有效信息量較大,是較好的神經(jīng)網(wǎng)絡(luò)輸入數(shù)據(jù)。對(duì)僅使用負(fù)荷和LMP 電價(jià)數(shù)據(jù)作為輸入特征(圖2b)進(jìn)行分析可知,雖然其大致呈正相關(guān)的線性關(guān)系,但噪點(diǎn)分布具有明顯的異方差性,由于實(shí)時(shí)電價(jià)的形成原因十分復(fù)雜,同時(shí)涉及經(jīng)濟(jì)規(guī)律與物理規(guī)律,較少的輸入數(shù)據(jù)特征所得分析結(jié)果也將不具備可解釋性。
在回歸類問(wèn)題中,評(píng)價(jià)回歸模型效果的評(píng)價(jià)指標(biāo)一般為均方誤差。而平均絕對(duì)百分比誤差可以較為直觀地了解預(yù)測(cè)值與真實(shí)值之間的差距,本文同時(shí)使用這兩項(xiàng)指標(biāo)作為模型的評(píng)價(jià)指標(biāo)。計(jì)算公式如下:
平均絕對(duì)百分比誤差(mean absolute percent error,MAPE)為

均方誤差(mean squared error,MSE)為

式(10)(11)中:T為預(yù)測(cè)時(shí)間區(qū)間;
yt為t時(shí)刻的真實(shí)值。
利用Seq2Seq-Attention網(wǎng)絡(luò)進(jìn)行電價(jià)預(yù)測(cè),其求解步驟如下:
1)對(duì)輸入特征數(shù)據(jù)進(jìn)行編碼。將用于預(yù)測(cè)的輸入特征傳入編碼層。經(jīng)過(guò)LSTM計(jì)算后得到編碼層隱藏狀態(tài)。輸入特征的信息被壓縮在隱藏狀態(tài)內(nèi)。
2)解碼。將編碼層隱藏狀態(tài)與目標(biāo)電價(jià)信息傳入解碼層,經(jīng)LSTM計(jì)算后得到解碼層隱藏狀態(tài)。輸入特征與電價(jià)通過(guò)解碼層在此形成了聯(lián)系。
3)計(jì)算語(yǔ)義矩陣。由于每個(gè)時(shí)刻的隱藏狀態(tài)不同,Attention模塊將編碼層隱藏狀態(tài)與解碼層隱藏狀態(tài)按式(9)求得其相關(guān)系數(shù),并據(jù)此求出每一時(shí)刻的語(yǔ)義向量ci,得到語(yǔ)義矩陣C。建立特征與目標(biāo)電價(jià)之間的聯(lián)系權(quán)重。
4)求解預(yù)測(cè)電價(jià)。通過(guò)最終的激活函數(shù),將語(yǔ)義矩陣C與解碼層隱藏狀態(tài)聯(lián)系起來(lái),求解所需的預(yù)測(cè)電價(jià)。
5)反向傳播與迭代。利用損失函數(shù)計(jì)算預(yù)測(cè)電價(jià)與目標(biāo)電價(jià)的誤差,并通過(guò)一定的學(xué)習(xí)率反向傳播不斷迭代,直至達(dá)到終止條件。
在此過(guò)程中,輸入特征被不斷編碼解碼,信息以隱藏狀態(tài)的方式在網(wǎng)絡(luò)中流動(dòng),依靠網(wǎng)絡(luò)結(jié)構(gòu)與其相應(yīng)的神經(jīng)元節(jié)點(diǎn)參數(shù)被記憶保存,最終由激活函數(shù)輸出預(yù)測(cè)結(jié)果。
本文預(yù)測(cè)模型首先在訓(xùn)練集上進(jìn)行迭代,訓(xùn)練完畢后使用測(cè)試集進(jìn)行預(yù)測(cè)效果測(cè)試,當(dāng)通過(guò)調(diào)參取得理想測(cè)試效果后再使用驗(yàn)證集進(jìn)行模型驗(yàn)證,取驗(yàn)證集的驗(yàn)證結(jié)果作為模型預(yù)測(cè)效果。其中,編碼層和解碼層都使用兩層LSTM結(jié)構(gòu),隱藏節(jié)點(diǎn)數(shù)分別為256和128,通過(guò)注意力機(jī)制進(jìn)行連接,損失函數(shù)采用Log-Cosh 損失函數(shù)。輸入序列的長(zhǎng)度為7 d,目標(biāo)序列長(zhǎng)度為1 d,即用168個(gè)時(shí)間點(diǎn)的數(shù)據(jù)對(duì)接下來(lái)24個(gè)時(shí)間點(diǎn)的數(shù)據(jù)進(jìn)行預(yù)測(cè)。為保證模型的計(jì)算效率與適應(yīng)性,模型內(nèi)還引入了正則化、學(xué)習(xí)率衰減、Mini-batch 等方法。考慮到需對(duì)基于實(shí)時(shí)電價(jià)特征輸入與僅使用歷史負(fù)荷和節(jié)點(diǎn)邊際電價(jià)作為特征輸入進(jìn)行對(duì)照實(shí)驗(yàn),兩者使用同樣的網(wǎng)絡(luò)結(jié)構(gòu)。且為避免在一次預(yù)測(cè)中可能產(chǎn)生的誤差影響對(duì)比情況,本文在驗(yàn)證集中取最后一周的數(shù)據(jù)做為在該周期上的平均表現(xiàn)對(duì)照。預(yù)測(cè)結(jié)果如圖3所示。
由圖3可以看出,僅使用負(fù)荷和電價(jià)特征作為輸入時(shí),模型雖對(duì)電價(jià)的變化趨勢(shì)捕捉較好,但擬合度較差,不能準(zhǔn)確捕捉到電價(jià)變化的細(xì)節(jié),且預(yù)測(cè)結(jié)果較真實(shí)值整體偏高,原因可能是電價(jià)數(shù)據(jù)集整體均值為30.891美元/(MW·h),驗(yàn)證數(shù)據(jù)整體在均值以下所導(dǎo)致。在采用基于實(shí)時(shí)電價(jià)特征的輸入時(shí),模型對(duì)電價(jià)變化趨勢(shì)的捕捉較為準(zhǔn)確,較僅使用負(fù)荷和電價(jià)特征作為輸入時(shí)提高了約5%,說(shuō)明使用大量實(shí)時(shí)電價(jià)形成機(jī)理的特征進(jìn)行輸入時(shí),一些在負(fù)荷和電價(jià)數(shù)據(jù)本身無(wú)法反映的變化規(guī)律被挖掘出來(lái),但其在電價(jià)突變的時(shí)間點(diǎn)的預(yù)測(cè)效果仍不太理想。例如12月26日12:00PM 附近電價(jià)突升的時(shí)間點(diǎn)兩者都沒(méi)有很好地預(yù)測(cè)到,說(shuō)明模型對(duì)異常信息檢測(cè)的能力有限,抑或是本文選擇的輸入特征與最終形成電價(jià)之間仍存在時(shí)滯,當(dāng)電價(jià)可能發(fā)生突變時(shí),本文所選的特征信息并不能被及時(shí)地反映出來(lái),導(dǎo)致模型未能預(yù)測(cè)到這一現(xiàn)象。

圖3 電價(jià)預(yù)測(cè)曲線Fig.3 Curves of price forecasting
不同評(píng)價(jià)特征預(yù)測(cè)結(jié)果如表2所示。

表2 不同輸入特征預(yù)測(cè)結(jié)果Table2 Prediction results of different input characteristics
從表2可以看出,在使用實(shí)時(shí)電價(jià)特征輸入時(shí),每一天的預(yù)測(cè)誤差均小于僅使用負(fù)荷與電價(jià)特征輸入所得誤差。兩者雖然在電價(jià)突變情況的2018年12月26日數(shù)據(jù)集上表現(xiàn)較為接近,但在其它時(shí)段采用實(shí)時(shí)電價(jià)特征作為輸入數(shù)據(jù)時(shí)誤差明顯降低,驗(yàn)證了該方法的可行性。
本文基于實(shí)時(shí)電價(jià)理論,對(duì)實(shí)時(shí)電價(jià)形成原因進(jìn)行深入分析,將形成電價(jià)的各分量分別選取一定的特征參數(shù)作為輸入數(shù)據(jù),并根據(jù)電價(jià)預(yù)測(cè)的特點(diǎn),建立了Seq2Seq-Attention網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),通過(guò)與僅使用歷史負(fù)荷和電價(jià)數(shù)據(jù)進(jìn)行預(yù)測(cè)的結(jié)果進(jìn)行對(duì)比,證明了在使用Seq2Seq-Attention網(wǎng)絡(luò)模型時(shí),基于實(shí)時(shí)電價(jià)特征的多特征參數(shù)輸入能更好地預(yù)測(cè)電價(jià)的變化趨勢(shì),有更高的準(zhǔn)確性。
未來(lái)將考慮對(duì)實(shí)時(shí)電價(jià)的特征進(jìn)行深入分析,尋找對(duì)電價(jià)變化,特別是電價(jià)突變時(shí),具有較好跟蹤效果的特征,以提升對(duì)電價(jià)突變時(shí)的預(yù)測(cè)效果。