劉 牮,李佳偉
(上海理工大學 機械工程學院,上海 200093)
隨著分布式發電技術與電力物聯網的發展,電力系統的組成更加多樣化,用電調度和電力市場的平穩運行面臨新的挑戰。為滿足電網安全運行的需求,提高電力系統的可靠性與穩定性,電力負荷數據的重要性不言而喻。然而,電力負荷具有隨機性和不確定性,并且傳統負荷數據的預測與生成受到很多因素影響,如天氣、季節、社會活動等,這些因素對于電網的穩定性構成威脅。
文獻[1]提出一種基于模糊集隸屬度改進均值生成函數的方法,通過新的模糊集隸屬度改進均值生成函數構造,在與最優子集模型結合后,使用模型對負荷進行短期預測;文獻[2]提出一種考慮風電場出力波動趨勢和相關性的建模方法生成風電負荷數據;文獻[3]提出基于支持向量回歸的負荷數據生成方法;文獻[4]將卷積神經網絡和支持向量回歸模型相結合,通過卷積神經網絡進行特征提取,將新特征輸入支持向量回歸模型進行預測。然而,文獻[1]的方法只適合進行短期數據預測,且無法生成大量數據;文獻[2]和文獻[3]的方法容易受到特殊因素影響,如天氣因素等,使得生成結果往往具有局限性,而不具有普遍性;文獻[4]的模型雖然能夠生成大量精確的電力負荷數據,但該方法模型結構復雜、計算量較大,且網絡訓練時間較長。
本文運用對抗神經網絡模型生成新的電力負荷數據,該方法不會受到特殊因素影響,使新生成的數據更具有普遍性,并且具有網絡結構簡單、訓練時間短等優點。對抗神經網絡是一種無監督學習神經網絡,伴隨著監督式學習性能瓶頸的到來,針對非監督學習的研究越來越多。運用DCGAN網絡進行電力負荷場景建模,分析驗證其在保留電力負荷數據原始序列時間、空間相關特性方面的能力。該模型通過生成器與判別器兩者之間的相互博弈,從中學習歷史負荷數據時空分布規律,并使用DCGAN網絡生成電力數據,可防止出現原始GAN在訓練過程中梯度下降、訓練不穩定以及無法進行單純的數據生成等問題。將電力數據通過坐標系轉化為曲線圖,將這些曲線圖作為數據樣本、深度卷積生成對抗網絡結構作為模型進行訓練,得到的新的電力負荷數據。通過將訓練得到的新數據與原始數據進行相關性分析,并與傳統支持向量法與均值生成函數法進行對比,結果證明本文模型能夠生成大量符合要求的新數據。
GAN網絡優化目標函數如下:

對于判別器而言,這是一個二分類問題,V(G,Z) 為二分類里常見的交叉熵損失。
對于生成器而言,為了盡可能地欺騙判別器D,判別概率D(G(z)) 需要最大化,也即使log(1-D(G(z))) 最小化。在實際訓練過程中,生成器與判別器交替進行訓練,不斷往復,當判別器與生成器二者達到納什均衡,生產樣本和真實樣本就達到了以假亂真的程度。

Fig.1 Adversarial neural network model圖1 對抗神經網絡模型
CNN網絡主要由3 種模塊構成:卷積層、采樣層和全連接層。CNN網絡訓練過程可理解為:首先通過第一層卷積提取圖片特征圖(feature map);然后通過第一層采樣層對特征圖進行特征選擇,去掉不需要的特征后得到新的特征圖;第二層卷積層再次對上一層采樣層的feature map提取特征,第二層采樣層也對上一層進行二次選擇;全連接層根據上述過程的特征結果進行分類。
DCGAN將CNN與GAN的兩種網絡進行結合,將卷積網絡引入模型中。卷積網絡具有非常強的特征提取能力,將其加入到GAN網絡進行無監督訓練生成的新的電力負荷數據。由于GAN網絡訓練具有不穩定性,DCGAN選擇使用CNN結構以穩定GAN的訓練。
網絡改進如下:
(1)取消所有pooling層,G網絡中使用轉置卷積進行上采樣,D網絡中用加入stride的卷積代替pooling。
(2)在D和G中均使用batch normalization,去掉FC層,使網絡變為全卷積網絡。
(3)G網絡中使用ReLU作為激活函數,最后一層使用tanh。
(4)D網絡中使用LeakyReLU作為激活函數。
DCGAN對卷積神經網絡結構作出的改變,可以提高樣本質量和收斂速度。在預處理環節,將圖像scale到tanh的[-1,1],學習率必須很小。本文設置學習率為rate=0.000 2,初始化參數由均值為0、方差為0.002 的正態分布中得到,LeakyReLU的斜率是0.2,將momentum參數beta從0.9 降為0.5,以防止震蕩及不穩定。在訓練過程中,判別器與生成器均采用adam優化算法。對數據結果進行比較分析,隨著訓練的逐步進行,基于DCGAN網絡的模型可生成大量滿足多樣性和準確性的數據序列。
圖2-圖4 分別為總迭代次數e=10、e=50、e=200 時的生成結果,從圖中可以看出,神經網絡逐漸學習到數據變化分布規律,生成的結果越來越好。在網絡訓練過程中,迭代次數越多,模型生成的曲線越清晰,并且可以大量生成電力負荷數據曲線,在程序中稍加修改還可得到生成的單張數據曲線圖。如圖5 為迭代次數為300 時其中的某單張電力數據曲線圖,通過坐標系可提取出曲線中的電力數據。

Fig.2 Result generated when e=5圖2 e=5 時生成結果

Fig.3 Result generated when e=50圖3 e=50 時生成結果

Fig.4 Result generated when e=200圖4 e=200 時生成結果

Fig.5 Single electric data curve generated when e=300圖5 e=300 時生成的單張電力數據曲線
經驗模態分解(EMD)可用來處理非平穩數據序列:假如一個原始數據序列X(t)的極大值或極小值數目比上跨零點或下跨零點的數目多2 個(或2 個以上),則需要對該數據序列進行平穩化處理。先選取序列長度為T的數據序列X(t):x1,x2,…,xT,令h(t)=X(t),找出全部的極大值點,并用樣條函數插值作為原數據序列X(t)的上包絡線,找出全部的極小值點。將樣條函數插值作為原數據序列的下包絡線,m(t)為均值序列,用數據序列h(t)減去該平均包絡后得到去掉低頻的一個新數據序列hl(t),從而得到第一個IMF分量C1(t):C1(t)=hk(t)。
第一個IMF分量代表原始數據序列中最高頻的組成成分。用X(t)減去第一個IMF分量C1(t),得到一個去掉最高頻成分后的新數據序列r1(t)。同理,對r1(t)用同樣的方法經過平穩化處理便得到第二個IMF分量C2(t),一直到序列rn(t)不可再被分解時,rn(t)便可作為數列X(t):x1,x2,....xT的均值或趨勢:

經過前面的多次平穩化處理后,可得到原始序列中的多組IMF分量和殘差表示:

從上述過程可以看出,EMD算法是一種將原始數據用多組特征波形進行疊加的算法,具體流程如圖6 所示。

Fig.6 Algorithm flow圖6 算法流程
將輸入的電力負荷數據序列通過經驗模態分解算法進行多時間尺度分解,得到若干個IMF分量和一個趨勢分量Rn。不同分量代表序列在不同時間周期上的波動規律,能更準確地反映電力負荷時間序列的變化,并保留序列本身的特征。
本文對原始電力負荷數據和生成的電力負荷數據分別求出其每個時間點上的平均值,將得到的兩個樣本轉換成電力數據曲線,通過EMD算法將兩個曲線進行經驗模態分解,便可得到其特征尺度數據序列和一個趨勢分量,如圖7、圖8 所示。從圖中可清晰看出生成的數據與原始數據樣本在時間分布上的相似程度,最后的趨勢分量更能體現生成數據可保留原始數據隨時間變化趨勢的特征規律,表明基于對抗生成網絡的模型能夠準確生成大量符合要求的負荷數據。

Fig.7 Raw data load curve圖7 原始數據負荷曲線

Fig.8 Data load curve圖8 數據負荷曲線
為進一步證明電力原始樣本與生產樣本之間的關系,對兩組數據使用皮爾遜分析法作相關性檢驗。皮爾遜相關系數是用來反映兩個變量線性相關程度的統計量。其中,r為相關系數,用來表現兩組被測數據之間的線性相關程度,r的絕對值越大,兩組變量之間的相關性越強;n為數據樣本數量,對應觀測值和均值。
兩個變量之間的皮爾遜相關系數定義為兩個變量之間的協方差和標準差的商:

皮爾遜相關系數體現了兩者之間的線性關聯性,系數取值總是在-1~1 之間,接近0 的變量被稱為無相關性,接近1 或-1 被稱為具有強相關性。
利用皮爾遜分析法對本文方法獲得的數據與傳統支持向量法和均值生成函數法獲得的數據進行分析,得到結果如表1、表2 所示。
從表1、表2 結果可以看出,原始的電力負荷數據與生成的電力負荷數據之間的皮爾遜相關性系數為0.971,而支持向量法的相關性系數為0.968,均值生成函數法的相關性系數為0.968。數據結果表明,本文方法比兩種傳統方法的相關性更強,證明了基于對抗生成網絡模型在電力負荷數據生成上的可行性與優越性。

Table 1 Descriptive statistics表1 描述統計

Table 2 Pearson correlation表2 皮爾遜相關性
在實驗過程中,傳統方法在數據生成上往往只能生成少量樣本,隨著深度學習和人工智能技術的發展,對于樣本數量的需求不斷增加。本文模型在訓練穩定后能充分學習原始數據分布規律,每一輪都可得到大量數據樣本,為增加神經網絡的泛化能力提供了大量數據支持,可提高電力系統的穩定性與可靠性。
電力負荷數據是電力設備與配電網設計的關鍵因素之一。社會經濟的發展對電力設備與配電網設計提出了更高要求,這就需要大量精準的電力負荷數據。本文基于實測數據使用DCGAN場景建模方法,通過實驗驗證了該方法在保留原始數據樣本時空規律特性等方面的能力,證明了該方法的可行性,能夠在數據樣本匱乏的情況下大量生成符合要求的數據。本文基于DCGAN的建模方法相比傳統場景建模方法能更好地體現無監督神經網絡的優越性,可降低人為因素影響、減少訓練時間、降低成本等。但是,如何改進DCGAN模型以更準確地把握電力負荷序列的時序特性,仍有待進一步研究。