











摘要:針對目前低壓配電網日線損預測精度較低,原始電力數據缺失和異常值問題,提出了一種包含數據預處理和改進LSTM預測網絡的雙階段線損率預測,及基于GAN擴充樣本,增加樣本多樣性的方法。改進LSTM預測網絡為一個融合多層LSTM的R-CNN深度學習網絡架構,可提取電力數據特征以及時間維度信息。通過實驗,與Bi-LSTM、LSTM自動編碼器、CNN-GRU、BL-Seq2seq相比,所提預測網絡的RMSE、MAE、RA2、訓練時間指標綜合性能最優。實驗結果表明,所提預測網絡在低壓配電網日線損率預測中可以獲得更好的預測精度,且模型訓練時間最短。
關鍵詞:低壓配電網;線路損失;深度學習;卷積神經網絡;循環神經網絡
中圖分類號:TP391;TM711文獻標志碼:A文章編號:1001-5922(2025)01-0188-05
A daily line loss prediction method for medium and low voltage distribution networks based on improved LSTM
BIAN Shufang,ZHANG Wei
(1.State Grid Jibei Electric Power Company Limited,Tangshan Fengrun District Power Supply Branch Co.,Ltd.,Tangshan 063000,Hebei China;
2.State Grid Jibei Electric Power Company Limited,Luanzhou Power Supply Branch Co.,Ltd.,Luanzhou 063700,Hebei China)
Abstract:In order to solve the problems of low accuracy of daily line loss prediction,lack of original power data and outliers in the current low-voltage distribution network,a two-stage line loss rate prediction method including data preprocessing and improved LSTM prediction network and a method based on GAN to expand the sample and increase the sample diversity were proposed.The improved LSTM prediction network was an R-CNN deep learning network architecture with multi-layer LSTM,which can extract features and temporal dimension information from power data.Through experiments,compared with Bi LSTM,LSTM autoencoder,CNN-GRU,BL-Seq2seq,the pro-posed prediction network had the best comprehensive performance in terms of RMSE,MAE,RA2,and training time indicators.The experimental results showed that the proposed prediction network can achieve better prediction ac-curacy in predicting the daily line loss rate of low-voltage distribution networks,and the model training time is the shortest.
Key words:low voltage distribution network;line loss;deep learning;convolutional neural networks;recurrent neu-ral network
正確計算低壓配電網中日線路損耗[1-2]對配電網的安全管理具有重要意義。由于低壓配電網布線復雜,線路長度和負載差異巨大,傳統方法預測性能較低[3]。因此,迫切需要引入新技術、新方法提升線損預測性能。隨著國家智能電網的不斷建設和5G、傳感器、通信[4,5]等技術的快速發展,低壓配電網的數據采集能力正在逐步提高,越來越多的數據可以應用于低壓配電網線損的計算。提出了一種基于卷積神經網絡(CNN)的線路損耗評估方法[6]。提出了一種基于大數據挖掘的配電網低電壓臺區線損診斷方法[7]。
循環神經網絡(RNN)及其變種長短時記憶(LSTM)、門控循環單元(GRU)等對處理和分析時間序列數據具有較大優勢[8-10],已廣泛應用于負荷預測、信號處理等領域。因此,部分學者將LSTM[11]、GRU[12]等具備學習時間維度特征的模型引入配電網臺區線損預測模型,以改善CNN等網絡的預測精度較低的缺點。針對上述問題,提出了一種改進LSTM的低壓配電網日線損率預測方法。該方法通過雙階段訓練,實現低壓配電網中日線損率準確預測。
1線損影響因子
為了提高低壓配電網中日線損率預測的精度,本節根據低壓配電網線損的影響機制構建特征因子。選用計算精度較高的等效電阻法,研究分析了低壓配電網線損的影響機理。低壓配電網簡化電路模型如圖1所示。
根據等效電阻法,低壓電網總線路損失的計算方程可以表示為:
式中:A為低壓電網中的總線路損失;N為配電網的結構參數,其根據接線模式而變化;k為負載形狀因子;Iav為變壓器二次側的平均電流;Reql為低壓電網的等效電阻;Kb為三相不平衡系數;t為運行時間;D為年日歷天數;mi為電表數量;Adbi為電表的月能量損失;AC為無功負載補償設備的能量損失。
由于靜態線路因素與動態運行因素相對分離,研究將低壓電網中的靜態線路因素和動態運行因素相結合,建立了一種混合因素表征和分析配電網線損影響機制。該混合因素為低壓配電網中所有用戶的供電距離和平均日用電量的平均乘積:
式中:Me為供電混合因素;Pi為用電設備i的功率;n為低壓配電網中的用電設備總數量;Di為用電設備i和配電網的變壓器之間的距離。
綜合考慮低壓配電網線損的所有因素,選擇了以下8個特征因素,包括供電半徑、低壓配電網總線路長度、低壓配電網中的用電設備數量、低壓配電網的負載率、三相不平衡度、負載形狀因子,功率因數和混合因素。
2線損率預測模型
所提線損率預測模型整體架構如圖2所示。
由圖2可知,該架構為一個典型的2階段框架,包括數據預處理和改進LSTM預測網絡。數據預處理階段包括基于GAN的樣本擴充以及對數據進行歸一化操作,從而為有效訓練奠定基礎。第二階段改進LSTM預測網絡為一個融合多層LSTM的R-CNN深度學習網絡架構,其中R-CNN用于特征提取,多層LSTM學習電力數據的時間維度信息。通過雙階段訓練,實現低壓配電網中日線損率準確預測。
2.1數據預處理
考慮到電表故障、天氣條件、存儲、通信等異常問題,配電網采集的電力數據將存在異常值和缺失值。這些異常值和缺失值將干擾正常訓練,必須在訓練前進行數據清洗。
GAN[13-15]通常由2個深度神經網絡組成:生成器和鑒別器。生成器模型學習如何生成與真實數據相似的分布,鑒別器模型學習如何區分生成樣本和真實樣本。令Tf為生成的樣本數量。z(i)RM,i1 2…Tf為擬合到生成器的輸入噪聲向量,其樣本均勻分布在[1 1]上;M為要生成的低壓配電網線損影響因素的數量。生成器的損失計算公式如下:
式中:?G為生成器的損失函數;DGz(i)為指示樣本為偽生成數據的概率;θg為生成器的參數。
在訓練過程中,鑒別器計算概率DGz(i),并給出偽生成樣本Gz和真實數據集F之間的差異。因此,鑒別器的訓練可總結為通過最小化真實數據和偽生成數據之間的損失函數:
式中:?d為鑒別器的損失函數;θd為鑒別器模型的參數。
在樣本擴充之后,應用Box-Cox[16-17]轉換技術將擴充后的數據轉換為更適合有效訓練的特定格式,以消除電力數據分布的偏移。Box-Cox變換如式(5)所示。
式中:di(λ)為第i個經Box-Cox變換計算的新樣本;di為第i個原始樣本;λ為變換參數。
應用最小-最大歸一化[18]技術將數據轉換到特定的范圍,從而消除數據維度可能給深度學習模型帶來的干擾。最小-最大歸一化公式如方程(6)所示。
式中:Di為第i個最小-最大歸一化后的數據;d為混合數據集中的最小值;d x為混合數據集中最大值。
2.2改進LSTM預測網絡
CNN[19]是一種眾所周知的深度學習架構,通常由4種類型的層組成:卷積層、池化層、全連接層和回歸層。卷積層運算的基本方程如式(7)所示。
式中:Cl為第l卷積層的輸出特征;σ為激活函數;x為卷積層的輸入;W為卷積層的權重;b為偏置。
由于強大的特征提取能力,CNN架構已廣泛應用于圖像分類、視頻分類、時間序列數據預測等領域[20]。然而隨著網絡深度增加到一定程度,CNN會出現模型性能飽和的退化問題。為了解決退化問題,有學者提出了CNN的變種算法R-CNN架構。研究提出了融合多層LSTM架構的R-CNN深度學習網絡架構。LSTM中每個門的操作如式(8)~式(10)所示。
式中:it、ft、ot分別為輸入門、遺忘門和輸出門的第t個特征狀態;W為權重;b為偏置;W和b的下標i、o、f分別代表輸入門、輸出門和遺忘門的權重和偏置;為激活函數;h為隱含層特征值;xt為輸入特征值。
所提出的改進LSTM預測網絡結構如圖3所示。
由圖3可知,該預測網絡包含3種類型的層:含4個卷積層,其中第3個卷積層(Cnov3)融合了第1個卷積層(Cnov1)和第2個卷積層(Cnov2)的特征。第4個卷積層(Cnov4)融合了第2個卷積層(Cnov2)和第3個卷積層(Cnov3)的特征。其次,多層LSTM中第1個LSTM層融合了第3個卷積層(Cnov3)和第4個卷積層(Cnov4)的特征。在LSTM的學習過程中,根據當前狀態和前一狀態更新不同單元的特征值,從而更新參數并最小化損失函數。最后,將特征轉發到FC層實現最終預測。
3實驗與分析
3.1數據集
實驗的數據集來自某區域收集的8 343組低壓配電網數據。每個低壓電網的特征因子每天采集1次,連續記錄15 d。經數據清洗后,剔除部分缺失數據,將清洗后的數據制作為原始數據集。接下來,應用GAN對數據集進行樣本擴充操作。訓練完成GAN后,將所有生成的數據均放置在訓練集中,而測試集中的所有數據都來自原始數據集。基于GAN的數據擴充方法如圖4所示。為了訓練預測網絡模型,將數據集按9∶1的比例劃分為訓練集和測試集。
3.2實驗設置
實驗時環境設置如下:其中硬件為Windows 10操作系統的臺式電腦,32GB RAM和GE-FORCE-GTX-2080-Ti GPU,Intel-Core-i7 CPU。軟件環境為pycharm2020社區版,網絡架構由Python 3.7中pytorch 1.8.1搭建并執行。Python中主要使用的模塊如下:pandas 0.25.1,numpy 1.17.2,matplotlib
3.1.1。預測網絡訓練時超參數設置如下:初始學習率為0.000 1,學習率衰減率為0.000 1,衰減周期為500,批量歸一化數量為128,dropout概率設置為0.25,迭代總次數為20 000。多層LSTM數量設置為3。
3.3結果與分析
3.3.1數據擴充對比實驗
首先,對于數據擴充方法的性能進行測試。實驗分別對比了原始數據集、SMOTE擴充數據集、GAN擴充數據集中數據統計情況。需注意,電力數據已經歸一化為0至1之間。比較指標包括:平均值、標準差、最小值、最大值、第一四分位數(Q1)、第二四分位數(Q2)、第三四分位數(Q3)。數據擴充對比實驗結果如圖5所示。
由圖5可知,與SMOTE擴充數據集相比,GAN生成數據與原始數據更加接近,即在統計上更顯著。實驗結果表明了經GAN數據擴充后,可有效提升數據質量。
3.3.2交叉對比實驗
主要利用均方根誤差(RMSE)、平均絕對誤差(MAE)、R-調和平方(RA2)、訓練時間等指標評估模型性能。RMSE表征測量實際值和預測值之間的差異。MAE為絕對誤差的平均值。RMSE和MAE指標的數學方程如式(11)、式(12)所示。
式中:fRMSE和fMAE分別為RMSE和MAE的值;n為觀測值的數量;yi為實際值;y(?)i為預測值。
為了消除特征因素數量的影響,引入了RA2指標,該指標定義為:
式中:R2 a 為指標RA2;p 為特征因素的數量;ym為觀測值的平均值。
為驗證所提配電網日線損率預測模型的性能,分別對比了Bi-LSTM、LSTM自動編碼器[8]、CNN-GRU[9]、BL-Seq2seq[10]等方法。表1所示為與其他基線方法對比結果。
由表1可知,與Bi-LSTM、LSTM自動編碼器、CNN-GRU相比,所提改進LSTM預測網絡在RMSE、MAE和RA2指標分別實現了較低的誤差率。與BL-Seq2seq相比,所提改進LSTM預測網絡RMSE、MAE和RA2指標誤差率相差不大,且RA2指標略低。然而訓練時間指標表明所提模型訓練性能最優,這表明所提改進LSTM預測網絡可通過較少的網絡參數獲取較優的預測性能。
4結語
(1)分析了配電網線損的物理和運行影響機制,構建了低壓配電網電氣特性因素;
(2)提出了低樣本數據下基于GAN的樣本擴充方法,從而提升樣本多樣性;
(3)構建了改進LSTM的低壓配電網日線損率預測網絡。該預測網絡為一個融合多層LSTM的R-CNN深度學習網絡架構,其中R-CNN用于特征提取,多層LSTM層學習電力數據的時間維度信息。通過雙階段訓練,從而實現低壓配電網中日線損率準確預測。
【參考文獻】
[1]唐賡.電網同期線損檢測系統的設計與實現路徑[J].粘接,2022,49(5):170-173.
[2]胡程平,陳婧,胡劍地,等.配電臺區線損率異常自動檢測系統設計[J].粘接,2022,49(5):188-192.
[3]田銘興,趙遠鑫,王江彬.基于等效的視在功率計算新方法[J].電力自動化設備,2017,37(9):153-158.
[4]梅建華,楊彥辰,云利軍,等.多視角人體紅外步態信息采集與處理[J].云南師范大學學報(自然科學版),2022,42(4):36-40.
[5]陶妍.基于5G的綠色寬帶通信系統研究與實現[J].云南師范大學學報(自然科學版),2022,42(3):42-46.
[6]肖榮洋,黃雁.基于卷積神經網絡的線路損耗智能評估方法研究[J].自動化與儀器儀表,2023(1):188-193.
[7]王堅,劉暢,張忠靜,等.基于大數據挖掘的配電網低電壓臺區線損診斷[J].自動化技術與應用,2023,42(12):124-127.
[8]龐傳軍,余建明,馮長有,等.基于LSTM自動編碼器的電力負荷聚類建模及特性分析[J].電力系統自動化,2020,44(23):57-63.
[9]吳永洪,張智斌.基于貝葉斯優化的CNN-GRU短期電力負荷預測[J].現代電子技術,2023,46(20):125-129.
[10]徐先峰,王世鑫,龔美,等.引入BL-Seq2seq模型進行負荷預測[J].計算機仿真,2021,38(8):103-107.
[11]吳龍雨,黃耀輝,邢藝騰,等.基于長短期記憶網絡的配電網臺區線損預測系統[J].電工技術,2021(9):60-62.
[12]生西奎,付強,于洋,等.基于深度學習GRU網絡的配電網理論線損計算方法[J].電測與儀表,2021,58(3):54-59.
[13]楊順,郝曉燕,馬垚,等.基于生成對抗網絡的差分隱私生成數據方法[J].計算機工程與設計,2024,45(1):39-46.
[14]趙宏,李文改.基于擴散生成對抗網絡的文本生成圖像模型研究[J].電子與信息學報,2023,45(12):4371-4381.
[15]陳麗,許思揚,劉芳,等.基于生成對抗網絡的OFDM信號生成[J].電子科技大學學報,2023,52(6):841-850.
[16]楊??瑥埥▌?,李慧琴,等.基于Box-Cox變換與隨機系數回歸模型的非線性退化設備剩余壽命預測方法[J].航空學報,2023,44(11):199-211.
[17]劉會家,江旭旭.基于BOX-COX變換與改進核密度估計潮流計算[J].電子測量技術,2022,45(14):65-70.
[18]楊寒雨,趙曉永,王磊.數據歸一化方法綜述[J].計算機工程與應用,2023,59(3):13-22.
[19]楊盼盼,郭楊成.基于深度學習的城市道路瀝青路面病害智能檢測仿真實驗[J].粘接,2023,50(12):174-178.
[20]許洪光,李鳳英,郭茜.機器學習算法改進及在化工故障診斷中的應用[J].粘接,2022,49(5):85-89.
(責任編輯:蘇幔,平海)