楊朝赟, 夏圣峰,江南,黃毅標,李渴,張逸
(1.國網福建省電力有限公司福州供電公司,福州市 350009;2.福州大學電氣工程與自動化學院,福州市 350108)
分布式電源、電力電子負荷和各種新型負荷大量接入配電網,使得配電臺區源荷的非線性和隨機性程度日漸加劇,各種電能質量問題越發顯著[1-2]。電壓指標對電能質量技術研究、生產管理而言具有重要意義。準確預測和分析電壓偏差、電壓總諧波畸變率等穩態電壓質量監測數據的變化趨勢[3],提早發現指標異常或超標問題,對于優化電網運行方式、實施精確治理、提高配電臺區電能質量水平尤為關鍵[4-5]。
近年來,穩態電能質量指標的預測分析研究受到廣泛關注[6-7]。基于穩態電能質量監測數據本身的規律,現有文獻分別從不同時間尺度對其進行了預測研究。文獻[8-9]均建立了基于灰色預測模型、線性回歸模型和隨機時間序列模型的優選組合預測模型,但局限于月穩態指標的預測,時間尺度大;文獻[4]從日指標時間序列入手,實現未來15天的指標預測;文獻[10]基于長短時記憶(long short-term memory,LSTM)網絡進行了諧波監測數據預測,涉及10 min、1 min和10 s這3種時間尺度的電壓總諧波畸變率和各次諧波電壓含有率等監測值,能夠預測到秒級、分鐘級的指標數據,但只能得到未來1天內的預測結果。上述文獻并未考慮穩態指標與外部信息的相關性。文獻[11]利用離網系統中穩態指標與溫度、電池狀態的關聯性進行預測。文獻[12]在指標預測時,更多地考慮了風電場天氣因素。文獻[13]考慮有功功率和穩態日指標之間的相關性,在得到有功功率預測值的基礎上,再將其輸入到神經網絡中用于電能質量指標預測,但存在的缺陷是直接處理時序數據,沒有依據兩種數據之間的相關性進行特征量篩選,有功功率的預測值極大程度上影響著穩態指標的預測結果,并且不同指標預測精度差別較大。
在預測對象及場景限定上,為了降低考慮各種相關因素時帶來的預測分析復雜性,文獻[4]選取負荷類型和容量等處于相對恒定的分析時段。文獻[14]針對具有非線性、單相獨立性和隨機波動性等電鐵一類的用電負荷,提出了一種基于蒙特卡洛(Monte Carlo)抽樣的電鐵電能質量預測方法,先處理牽引負荷的隨機波動性,再基于實測數據對諧波、負序電壓不平衡等指標作預測分析。上述文獻所提的預測方法由于限定了分析場景,并不適用配電臺區實際源荷的特點。
實際中公共連接點(point of common coupling,PCC)的穩態電壓質量水平與主要干擾源用戶的用電行為有明顯關系[15]。由于配電臺區負荷變化具有較強隨機性和周期性[16],電能質量監測數據會隨干擾源用戶生產用電行為表現出明顯的變化規律。在進行穩態指標預測建模時,預測精度在一定程度上依賴于建模數據合理性和全面性[17],如果忽略臺區不同用戶用電特征這一重要因素,在干擾源負荷發生一定變動時,電壓質量監測數據的單變量預測將丟失一些有價值的外部預測信息,會有較大偏差。
針對以上問題,本文將干擾源用戶用電和電壓質量指標變化結合起來,并且篩選出最具代表性的特征量,通過改進多變量預測提高預測模型性能和效率。本文提出一種基于相關性分析和LSTM網絡的電壓質量穩態指標預測模型。所提方法首先通過相關性分析篩選出強相關用戶數據,并基于此得到模型訓練的輸入量,接著建立基于LSTM的預測模型。最后,運用模型得到各個時刻的穩態數據,并對預測結果進行分析評價。
電能質量監測系統的監測數據和用電信息采集系統的平均有功功率數據分別反映了系統及所供電用戶綜合作用的電能質量水平[15]和用戶用電特性。文獻[15]將這兩類數據相結合,分析了用戶平均有功功率與電壓總諧波畸變率的時序相關性。對于其他的穩態電壓質量指標數據,如電壓偏差、電壓不平衡等,也能借鑒數據相關性思想得到類似的關聯規律。
福建某配電臺區中接入電網PCC的各用戶實際有功功率如圖1所示。從圖1可以看出,各用戶的實際有功功率曲線數據表現出不同的時序特點,在用電行為上表現出夜間用電、單峰用電、雙峰用電等類型[16]。該PCC處監測終端采集到的實測穩態指標有電壓總諧波畸變率和電壓偏差等,圖2為同一天內2種穩態電壓質量指標實測數據的95%概率大值變化曲線。《電能質量 公用電網諧波》(GB/T 14549—1993)中給出了實測值的95%概率值的近似獲取方法,即將實測值按降序排列,舍棄前面5%的大值,取剩余實測值中的大值。圖2(a)的電壓總畸變率時序呈現出夜間高峰、白天低平的形態,而圖2(b)的電壓偏差在凌晨維持相對較高的數值,并且在午間有明顯突變。

圖1 不同用戶同一天內有功功率曲線Fig.1 Curves of active power of different users on the same day

圖2 穩態電壓質量指標曲線Fig.2 Curves of voltage quality steady-state indices
從直觀上可以看出,在圖1所示這一天內,用戶4的用電負荷曲線和電壓總諧波畸變率的變化規律具有相似性,在夜間時段有峰值而白天保持平穩且低值的特征,可認為用戶4的用電行為與電壓總諧波畸變率存在正相關性。對比電壓偏差曲線和不同用戶有功功率曲線,用戶8對應曲線的時序特點和電壓偏差趨勢正好相反,粗略認為這一天中兩者有負相關性。
從實際數據的時間序列曲線來看,穩態指標和有功功率存在一定的關聯性,由此可進一步定量這2種數據之間的相關性,從而進行穩態電壓質量預測分析。
動態時間規整算法(dynamic time warping,DTW)[18],能夠衡量2個非對齊時間序列的相似程度。通過序列之間的動態化匹對,可以得到電壓質量監測數據和各個用戶有功功率時間序列之間的距離矩陣,從而定量分析各用戶平均有功功率與電能質量指標的相關性。
設分析時段內電能質量監測終端采集的時段總數為n,用電采集系統采集的時段總數為η,則有2個時間序列的矩陣形式,分別表示為式(1)和式(2)。
X=[x1,x2,…,xi,…,xn]
(1)
Pk=[p1,p2,…,pj,…,pηk]
(2)
式中:X代表某類型電壓質量穩態監測數據序列;xi代表第i個數值,共有n個數;Pk代表某個用戶k的有功功率時序;pj代表第j個數值,共有ηk個數。監測數據類型有電壓總諧波畸變率(total voltage harmonic distortion,THDu)、各次諧波電壓含有率、電壓偏差、電壓不平衡等。
定量計算電壓質量監測數據和某個用戶有功功率數據之間的距離時,定義一個大小為n×ηk的距離矩陣D,其中D[i,j]表示矩陣X中第i個數xi與用戶k的Pk矩陣中第j個數pj之間的歐氏距離,計算表達式為式(3)。
(3)
DTW距離基于距離矩陣D中的元素迭代而得,記累積距離矩陣為S,迭代初值S[1,1]為D[1,1]。
先計算矩陣S中第一行和第一列的所有元素項,第一列中第二行起行元素S[i,1]表達式為式(4),第一行中第二列起列元素S[1,j]表達式為式(5)。
S[i,1]=D[i,1]+S[i-1,1],2≤i≤n
(4)
S[1,j]=D[1,j]+S[1,j-1],2≤j≤ηk
(5)
然后,針對2≤i≤n,2≤j≤ηk的情況,基于矩陣S中已知的行元素和列元素,比較3個元素S[i,j-1],S[i-1,j],S[i-1,j-1]的最小值,將最小累積距離項加上此時的D[i,j],作為新元素S[i,j],再依次迭代計算新的累積距離項,更新S中的元素。具體的計算表達式如式(6)所示。
(6)
直至i=n且j=ηk時,S[n,ηk]的數值是整體最小累積距離[15],即為2個序列的DTW距離,代表該用戶k與電能質量監測數據在趨勢特征和時間特征上的相似度,距離值越小,則兩者相似度越高。
通過以上分析,本文篩選出與穩態電壓質量數據相關性強的用戶有功數據,將其作為預測模型的輸入量。在臺區負荷種類多且容量變化大、電能質量問題復雜的背景下,結合2種數據的時序特性和內在關聯性,能夠有效預測穩態指標的變化趨勢。
LSTM作為循環神經網絡(recurrent neural network,RNN)的改進形式,隱含層更為復雜。與RNN一樣,LSTM網絡專門用于處理序列數據,且能夠處理過長的輸入序列[19]。LSTM網絡可設置為多輸入單輸出模型,適用于本文中的序列分析問題,即通過多特征量時序數據(穩態電壓質量指標監測數據、用戶有功功率數據等)進行穩態電壓質量預測。LSTM存在多種變體形式[20-22],最基本的LSTM網絡中包括3個門控結構,通過遺忘門、輸入門和輸出門實現對信息的添加和刪除操作。
LSTM的內部結構如圖3所示,每個門包含一個Sigmoid神經網絡層和一個點乘操作,用σ表示Sigmoid激活函數。

圖3 LSTM內部結構示意圖Fig.3 Schematic of LSTM cell structure
1)由遺忘門的Sigmoid層決定是否舍棄一些信息,其運算結果為1時代表保留,為0時即為舍棄信息。
ft=σ(Wf·[ht-1,xt]+bf)
(7)
式中:ft為遺忘門運算結果;Wf為遺忘門權重矩陣;xt、ht-1分別為當前時刻的輸入與上一時刻LSTM的輸出;bf為遺忘門偏置項。
2)根據輸入門的Sigmoid層加入新信息,并結合tanh層得到的候選值,得到狀態更新量。
it=σ(Wi·[ht-1,xt]+bi)
(8)
(9)

綜合考慮1)中丟棄的信息,可以得到當前時刻的單元狀態。
(10)

3)由輸出門的Sigmoid層決定輸出哪些信息,再結合經tanh層處理后的候選單元狀態,得到輸出。
Ot=σ(Wo·[ht-1,xt]+bo)
(11)
ht=Ot·tanh(Ct)
(12)
式中:Ot為輸出門的運算結果;ht為當前時刻的輸出;Wo和bo分別為輸出門的權重矩陣和偏置項。
具體到本文,LSTM網絡模型的輸入x為電力用戶有功功率數據和穩態電壓質量歷史監測數據,最終預測模型輸出量即為穩態監測數據預測值。
本文預測模型的構建步驟包含以下幾個內容:
1)數據預處理,對某時段10 kV母線PCC處監測終端采集的電壓質量監測數據和所接用戶的有功功率數據作缺失值填充和歸一化處理。
2)根據DTW算法,對各類用戶的有功功率數據與穩態電壓質量數據進行相關性分析,選擇關聯性較強的用戶用電數據,和穩態監測數據一同作為構建LSTM模型的數據集。
3)將數據集劃分為訓練集、驗證集和測試集,并基于LSTM網絡構建DTW-LSTM預測模型。
4)在訓練好預測模型的基礎上,利用測試數據集獲得預測值,并作反歸一化處理,對比真實值來評估模型性能。
3.1.1原始數據集
2020年4月15日至21日的原始THDu時序數據圖4所示,同一時段內10個用戶的有功功率時序數據如圖5所示,圖5中用2個子圖依次展示大工業用戶(用戶2、用戶9、用戶10)和普通工業用戶的生產用電情況。

圖4 電壓總諧波畸變率時間序列Fig.4 Time series of total harmonic distortion of the voltage

圖5 多用戶有功功率時間序列Fig.5 Time-series of active power of the users
3.1.2關聯性篩選
由圖4和圖5可知,2種時序數據都表現出一定的變化規律。經歸一化等預處理以后,序列之間通過DTW算法進行動態化匹配,取滑窗T=96,可以得到相關系數,即DTW距離。THDu與有功功率的相關性測度如表1所示。根據1.2節的相關性測度思想,DTW距離值越小,則相應用戶有功數據與THDu相似度越高。表1中用戶x2、x9、x10對應的DTW數值相對較小,可以認為,在分析時段內,用戶2、用戶9和用戶10的有功功率時序與THDu時序具有較強相關性,后續將這3個用戶的有功功率數據作為模型輸入量。

表1 THDu與有功功率的相關性測度Table 1 Correlation measure between THDu and active power
3.1.3數據集拆分
考慮到用戶采集數據與監測數據的存儲周期不同,前者每個數據點間隔15 min,后者為每3 min一個點,所以在同一分析時段內,2種數據的總數是不一致的。為了使輸入特征量和預測輸出量的時刻一一對應,在此作簡化處理,對于穩態電壓質量指標依次間隔15 min,即每5個數據點,取相應監測數據作為新的數據點。由此,把篩選出的用戶群有功功率數據和THDu數據整合成若干組對應同一時刻的數據集。
預測模型樣本輸入特征量包括經篩選后若干用戶的有功功率數據和PCC處穩態電壓質量歷史監測數據,各輸入特征量的樣本總數均為1 343。同一時刻的數據點看作一組數據,則得到對應1 343個時刻的輸入樣本對。本文構建的預測模型為單輸出模型,以每一組輸入特征量數據作為前一狀態量,輸出下一時間點的穩態電壓質量監測數據。
針對為期2周的數據集,本文取前7天的數據按6:2:2的比例劃分為模型訓練集、驗證集和測試集,訓練集和驗證集數據用于建模,剩下數據作為測試數據,用來檢驗LSTM模型的預測準確性。
評估模型預測結果時,本文采用平均絕對誤差(mean absolute error,MAE)和均方根誤差(root mean square error,RMSE),分別按式(13)、(14)計算,值越小則代表預測值與實際值越接近,預測模型性能好。
為了消除刀片淬火時產生的內應力以及得到硬度較高、穩定性好的回火馬氏體,采用回火溫度為150~250℃的低溫回火,試驗中選擇170℃進行低溫回火。
(13)
(14)

本文通過Keras深度學習框架搭建一個2層隱層的LSTM網絡,首先建立一個Keras序列模型Sequential[10],在此框架中依次加入輸入層、隱含層和輸出層。分為以下2種情況進行分析,標識為“情況一”“情況二”。
3.3.1用戶日用電行為相對恒定(情況一)
這里以3.1.2節的篩選結果為例,所以輸入層有4個特征量,即3個強相關的用戶數據和歷史THDu數據;設置2個隱層,分別有50、32個神經元,激活函數均為線性整流函數(rectified linear unit,ReLU);預測模型為單輸出,故輸出層包含1個神經元,選擇線性函數作為激活函數。優化算法利用自適應時刻估計法[23](adaptive moment estimation, ADAM)。當監測數據類型或監測點類型發生變化時,需要調整模型結構參數,以達到較好的預測效果。
本文將前7天的數據按6:2:2的比例劃分,測試集記為測試樣本1。為了驗證預測模型的泛化性,將后6天的數據,即2020年4月23日至28日的數據全部作為測試集,記為測試樣本2。
基于相關性分析得到的訓練數據集,考慮了監測點處歷史穩態電壓指標監測數據和用戶有功功率數據這2種類型數據的關聯關系,篩選高相關度的用戶數據作為輸入量,即為改進多輸入量的輸入方式,并將此構建的模型記為DTW-LSTM模型。對比另外2種情況構建的LSTM模型,一是僅依據穩態電壓指標歷史監測數據進行預測,即為單輸入量模型;二是在歷史監測數據的基礎上,引入對應監測點下所有用戶有功變量作為輸入量,即為多輸入量模型。情況一中THDu的預測誤差統計結果如表2所示。

表2 情況一中THDu的預測誤差統計Table 2 Forecast error statistics of THDu in the first case
類似地,根據電壓偏差與用戶用電數據相關性分析結果,篩選出特征數據,并仍以6:2:2的比例構建數據集,進行該穩態指標的模型訓練和預測分析。表3展示了3種預測模型的誤差結果,其中“測試樣本1”和“測試樣本2”對應的時段與表2中2個測試樣本數據的一樣。

表3 情況一中電壓偏差的預測誤差統計Table 3 Forecast error statistics of voltage deviation in the first case
通過對比該監測點的電壓總諧波畸變率和電壓偏差預測結果,可以看出:
1)當所有用戶數據都作為模型訓練集時(LSTM+多輸入量),RMSE數值相對較大,甚至不如單純依靠歷史監測數據時(LSTM+單輸入量)的預測結果;
2)選取和穩態數據相關性較強的干擾源用戶數據,也就是DTW-LSTM,基于測試樣本1得到的誤差指標MAE和RMSE數值小,改善了穩態監測數據的短期預測效果;
3)預測模型在預測未來時段的穩態指標數據(測試樣本2)時,MAE和RMSE指標數值變大,DTW-LSTM模型預測精度有明顯降低趨勢。
本文從多輸入量中舍棄與穩態電壓質量指標弱相關或無關的用戶用電數據,充分利用了對指標預測有價值的數據。將相關程度高的變量作為訓練參數,在提高模型短期預測精度上有優勢。但在所分析的時間尺度下,該監測點負荷類型和容量等相對恒定,無法涵蓋用戶所有的運行工況,且可能遺漏了監測數據重要的趨勢特征和變化規律,使模型在預測樣本2時的效果不夠好。
3.3.2用戶日用電行為發生變化(情況二)
針對3.3.1節DTW-LSTM在預測測試樣本2時效果不佳的情況,鑒于該建模數據集對應時間段內各個用戶日用電特性較為穩定,故選取另一監測點的電壓質量監測數據和用戶用電數據作預測分析。該點接有明顯用電行為變化的用戶,由此盡可能多地捕捉用戶用電與電能質量數據之間的關聯特征,進一步檢驗DTW-LSTM模型在預測未來時段穩態指標的效果。
用戶“飛龍塑鋼”有功功率時間序列如圖6所示,不同于圖5中各個用戶每天保持相對穩定的生產作業情況,該用戶存在周末停產休息的工況。

圖6 某用戶有功功率時間序列Fig.6 Time series of active power of a power user
本文同樣構建了單輸入量、多輸入量LSTM模型以及DTW-LSTM模型來預測該點穩態電壓質量指標數值。
預測模型需要使用新的數據,類似于3.3.1節中的數據集拆分規則,依次劃分出訓練集和測試樣本。同樣在新數據集中形成2份測試樣本,規則為:前7天的新數據集按訓練集、驗證集、測試集三者比例為6:2:2劃分,其中測試集記為測試樣本3;將后6天的數據全部作為測試集,記為測試樣本4。并設置模型參數,重新訓練后再進行預測。以新監測點的THDu和電壓偏差為例,其預測誤差結果見表4、表5。

表4 情況二中THDu的預測誤差統計Table 4 Forecast error statistics of THDu in the second case
根據表4、表5中的預測誤差結果可以得出,與3.3.1節存在一致性的2點結論,即:1)對比分別以單輸入量和多輸入量作為訓練數據集的LSTM模型,后者預測誤差指標MAE和RMSE均大于前者,換句話說,多輸入量的LSTM模型并不能提升預測性能;2)通過改進多輸入量建立的DTW-LSTM模型,在預測短期測試樣本數據(測試樣本3)時,MAE及RMSE指標數值比其他2種預測模型的小,預測效果好。

表5 情況二中電壓偏差的預測誤差統計Table 5 Forecast error statistics of voltage deviation in the second case
同時,通過對比測試樣本3和測試樣本4的預測誤差可知,在用戶用電特性變化大時,考慮了強相關特征量的DTW-LSTM模型在預測未來的穩態指標數據變化情況時效果顯著。
本文建立了基于DTW-LSTM網絡的穩態電壓質量指標預測模型,通過對實際數據應用與分析,得到以下結論:
1)不加以特征篩選的多輸入量LSTM模型,會引入對預測分析意義不大的特征量,使得預測誤差較大;
2)不同場景下,DTW-LSTM預測模型都使得穩態指標短期預測誤差減小;
3)當分析時段內,用戶每日用電特征具有明顯差異時,改進多輸入量DTW-LSTM模型由于結合了監測點下各類用電負荷不同的運行情況,所以能夠更好地挖掘出與穩態指標關聯的數據特點,提高了穩態指標短期及長期預測精度。
后續將考慮臺區用戶長期用電特性,結合監測點下各個用戶不同的用電特點進行特征提取和篩選,并研究多尺度數據融合技術,得到數據量和信息量比較完整的建模數據集。同時針對除電壓質量指標以外的其他穩態電能質量指標,開展進一步的應用研究。