徐嚴軍,吳 蒙,白佳靈,丁熠輝,謝 智,盧 宏,肖先勇
(1.國網四川省電力公司計量中心,四川 成都 610045; 2.四川大學電氣工程學院,四川 成都 610065)
關口計量裝置是購售電雙方進行貿易決算的重要設備,計量的準確性和可靠性直接影響著貿易決算的公平性。計量裝置的異常狀態會導致售電公司存在大量資產流失的風險[1-2]。目前對關口計量裝置運行狀態的評價主要依靠檢修人員定期到現場對裝置進行檢修,造成人力和物力的嚴重浪費[3-4]。由于裝置的異常運行狀態會與計量過程中出現的一系列異常事件有關,這些異常事件的數據可以通過用戶用電采集系統獲得[5-7]。因此,基于用戶用電采集系統的數據,研究關口計量裝置的異常事件識別方法,可以為異常運行狀態的快速準確診斷提供依據,對保證貿易決算的公平性具有重要的意義。
針對目前對關口計量裝置進行周期性校驗存在的不足,國家電網公司[8]在2016年構建了用于電能表狀態評價的狀態量,并利用層次分析法對各狀態量進行了賦權,但這種方法僅采用離線數據進行驗證,缺少時效性。文獻[9]利用在線監測數據和現場校驗數據,采用多層次模糊評價法對指標進行賦權,實現對計量裝置運行狀態的評價,同時還采用了云自適應粒子群優化算法優化BP 神經網絡的預測模型,對其未來運行狀態進行了預測。文獻[10]提出了灰色關聯度與熵權理論組合的智能電表綜合評價方法。文獻[11]將泛在電力物聯網運用到智能電表的狀態評估中。文獻[12]提出了一種CRITIC法和理想點法相結合的計量設備運行質量評估方法。文獻[13]提出了一種基于信息融合的電能表運行狀態評價方法,考慮了電能表可靠度和計量異常等因素,并采用熵值法對選擇的指標進行賦權,最后結合地區影響因素實現了對電能表的動態狀態評價。
但上述文獻中的方法大多以選擇與計量裝置運行狀態有關的指標,并對選擇出的指標進行簡單賦權為主,狀態評價結果的有效性主要依賴于所選指標的準確性,指標權重選擇受人工干預,指標有效性和評價結果均難以有效驗證。由于異常事件的監測數據中含有大量與設備運行狀態有關的信息,從監測數據中可提取反映計量裝置狀態的相關特征,并構建特征到運行狀態的映射模型。因此,本文提出了一種多特征提取與深度學習相結合的關口計量裝置異常事件識別方法,利用深度學習方法構建異常事件特征與設備狀態的映射關系,并對所提方法進行了驗證。
關口計量裝置主要由安裝在關口處的電能表、電流互感器、電壓互感器和二次回路組成,在計量過程中會出現不同類型的異常事件。異常事件的運行數據包含了電網中的重要信息,如設備故障、負荷異常和人為竊電等情況,極大地影響計量的有效性和準確性[14-16]。因此,有必要對關口計量裝置異常事件的類型和原因進行分析。關口計量裝置異常事件的類型主要包括電量異常、電壓電流異常、時鐘異常和接線異常等,如圖1所示。
圖1 關口計量裝置常見異常事件類型
導致圖1中異常事件的原因眾多,主要可分為:
1)關口計量裝置故障
關口計量裝置組成元件眾多,由于裝置質量和現場安裝工藝,裝置會存在一定的缺陷。在長時間運行后,可能出現故障,引起計量數據出現異常,隨著時間的增加,計量的誤差逐漸增大,影響計量準確性和用戶滿意度。
2)人為竊電
人為竊電是造成計量數據異常的主要原因,用戶通過擅自篡改電能表接線方式,造成電能表慢走或停走,極大地損害了電網企業的利益。
3)終端故障
關口計量裝置的終端在長時間運行后可能會出現黑屏和軟件故障等問題,引起電能表的時鐘異常。若時鐘出現異常將導致計量的數據與當前的時刻不匹配,會影響電網對當前時刻用戶用電的評估。
異常事件的數據包含了關口計量裝置運行狀態的重要信息,從監測數據中提取相關特征是進行計量裝置運行狀態辨識的必要條件。通過第1節對計量異常事件的分析可知,這些異常事件的相關特征都會反映在監測數據中,并呈現出不同的數據形式。如果關口計量裝置在一段時間內重復發生這些異常中的一種或者幾種,會極大地影響裝置的壽命及計量準確性。因此,有必要對用電采集系統中采集到的常見異常事件的運行數據進行分析。本文以異常事件的產生機理和數據呈現形式為基礎,提取了不同異常事件的特征。
2.1.1 電量異常
電能表示值不平是指電能表的總電能示值與各費率電能示值之和不等。采用日正向有功總電量與日峰、平和谷段各個費率的總電能的差值來表征該異常事件的特征,計算公式為:
式中:P1——日正向-有功總電量;
A1、A2和A3——日峰、平和谷不同費率段的電量。
電能表飛走是指電能表示值出現快速增加的情況。采用日正向有功總電量與對應參考值的比值來判斷電能表示值是否快速增加,計算公式為:
其中P1_ref為日正向有功總電量參考值。
電能表倒走是指電能表示值出現下降的情況。采用連續兩日正向有功總電量的差值來判斷電能表示值是否出現了下降,計算公式為:
其中P1_bef為前一天記錄的日用戶正向有功總電量。
電能表停走是指非電廠用戶出現了電能表示值不變化的情況。此時可能是由于人為竊電引起的,在人為竊電時會出現反向有功電量,且每日的反向有功電量和日線損率都會逐漸增加,因此采用連續兩日反向有功電量的差值和連續兩日線損率差值來綜合表征該異常事件的特征,計算公式為:
式中:P2——日反向有功總電量;
P2_bef——前一天記錄的日用戶反向有功總電量;
ζ1和ζbef——當日線損率和前一天的線損率。
電能表自動核抄異常是指電能表的示值與主站保存的值不一致。采用日凍結的正向有功總電量與主站保存值的差值來表征該異常事件的特征,計算公式為:
其中P1_site為主站保存的日正向有功總電量。
2.1.2 電壓電流異常
電壓失壓是指出現某相電壓降低及電流增加的情況。采用某相電壓與正常運行時電壓的差值,及該相電流與電能表啟動電流的差值,綜合表征該異常事件的特征,計算公式為:
式中:uj——電壓(j=a,b,c);
ij——電流;
ist——電能表的啟動電流;
unormal——正常運行時的電壓值。
電壓斷相是指出現某相電壓明顯降低及電流下降的情況。由于電壓斷相與電壓失壓相比,電壓下降更明顯,因此采用某相電壓與電壓的下限閾值差值,及該相電流與電能表啟動電流的差值,綜合表征該異常事件的特征,計算公式為:
其中ulower為電壓的下限閾值。
電壓越限是指電壓超過設置的上限或下限閾值。采用各相電壓與正常運行時電壓值的差值來表征該異常事件的特征,計算公式為:
電壓不平衡是指排除電壓失壓和斷相情況下,三相電壓中出現不平衡的情況。采用三相中最大電壓和最小電壓的差值來表征該異常事件的特征,計算公式為:
其中ujmax和ujmin分別表示三相電壓的最大值和最小值。
電流失流指三相電流中任一相或兩相小于啟動電流。采用三相電流與電能表啟動電流的差值來表征該異常事件的特征,計算公式為:
電流不平衡是指排除電流失流情況下,三相電流出現不平衡的情況。采用最大電流與最小電流的差值來表征該異常事件的特征,計算公式為:
其中ijmax和ijmin分別表示三相電流的最大值和最小值。
2.1.3 時鐘異常
時鐘異常是指計量裝置的時鐘與標準時鐘的誤差過大。采用電能表時鐘與標準時鐘之間的差值來表征該異常事件的特征,如下式所示:
其中t1和tnormal分別表示電能表時鐘和標準時鐘的值。
2.1.4 接線異常
計量回路接線異常也可能引起反向電量異常。與電能表停走中由于人為竊電引起的反向電量異常相比較,此時的日線損率不會增加,因此采用日反向電量和連續兩日線損率差值來表征反向電量異常的特征,計算公式為:
潮流反向是指在計量過程中線路反接,造成采集到的值與真實值符號相反。采用三相電流來表征潮流反向的特征,計算公式為:
通過前面的分析,將不同的特征組合成向量的形式,可以得到關口計量裝置的初始特征向量X:
由于X中的數據可能出現量綱不統一的問題,會影響后續識別的準確性,因此需要對X中的數據進行歸一化處理。本文采用的方法是最大-最小值法,對應公式如下:
式中:Xi_nor——特征Xi經過歸一化的數據;
Xi_max和Xi_min——特征Xi的最大值和最小值。
由于特征之間存在一定的冗余性,不利于準確識別出異常事件,在特征內部還可能存在一系列更能與異常事件的類型相對應的隱藏特征。因此,需要從這些特征中進一步提取出更深層的特征,提高識別的效率和準確性。考慮關口計量裝置監測數據量大的特點,傳統數據挖掘方法不能有效地分析數據中隱藏的信息。深度學習方法是一種包含一個輸入層、多個隱藏層和一個輸出層的多層網絡,它能夠自動學習得到輸入數據中的非線性特征表達,建立輸出層與輸入層的映射關系,從而實現對數據的準確識別[17-18]。因此本文提出了基于多特征提取與深度學習的關口計量裝置異常事件識別方法,其中采用SAE作為深度學習模型,提取輸入數據的深層特征。
自動編碼器(auto-encoder,AE)是組成SAE的基本單元,由一個輸入層、一個隱藏層和一個輸出層組成,如圖2所示。AE的訓練結果由編碼和解碼獲得,對應的公式如下所示:
圖2 自動編碼器模型
式中:X——輸入數據,含有m個神經元;
Y——經過編碼獲得的特征表達,含有n個神經元;
Z——經過解碼過程獲得的數據,與X一樣具有m個神經元;
f1和f2——激活函數;
W1和W2——編碼和解碼矩陣;
b1和b2——偏置向量。
AE的訓練目標是使解碼后的數據Z近可能與輸入數據X相近,即隱藏層的特征Y就可以代表X的特征,實現對輸入數據特征的自動提取。但由于單個AE不能充分地挖掘出異常事件數據中的隱藏特征,因此需要通過堆疊多個AE形成SAE模型。利用SAE強大的特征提取能力,對關口計量裝置不同異常事件的數據進行學習,逐層提取輸入數據的隱藏特征,提取的隱藏特征更能代表輸入數據的類型,最終得到能夠準確識別不同異常事件的網絡模型。
本文提出了基于多特征提取和SAE的異常事件識別方法,流程如圖3所示。通過對在線監測數據的分析與處理,實現對關口計量裝置異常事件的識別,包括電量異常、電壓電流異常、時鐘異常、接線異常和正常情況。詳細步驟如下:
圖3 所提方法的流程圖
1)基于用電采集系統記錄到的三相電壓、電流和功率等數據,分析關口計量裝置常見的異常事件,并對異常事件的特征進行提取。然后將提取到的特征集利用式(16)進行歸一化處理,并將不同異常事件的數據標簽化。
2)將歸一化的數據按照3∶1的比例分為訓練集和測試集。其中訓練集作為SAE的輸入,通過SAE強大的特征提取能力,挖掘輸入數據中的隱藏特征,構建異常事件識別模型,從而提高異常事件識別的準確性。
本文構建的SAE模型由一個輸入層、多個隱藏層和一個輸出層構成。SAE將第一個AE的隱藏層作為整個網絡的第一個隱藏層,第二個AE的隱藏層作為第二個隱藏層,依次類推,最后獲得整個SAE模型[19]。圖4表示由兩個AE堆疊形成的SAE結構圖。
圖4 堆疊自動編碼器模型
SAE首先通過無監督學習預訓練整個網絡,然后通過有監督學習微調網絡參數,實現對深層特征的提取。通常采用均方誤差來構造代價函數L(W,b),采用最小化代價函數使構建的模型能夠最大化提取輸入數據的特征,減小訓練誤差,提高模型的準確性。
式中:λ——稀疏懲罰性參數;
KL(·)——KL 散度;
ρ——設置的一個接近為0的量;
通過調整網絡參數W和b來最小化代價函數,減少模型的訓練誤差[20]。對應的網絡參數更新公式如下所示:
式中:β——參數更新時的學習率;
Wij(l+1)和Wij(l)——第l+1、l層的權重參數;
bij(l+1)和bij(l)——第l+1、l層的偏置參數。
3)將測試數據輸入到訓練完成的異常事件識別模型中,得到異常事件識別結果,最后采用4.2節所示的評估指標對所提方法的識別性能進行評估。
本文分析的數據來自于某地區電網8個關口計量裝置終端的采集數據,數據包括正常計量裝置和異常計量裝置記錄的數據。監測數據的時間尺度為1年,每15 min采集1個點。數據類型包括三相電流、電壓、正反向有功和無功電能、峰平谷相加的總電能等。
其中每個關口計量裝置分別選擇了240個故障樣本,包含了電量異常、電壓電流異常、時鐘異常和接線異常,每種故障類型的樣本為60個。為了將不同的故障類型樣本與正常運行的樣本進行區分,還選擇了每個關口計量裝置的60個正常運行樣本。最后每種類型一共480個樣本,合計2 400個樣本。每種類型中的360個樣本用于訓練構造SAE模型,剩下的120個樣本用于測試模型的識別性能。詳細的樣本信息如表1所示。
表1 樣本信息
為了評估本文所提方法的性能,采用的評估指標包括準確率(Acc)、F1值和馬修斯相關系數(Matthews correlation coefficient,MCC)。其中 Acc為所提方法識別異常事件的準確率,表示識別正確樣本占總體樣本的比例。由于單一的指標并不能準確評估所提方法的性能,為了全面評估所提方法的性能,還采用了分類性能評估中常用的指標F1值和MCC值。F1值表示識別精確率和召回率的調和平均值,MCC值綜合考慮了樣本數據可能出現不平衡的情況,實現對每種類別識別結果的詳細統計分析,MCC值越靠近1,證明識別效果越好,能夠準確衡量所提方法的識別穩健性,相關的計算公式見參考文獻[21]和[22]。
將提取的特征進行歸一化處理后輸入到SAE中,并按照3∶1的比例將歸一化后的數據分為訓練數據和測試數據。首先分析異常事件與正常運行情況的識別結果,詳細的結果如表2所示。其中,以異常事件為正類,正常情況為負類。則TP表示將正類識別為正類的樣本總數量,TN表示將負類識別為負類的樣本總數量,FP表示將負類識別為正類的樣本總數量,FN表示將正類識別為負類的樣本總數量。
表2 異常事件與正常情況的識別結果
可以看出,本文方法的Acc、F1值和MCC值分別為97.17%、98.20%和91.80%,能夠從多種正常運行情況和異常事件中準確識別出異常事件,為檢修人員對關口計量裝置的異常事件及時處理提供了決策支持,提高了計量的經濟性與準確性。
為了進一步分析所提方法的詳細識別結果,還對每一類異常事件的識別情況進行了分析,獲得的結果如表3所示。由表可知,本文所提方法不僅能夠從在線監測數據中準確識別出異常事件,同時還能識別出異常事件的類型。識別電量異常的評估指標:Acc、F1值和 MCC值分別為 95.83%、96.64%和98.80%;識別接線異常的評估指標,有5個樣本被錯誤分類為接線異常情況,證明了這兩種異常事件的數據可能出現混淆的情況,后續可以通過進一步增加對應的判據,實現對這兩種類型的準確區分。同時,識別正常情況的評估指標:Acc、F1值和MCC值分別為99.17%、99.58%和99.48%,僅有1個樣本被錯誤分類為電量異常,防止了在實際情況中出現錯誤識別的問題,提高了識別的準確性。
表3 不同異常事件的識別結果
在識別出異常事件的類型后,檢修人員可有針對性地對出現異常的計量裝置做進一步的校驗,提高了工作的效率和準確性,更有利于構建關口計量裝置的智慧評價體系。
將本文所提方法與K近鄰(K-nearest neighbor,KNN)、決策樹(decision tree,DT)、支持向量機(support vector machine,SVM)、卷積神經網絡(convolutional neural network,CNN)進行比較,分析的數據都為經過多特征提取并進行歸一化的數據,并將歸一化后的數據輸入到不同分類方法的模型中,得到不同方法的識別結果,如表4所示。
表4 與其他方法的識別結果比較
由表可知,本文所提方法的評估指標比其他4種方法都更高。其中SVM相比KNN和DT方法的識別性能更好,Acc、F1值和 MCC值分別為91.83%、95.07%和83.08%,KNN的識別性能最差,Acc、F1值和 MCC值分別為 70.00%、79.64%和65.26%。而KNN和DT法相比于其他方法識別性能指標的值更低,主要原因是因為KNN僅利用常見的距離計算公式來衡量不同異常事件的類別界限,對于異常事件中存在大量相似數據的情況下,就會造成識別性能低。DT在訓練過程中會出現過擬合問題,同樣會造成識別性能劣于其他方法。CNN相比其他3種傳統的分類方法的性能更好,主要原因是CNN也能逐層提取輸入數據的特征,其特征識別性更強,但Acc、F1值和MCC值分別比所提方法低2.67%、1.72%和7.31%。主要原因是CNN多適用于對二維圖像的處理,在處理異常事件的特征時,可能出現過擬合的問題,降低識別性能。
本文所提方法采用深度學習中的SAE模型,相比于基于KNN、DT、SVM和CNN的分類方法,SAE模型不僅能夠逐層提取輸入數據的特征表達,實現對數據與標簽之間非線性映射關系的提取,得到數據中隱藏的特征,而且訓練過程中添加的稀疏懲罰性參數能夠防止模型出現過擬合,提高模型的魯棒性。通過SAE模型自動學習得到的不同異常事件類別的隱藏特征聚集度更高、識別性更強,更有利于從多種事件中準確識別出異常事件,證明了本文方法的準確性和可行性。
針對目前對關口計量裝置進行定期檢修和通過對狀態評估指標進行賦權的不足,本文提出了一種基于多特征提取與深度學習的關口計量裝置異常事件識別方法,獲得的主要結論有:
1)通過分析不同異常事件的產生機理,并基于不同異常事件的數據呈現形式,提取了對應的特征,這些特征與異常事件的類型有關,有利于后續構建準確的識別模型。
2)在提取不同異常事件的特征后,采用深度學習方法中的SAE模型,利用該模型強大的特征提取能力,獲得能夠準確識別異常事件類型的智能模型。結果表明,所提方法的性能評估指標比KNN、DT、SVM和CNN更優,魯棒性更好。
本文提出的計量裝置異常事件識別模型在每個事件單獨出現時,識別準確率高。但在實際情況中可能有多類型異常事件同時出現的情況,此時就需要研究復合異常事件下的數據表現形式,并提出對應的識別方法,后續將會做進一步的研究。