王鵬飛, 湯銘, 杜元翰, 李效龍
(1.國網(wǎng)江蘇省電力有限公司信息通信分公司, 江蘇, 南京 210024;2.國電南瑞科技股份有限公司信息系統(tǒng)集成分公司, 江蘇, 南京 211100)
當(dāng)前國內(nèi)的用電信息采集系統(tǒng)包括居民用電計量系統(tǒng)、企業(yè)用電計量系統(tǒng)和變電站負(fù)荷流量計量系統(tǒng)。張慧[1]認(rèn)為居民用電計量系統(tǒng)以居民用電電能表為核心設(shè)備,目前國內(nèi)絕大部分地區(qū)均已經(jīng)普及了實時費控電能表系統(tǒng),可以將居民用電按照尖峰平谷4個時段進(jìn)行分別計量,當(dāng)前部分地區(qū)開始逐漸普及擁有遠(yuǎn)程物聯(lián)網(wǎng)抄表功能和實時錄波功能的電能表系統(tǒng)。妙紅英等[2]指出企業(yè)用電計量系統(tǒng)包括企業(yè)用電專變的電流互感器和電壓互感器系統(tǒng)支持的用電負(fù)荷計量系統(tǒng),該計量系統(tǒng)與變電站負(fù)荷流量計量系統(tǒng)結(jié)構(gòu)相似,但后者結(jié)構(gòu)更為復(fù)雜多變,精密度和難度系數(shù)也更高。
馬吉科等[3]在實現(xiàn)用電信息采集系統(tǒng)自診斷功能的過程中,其核心原理為對某一負(fù)荷的用電數(shù)據(jù)特征進(jìn)行大數(shù)據(jù)畫像,當(dāng)該畫像數(shù)據(jù)出現(xiàn)突變時,即有可能出現(xiàn)計量系統(tǒng)的故障。但也可能會出現(xiàn)用戶大負(fù)荷用電器的增撤或者用戶實施了竊電行為。
使用多列神經(jīng)網(wǎng)絡(luò)技術(shù),判斷畫像數(shù)據(jù)變化的同時,在不完備數(shù)據(jù)的前提下[4],實現(xiàn)對計量系統(tǒng)故障、用電器配置變更、用戶竊電等三大主要可能性做出基于大數(shù)據(jù)深度挖掘的主動判斷,是該研究的核心創(chuàng)新點。
部分居民用電計量系統(tǒng)僅可記錄每月的用電量數(shù)據(jù),所以考察所有計量設(shè)備的每月雙向分時用電量數(shù)據(jù)作為該數(shù)據(jù)挖掘的數(shù)據(jù)來源,采用綜合差值法對上述數(shù)據(jù)進(jìn)行升維,使單一數(shù)據(jù)來源條件下的數(shù)據(jù)細(xì)節(jié)得到充分展現(xiàn),解決數(shù)據(jù)不完備問題。
圖1中,對數(shù)據(jù)求取以下多次差值,以實現(xiàn)數(shù)據(jù)的升維。

圖1 基于差值法的數(shù)據(jù)升維方案
計算雙向尖峰平谷計量數(shù)據(jù)環(huán)比差值,得到8個直接環(huán)比差值數(shù)據(jù);計算雙向尖峰平谷計量數(shù)據(jù)的同比差值,得到8個直接同比差值數(shù)據(jù);針對上行或者下行數(shù)據(jù),計算尖時與峰時數(shù)據(jù)差值、峰時與平時數(shù)據(jù)差值、平時與谷時數(shù)據(jù)差值、谷時與尖時數(shù)據(jù)差值,得到8個計量時段間的差值結(jié)果;對本月計量時間段差值結(jié)果按照第1步和第2步,分別計算其環(huán)比差值和同比差值,各得到8個二次差值數(shù)據(jù),共16個二次差值數(shù)據(jù)。至此,得到40列差值升維數(shù)據(jù),使可提供給畫像模塊的數(shù)據(jù)量得到充分?jǐn)U充。
基于設(shè)計需求,需要對計量系統(tǒng)故障、用電系統(tǒng)變更、竊電行為影響等3種計量數(shù)據(jù)畫像變更的影響原因作出判斷,所以構(gòu)建3列相對獨立的多列神經(jīng)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)挖掘分析。每列神經(jīng)網(wǎng)絡(luò)構(gòu)建結(jié)構(gòu)2個相同但獨立運行的神經(jīng)網(wǎng)絡(luò)模塊。最終分別輸出3個二值化結(jié)果[5]。該架構(gòu)如圖2所示。

圖2 多列神經(jīng)網(wǎng)絡(luò)架構(gòu)圖
圖2中,未對48列輸入數(shù)據(jù)進(jìn)行模糊化處理,其原因為該48列輸入結(jié)果的量綱統(tǒng)一為kWh,可以在輸入神經(jīng)網(wǎng)絡(luò)時將其強制轉(zhuǎn)化為最適應(yīng)神經(jīng)網(wǎng)絡(luò)運行的雙精度浮點變量(Double)格式,神經(jīng)網(wǎng)絡(luò)之間和神經(jīng)網(wǎng)絡(luò)節(jié)點之間的數(shù)據(jù)傳導(dǎo),也采用雙精度浮點變量(Double)格式數(shù)據(jù)。經(jīng)過二值化模塊輸出的數(shù)據(jù)雖然收斂到1.000和0.000附近,但其數(shù)據(jù)結(jié)構(gòu)仍然為雙精度浮點變量(Double)格式,需要在后續(xù)故障判斷模塊中給出如式(1)的判斷過程將其整理為邏輯型變量[6],

(1)
式中,當(dāng)神經(jīng)網(wǎng)絡(luò)輸出值大于0.900時,故障判斷模塊輸出邏輯真值(Logical格式),當(dāng)神經(jīng)網(wǎng)絡(luò)輸出值小于0.100時,故障判斷模塊輸出邏輯假值(Logical格式),當(dāng)神經(jīng)網(wǎng)絡(luò)輸出值介于0.100和0.900之間時,認(rèn)為該神經(jīng)網(wǎng)絡(luò)模塊未有效收斂,該神經(jīng)網(wǎng)絡(luò)模塊自身故障。
即該神經(jīng)網(wǎng)絡(luò)模塊可能存在2種自身故障模式。
(1)其中1列輸出的二值化結(jié)果介于0.100和0.900之間。
(2)同時出現(xiàn)2列或3列輸出的二值化結(jié)果大于0.900。
在對該神經(jīng)網(wǎng)絡(luò)模塊進(jìn)行數(shù)據(jù)訓(xùn)練時,應(yīng)確保在多次判斷過程中,均不出現(xiàn)上述2種自身故障,方認(rèn)為該神經(jīng)網(wǎng)絡(luò)在訓(xùn)練中充分收斂。
上述多列神經(jīng)網(wǎng)絡(luò)整體設(shè)計中,每1列神經(jīng)網(wǎng)絡(luò)模塊均包含1個降維模塊和1個二值化模塊。3列神經(jīng)網(wǎng)絡(luò)中,對應(yīng)的降維模塊和二值化模塊內(nèi)部結(jié)構(gòu)相同但訓(xùn)練收斂過程中的待回歸變量賦值內(nèi)容不同,以形成對3種不同計量系統(tǒng)故障原因的判斷功能。以下討論該降維模塊和二值化模塊的設(shè)計過程。
(1)降維模塊
降維模塊將經(jīng)過前置基于差值法升維計算的48列數(shù)據(jù)進(jìn)行降維處理,輸出1個雙精度浮點型變量(Double格式),因為數(shù)據(jù)降維過程會造成大比例的信息損失,損失信息量需要使用降維模塊的待回歸變量進(jìn)行消化[7]。所以,常規(guī)降維模塊的節(jié)點設(shè)計采用多項式回歸函數(shù),其基函數(shù)如式(2):
(2)
式中,Xi為輸入變量集中的第i個輸入量,Y為節(jié)點輸出量,j為多項式階數(shù),Aj為第j階多項式的待回歸系數(shù)。
因為該多項式回歸函數(shù)擁有6個待回歸系數(shù),所以能有效的處理數(shù)據(jù)降維過程中的信息損失量。借鑒相關(guān)研究的設(shè)計方案,采用40%的降維壓縮率,每一層隱藏層將數(shù)據(jù)維度壓縮40%,故形成表1中的降維模塊分層架構(gòu)。

表1 降維模塊分層架構(gòu)設(shè)計參數(shù)表
表1中,除輸入層和輸出層外,共設(shè)計3層隱藏層架構(gòu),隱藏層共包含32個節(jié)點,整個模塊共包含81個節(jié)點。所有節(jié)點均采用式(2)的六階多項式回歸函數(shù)進(jìn)行節(jié)點設(shè)計。該降維模塊輸出的數(shù)據(jù),輸入到二值化模塊中進(jìn)行二值化處理。
(2)二值化模塊
二值化模塊的統(tǒng)計學(xué)意義在于使降維模塊輸出的結(jié)果實現(xiàn)二值化,即使其投影向1.000或0.000進(jìn)行偏移。與降維模塊需要的較大數(shù)據(jù)處理量不同,二值化模塊的設(shè)計較為簡單,數(shù)據(jù)挖掘需求較為單一。大部分?jǐn)?shù)據(jù)投影整理工作均交由降維模塊處理,二值化模塊僅提供一次后置的數(shù)據(jù)重投影處理[8]。
二值化模塊采用二值化函數(shù)進(jìn)行節(jié)點設(shè)計,其節(jié)點基函數(shù)可寫作式(3):
Y=∑(A·eXi+B)-1
(3)
式中,Xi為輸入變量集中的第i個輸入量,Y為節(jié)點輸出量,e為自然常數(shù),此處取近似值e=2.718 281 828,A、B為節(jié)點待回歸系數(shù)。
因為二值化模塊無數(shù)據(jù)升維與降維操作,其隱藏層設(shè)計目的為確保模塊內(nèi)擁有足夠的待回歸系數(shù)資源,且使該模塊占用的算力資源足夠小。所以,該二值化模塊的架構(gòu)設(shè)計采用表2方案。

表2 二值化模塊分層架構(gòu)設(shè)計參數(shù)表
表2中,該二值化模塊的輸入層和輸出層均為1個節(jié)點,隱藏層分別包含3個、7個、3個節(jié)點,整個模塊含輸入層輸出層在內(nèi),共包含15個節(jié)點,所有節(jié)點均采用式(3)二值化函數(shù)進(jìn)行節(jié)點設(shè)計。
該系統(tǒng)在早期系統(tǒng)中并無可參照系統(tǒng)作為仿真驗證參照組數(shù)據(jù)。本實驗對比的早期方法指,對居民用電計量系統(tǒng)、企業(yè)用電計量系統(tǒng)、變電站負(fù)荷流量計量系統(tǒng)進(jìn)行分別管理,利用較為復(fù)雜的工作流程,特別借助計量人員的現(xiàn)場確認(rèn)和設(shè)備拆檢確認(rèn)故障類型[9-10]。所以,仿真驗證參照組數(shù)據(jù)來自早期計量稽查工作的綜合日志數(shù)據(jù)。
觀察組數(shù)據(jù)來自該系統(tǒng)經(jīng)過充分訓(xùn)練收斂后,帶入近3年相關(guān)數(shù)據(jù)進(jìn)行數(shù)據(jù)仿真運行,從而確定其實際數(shù)據(jù)挖掘效能。仿真系統(tǒng)為電力CAE系統(tǒng)中的SimuWorks模塊,該模塊在電力管理信息系統(tǒng)驗證中屬于成熟技術(shù),具有較強的穩(wěn)定性和可用性。
判斷人工介入的早期判讀結(jié)果和該系統(tǒng)給出的判讀結(jié)果,可以得到表3中的仿真驗證對比數(shù)據(jù)。

表3 判斷敏感性仿真驗證對比數(shù)據(jù)
表3中,t值來源與使用SPSS24.0對仿真數(shù)據(jù)進(jìn)行雙變量t校驗的直接輸出結(jié)果,該結(jié)果小于10.000時,認(rèn)為數(shù)據(jù)存在統(tǒng)計學(xué)差異,且t值越小,認(rèn)為數(shù)據(jù)差異性越大。P值來源為使用SPSS24.0對仿真數(shù)據(jù)進(jìn)行雙變量t校驗的log變量輸出值,當(dāng)P<0.05時,認(rèn)為該雙變量t校驗結(jié)果處于置信空間內(nèi),當(dāng)P<0.01時,認(rèn)為該雙變量t校驗結(jié)果具有顯著的統(tǒng)計學(xué)意義。經(jīng)過分析,上述4組比較結(jié)果中,均出現(xiàn)t<10.000,P<0.01的分析結(jié)果,證實該系統(tǒng)較早期方法有顯著的統(tǒng)計學(xué)差異。在計量系統(tǒng)故障、用電系統(tǒng)變更、竊電行為影響和總和敏感性方面,該系統(tǒng)較早期方法分別實現(xiàn)了14.3%、83.7%、36.3%、34.8%的計算效能提升。
使用多列神經(jīng)網(wǎng)絡(luò)系統(tǒng)可以將功能細(xì)分化,在僅考察電能計量系統(tǒng)的上行和下行計量結(jié)果中的每月尖峰平谷分時數(shù)據(jù),即可判斷計量系統(tǒng)的主要故障,給出該故障的實際原因。該系統(tǒng)投入使用后,針對居民、廠礦企業(yè)、變電站的計量系統(tǒng)故障自診斷管理將實現(xiàn)統(tǒng)一化,對未來電力計量系統(tǒng)的整體管理效率提升有積極意義。