丁江橋,文屹,呂黔蘇,張迅,范強(qiáng),黃軍凱
(貴州電網(wǎng)有限責(zé)任公司電力科學(xué)研究院,貴陽 550002)
電網(wǎng)是經(jīng)濟(jì)和社會發(fā)展的重要基礎(chǔ)設(shè)施,也是能源產(chǎn)業(yè)鏈中的重要紐帶[1]。在堅(jiān)強(qiáng)智能電網(wǎng)框架下,智能輸變電設(shè)備逐漸成為建設(shè)未來電網(wǎng)必不可少的環(huán)節(jié)。但輸變電設(shè)備存在過載、過壓、老化等現(xiàn)象,導(dǎo)致設(shè)備缺陷和故障等[2]。隨著大數(shù)據(jù)時(shí)代的到來,大數(shù)據(jù)技術(shù)逐漸成熟并應(yīng)用到各個(gè)領(lǐng)域。應(yīng)用大數(shù)據(jù)技術(shù)對數(shù)據(jù)本身的內(nèi)在規(guī)律進(jìn)行挖掘,從而對設(shè)備狀態(tài)進(jìn)行更加全面和詳細(xì)的分析。因此,對基于大數(shù)據(jù)技術(shù)的電力設(shè)備異常狀態(tài)檢測方法進(jìn)行研究具有重要的現(xiàn)實(shí)意義。
目前,國內(nèi)外對設(shè)備異常狀態(tài)檢測方法進(jìn)行了大量的研究。但在電力行業(yè),大數(shù)據(jù)技術(shù)在設(shè)備異常檢測中的應(yīng)用尚處于起步階段。主要包括時(shí)間序列分析、馬爾可夫模型和分類算法等。在文獻(xiàn)[3]中,提出了一種基于無監(jiān)督學(xué)習(xí)的數(shù)據(jù)挖掘方法,使用自回歸模型,提出了契合度指標(biāo),并在正常工作時(shí)間序列上進(jìn)行了歐氏距離分析,最后通過實(shí)例驗(yàn)證了該方法的準(zhǔn)確性。在文獻(xiàn)[4]中,提出一種通過大數(shù)據(jù)技術(shù)深度挖掘與分析電力變壓器狀態(tài)數(shù)據(jù)的方法,分析當(dāng)前的應(yīng)用現(xiàn)狀以及決策優(yōu)化的典型場景。在文獻(xiàn)[5]中,提出一種采用移動(dòng)時(shí)間窗劃分狀態(tài)數(shù)據(jù)的方法,結(jié)合空間位置坐標(biāo)形成時(shí)空聯(lián)合數(shù)據(jù),采用模糊C均值聚類方法對數(shù)據(jù)進(jìn)行聚類,判斷電力設(shè)備運(yùn)行狀態(tài)。在文獻(xiàn)[6]中,根據(jù)變電站設(shè)備狀態(tài)監(jiān)測和評估的手段,對新一代智能變電站設(shè)備狀態(tài)監(jiān)測與評價(jià)的大數(shù)據(jù)處理方法進(jìn)行分析。從建立設(shè)備異常知識庫和狀態(tài)評估兩個(gè)方面展望大數(shù)據(jù)技術(shù)在設(shè)備檢測中的應(yīng)用前景。但是以上電力設(shè)備異常檢測方法利用的數(shù)據(jù)量小,沒有充分考慮到歷史數(shù)據(jù)的作用。
在此基礎(chǔ)上,文中提出了一種基于時(shí)間序列和神經(jīng)網(wǎng)絡(luò)的電力設(shè)備狀態(tài)信息異常檢測方法。通過自回歸時(shí)間序列模型和自組織映射神經(jīng)網(wǎng)絡(luò)將連續(xù)的監(jiān)測數(shù)據(jù)進(jìn)行離散化,找出歷史數(shù)據(jù)隨時(shí)間的變化規(guī)律,以此為基礎(chǔ)完成數(shù)據(jù)的快速異常檢測。最后通過實(shí)驗(yàn)驗(yàn)證了該方法在實(shí)際電力設(shè)備狀態(tài)診斷中的有效性。
電力設(shè)備狀態(tài)評估數(shù)據(jù)包括實(shí)時(shí)狀態(tài)數(shù)據(jù),如在線監(jiān)測信息等;準(zhǔn)實(shí)時(shí)狀態(tài)數(shù)據(jù),如日常巡檢、預(yù)防性試驗(yàn)和維護(hù)等;靜態(tài)原始數(shù)據(jù),如設(shè)備臺帳等[7]。巡檢數(shù)據(jù)包括運(yùn)行巡檢數(shù)據(jù),并且在每次檢查后更新數(shù)據(jù)。在線監(jiān)測數(shù)據(jù)包括現(xiàn)場所有監(jiān)測設(shè)備實(shí)時(shí)或定期向中心發(fā)送的數(shù)據(jù),并實(shí)時(shí)更新數(shù)據(jù);預(yù)防性試驗(yàn)數(shù)據(jù)包括各種周期性離線試驗(yàn)數(shù)據(jù);檢修數(shù)據(jù)包括檢修后設(shè)備各部分的最新狀態(tài),并在每次檢查后更新數(shù)據(jù)。
基于電力設(shè)備不同維度的狀態(tài)信息,從電力設(shè)備的狀態(tài)監(jiān)測信息、測試信息和電網(wǎng)運(yùn)行信息等全景信息的特征信息。電力設(shè)備狀態(tài)全景信息模型如圖1所示。

圖1 全景信息模型
文中研究的異常檢測方法主要是對在線監(jiān)測的狀態(tài)信息,集合歷史數(shù)據(jù)和設(shè)備類型數(shù)據(jù),從縱向時(shí)間跨度、橫向電網(wǎng)和設(shè)備跨度這三個(gè)方面對設(shè)備的全景狀態(tài)信息進(jìn)行綜合分析。然而,大數(shù)據(jù)技術(shù)為異常狀態(tài)檢測提供了新的解決思路和技術(shù)手段。
由于電力設(shè)備在運(yùn)動(dòng)過程中動(dòng)態(tài)性較低,具有較強(qiáng)記憶力的自回歸(Auto Regressive,AR)時(shí)間序列模型被廣泛用于評估[8]。在一般情況下,電力設(shè)備的狀態(tài)變量有兩類[9]。第一類是平穩(wěn)序列,一階AR可以直接擬合,如接地電流和導(dǎo)線張力等。另一類為狀態(tài)變量周期變化,但由于幅度較小,也可以調(diào)整后使用一階AR進(jìn)行擬合,例如油溫、環(huán)境溫度等。因此,采用一階AR模型來擬合設(shè)備數(shù)據(jù)。如式(1)所示:
(1)
式中xt為監(jiān)測數(shù)據(jù)t時(shí)刻的時(shí)間序列;α為自相關(guān)系數(shù);et為t時(shí)刻的白噪聲,遵循正態(tài)分布et~N(μe,λ2);μe為該分布的數(shù)學(xué)期望;λ為該分布的標(biāo)準(zhǔn)差。因此,xt服從N(μ,σ2)正態(tài)分布,并且μ和σ滿足式(2)和式(3)所示:
μ=μe/(1-α)
(2)
(3)
正常運(yùn)行時(shí)設(shè)備狀態(tài)量在閾值范圍內(nèi),因此,假定xt在區(qū)間[a,b]內(nèi)。
在采樣時(shí)t+1,t+2,…,t+k時(shí)刻可以判斷其量化是否屬于同一區(qū)間。僅當(dāng)式(4)成立時(shí),有a≤xt+k≤b[10]。
-αkxt+α≤et+k+αet+k-1+…+αk-1et+1≤-αkxt+b
(4)
式中et~N(μe,λ2),只有當(dāng)α<α0時(shí),整個(gè)序列才能滿足區(qū)間[a,b]。
但是,僅用AR模型無法準(zhǔn)確檢測超過狀態(tài)變量閾值的異常數(shù)據(jù)[11]。這主要是由于設(shè)備之間的數(shù)據(jù)不一致,當(dāng)設(shè)備性能逐漸下降并存在潛在故障時(shí),異常數(shù)據(jù)通常在規(guī)定閾值內(nèi),這會導(dǎo)致錯(cuò)誤的狀態(tài)評估。
自組織映射(Self Organized Maps,SOM)是一種神經(jīng)網(wǎng)絡(luò),在數(shù)據(jù)聚類和降維中應(yīng)用較多[12]。工作原理如圖2所示。在輸入層通過輸入樣本進(jìn)行模型訓(xùn)練。訓(xùn)練過程會不斷更改輸入數(shù)據(jù)的權(quán)重,趨于平穩(wěn)輸入實(shí)時(shí)數(shù)據(jù),將輸入輸出神經(jīng)元比較,只有一個(gè)輸出層神經(jīng)元將成為獲勝者。

圖2 SOM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
由于SOM可以執(zhí)行無監(jiān)督分類,將xt作為SOM的輸入,而該序列C={C1,C2,…,Cn}將用作網(wǎng)絡(luò)的輸出。那么每一個(gè)xt訓(xùn)練其屬于節(jié)點(diǎn)Cj的公式,判別通過為歐幾里得距離,如式(5)所示[13]:
j=i(xt)=argmind(xt,Ci(t))
(5)
連續(xù)輸入數(shù)據(jù)后,改變權(quán)值以最小化xt與最終輸出節(jié)點(diǎn)的距離,如式(6)所示:
(6)
在式中,γ(t)為SOM神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率,隨t的增加逐漸降低,取值在[0,1]之間。
輸入狀態(tài)序列xt到SOM神經(jīng)網(wǎng)絡(luò)模型中,分類后,xt就變?yōu)榫€性空間中的離散點(diǎn)時(shí)間序列Ct∈{C1,C2,…,CN},如式(7)所示[14]:
Ct=Ci(xt)
(7)
式中Ct為t時(shí)刻最接近xt的節(jié)點(diǎn)。
因?yàn)镾OM在競爭層節(jié)點(diǎn)相關(guān)關(guān)聯(lián),所以每個(gè)神經(jīng)元節(jié)點(diǎn)與其鄰域節(jié)點(diǎn)有很強(qiáng)的相關(guān)性,而與區(qū)域外節(jié)點(diǎn)的相關(guān)性較弱??梢砸暈橥?fù)浣Y(jié)構(gòu)中一個(gè)神經(jīng)元到另一個(gè)神經(jīng)元的轉(zhuǎn)移,挖掘數(shù)據(jù)時(shí)間變化規(guī)律。
(1)神經(jīng)元的概率密度函數(shù)
當(dāng)使用一階轉(zhuǎn)移概率P概率來表示神經(jīng)元之間的相關(guān)性時(shí),AR(N)模型中的神經(jīng)元之間的一階傳遞概率P[ct+1|ct,ct-1,…,c1],AR(1)模型中的神經(jīng)元之間的一階傳遞轉(zhuǎn)移概率可以簡化為P[ct+1|ct]。
令{C1,C2,…,CN}的取值為{1,2,…,N},t時(shí)刻的概率可以通過式(5)推導(dǎo),ct的取值為CI的概率如式(8)所示[15]:
P[ct=CI]=P[i(xt)=I]
(8)
由式(7)和式(8)導(dǎo)出的概率密度函數(shù)如式(9)所示:
(9)

由于x和c是一維數(shù)組,因此令a=(CI+CI+1)/2,且b=(CI+CI-1)/2,由于xt服從正態(tài)分布,xt概率分布函數(shù)可以表示為標(biāo)準(zhǔn)正態(tài)分布函數(shù),如式(10)所示[16]:
(10)
當(dāng)I= 1 時(shí),如式(11)所示:
(11)
當(dāng)I=N時(shí),如式(12)所示:
(12)
(2)神經(jīng)元之間的傳遞
AR過程中數(shù)據(jù)較為平穩(wěn)。二階概率分布函數(shù)如式(13)所示:
P[ct=CI1,ct+k=C12]=P[xt∈(b1,a1),xt+k∈(b2,a2)]
(13)
式中CI1,CI2∈{C1,…,CN},I1=(a1,b1),I2=(a2,b2)。因?yàn)閤t服從正態(tài)分布,所以xt的二階正態(tài)分布函數(shù)如式(14)所示[17]:
(14)
式中ρ(k)=αk為一階AR過程的自相關(guān)函數(shù)。
在該模型中,神經(jīng)元僅轉(zhuǎn)移一步,故式(13)可由式(12)和式(14)轉(zhuǎn)化為式(15):
(15)
在實(shí)際的操作過程中,由于設(shè)備屬性、操作條件和環(huán)境的差異,很難用準(zhǔn)確、統(tǒng)一的函數(shù)來表示設(shè)備狀態(tài)監(jiān)控參數(shù)。例如,變壓器熱點(diǎn)溫度和底油溫度、頂油溫度、環(huán)境溫度和負(fù)荷等參數(shù)之間的關(guān)系主要由熱平衡方程式給出。熱平衡方程具有許多參數(shù),并且在高溫下常常不準(zhǔn)確,從而難以檢測異常熱點(diǎn)溫度。
為了解決多維參數(shù)融合的問題,采用具有噪聲的基于密度的聚類方法(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)完成多維在線監(jiān)測數(shù)據(jù)的聚類,簡化了不同參數(shù)之間的復(fù)雜關(guān)聯(lián)[18]。
通過以上提取算法,可以快速檢測在線監(jiān)視數(shù)據(jù)流中的異常。具體步驟如下:
步驟一:根據(jù)每個(gè)參數(shù)的歷史數(shù)據(jù),使用AR模型和SOM神經(jīng)網(wǎng)絡(luò)算法計(jì)算單參數(shù)轉(zhuǎn)移概率矩陣{X1,X2,…,XN}[19]。
步驟二:使用DBSCAN算法對所有參數(shù)的歷史數(shù)據(jù)進(jìn)行聚類以獲得m個(gè)正常聚類簇。
步驟三:用步驟一中的轉(zhuǎn)移概率矩陣替換在線監(jiān)測實(shí)時(shí)數(shù)據(jù)流,得到各參數(shù)的轉(zhuǎn)移概率序列,然后判斷每個(gè)時(shí)間點(diǎn)的數(shù)據(jù)是否屬于m個(gè)聚類簇。
步驟四:根據(jù)步驟三的結(jié)果執(zhí)行異常檢測,邏輯如下:
(1)如果每個(gè)參數(shù)的轉(zhuǎn)移概率序列不為零,數(shù)據(jù)流中的數(shù)據(jù)屬于m個(gè)簇,則該數(shù)據(jù)段正常。
(2)如果具有少量參數(shù)的轉(zhuǎn)移概率序列為零個(gè),數(shù)據(jù)流中有一小部分?jǐn)?shù)據(jù)不屬于m個(gè)簇,則認(rèn)為該數(shù)據(jù)有少量噪聲,為可以忽略的傳感器異常。
(3)如果k個(gè)參數(shù)的轉(zhuǎn)移概率序列中有一段為0,數(shù)據(jù)流中有一小部分?jǐn)?shù)據(jù)不屬于m個(gè)簇,則設(shè)備參數(shù)異常,設(shè)備運(yùn)行狀態(tài)異常。
(4)對于邏輯(3)的異常操作狀態(tài),從每個(gè)參數(shù)的轉(zhuǎn)變概率序列的過零確定參數(shù)的異常發(fā)生時(shí)間。檢測過程如圖3所示。

圖3 檢測流程
在當(dāng)?shù)乇O(jiān)測中心取220 kV主變壓器正常運(yùn)行時(shí)的在線監(jiān)測數(shù)據(jù),以變壓器油溫、設(shè)備負(fù)荷、環(huán)境溫度等為例評估設(shè)備的狀態(tài),取2019年的數(shù)據(jù),以7月15日—7月22日為樣本,并取7月23日12點(diǎn)—20點(diǎn)數(shù)據(jù)為待測樣本。以每分鐘采集一次這些狀態(tài)變量,總計(jì)480組。通過AR(1)模型擬合后參數(shù)為λ=0.01、α=0.85、μe=0,設(shè)置 SOM 的神經(jīng)元個(gè)數(shù)為 12,兩相鄰時(shí)刻的數(shù)據(jù)屬于同一神經(jīng)元的概率最大。如圖4所示,設(shè)備負(fù)荷和油溫在380點(diǎn)后上升趨勢平穩(wěn)。

圖4 變壓器檢測信號
通過文中方法進(jìn)行異常檢測結(jié)果如圖5所示。可以得到以下結(jié)論。

圖5 變壓器異常檢測結(jié)果
(1)觀測時(shí)刻80 min處油溫有0點(diǎn),這種情況下的聚類結(jié)果也顯示異常值,但是由于時(shí)間傳遞概率高,聚類結(jié)果正常,判斷為傳感器異常引起,可忽略[20]。
(2)油溫和負(fù)荷的推移概率在觀測時(shí)為0。在觀測時(shí)刻(390~410)min處,轉(zhuǎn)移概率序列的值上下波動(dòng),并且有很多零點(diǎn)。聚類結(jié)果還表明,在觀測時(shí)刻(390~500)min處大多數(shù)觀測數(shù)據(jù)不屬于常規(guī)聚類。因此,從觀測時(shí)間384 min處(對應(yīng)于時(shí)間18:20)開始運(yùn)行異常,出現(xiàn)油溫和負(fù)荷快速升高的現(xiàn)象。并且偏離正常值,此時(shí)應(yīng)發(fā)出異常運(yùn)行狀況的早期預(yù)警。
在查看日志和記錄后,在7月23日18:15,變壓器收到調(diào)度命令,在高負(fù)載系數(shù)1.1~1.2下,工作75分鐘后,在7:30恢復(fù)正常運(yùn)行。檢測與實(shí)際相同,文中方法能夠完成變壓器異常檢測。
在變壓器狀態(tài)評估中沒有油溫、負(fù)荷、環(huán)境溫度的閾值標(biāo)準(zhǔn) 。使用閾值判定方法,根據(jù)經(jīng)驗(yàn)選擇1.2倍。即如果測量數(shù)據(jù)超過正常值的1.2倍,則判斷為異常,有以下結(jié)果。
(1)在觀測時(shí)刻80 min處油溫異常;
(2)觀測時(shí)刻450 min(相當(dāng)于18:50)以后,油溫和負(fù)載同時(shí)異常。閾值判定方法的異常檢測結(jié)論滯后于實(shí)際情況,無法杜絕傳感器異常引起的誤判。
在當(dāng)?shù)乇O(jiān)測中心選擇500 kV的輸電線路覆冰數(shù)據(jù)。每年11月至2月,冰層覆蓋率最高,將2019年處于重冰覆蓋的9月至11月附冰裝置采集數(shù)據(jù)作為訓(xùn)練樣本。數(shù)據(jù)如圖6所示。從2019年12月到2020年1月數(shù)據(jù)為待測樣本,設(shè)備的采樣周期為一小時(shí)。

圖6 輸電線路覆冰監(jiān)測數(shù)據(jù)
在對SOM網(wǎng)絡(luò)和集群進(jìn)行訓(xùn)練之后,將圖6數(shù)據(jù)作為輸入,通過文中檢測流程,得到如圖7所示轉(zhuǎn)移概率序列和聚類結(jié)果。可以得到以下結(jié)論。

圖7 輸電線路異常檢測結(jié)果
(1)在觀測時(shí)刻345 h時(shí),具有大量接近0或?yàn)?的數(shù)據(jù)。在觀測時(shí)刻(380~400)h段,導(dǎo)線拉力和傾角幾乎都為0點(diǎn),從聚類結(jié)果來看,該數(shù)據(jù)段不屬于常規(guī)聚類,在觀測時(shí)刻(400~580)h段有聚類異常。因此,在觀測時(shí)刻380 h時(shí)(12月17日)就存在覆冰異常,可判斷當(dāng)天輸電線路狀態(tài)異常。
(2)觀測時(shí)間在(590~610)h段(12月26日)導(dǎo)線張力、傾角和風(fēng)速的轉(zhuǎn)換概率序列中有很多零點(diǎn),聚類結(jié)果介于正常和異常之間,從而確定覆冰厚度異常增大,線路檢測異常,每日覆冰均有記錄。線路的結(jié)冰厚度從去年12月以來,約為2 mm。16日,由于天氣(寒冷,小雪,大霧),線路的冰層厚度迅速增加。在18日對冰上的涂層進(jìn)行特別檢查時(shí),發(fā)現(xiàn)監(jiān)控設(shè)備附近的冰厚度超過10 mm。線路檢查員向有關(guān)部門報(bào)告后,主管部門發(fā)出了異常檢測信息,與異常檢測結(jié)果相一致。12月26日以后,檢測出異常,但覆冰厚度僅為8.7 mm,這可能是風(fēng)速增加導(dǎo)致的張力異常,非覆冰引起。
在評估輸電線路狀態(tài)時(shí),將早期覆冰厚度預(yù)警值設(shè)置為10 mm。根據(jù)該預(yù)警值,采用閾值判斷方法進(jìn)行異常檢測。圖8所示覆冰厚度的時(shí)變曲線。閾值異常僅在觀察時(shí)刻446 h處(對應(yīng)于12月20日)出現(xiàn),預(yù)警時(shí)間晚于文中的方法,并且在觀測時(shí)間(570~610)h段也出現(xiàn)閾值異常,與實(shí)際不同。可以得出文中方法優(yōu)于閾值判斷方法。

圖8 覆冰厚度變化曲線
文中結(jié)合大數(shù)據(jù)分析技術(shù)和設(shè)備評估技術(shù),提出了一種基于時(shí)間序列和神經(jīng)網(wǎng)絡(luò)的狀態(tài)數(shù)據(jù)異常檢測方法。通過AR時(shí)間序列模型和SOM神經(jīng)網(wǎng)絡(luò)將連續(xù)的電力設(shè)備數(shù)據(jù)離散為單個(gè)序列,計(jì)算狀態(tài)變量在時(shí)間軸上的轉(zhuǎn)移概率。通過實(shí)驗(yàn)對該方法的合理性和有效性進(jìn)行驗(yàn)證。結(jié)果表明該方法可以快速、有效地檢測電力設(shè)備異常狀態(tài)。后續(xù)將針對不斷增長的電力設(shè)備數(shù)量和數(shù)據(jù)規(guī)模,完善基于大數(shù)據(jù)技術(shù)的電力設(shè)備異常狀態(tài)檢測模型。