999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機(jī)器學(xué)習(xí)的變電站設(shè)備異常狀態(tài)數(shù)據(jù)清洗

2022-01-13 10:11:12孟令雯張銳鋒李鑫卓
關(guān)鍵詞:變電站設(shè)備模型

孟令雯,張銳鋒,李鑫卓,席 禹

(1.貴州電網(wǎng)有限責(zé)任公司電力科學(xué)研究院,貴陽 550000;2.南方電網(wǎng)數(shù)字電網(wǎng)研究院有限公司,廣州 510000)

變電站正常運(yùn)行是電力系統(tǒng)安全穩(wěn)定可靠運(yùn)作的基礎(chǔ)。變電站設(shè)備尤其是變壓器等關(guān)鍵設(shè)備一旦發(fā)生故障,將會(huì)對(duì)電力系統(tǒng)產(chǎn)生一系列的影響,在造成巨大的經(jīng)濟(jì)損失的同時(shí),還危及公共安全[1-2]。因此,變電站設(shè)備的穩(wěn)定運(yùn)行和異常狀態(tài)的正確判斷與及時(shí)處理是電網(wǎng)堅(jiān)強(qiáng)、可靠運(yùn)行的前提[3]。然而,變電站數(shù)據(jù)從采集到應(yīng)用過程中因?yàn)閭鞲衅鳟惓!鬏斣O(shè)備異常、外部環(huán)境干擾等原因,會(huì)導(dǎo)致數(shù)據(jù)出現(xiàn)跳變、缺失、超值等數(shù)值不合理問題[4]。值得注意的是,這些“臟數(shù)據(jù)”并不是真正的變電站設(shè)備異常數(shù)據(jù),會(huì)干擾運(yùn)維人員對(duì)設(shè)備真實(shí)狀態(tài)的評(píng)判。此外,隨著大數(shù)據(jù)技術(shù)和智能設(shè)備在電力領(lǐng)域逐步發(fā)展,變電站設(shè)備數(shù)據(jù)爆炸式增長,從海量設(shè)備數(shù)據(jù)中提取有價(jià)值信息也迫在眉睫[5-6]。因此,為了準(zhǔn)確感知變電站設(shè)備狀態(tài),以及更好地挖掘數(shù)據(jù)價(jià)值,需要進(jìn)行設(shè)備異常狀態(tài)數(shù)據(jù)清洗。

電力數(shù)據(jù)的清洗主要分為異常數(shù)據(jù)檢測和錯(cuò)誤數(shù)據(jù)修正兩部分。傳統(tǒng)檢測方法大多是通過單一量的閾值判斷“臟數(shù)據(jù)”(數(shù)據(jù)中的奇異點(diǎn)),方法存在設(shè)備信息利用率低、狀態(tài)評(píng)價(jià)結(jié)果片面、故障類型難以分辨等問題[7-8]。因此,為充分挖掘狀態(tài)數(shù)據(jù)的異常信息,近年來國內(nèi)外學(xué)者將機(jī)器學(xué)習(xí)算法引入到電力設(shè)備異常檢測中,為設(shè)備狀態(tài)異常檢測提供了更加前沿的設(shè)計(jì)思想與解決方法,主要包括基于線性模型的異常值檢測方法、基于鄰近度的異常值檢測方法、基于集成方法的異常值檢驗(yàn)方法3類[9]。例如:主成分分析法PCA(principal component analysis)是一種基于線性模型的方法,PCA將原數(shù)據(jù)從原空間映射到主成分空間,再將投影映射回原空間,從而找出違反數(shù)據(jù)相關(guān)性的異常點(diǎn),但PCA對(duì)非線性依賴關(guān)系的數(shù)據(jù)不能得到很好的檢測結(jié)果[9];K均值聚類算法(K-means clustering algorithm)是一種基于鄰近度的方法,其實(shí)現(xiàn)在空間內(nèi)對(duì)數(shù)據(jù)的聚類,并識(shí)別其正常模式,若輸入數(shù)據(jù)到正常模式的距離超過設(shè)置的閾值,則判斷為異常情況,當(dāng)樣本集數(shù)據(jù)量過大時(shí),聚類時(shí)間較慢[10];孤立森林法是一種基于集成方法的異常檢測方法,其通過選定的樣本屬性進(jìn)行空間分割,根據(jù)路徑長度計(jì)算異常分?jǐn)?shù)并排序,排名靠前的即為異常數(shù)據(jù),然而對(duì)于數(shù)據(jù)流中異常數(shù)據(jù)占比太小且異常類型過少的情況,檢測效果并不理想[11]。

如果直接去除錯(cuò)誤數(shù)據(jù),將破壞數(shù)據(jù)的連續(xù)性,不利于數(shù)據(jù)本身信息的挖掘。因此,在剔除異常數(shù)據(jù)后,需要填補(bǔ)空白值,主要包括回歸方法、時(shí)間序列方法、神經(jīng)網(wǎng)絡(luò)等。對(duì)于回歸方法,文獻(xiàn)[12]將Pearson相關(guān)系數(shù)與回歸模型相結(jié)合,對(duì)缺失的配電變壓器數(shù)據(jù)進(jìn)行插值;文獻(xiàn)[13]提出了一種基于最小二乘向量機(jī)-貝葉斯網(wǎng)絡(luò)決策樹的繼電保護(hù)系統(tǒng)故障診斷模型,解決數(shù)據(jù)缺失和模糊的問題。但此類方法本質(zhì)上是進(jìn)行線性回歸,對(duì)于在一定范圍內(nèi)上下浮動(dòng)的數(shù)據(jù),很難體現(xiàn)出其真實(shí)波動(dòng)情況。文獻(xiàn)[7]認(rèn)為電力設(shè)備數(shù)據(jù)在正常狀態(tài)下可看成時(shí)間序列,利用自回歸求和移動(dòng)平均函數(shù)并迭代檢驗(yàn)的方法修正不良數(shù)據(jù),然而該方法僅依賴于少量的輸入信息,不適用于修復(fù)連續(xù)分布的缺失值。文獻(xiàn)[14]提出反向傳播BP(back propagation)神經(jīng)網(wǎng)絡(luò)結(jié)合遺傳算法的修正方法對(duì)電力系統(tǒng)中異常數(shù)據(jù)進(jìn)行修復(fù),但快速收斂到全局最優(yōu)解的速度有限。

變電站設(shè)備數(shù)據(jù)清洗難點(diǎn)主要存在3個(gè)方面:①異常數(shù)據(jù)在整個(gè)數(shù)據(jù)流中占比很小,很難定義其界線;②設(shè)備各狀態(tài)量之間的關(guān)系復(fù)雜,難以用函數(shù)精準(zhǔn)擬合;③面對(duì)大數(shù)據(jù)流情況,檢測速度要快,否則異常情況不能及時(shí)處理[8]。因此,一種能快速區(qū)分設(shè)備狀態(tài)異常和“臟數(shù)據(jù)”的數(shù)據(jù)清洗方法成為變電站狀態(tài)數(shù)據(jù)監(jiān)測的迫切需求。

針對(duì)上述難點(diǎn)和目前電力領(lǐng)域數(shù)據(jù)清洗方法的不足之處,本文設(shè)計(jì)了一種基于大數(shù)據(jù)分析技術(shù)的變電站設(shè)備異常狀態(tài)數(shù)據(jù)清洗方法,利用快速密度峰值聚類CFSFDP(clustering by fast search and find of density peaks)算法和自組織特征映射SOM(selforganizing feature map)神經(jīng)網(wǎng)絡(luò)的雙重判據(jù)對(duì)設(shè)備數(shù)據(jù)進(jìn)行異常識(shí)別,并實(shí)現(xiàn)對(duì)數(shù)據(jù)類型(未被記錄的正常數(shù)據(jù)、“臟數(shù)據(jù)”或設(shè)備異常狀態(tài)數(shù)據(jù))的判斷;再基于長短期記憶LSTM(long short-term memory)網(wǎng)絡(luò)預(yù)測并替換“臟數(shù)據(jù)”時(shí)刻值,完成對(duì)異常數(shù)據(jù)中“臟數(shù)據(jù)”的修正,從而提高了數(shù)據(jù)分析處理的能力,保證了決策的正確率和數(shù)據(jù)挖掘的效率。

1 設(shè)備異常數(shù)據(jù)檢測

為了有效地區(qū)分變電站設(shè)備的正常數(shù)據(jù)、“臟數(shù)據(jù)”和異常狀態(tài)數(shù)據(jù),本文綜合采用基于CFSFDP算法和基于SOM神經(jīng)網(wǎng)絡(luò)算法的異常檢測的雙重判據(jù)對(duì)設(shè)備數(shù)據(jù)進(jìn)行辨識(shí)。

1.1 基于CFSFDP的異常檢測

在實(shí)際運(yùn)行過程中,變電站設(shè)備檢測數(shù)據(jù)是緩慢變化的,當(dāng)出現(xiàn)異常數(shù)據(jù)時(shí),無論是設(shè)備狀態(tài)異常還是“臟數(shù)據(jù)”,都可以采用多維參量融合方式,通過各個(gè)變量之間的相關(guān)性進(jìn)行判斷。然而,由于設(shè)備狀態(tài)、工作狀況、環(huán)境等因素的影響,很難用一個(gè)高精度、強(qiáng)實(shí)用性的計(jì)算模型來表達(dá)設(shè)備各參量之間的關(guān)系。

因此,為解決多維參數(shù)融合問題,本文采用CFSFDP算法對(duì)多維在線監(jiān)測數(shù)據(jù)進(jìn)行聚類,該方法不僅可以充分利用大量的在線監(jiān)測數(shù)據(jù),而且可以簡化各參量之間的復(fù)雜關(guān)系。CFSFDP算法作為一種基于密度的聚類算法,其優(yōu)勢在于能發(fā)現(xiàn)任意形狀的類簇,在對(duì)檢測數(shù)據(jù)進(jìn)行類簇劃分時(shí)無需進(jìn)行迭代,只需一步即可完成分配,降低了時(shí)間復(fù)雜度,因此面對(duì)海量數(shù)據(jù)仍能實(shí)現(xiàn)快速聚類分析,聚類結(jié)果穩(wěn)定且效果好[15]。

CFSFDP算法通過計(jì)算數(shù)據(jù)局部密度與距離來確定聚類中心及類簇?cái)?shù)。設(shè)定數(shù)據(jù)集U={xi},i=1,2,…,T。對(duì)于定數(shù)據(jù)集U中的任意數(shù)據(jù)點(diǎn)xi,定義其局部密度ρi為

式中:dij為數(shù)據(jù)點(diǎn)之間的歐式距離;dc為截?cái)嗑嚯x,通常dc選取為dij升序排列1%~2%位置處的距離值。使用該計(jì)算方法得到數(shù)據(jù)點(diǎn)的局部密度ρi,通常等于該數(shù)據(jù)點(diǎn)周圍與之距離小于dc的數(shù)據(jù)點(diǎn)的個(gè)數(shù)。

數(shù)據(jù)點(diǎn)之間的距離δi是通過計(jì)算數(shù)據(jù)點(diǎn)xi與比該數(shù)據(jù)點(diǎn)局部密度高的其他數(shù)據(jù)點(diǎn)的距離得到的,數(shù)據(jù)點(diǎn)之間的距離δi可以表示為

一般而言,數(shù)據(jù)點(diǎn)之間的距離δi為數(shù)據(jù)點(diǎn)i與比該數(shù)據(jù)點(diǎn)局部密度ρi更高的其他數(shù)據(jù)點(diǎn)的所有距離中的最小值,但對(duì)于局部密度ρi最高的點(diǎn),數(shù)據(jù)點(diǎn)之間的距離δi為其他數(shù)據(jù)點(diǎn)與之距離的最大值。

以變電站設(shè)備變壓器為例,將數(shù)據(jù)參量S(包括變壓器頂層油溫、負(fù)荷、環(huán)境溫度)作為1個(gè)三維數(shù)組,然后用CFSFDP算法進(jìn)行聚類。首先計(jì)算歷史正常數(shù)據(jù)組局部密度ρ和距離d,若1個(gè)在線檢測三維數(shù)組到任意一個(gè)類簇的距離都大于距離閾值dc且密度小于臨界密度ρb,則認(rèn)為該數(shù)組不屬于歷史正常數(shù)據(jù)中的任何1個(gè)簇。因此,當(dāng)某個(gè)參量值變化而導(dǎo)致該多維參量S不屬于歷史正常數(shù)據(jù)類簇時(shí),則認(rèn)為該時(shí)刻的多維參量S出現(xiàn)異常情況,標(biāo)記此離群點(diǎn)為異常點(diǎn)。

1.2 基于SOM的異常檢測

1.2.1 設(shè)備狀態(tài)數(shù)據(jù)的時(shí)間序列自回歸模型

自回歸模型是在工業(yè)過程中應(yīng)用最廣泛的時(shí)間序列模型之一,具有極強(qiáng)的記憶性,用來表示t時(shí)刻值xt對(duì)t之前時(shí)刻值的依存關(guān)系,自回歸模型變化趨勢與變電站設(shè)備運(yùn)行過程中的數(shù)據(jù)值緩慢變化情況相符。變電站設(shè)備負(fù)荷狀態(tài)量的檢測數(shù)據(jù)是由各個(gè)傳感器采集然后上傳到平臺(tái),可以認(rèn)為原始數(shù)據(jù)就是按照時(shí)間序列排列的,符合自回歸模型特點(diǎn)。而其他狀態(tài)量(例如變壓器油溫、環(huán)境溫度等)呈日周期性變化且變化幅值在一定范圍內(nèi),在日周期內(nèi)可認(rèn)為屬于平穩(wěn)序列,具有自回歸模型特性。因此,首先把狀態(tài)數(shù)據(jù)處理為零均值平穩(wěn)序列xt,然后通過一階自回歸模型對(duì)xt進(jìn)行擬合,即

式中:φ為回歸系數(shù),表示xt對(duì)xt-1的依賴程度;εt為白噪音,服從分布;T為數(shù)據(jù)量。一階自回歸模型的回歸系數(shù)φ和白噪聲方差可通過矩估計(jì)[16]得到,即

式中:γ0為時(shí)間序列{xt}的方差;γ1為一階自協(xié)方差函數(shù)。

通過上述方法將變壓器狀態(tài)數(shù)據(jù)進(jìn)行一階自回歸模型擬合,為后續(xù)對(duì)時(shí)間序列求解轉(zhuǎn)移概率矩陣做預(yù)處理。

1.2.2 時(shí)間序列的量化

自組織神經(jīng)網(wǎng)絡(luò)是一種無監(jiān)督、依靠神經(jīng)元之間互相競爭逐步優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)的人工神經(jīng)網(wǎng)絡(luò)。因此,在訓(xùn)練過程中無需人工介入(即不需要樣本標(biāo)簽),可以在不清楚類別的情況下,對(duì)數(shù)據(jù)進(jìn)行聚類,從而獲取針對(duì)某一問題的內(nèi)在關(guān)聯(lián),適用于量大且特點(diǎn)不突出的變電站狀態(tài)數(shù)據(jù)。

首先,將狀態(tài)數(shù)據(jù)xt輸入到自組織神經(jīng)網(wǎng)絡(luò)中,判斷競爭層中所有神經(jīng)元對(duì)應(yīng)的權(quán)值向量W={W1,W2,…,WN}與輸入數(shù)據(jù)xt之間的相似性,即計(jì)算每個(gè)權(quán)值與輸入數(shù)據(jù)之間的歐氏距離,判定歐氏距離最小時(shí)對(duì)應(yīng)的權(quán)向量為獲勝神經(jīng)元k*。

然后,根據(jù)Winner-Take-All(勝者為王)學(xué)習(xí)規(guī)則,獲勝神經(jīng)元k*可以調(diào)整其權(quán)值Wk*(t),而其他神經(jīng)元保持原樣。具體可表示為

式中,α為學(xué)習(xí)率。SOM神經(jīng)網(wǎng)絡(luò)是基于無監(jiān)督學(xué)習(xí)規(guī)則的機(jī)器學(xué)習(xí)算法,所以設(shè)定當(dāng)學(xué)習(xí)率衰減到0或一個(gè)很小的設(shè)定值時(shí)迭代終止。

最后,經(jīng)過大量數(shù)據(jù)訓(xùn)練,權(quán)值即為訓(xùn)練數(shù)據(jù)分成N個(gè)類別的中心數(shù)據(jù)值,因此采用離輸入狀態(tài)數(shù)據(jù)xt最近的權(quán)值作為其量化值。將權(quán)值按照從小到大的順序排布獲得Qt∈{W1,W2,…,WN},量化值可表示為,i(xt)為xt對(duì)應(yīng)量化值的索引,i(xt)取值為{1,2,…,N}。SOM神經(jīng)網(wǎng)絡(luò)是對(duì)輸入數(shù)據(jù)進(jìn)行非均勻量化,SOM神經(jīng)元數(shù)目N定義了量化級(jí)別的數(shù)目和量化的精確程度。

1.2.3 時(shí)間序列變化過程的挖掘

訓(xùn)練后的每個(gè)神經(jīng)元將相似的數(shù)據(jù)樣本聚集在一起,而與其時(shí)間順序無關(guān),因此數(shù)據(jù)僅經(jīng)過訓(xùn)練的SOM神經(jīng)網(wǎng)絡(luò)其實(shí)無法捕獲時(shí)間信息。本節(jié)會(huì)分析在符合自回歸模型的數(shù)據(jù)作為訓(xùn)練集的特殊情況下,如何挖掘其中隱藏的時(shí)間信息。

SOM神經(jīng)網(wǎng)絡(luò)可將相似的輸入狀態(tài)量用相鄰神經(jīng)元的權(quán)重表示。由于SOM訓(xùn)練遵循競爭規(guī)則,每個(gè)輸出神經(jīng)元與其他神經(jīng)元之間關(guān)系隨距離的變化而呈現(xiàn)不同的狀態(tài),即與鄰近神經(jīng)元關(guān)系密切并相互激勵(lì),與跨度較大的神經(jīng)元關(guān)系薄弱甚至相互抑制。因此,qt在時(shí)間上的演變可映射為兩個(gè)神經(jīng)元間的連續(xù)過渡[17]。

為了確定自回歸模型中數(shù)據(jù)的轉(zhuǎn)移區(qū)域,即時(shí)間序列變化中可以移動(dòng)的神經(jīng)元集合,需要求出兩個(gè)神經(jīng)元間的轉(zhuǎn)移概率,轉(zhuǎn)移概率大于0的部分構(gòu)成轉(zhuǎn)移概率矩陣的轉(zhuǎn)移區(qū)域。若xt符合高斯白噪聲的n階自回歸模型,則轉(zhuǎn)移概率可以用條件概率P(qt+1|qt,qt-1,…,qt-n+1)來計(jì)算,這意味著需要計(jì)算n+1階qt的聯(lián)合概率分布。變電站設(shè)備數(shù)據(jù)符合一階自回歸模型,則轉(zhuǎn)移概率為P(qt+1|qt),需計(jì)算其二階概率分布。

令量化值QI={Q1,Q2,…,QN},I=1,2,…,N,根據(jù)xt和Wt的相似性可得出t時(shí)刻qt取值為QI的概率[17]為

式中:a=(QI+QI+1)/2;b=(QI+QI-1)/2。

令i(xt)=I,則P[i(xt)=I]=P[b<xt<a]=Fx(a)-Fx(b),其中Fx為變量xt的概率分布函數(shù)。如果xt服從正態(tài)分布,那么上述概率可以用均值為μ、方差為σ的標(biāo)準(zhǔn)正態(tài)分布函數(shù)表示,即

在相同條件下,qt的二階概率分布為

式中,QI1,QI2∈{W1,W2,…,WN}和I1=(a1,b1),I2=(a2,b2)是互相獨(dú)立的。當(dāng)xt服從正態(tài)分布,則xt二階概率分布可表示為

根據(jù)式(8)和式(9)可將式(10)簡化為

以變壓器在正常工況下的頂部油溫?cái)?shù)據(jù)為例。首先利用一階自回歸模型對(duì)歷史正常數(shù)據(jù)進(jìn)行擬合,得到模型參數(shù)φ和;然后用大量的歷史數(shù)據(jù)訓(xùn)練1個(gè)由10個(gè)神經(jīng)元組成的SOM神經(jīng)網(wǎng)絡(luò);通過自回歸模型參數(shù),計(jì)算歷史正常數(shù)據(jù)下SOM神經(jīng)元之間的轉(zhuǎn)移概率(即1個(gè)10×10的矩陣),如圖1所示,其中Q(i,j)表示從神經(jīng)元i向神經(jīng)元j轉(zhuǎn)移的概率,i,j∈{1,2,…,N}。從圖1中可以看出,矩陣對(duì)角線附近(深色部分所示)的轉(zhuǎn)移概率比較大,這表明量化值下次轉(zhuǎn)移仍在當(dāng)前神經(jīng)元附近的概率比較大,隨著神經(jīng)元之間的跨度增大,轉(zhuǎn)移的可能性就越小。因此,矩陣中部分概率為0,說明在歷史正常數(shù)據(jù)集中這兩個(gè)神經(jīng)元之間從未發(fā)生過轉(zhuǎn)移。

圖1 轉(zhuǎn)移概率矩陣Fig.1 Matrix of transition probabilities

圖2(a)為歷史數(shù)據(jù)中部分頂層油溫?cái)?shù)據(jù),圖2(b)為通過訓(xùn)練好的SOM神經(jīng)網(wǎng)絡(luò)量化后的頂層油溫?cái)?shù)據(jù),時(shí)序下頂層油溫?cái)?shù)據(jù)的轉(zhuǎn)移概率動(dòng)態(tài)變化情況如圖2(c)所示。由圖2可知,當(dāng)變電站設(shè)備處于正常運(yùn)行狀態(tài)時(shí),時(shí)間序列的轉(zhuǎn)移概率值都很高,并且大部分取值都分布在矩陣的深色區(qū)域內(nèi),這種現(xiàn)象表明在時(shí)序下數(shù)據(jù)變化保持平穩(wěn);相反,當(dāng)時(shí)間序列的轉(zhuǎn)移概率從白色區(qū)域取值時(shí),說明該時(shí)間序列在距離較遠(yuǎn)的神經(jīng)元之間進(jìn)行轉(zhuǎn)移,數(shù)據(jù)劇烈變化,判別為突變情況,這時(shí)數(shù)據(jù)已不符合初始的一階自回歸模型分布。

圖2 頂層油溫?cái)?shù)據(jù)、量化值及其轉(zhuǎn)移概率序列示例Fig.2 Example of top oil temperature data,its quantitative values,and its transition probabilities series

1.3 基于CFSFDP算法和SOM算法的雙重異常檢測

利用CFSFDP算法可以篩選出數(shù)據(jù)中不屬于正常數(shù)據(jù)簇的離群點(diǎn),但并不能判斷其異常類型。而SOM神經(jīng)網(wǎng)絡(luò)可將符合自回歸模型的數(shù)據(jù)計(jì)算出其狀態(tài)轉(zhuǎn)移序列,當(dāng)轉(zhuǎn)移概率序列出現(xiàn)0值時(shí),說明數(shù)據(jù)劇烈變化,但也不能判斷其變化的原因。因此,僅基于CFSFDP算法或SOM算法并不能辨析出數(shù)據(jù)異常的原因,所以本文將兩者優(yōu)勢結(jié)合,實(shí)現(xiàn)對(duì)“臟數(shù)據(jù)”和狀態(tài)異常數(shù)據(jù)的檢測。

首先,利用CFSFDP算法聚類,篩選出在線監(jiān)測參量中不屬于正常數(shù)據(jù)簇的離群點(diǎn),標(biāo)記為異常點(diǎn);然后,結(jié)合SOM神經(jīng)網(wǎng)絡(luò),計(jì)算出參量數(shù)據(jù)的轉(zhuǎn)移概率序列;最后,按照以下方法進(jìn)行異常數(shù)據(jù)類型檢測。

(1)當(dāng)數(shù)據(jù)中無異常點(diǎn)且各參量轉(zhuǎn)移概率序列均不為0時(shí),則認(rèn)為此時(shí)刻數(shù)據(jù)是正常數(shù)據(jù)。

(2)當(dāng)數(shù)據(jù)中出現(xiàn)異常點(diǎn)時(shí),①若各參量轉(zhuǎn)移概率序列均不為0,則說明數(shù)據(jù)變化不大,認(rèn)為是被誤判為異常點(diǎn)的正常數(shù)據(jù),將此數(shù)據(jù)入庫,擴(kuò)展正常數(shù)據(jù)集;②若單個(gè)參量的轉(zhuǎn)移概率出現(xiàn)0值,則說明是受到傳感器異常、傳輸線路異常、外部環(huán)境干擾等原因,會(huì)造成數(shù)據(jù)出現(xiàn)跳變、缺失、超值等數(shù)值不合理問題,將此異常點(diǎn)標(biāo)記為“臟數(shù)據(jù)”;③若多個(gè)參量的轉(zhuǎn)移概率出現(xiàn)0值的情況,且數(shù)據(jù)流中附近時(shí)間點(diǎn)的數(shù)據(jù)都被判為異常點(diǎn)時(shí),則認(rèn)為此時(shí)刻之后的異常點(diǎn)均屬于故障數(shù)據(jù),設(shè)備處于異常運(yùn)行狀態(tài)。

2 “臟數(shù)據(jù)”修正

由于變電站設(shè)備狀態(tài)數(shù)據(jù)具有非線性、時(shí)變性、易受干擾、觀測時(shí)間有限等特點(diǎn),傳統(tǒng)的預(yù)測模型難以對(duì)其進(jìn)行精準(zhǔn)預(yù)測,導(dǎo)致實(shí)際應(yīng)用效果較差。考慮到變電站設(shè)備數(shù)據(jù)的時(shí)間相關(guān)因素,本文構(gòu)建了一個(gè)LSTM模型,將以前的時(shí)間信息與當(dāng)前的時(shí)間任務(wù)聯(lián)系起來。LSTM神經(jīng)網(wǎng)絡(luò)是在遞歸神經(jīng)網(wǎng)絡(luò)RNN(recurrent neural network)基礎(chǔ)上進(jìn)行改進(jìn),充分利用時(shí)序數(shù)據(jù)特點(diǎn)的同時(shí),解決了RNN長期訓(xùn)練中存在的梯度消失和梯度爆炸的問題[18-19]。由于LSTM模型含有時(shí)間記憶模塊,能夠良好地學(xué)習(xí)時(shí)間序列的依賴信息,適用于時(shí)間序列空缺值的處理和預(yù)測[20]。

目前,常用的LSTM隱含層結(jié)構(gòu)和輸入門、輸出門、候選門、忘記門4個(gè)復(fù)合控制門示意如圖3所示[21-22]。圖3中Xt和ht分別為t時(shí)刻的輸入時(shí)間序列和輸出,忘記門選擇性遺忘上一時(shí)刻的輸出和輸入的信息;輸入門決定及時(shí)狀態(tài)輸入到長期狀態(tài)中比例;候選門起到產(chǎn)生一個(gè)新的當(dāng)前細(xì)胞狀態(tài)Ct的作用;輸出門控制傳遞到下一時(shí)刻的內(nèi)容。LSTM模型加入了Softmax層,選取ReLu函數(shù)作為誤差反傳的損失函數(shù),可以有效減少梯度爆炸。

圖3 LSTM隱藏層結(jié)構(gòu)及單個(gè)門限示意Fig.3 Schematic of LSTM hidden layer structure and single threshold

以變壓器數(shù)據(jù)為例,將在線監(jiān)測參量S的每維分別建立LSTM模型,對(duì)于檢測出是“臟數(shù)據(jù)”的時(shí)刻,輸入其前3個(gè)時(shí)刻值進(jìn)行估計(jì),然后利用估計(jì)值替換當(dāng)前時(shí)刻錯(cuò)誤值。這里構(gòu)建的LSTM神經(jīng)網(wǎng)絡(luò)中,輸入層由3個(gè)神經(jīng)元組成,隱藏層包含10個(gè)存儲(chǔ)單元,輸出層則輸出單個(gè)預(yù)測值,總共訓(xùn)練2 000個(gè)周期。

3 異常數(shù)據(jù)清洗流程

本文所提的變電站設(shè)備異常數(shù)據(jù)清洗方法流程如圖4所示,具體步驟如下。

圖4 異常數(shù)據(jù)清洗方法流程Fig.4 Flow chart of abnormal data cleaning method

步驟1對(duì)歷史數(shù)據(jù)進(jìn)行預(yù)處理。通過CFSFDP算法對(duì)多維歷史數(shù)據(jù)進(jìn)行聚類;通過一階自回歸模型、SOM神經(jīng)網(wǎng)絡(luò)計(jì)算出每個(gè)參量的狀態(tài)轉(zhuǎn)移概率矩陣;將各個(gè)參量的歷史數(shù)據(jù)分別輸入到LSTM模型中進(jìn)行訓(xùn)練,得到各參量的預(yù)測模型。

步驟2對(duì)在線監(jiān)測數(shù)據(jù)進(jìn)行預(yù)處理。將在線監(jiān)測數(shù)據(jù)集進(jìn)行CFSFDP聚類,將在線數(shù)據(jù)量化并用轉(zhuǎn)移概率矩陣求得各參量的轉(zhuǎn)移概率序列。

步驟3異常數(shù)據(jù)檢測。得到在線數(shù)據(jù)中的正常數(shù)據(jù)、“臟數(shù)據(jù)”和設(shè)備異常數(shù)據(jù)。

步驟4異常數(shù)據(jù)處理。對(duì)辨析出的異常數(shù)據(jù)分別進(jìn)行處理,將“臟數(shù)據(jù)”t時(shí)刻的前3個(gè)時(shí)間序列值輸入到LSTM神經(jīng)網(wǎng)絡(luò)中得到估計(jì)值,用計(jì)算得到的估計(jì)值替換原數(shù)據(jù)值,從而得到正確的設(shè)備狀態(tài)數(shù)據(jù)集;根據(jù)步驟3判別為設(shè)備狀態(tài)異常數(shù)據(jù)及轉(zhuǎn)移概率為0的點(diǎn),判斷設(shè)備發(fā)生異常的時(shí)間并告警。

4 仿真分析

以某變電站220 kV主變壓器為例,取油溫、負(fù)荷、環(huán)境溫度歷史正常數(shù)據(jù)中的5 000組作為訓(xùn)練集,然后選取含有兩種異常情況的500組數(shù)據(jù)集作為本次仿真的清洗樣本。頂層油溫、負(fù)荷電流、環(huán)境溫度3個(gè)參量的采樣間隔均為1 min/組,其采用數(shù)據(jù)如圖5所示,可見,在400 min后,負(fù)荷和油溫呈上升趨勢。

圖5 頂層油溫、負(fù)荷電流、環(huán)境溫度的數(shù)據(jù)Fig.5 Data of top oil temperature,load current and ambient temperature

仿真過程中,首先將變壓器在線監(jiān)測歷史數(shù)據(jù)中生成4個(gè)簇,分別計(jì)算3個(gè)參量的轉(zhuǎn)移概率矩陣,并訓(xùn)練LSTM預(yù)測模型;然后,對(duì)500組在線數(shù)據(jù)進(jìn)行聚類,判斷每個(gè)參量是否屬于4個(gè)簇(1表示屬于,0表示不屬于),結(jié)果如圖6(a)所示,同時(shí)計(jì)算出各參量的轉(zhuǎn)移概率,結(jié)果如圖6(b)~(d)所示;最后進(jìn)行異常數(shù)據(jù)處理,結(jié)果如圖7所示。

圖6 異常檢測結(jié)果Fig.6 Results of anomaly detection

圖7 異常數(shù)據(jù)處理結(jié)果Fig.7 Processing result of abnormal data

當(dāng)t=100 min時(shí),在線檢測數(shù)據(jù)不屬于任何一個(gè)歷史正常數(shù)據(jù)類簇,且環(huán)境溫度的轉(zhuǎn)移概率出現(xiàn)0值,而此刻油溫和負(fù)荷數(shù)據(jù)不存在這類現(xiàn)象。由此推斷,該時(shí)刻的環(huán)境溫度為“臟數(shù)據(jù)”,將此點(diǎn)輸入到訓(xùn)練好的LSTM神經(jīng)網(wǎng)絡(luò)中估計(jì)一個(gè)正常值替代原來的錯(cuò)誤數(shù)據(jù),然后將修正“臟數(shù)據(jù)”后的正常運(yùn)行狀態(tài)數(shù)據(jù)(見圖7中實(shí)線部分,修補(bǔ)的數(shù)據(jù)用*號(hào)標(biāo)出)入庫,為以后數(shù)據(jù)的分析、處理和挖掘提供數(shù)據(jù)支持。

當(dāng)t=400 min時(shí),在線檢測數(shù)據(jù)不屬于任何一個(gè)歷史正常數(shù)據(jù)類簇,且此時(shí)負(fù)荷和頂層油溫的轉(zhuǎn)移概率同時(shí)出現(xiàn)0值,說明此時(shí)刻負(fù)荷和頂層油溫?cái)?shù)據(jù)變化劇烈。t=400 min后在線數(shù)據(jù)均都被判為異常點(diǎn),因此判定t=400~500 min內(nèi)數(shù)據(jù)為故障數(shù)據(jù),設(shè)備出現(xiàn)異常運(yùn)行狀態(tài)(見圖7中虛線部分),應(yīng)及時(shí)告警,對(duì)變壓器運(yùn)行狀態(tài)加以關(guān)注。

5 結(jié)語

本文根據(jù)變電站設(shè)備狀態(tài)數(shù)據(jù)的特性,基于CFSFDP算法和SOM神經(jīng)網(wǎng)絡(luò)算法的異常檢測的雙重判據(jù),設(shè)計(jì)了可區(qū)分設(shè)備狀態(tài)異常數(shù)據(jù)和“臟數(shù)據(jù)”的檢測方案,并搭建了異常數(shù)據(jù)處理架構(gòu),實(shí)現(xiàn)對(duì)變電站設(shè)備運(yùn)行狀態(tài)的診斷分析和“臟數(shù)據(jù)”修正。

然而,本文的方法在快速檢測設(shè)備異常運(yùn)行狀態(tài)和修正“臟數(shù)據(jù)”的同時(shí),也存在一些不足,例如,LSTM神經(jīng)網(wǎng)絡(luò)對(duì)于時(shí)間序列量的估計(jì)有著巨大優(yōu)勢,但當(dāng)有多維數(shù)據(jù)需要修正時(shí)不能并行運(yùn)算,導(dǎo)致耗時(shí)變長。因此,今后將針對(duì)上述問題對(duì)算法做進(jìn)一步的改進(jìn)。

猜你喜歡
變電站設(shè)備模型
一半模型
諧響應(yīng)分析在設(shè)備減振中的應(yīng)用
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
基于MPU6050簡單控制設(shè)備
電子制作(2018年11期)2018-08-04 03:26:08
關(guān)于變電站五防閉鎖裝置的探討
電子制作(2018年8期)2018-06-26 06:43:34
超高壓變電站運(yùn)行管理模式探討
電子制作(2017年8期)2017-06-05 09:36:15
3D打印中的模型分割與打包
220kV戶外變電站接地網(wǎng)的實(shí)用設(shè)計(jì)
500kV輸變電設(shè)備運(yùn)行維護(hù)探討
主站蜘蛛池模板: 黄色三级网站免费| 亚洲码一区二区三区| 国产黄色片在线看| 99人体免费视频| 国产精品免费福利久久播放| 国产丰满成熟女性性满足视频| 亚洲国产欧美国产综合久久 | 国产偷倩视频| 青青草一区| 国产资源站| 国产免费看久久久| 54pao国产成人免费视频| 亚洲午夜福利在线| 亚洲天堂免费观看| 国产丝袜91| 天堂中文在线资源| 欧美亚洲综合免费精品高清在线观看 | 好紧太爽了视频免费无码| 91丝袜乱伦| 久久国产精品波多野结衣| 激情无码字幕综合| 91福利免费视频| 青青草原国产免费av观看| 91美女视频在线观看| 亚洲高清资源| 亚洲国产精品久久久久秋霞影院| 国产成人一区| 欧美激情二区三区| 亚洲中文字幕无码爆乳| 真人免费一级毛片一区二区 | 国产福利免费视频| 麻豆精品在线视频| 欧美一级99在线观看国产| 啪啪啪亚洲无码| 国产在线观看99| 中文字幕色站| 亚洲 欧美 偷自乱 图片 | 国产麻豆另类AV| 三上悠亚精品二区在线观看| 91视频国产高清| 九九热视频精品在线| 欧美性天天| 亚洲中文字幕久久无码精品A| 91精品免费久久久| 欧美日韩国产综合视频在线观看 | 日韩在线中文| 无码免费试看| 第九色区aⅴ天堂久久香| 97久久免费视频| 91福利片| 成人福利一区二区视频在线| 欧美a级完整在线观看| 国产91丝袜在线播放动漫 | 国产精品永久免费嫩草研究院| 日韩成人在线网站| 欧美 国产 人人视频| 免费女人18毛片a级毛片视频| 67194亚洲无码| a天堂视频| 97在线公开视频| 一级片免费网站| 国产经典三级在线| 国产区91| 国产真实乱子伦精品视手机观看 | 成年片色大黄全免费网站久久| 久久国语对白| 久草青青在线视频| 亚洲日韩Av中文字幕无码| 亚洲成av人无码综合在线观看 | 丁香五月亚洲综合在线| 日韩 欧美 国产 精品 综合| 天天综合亚洲| 日韩AV手机在线观看蜜芽| 成人在线综合| 欧美精品1区| 国内丰满少妇猛烈精品播 | 中文字幕有乳无码| 波多野结衣一区二区三区四区| 国产女人在线视频| 国产99免费视频| 欧美成人日韩| 国产丰满大乳无码免费播放|