鐘燕


摘要:文章結(jié)合相關(guān)的研究工作,提出了一種基于大數(shù)據(jù)分析手段下的檢測方法,由數(shù)據(jù)的演進過程、數(shù)據(jù)關(guān)聯(lián)等角度實現(xiàn)了對于異常情況有效檢測,并進一步提出了異常檢測體系,使其能夠使用在輸變電設(shè)備的狀態(tài)監(jiān)測數(shù)據(jù)流中,促使數(shù)據(jù)流當中的異常狀況能夠得以及時測出。
關(guān)鍵詞:大數(shù)據(jù);輸變電設(shè)備;異常檢測;時間序列;神經(jīng)網(wǎng)絡(luò) 文獻標識碼:A
中圖分類號:TM764 文章編號:1009-2374(2016)29-0128-02 DOI:10.13535/j.cnki.11-4406/n.2016.29.058
在輸變電設(shè)備的日常運行過程中常常會遭受到負荷、過電壓、內(nèi)部絕緣老化、自然環(huán)境等多方面異常狀況的影響,此類異常狀況往往會致使設(shè)備出現(xiàn)缺陷情況,因而針對設(shè)備狀態(tài)實施異常檢測十分重要,應(yīng)當引起人們的重視與思考。
1 單狀態(tài)量數(shù)據(jù)流特征量提取
1.1 自回歸模型
時間序列的自回歸模型大多應(yīng)用在許多工業(yè)過程之中,其主要的特點即為具備有極強記憶能力的AR系統(tǒng),在時間維度的t值上往往需借助于從前時刻行為,這和設(shè)備運行過程當中的低動態(tài)性完全符合。輸變電設(shè)備在日常運行過程當中其一部分狀態(tài)量的改變程度相對較小,例如導線拉力、接地電流等內(nèi)容,這些狀態(tài)量的數(shù)據(jù)信息往往從屬于平穩(wěn)序列,能夠直接應(yīng)用于AR擬合;此外還有一部分的狀態(tài)量會伴隨時間的推移而呈現(xiàn)出周期性的改變,但改變的幅度相對較小,例如油溫、環(huán)境溫度等情況,將其日周期性的改變因素排除后亦可借助于AR進行擬合,因而針對狀態(tài)數(shù)據(jù)則可利用一階AR進行模型擬合。
1.2 時間序列量化
自組織神經(jīng)網(wǎng)絡(luò)具體的運行機制是借助于無監(jiān)督學習方式,來促使競爭層當中不同的神經(jīng)元可以利用競爭和輸入模式予以匹配,最終僅保留一項神經(jīng)元即為獲勝者,此種獲得神經(jīng)元的輸入方法即為輸入模式分類法。因為無監(jiān)督學習的訓練樣本不具備有期望輸出情況,沒有任何的經(jīng)驗知識,因而較適用在數(shù)據(jù)量大、不含有標簽的狀態(tài)監(jiān)測數(shù)據(jù)當中。
采用SOM可以實時無監(jiān)督分類,進而促使整體序列成為SOM的一項輸出節(jié)點,其中序列是其中一項輸出節(jié)點,針對每一項訓練其專屬于節(jié)點的公式可表述為:
進行持續(xù)性的循環(huán)與改進,以保障距離所屬節(jié)點的距離值能夠達到最小。
1.3 時間序列變化過程
與徑向基、反饋型等神經(jīng)網(wǎng)絡(luò)所不同的是,SOM神經(jīng)網(wǎng)絡(luò)的輸出節(jié)點之間是互相關(guān)聯(lián)的,其相互間的關(guān)系可以借助于網(wǎng)絡(luò)拓撲結(jié)構(gòu)來表達。在拓撲結(jié)構(gòu)中,因為SOM在訓練過程當中的競爭性,使得每一項神經(jīng)元節(jié)點和鄰域當中的節(jié)點存在明顯的關(guān)聯(lián)性,和鄰域外部的節(jié)點關(guān)聯(lián)性較弱。也正是基于SOM神經(jīng)網(wǎng)絡(luò)的此種特性,在量化之后的時間序列可被視作為拓撲結(jié)構(gòu)中一項神經(jīng)元到另一項神經(jīng)元的轉(zhuǎn)移,進而挖掘出數(shù)據(jù)伴隨時間發(fā)生改變的規(guī)律性。
第一,計算神經(jīng)元所屬概率密度函數(shù)。借助于第一階段的轉(zhuǎn)移概率P值來達標神經(jīng)元間的相關(guān)性,AR模型當中神經(jīng)元的一階轉(zhuǎn)換概率可表述為,據(jù)此可求出AR模型在位于一階轉(zhuǎn)移之時的概率即為。
第二,計算神經(jīng)元間的轉(zhuǎn)移概率。因為AR過程較為穩(wěn)定,距離相對較近的神經(jīng)元之間發(fā)生轉(zhuǎn)移的概率也就相對較大,距離較遠的神經(jīng)元之間出現(xiàn)轉(zhuǎn)移的概率相對較小。利用變壓器油溫正常狀況之下的在線監(jiān)測數(shù)據(jù)進行舉例說明,首先使數(shù)據(jù)可以借助于AR模型予以擬合表述,進而得出相應(yīng)的模型參數(shù)值即為,,,而后將數(shù)量點的溫度數(shù)據(jù)值錄入至包含有12項神經(jīng)元的SOM當中予以擬合訓練,進而得到訓練完成的SOM神經(jīng)網(wǎng)絡(luò)系統(tǒng)。截取出其中的一段溫度數(shù)據(jù)值,如圖1(a)所示,同時將之錄入到完成擬合訓練的SOM當中進而取得量化輸出,即為圖1(b)所示。
依據(jù)AR模型參數(shù),求得SOM神經(jīng)元之間的轉(zhuǎn)移概率值,如圖2所示。通過觀察圖2可以發(fā)現(xiàn),位于對角線當中的轉(zhuǎn)移概率值最大,并且在灰色區(qū)域當中的轉(zhuǎn)移概率要顯著大于灰色區(qū)域之外的轉(zhuǎn)移概率,此即表明AR過程之中的數(shù)據(jù)在神經(jīng)元間的轉(zhuǎn)移概率和神經(jīng)元距離呈現(xiàn)出反比狀況,神經(jīng)元間的距離越大,相應(yīng)的數(shù)據(jù)信息也就越難發(fā)生轉(zhuǎn)移。
通過將溫度數(shù)據(jù)伴隨時間推移而產(chǎn)生的動態(tài)性改變,利用轉(zhuǎn)移概率序列來進行表達,如圖1(c)所示。通過觀察可以明顯的發(fā)現(xiàn)在一般狀況下,數(shù)據(jù)的轉(zhuǎn)移概率都較大,并且通常都是由圖2當中的灰色區(qū)域進行數(shù)值選取,此即表明溫度數(shù)據(jù)會伴隨著時間的改變而逐漸趨于平穩(wěn)。相反若序列當中的一段數(shù)據(jù)轉(zhuǎn)移概率在灰色區(qū)域之外時,則表明這一段數(shù)據(jù)在神經(jīng)元間的轉(zhuǎn)移相對更加頻繁,因此即可判定狀態(tài)量出現(xiàn)了異常。
2 多狀態(tài)量數(shù)據(jù)流特征提取
在日常的設(shè)備運行時,因受設(shè)備屬性、運行工作狀況、環(huán)境差異等因素的影響,通常會使得設(shè)備的狀態(tài)監(jiān)測量,多為參量間的相關(guān)性往往無法做出明確的函數(shù)表達。例如變壓器的熱點溫度、油溫、環(huán)境溫度以及負荷量等參數(shù)值往往需要借助于熱平衡方程予以表達,但是熱平衡方程參數(shù)數(shù)量較多并且在高溫環(huán)境下也會出現(xiàn)計算不準確的情況,進而使得熱點溫度值出現(xiàn)異常無法做出準確測定。
通過輸電線路覆冰舉例說明,將在線監(jiān)測的參量值Z作為一項三維數(shù)組,進而借助于DBSCAN算法進行類型聚合處理。如果一項三維數(shù)組與所有簇中點的距離均超過了某一特定值R,那么即表明這一數(shù)據(jù)不屬于任何一項簇組。因而,在某一參量值發(fā)生異常情況進而使得這一多維數(shù)組當中的Z不屬于任何一簇之時,即可判別這一時刻的多維數(shù)據(jù)發(fā)生了異常狀況。
3 異常檢測步驟
依據(jù)上文內(nèi)容當中的時間序列特征量提取算法,針對在線監(jiān)測數(shù)據(jù)實施以異常檢測的流程如圖3所示。
第一,對于每一項參量的歷史數(shù)據(jù)信息,借助于單狀態(tài)量數(shù)據(jù)流特征量的提取算法來就其轉(zhuǎn)移概率的矩陣模型進行計算處理。
第二,對于每一項參量的歷史數(shù)據(jù)信息,借助于多狀態(tài)量數(shù)據(jù)流特征量的提取算法針對多元時間序列予以聚合處理,從而使得歷史數(shù)據(jù)可以被聚集為m個簇。
第三,將實時監(jiān)測所得到的數(shù)據(jù)流信息導入至轉(zhuǎn)移概率矩陣當中,從而取得不同參量的轉(zhuǎn)移概率序列,進而就不同時間點當中數(shù)據(jù)是否為多狀態(tài)量數(shù)據(jù)流特征量的m聚類予以判別。
第四,依據(jù)上述判定結(jié)果針對數(shù)據(jù)流采取異常檢測,其中異常檢測的邏輯表述如下:(1)在不同的參量值轉(zhuǎn)移概率序列均不具備0值之時,并且數(shù)據(jù)流之中不同時間點數(shù)據(jù)從屬于m簇當中的1項之時,則這一段的數(shù)據(jù)即不存在異常狀況;(2)在鉻參量的轉(zhuǎn)移概率序列存在有少量的0值之時,同時數(shù)據(jù)流當中少數(shù)時間點數(shù)據(jù)均不為m簇,那么這一段落數(shù)據(jù)當中則存在有少量的幾個噪聲點,此為傳感器狀態(tài)異常,可忽略不計;(3)若k個參量的轉(zhuǎn)移概率序列存在有一連續(xù)的整段0值時,那么數(shù)據(jù)流當中的一大段時間點數(shù)據(jù)則均不屬于m簇,相應(yīng)的即可判定設(shè)備出現(xiàn)了異常運行狀況;(4)針對設(shè)備所出現(xiàn)的異常狀況,可依據(jù)參量轉(zhuǎn)移概率序列經(jīng)過0點位置的情況,判定出設(shè)備發(fā)生異常情況的具體時間點。
4 結(jié)語
本次研究所探討的方法其優(yōu)點即為能夠結(jié)合多元狀態(tài)量的歷史數(shù)據(jù)及目前數(shù)據(jù),同時可以實現(xiàn)對動態(tài)數(shù)據(jù)的異常檢測,相較于一般的閾值判定方法而言準確率相對較高。在設(shè)備被檢測出異常狀態(tài)后,此項檢測方法同時也存在有一定的缺陷,在今后的工作當中進行不斷改進與完善,從而避免由于外界環(huán)境異常所帶來的不利影響。
參考文獻
[1] 王佳明,劉文穎,魏帆,等.基于壽命周期成本管理的輸變電設(shè)備狀態(tài)檢修策略研究[J].電力系統(tǒng)保護與控制,2014,(5).
[2] 孫才新.輸變電設(shè)備狀態(tài)在線監(jiān)測與診斷技術(shù)現(xiàn)狀和前景[J].中國電力,2015,(2).
[3] 孫鵬,李劍,張勁,等.基于Markov過程的輸變電設(shè)備一體化智能監(jiān)測裝置可靠性評估[J].高電壓技術(shù),2015,(12).
(責任編輯:小 燕)