999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于稀疏自編碼的故障數據聚類清洗方法

2021-06-26 04:05:42李立生盧文華張世棟張林利
科學技術與工程 2021年15期
關鍵詞:設置特征故障

李立生, 劉 洋*, 盧文華, 張世棟, 張林利

(1.國網山東省電力公司電力科學研究院, 濟南 250002; 2.國網電力科學研究院武漢南瑞有限責任公司, 武漢 430000; 3.南京南瑞集團, 南京 210000)

在電力系統向智能電網及能源互聯網發展的過程中,海量的運行數據一方面促進電網的再發展,另一方面也帶來了數據利用處理難題。據調查,某省配電自動化后臺故障告警頁面一天可刷出(20~30)萬條故障告警信息,包含大量的重復、擾動、錯誤等故障數據。錄波型故障指示器主要應用于當下配電網故障數據記錄與故障診斷,當電網中元件發生故障或線路發生故障后,與該故障線路或元件相近的線路也會啟動錄波故障指示器,是造成更多重復數據的原因;運行老化和調試錯誤的故障指示器會造成干擾、抖動故障數據及錯誤故障數據混入正常故障數據中,加大了數據的復雜度和準確度,也是造成配電自動化后臺告警窗口數據刷新頻繁數據量大的主要原因。如此復雜和繁多的故障數據,運維人員短時間內無法準確定位實際的故障發生與故障類型,數據利用效率低下致使運維人員工作效率低下,如此便可能導致真實故障的惡化與擴散[1-2],嚴重情況下會導致電氣設備損壞,大面積長時間停電,造成巨大的經濟損失。因此對海量故障數據的處理和應用無疑是個亟需解決的技術問題。

針對海量故障數據智能清洗以獲得關鍵故障數據,中外學者已開展大量研究[3-5]。其中在輸電設備狀態故障數據清洗方面有諸多研究與應用,文獻[6-9]要研究電網輸變電設備的運行狀態監測數據清洗,集中于對狀態數據中的噪聲點、缺失數據進行清洗處理以及異常數據識別與修復,最終獲取運行設備的關鍵狀態故障數據。但文中清洗過程中對數據個體的完整性造成了一定的破壞,因此很難保證清洗效果。文獻[10]針對電網中過電壓故障數據運用神經網絡特征提取并進行分類研究,最終識別出正確的過電壓數據并對錯誤數據進行剔除,但文中只應用到三相中的一相數據,數據不能完整的反映故障特性,因此清洗效果還需驗證。文獻[1, 2, 11]對故障告警信息總體文本進行數據挖掘,匹配關鍵詞以達到對故障數據的清洗篩選,但忽略了海量數據清洗的實質,沒有從數據本身出發分析故障數據特征,清洗準確度有待驗證。以上研究在故障數據清洗方面或未有效利用故障數據本身或未有效地進行故障數據清洗提取。

針對以上問題,結合神經網絡及深度學習提出一種基于稀疏自編碼(sparse auto-encoder, SAE)的故障數據聚類清洗方法,其原理是首先對獲取的海量數據進行特征學習,提取數據中主要二維特征,其次利用聚類方法對數據進行預處理剔除干擾、抖動、錯誤故障數據,最終再次利用聚類方法對預處理故障數據進行聚類清洗,以實現對故障數據完全清洗與暫態故障數據庫的清潔效果,便于運維人員對關鍵故障信息的定位與發現,提高運維人員工作效率。

1 故障數據聚類清洗模型

1.1 稀疏自編碼

SAE的模型建立啟發于哺乳動物視覺系統簡單細胞感受野。其每一維被看作是一種特征,同基于稠密向量的分布式表示相比稀疏編碼具有更小的計算量和更好的可解釋性等優點[12-13]。在文獻[14-15]中稀疏自編碼已被證實完全可以應用于電氣量故障波形數據的特征獲取。單層稀疏自編碼由輸入層、隱含層、輸出層組成,其模型如圖1所示,其中由輸入層與隱含層構成“編碼器”能夠把高維數據降維表達至低維數據,由隱含層和輸出層構成“解碼器”能夠將降維后的低維數據復原回原來的高維輸入數據。

圖1 單層自編碼神經網絡結構Fig.1 Structure of single-layer auto-encoder neural network

對于此單層稀疏自編碼網絡,用(W,b)和(W′,b′)表示編碼層和解碼層的權重和偏置,則編碼過程為

a(1)=f(WX+b)

(1)

解碼過程為

y=f[W′a(1)+b′]

(2)

式中:f為隱含層單元的激活函數,即

(3)

對于一個k層的稀疏自編碼其稀疏懲罰項為

(4)

通過喂入數據使J(W,b)最小化,調節網絡中各個參數可以從隱含層獲得輸入數據的低維特征。

1.2 主成分分析

主成分分析(principal component analysis, PCA)是常用于數據預處理和圖像處理的一種數據降維方法,能有效從高維數據中提取到低維的數據特征并去除數據中噪聲和減少特征之間的相關性[16]。其定義為:在d維向量空間{tn}(n∈{1,2,…,n})中搜尋q個正交主向量wj(j∈{1,2,…,q}),獲得{tn}在wj子空間上的最大方差值[17],其主要目標是在高維數據中提取低維的線性無關主成分特征,圖2為二維數據投影到一維空間中,在方差最大的方向選取其投影才能保留更多的原始數據特征信息。

圖2 主成分分析Fig.2 Principal component analysis

1.3 密度峰快速搜尋聚類

密度峰快速搜尋聚類(clustering by fast search and find of density peaks, CFSFDP)是一種基于數據分布密度為依據進行分類的算法,處理故障數據能夠自動的獲取聚類簇數和聚類非球面形狀數據簇,算法速度更快實現更為簡單[18-19]。CFSFDP算法基于假設條件:對于數據集,聚類中心被一些較低局部密度的數據點所包圍且較低的局部密度點與其他較高的局部密度點有較大的距離[20-21]。

(5)

式(5)中:dc為大于0的人為設定截止距離,通常通過所有數據點的ρi升序排列,設置相鄰點平均百分數來間接控制其大小。如當有M個數據點時,設置不同的P值可得截止距離為第M×P/100個數據點的值。

xi與比其局部密度更高的數據組的距離為

(6)

在聚類過程中對應局部密度ρi較大,δi較大的數據組為各類簇中心,其余的數據組根據自身的ρi,xi歸類于各個類簇中心所表示的類簇,再或者由于dc的設置原因,造成其余數組在各類簇中存在交疊點,存在的交疊點則不為類簇的核元素[22]。

1.4 故障數據聚類清洗方法

暫態錄波故障數據清洗方法邏輯結構圖如圖3所示。整個系統主要由3部分組成。

圖3 故障數據清洗方法Fig.3 Failure data cleaning method

第一部分,故障特征提取,針對海量故障錄波數據用稀疏自編碼神經網絡進行特征提取,之后再使用PCA對稀疏特征進行降維提取,從而實現錄波故障數據的特征二維表達。需要注意的是導入網絡的故障數據應包括干擾、抖動、錯誤、高頻次擾動等故障數據波形,用來訓練神經網絡的參數以達到對故障數據特征有效的獲取[23]。

第二部分,故障數據預處理,對于第一部分提取的二維特征進行CFSFDP分析,找出數據點ρi非常小且遠離其他主類簇的離散數據,由于這些離散數據點有很大可能是單頻次異常干擾、抖動或者是錯誤故障數據,在混入真實故障數據后影響清洗效果,故需要對此類數據在進行完全聚類清洗之前進行異常數據預處理。

第三部分,故障數據清洗,在第二部的基礎上再次使用CFSFDP對預處理數據進行聚類分析,對于各個類簇實施類簇中心數據識別,確定各類屬性。如果聚類中心所表達的故障類型是高頻次擾動、錯誤等無效故障數據,則立即進行隔離清洗。對其余正確故障波形數據進行類簇中心代表數據提取作為推送數據,以達到對重復數據的剔除。繼而完成整個清洗過程,提高了海量數據中故障數據及故障屬性的識別率,提高了獲取主要、準確告警信息的效率。

2 故障錄波數據

本文模型訓練驗證所用數據為山東省各市縣2019年部分錄波故障數據,其中包含了大量的接地故障數據和一定量的干擾、抖動、無效數據。經過篩選,取得1 500條故障數據,其中包括320條干擾、抖動、錯誤故障數據如圖4所示,部分真實故障數據如圖5所示。

其中每一組訓練數據由故障點A、B、C三相電壓組成,獲取故障時刻三條線路電壓同時變化特征。在電網運行過程中不同類型的故障數據統一涌來,真實故障數據與錯誤無效故障數據魚目混雜,故有必要對此故障數據進行數據清洗。

3 暫態錄波故障數據清洗研究

3.1 故障波形特征提取

故障波形數據由故障時刻三相電壓拼接組成,由于故障指示器記錄故障時刻前4后8個周期波形,且往往在故障點左右3個周期便可有效反映故障特征,故取每一相電壓波形故障點時刻前1.5周期和故障點后1.5個周期,共256個數據,即每組數據為3×256維矩陣。經過稀疏自編碼降維壓縮后映射為2維數據,以用于實現后文聚類清洗。圖6為網絡設置為一個3層稀疏自編碼器進行特征降維后的數據可視化,其中輸入層神經元為768維,隱含層設置為2維,輸出為768維。喂入數據進行訓練,調節參數,提取隱含層數據為故障2維特征表達。

圖7所示為在三層稀疏自編碼神經網絡降維的基礎上加上PCA特征降維,即設置輸入層為768維,隱含層50維,PCA獲取50維數據后再降至2維主成分數據。比較圖6、圖7有明顯發現,稀疏自編碼直接降至2維后錯誤、無效波形數據與真實故障數據分離不明顯,離散程度較低,而加入PCA降維后的2維特征數據中錯誤、無效波形數據與真實故障數據分離較為明顯,離散度較高。

x、y為提取的第一、二特征量圖7 2維PCA特征提取Fig.7 2-D PCA feature extraction

造成圖6與圖7的差別在于把故障數據由768維直接降至2維會導致波形的特征信息損失較大,特征差別提取不明顯故可視化效果較差。而圖7首先把768維數據降至50維保留了更多的關鍵信息,而后用PCA在50維數據進行降維提取主成分能更好地保留數據特征,實現關鍵信息可視化。由此可見加入PCA的網絡對特征提取的效果更佳。

3.2 故障特征聚類清洗

針對稀疏自編碼和PCA對特征的降維提取后,利用CFSFDP進行對特征值進行數據預清洗,由于CFSFDP中截斷距離的設置對聚類效果有很大影響,當截斷距離dc設置為P=1時,計算各特征對應的ρi和δi,對ρi和δi和進行可視化如圖8所示,當ρi<0.2時有部分特征數據有較高的δi,即此類特征點為離散數據點,為錯誤、擾動的可能較極大,故應給予剔除隔離,實現對故障數據的初步預清洗。

圖8 數據點ρi、δi分布Fig.8 The ρi,δi distribution of the data point

對預清洗后的數據進行CFSFDP再次聚類效果如圖9(a),如表1中P=1時所示為圖9(a)對應的核元素聚類描述,其中可見類簇1和類簇3存在交疊點,這是由于相關參數dc的設置對聚類效果的影響,獲取各類簇中心代表點可知類簇2中心為錯誤無效特征,故由于類簇相似性可知類簇2為錯誤無效故障波形。應給予類簇2隔離實現聚類清洗的效果。

當設置截斷距離dc設置為P=0.5時,減小截斷距離后重新聚類,類簇1和類簇3的交疊點消失,得到新的各類簇如圖9(b)所示,表1中P=0.5時為圖9(b)聚類結果表述。同樣類簇2為錯誤無效波形數據需要進行隔離清洗。

表1 CFSFDP聚類結果

其中可以通過計算正確清洗率和錯誤清洗率來衡量模型聚類效果,通過計算當截斷距離dc設置為P=1和P=0.5時聚類效果如表2所示。

表2 CFSFDP聚類清洗結果統計表

即通過調節截斷距離,可以更好地獲取聚類模型,當截斷距離dc設置為P=1時,模型正確清洗高達92.50%但其錯誤清洗率也較高,損失了一部分正確波形。當截斷距離dc設置為P=0.5時,可知模型正確波形損失較少即錯誤清洗率較低為0.93%,但錯誤識別率降低了約5%。

x、y為提取的第一、二特征量圖9 聚類結果示圖Fig.9 Clustering results

顯然通過調節截斷距離可以使模型達到更好的聚類效果,故有必要研究截斷距離對聚類效果的影響,當截斷距離dc設置從P=0.1到P=3.2變化過程,各類簇聚類效果如圖10所示。

圖10 P對聚類結果的影響Fig.10 Influence of P on clustering results

根據dc對聚類結果的影響可知當dc設置較大時將造成各類簇間出現交疊點,從而影響聚類效果。根據本文研究設置截止距離相鄰點平均百分數P=0.4至P=1之間最為合適,可以得到較高的正確清洗率即可以有效地去除故障數據中的錯誤故障數據。以保證暫態故障數據庫的清潔。

目前針對暫態故障數據清洗方法有基于故障數據告警文本清洗方法[1]或基于波形文件規范邏輯的暫態故障數據[24]清洗方法。就基于波形文件規范邏輯清洗方法,在其清洗實驗中驗證正確清洗率雖然也在90%以上,但實驗條件苛刻無法驗證實測電網數據清洗效果以及對重復故障數據無法給予剔除。對本文中320條錯誤、干擾實測故障波形采用上述邏輯方法進行清洗測試。按照其方法分四步對數據文件進行合格波形篩選,第一步為判定每個文件夾下是否有成對的cfg與dat文件;第二步為判定是否每相波形數據采樣周期數不小于12個,周期采樣點不小于80個;第三步判定每相電流有效值是否均小于設定閾值;第四步判定波形突變點是否在錄波起始點前一周期內。如果滿足以上4個條件則判定為合格波形。根據現場實測數據電流普遍較大設置測試電流閾值范圍為2~16 A,計算并累計每步清洗后剔除的波形數據量,最終確定320條錯誤數據是否全部剔除。圖11為每層邏輯清洗剔除的波形數據量。

圖11 邏輯清洗波形剔除量圖Fig.11 Logical cleaning waveform elimination Figure

當電流閾值設置為較小時即2 A,第三步剔除波形數量為172條,總剔除量為236條,總未成功剔除量為74條,計算其正確清洗率約為74%,實測數據清洗效果較差。且隨著電流閾值設置增大時,總波形剔除量減小,邏輯清洗效果加劇變差。因此本文不失為一種更高效暫態故障數據清洗方法,切實從故障數據本身質量特征出發,故障清洗準確度、可信度更高。

4 結論

通過從電網總體故障數據中利用稀疏自編碼和PCA降維進行特征學習,然后利用CFSFDP對二維特征進行聚類,實現對故障數據的高效聚類清洗。適當的調節網絡參數,在正確清洗率達到87.18%,錯誤清洗率低于1%的情況下,對故障數據進行聚類清洗和代表數據點提取推送,能有效地從海量的故障數據中提取出真實準確的故障信息,剔除錯誤、無效的干擾數據,為智能告警提供優質的故障信息,同時從根本上解決了配電告警平臺頻繁刷屏的問題。

猜你喜歡
設置特征故障
中隊崗位該如何設置
少先隊活動(2021年4期)2021-07-23 01:46:22
故障一點通
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
奔馳R320車ABS、ESP故障燈異常點亮
本刊欄目設置說明
中俄臨床醫學專業課程設置的比較與思考
故障一點通
江淮車故障3例
主站蜘蛛池模板: 亚洲日韩Av中文字幕无码| 久久中文电影| 国产小视频免费| 东京热av无码电影一区二区| 免费看一级毛片波多结衣| 久久大香伊蕉在人线观看热2| 国产精品福利尤物youwu| 男女精品视频| 国产成人精品亚洲日本对白优播| 欧美97色| 国产性猛交XXXX免费看| 无码一区中文字幕| 免费女人18毛片a级毛片视频| 国产丝袜丝视频在线观看| 国产无码精品在线| 在线99视频| 97超级碰碰碰碰精品| 亚洲人成网址| 国产sm重味一区二区三区| 免费国产一级 片内射老| 亚洲中文在线视频| 国模极品一区二区三区| 手机永久AV在线播放| 国产永久在线视频| 97在线观看视频免费| 国产欧美日韩视频一区二区三区| 丁香婷婷综合激情| 911亚洲精品| 欧美中文字幕在线二区| 女人av社区男人的天堂| 中文字幕在线欧美| 日韩欧美中文字幕在线韩免费| 精品无码日韩国产不卡av| 中文字幕一区二区人妻电影| 精品久久蜜桃| 亚洲性网站| 欧美自慰一级看片免费| 欧美色综合网站| 欧美精品黑人粗大| 91小视频在线观看| 四虎永久免费地址| 人妻丰满熟妇啪啪| 国产一级精品毛片基地| 亚洲无码A视频在线| 亚洲黄色视频在线观看一区| 亚洲国产精品日韩专区AV| 亚洲六月丁香六月婷婷蜜芽| 亚洲v日韩v欧美在线观看| 在线亚洲精品福利网址导航| 一级片免费网站| 这里只有精品在线| 色天天综合久久久久综合片| 福利小视频在线播放| 3p叠罗汉国产精品久久| 成年人免费国产视频| www亚洲天堂| 精品99在线观看| 一级毛片免费的| 色悠久久综合| 欧美国产在线看| 久久黄色一级视频| 免费看一级毛片波多结衣| 欧美日韩资源| 国产精品免费电影| 亚洲αv毛片| 国产人妖视频一区在线观看| 91在线无码精品秘九色APP| 精品久久久无码专区中文字幕| 欧美日韩va| 少妇人妻无码首页| 国产成人综合在线视频| 国产福利影院在线观看| 久久99国产综合精品女同| 亚洲最大福利视频网| 麻豆AV网站免费进入| 在线免费不卡视频| 三级国产在线观看| 成人午夜视频网站| 午夜a级毛片| 国产在线一区视频| 69综合网| 久久久亚洲色|