999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Spark的變壓器局部放電模式識別并行化實現

2023-02-17 01:58:46朱永利
計算機應用與軟件 2023年1期
關鍵詞:模式識別模型

李 濤 朱永利

(華北電力大學控制與計算機工程學院 河北 保定 071003)

0 引 言

智能電網的飛速發展導致電力設備在線監測數據量正在呈現指數形式的增長。傳統的數據處理方式不能夠達到當今智能電網從海量數據中快速收集和分析數據的要求,這種情況會對電力設備在線監測系統的功能方面上提出了更加嚴格的要求。因此,在Spark平臺實現對局部放電類型快速高效的識別并進行診斷對電力設施的安全性和穩定性有著重大的意義。

目前神經網絡[1]、支持向量機[2-3]、聚類算法[4]等多種方法運用到放電信號的分類中,但以上所提出的算法都有著各自的一些問題。其中,人工神經網絡具有收斂速度慢、過擬合、網絡結構難以確定等問題[5]。支持向量機(Support Vector Machine,SVM)算法在處理多分類問題時較為復雜[6],對大數據進行處理的過程中會造成大量的計算負荷。聚類方法在樣本較大時存在分類效果差[7]。而以上的方法都沒有考慮到原始信號中所提取的特征向量間存在關聯。針對上述問題,Raghuraj等[8]提出了基于變量預測模型的模式識別方法。變量預測模型模式識別方法利用訓練數據間的關聯創建數學模型,然后對測試數據進行測試并且利用最小特征參數預測誤差值實現樣本間的分類。這種方法優勢在于可以對非線性多分類問題進行處理并且防止了神經網絡和SVM中結構和參數選擇問題。

當前MapReduce分布式編程模型已經普遍應用于電力行業中的大數據處理。但Hadoop在HDFS上重復進行讀寫操作造成較高的磁盤I/O負荷和時間消耗不能滿足數據處理的實時性要求。Spark[9-10]和MapReduce相比具有高效易用、支持DAG和Java、Scala、Python、R四種語言和分布式內存計算等優點,消除了MapReduce在計算時因重復讀寫磁盤帶來的消耗。例如文獻[11]將基于Spark的機器學習模型應用于大數據流以進行健康狀況預測,圍繞Apache Spark引擎構建了可擴展的實時健康狀況預測系統,并且將該引擎在云上進行了測試和部署,并在其中將模型運用到了流數據。如文獻[12]將Hadoop、Spark和Flink平臺的性能進行了對比,Spark與其他兩個平臺綜合比較下性能最佳。在大規模集群下,Spark計算框架在WordCount和K-Means算法中獲得了最佳的結果。如文獻[13]為網上學習平臺開發了分布式課程推薦系統,它旨在使用關聯規則方法發現學生活動之間的關系,以幫助學生選擇最合適的學習材料。研究結果表明Spark的內存內計算是最快且可擴展的解決方案,提出的系統可以被應用并容易地融入其他學習平臺中。

綜上所述,本文采取將并行化VPMCD算法應用到Spark平臺上構造變量預測模型(VPM),將此模型應用到了局部放電信號的模式識別并且完成了對放電類型的快速分類的實現。

1 基于VPMCD的模式識別方法

1.1 變量預測模型

本文采取特征向量X=[X1,X2,…,Xp]定義某種類別的局部放電信號,特征向量包括p個不同的特征值以及其他特征對Xi影響值(Xj;j≠i)。這些局部放電信號的特征量可能是一對一的關聯:X1=f(X2)或一對多的關聯:X1=f(X2,X2,…)。對VPMi模型進行數學訓練,以反映不同故障之間的相互關聯,并用于預測測試樣本屬于哪個故障類別。

本文采用線性(L)、線性交互(LI)、二次(Q)和二次交互(QI)等模型形式的四種多項式模型類型:

(1)

(2)

(3)

(4)

式中:r(r≤p-1)是模型階數。

以p個特征值分類問題為例,變量預測模型可以利用預測變量Xj(j≠i)預測變量Xi,其定義如下:

Xi=f(Xj,b0,bj,bjj,bjk)+e

(5)

1.2 VPMCD訓練

(1) 通常,假設訓練樣本具有g個不同的類,每個類擁有nk(k=1,2,…,g)個訓練數據。總集合為N[n×p;g],其中p為特征向量維數。讀取訓練集N。

(4) 令k=k+1并重復步驟(3)直到k=g,然后停止。

1.3 VPMCD測試

1.4 VPMCD算法流程

VPMCD模型訓練和測試的算法流程如圖1所示。

圖1 VPMCD算法流程

2 并行VPMCD

2.1 局部放電樣本特征量的采集

本文所用的數據是對以上四種放電模型所產生的局部放電信號進行特征提取收集到的數據。所收集原始信號的頻率為40 MHz,帶寬為40~300 kHz,選擇50個工頻周期的信號作為一個統計樣本。4類放電模型如圖2所示。

(a) 電暈放電 (b) 針板放電

(c) 板對板放電 (d) 懸浮放電圖2 四種局部放電模型

采取局部放電相位分析(PRPD)方法對以上四種放電類型放電信號的φ-q-n圖譜的PRPD特征進行提取并構造特征向量。每類放電收集到400個樣本,總共收集到1 600個樣本,選擇樣本中的1 000個樣本為訓練樣本,而剩余的600個樣本成為測試樣本。對各放電類型的φ-q-n圖譜分別提取11維特征分別作為特征向量輸入到VPMCD中實現分類識別,提取的特征如表1所示。基于PRPD的特征提取的具體內容如文獻[14-15]所述。

表1 PD信號的統計特征

2.2 數據處理流程

Spark平臺存在三種可行的并行化編程方法,分別是數據并行、任務并行、數據并行和任務并行結合等三種方案。數據量的持續增長會導致單機環境下訓練數據時效率降低。VPMCD在訓練不同數據的實驗過程中數據相互獨立,而且數據的處理的次序對結果無影響。因此,本論文采取將數據部署到多個節點進行數據的并行處理,可以減少訓練時間,大幅度提高處理數據的效率。

本文采取稀疏矩陣存儲方式對數據進行存儲,使用此方式的優勢在于計算速度快,并且能夠節省數據的儲存空間,讀取數據較為方便。

數據處理步驟如下:

(1) 所采集的特征向量數據導入HDFS(Hadoop Distributed File System)中并將數據讀入文件并創造RDD數據切片。

(2) 為獲取實驗所需的訓練集和測試集,首先通過collect()函數得到各種故障類的數據數量,其次使用map()和split()函數將數據進行劃分。

(3) 采用cartesian()和filter()函數對數據矩陣進行計算進而獲取每個樣本特征值的參數模型。

(4) 通過reduce()等相關函數計算最小預測誤差并且計算后獲取故障類型的最佳預測模型。

(5) 最后將最優化VPM模型參數保存到HDFS文件系統中。

數據流程如圖3所示。

圖3 數據流程

2.3 性能優化

本文所涉及的廣播(Broadcast)變量屬于Spark計算框架中共享變量中的一種,而廣播變量的優勢在于將只讀副本分給各個Executor而不是給所有的Task分發新副本,在很大程度上減少了變量所產生的副本和Executor的內存開銷。在進行并行計算過程中,隨著數據量和節點數的增多,各個節點間的數據交換和移動將會導致通信開銷的增長。

本文采取SparkContext.broadcast()來使用廣播變量對節點間數據進行優化,計算過程中在每個節點上存有只讀變量,Spark計算框架對廣播變量的優化節約了內存空間,對數據的處理效率和全局的處理速率進行了提升。廣播變量所定義的函數原型為:

def broadcast[T:ClassTag](value:T):Broadcast[T]

2.4 基于并行VPMCD的變壓器局部放電模式識別

本文為了有效地提高對放電類型的快速識別能力,提出在Spark計算框架下局部放電信號模式識別的并行化方法。算法流程如圖4所示。

圖4 算法流程

算法流程如下:

1) 配置Spark環境,Spark計算框架在內存中完成計算減少了對HDFS重復讀寫。

2) 將采集到的數據存入到HDFS系統當中,構造訓練集和測試集。

3) 從HDFS中將數據載入內存,轉換為RDD形式。

4) 采取變量預測模型模式識別中的四種數學模型對帶標簽的訓練數據進行訓練,得到參數,進而形成診斷分類模型。

5) 將訓練好的模型對測試集分類進而確定放電類型。

3 實驗結果及分析

3.1 環境搭建

本文在實驗室搭建的Spark集群共設置6個節點,1個主節點(MasterNode)節點和5個從節點(SalveNode),由千兆交換機構成一個內部網絡。主節點配置CPU為i3- 2120 3.30 GHz,內存3 GB,硬盤250 GB。從節點CPU為E5- 2609 v2 2.50 GHz,內存7 GB,硬盤300 GB。平臺采取YARN Cluster模式進行部署。各個節點的操作系統為CentOS- 7,Hadoop的版本為Hadoop2.9.2,Spark的版本是Spark2.3.0。

3.2 單機環境下放電類型的正確識別率

實驗在單機情況下采取在MATLAB平臺上分別使用BP神經網絡、SVM和VPMCD對隨機選取的測試樣本進行測試,以此進行算法正確識別率的對比。本實驗在聯想電腦上進行操作,相關配置:CPU為i5-8250U,內存為8 GB,64位Windows 10操作系統,編程環境為MATLAB R2018a。對樣本集中各類放電類型隨機選擇150個為訓練樣本,對所有測試集進行測試后分類的結果如表2所示。

表2 PD信號識別的準確率(%)

可以看出,VPMCD算法與BP神經網絡和SVM相比較下具有更高的準確率、實驗證明變量預測模型模式識別算法有較高的正確識別率、更好的識別效果。

3.3 VPMCD并行驗證

(1) 集群環境和單機環境訓練時間的對比。集群環境下的實驗需要對樣本數據進行隨機復制操作。因電力設備故障樣本屬于小樣本,樣本數量有限,通過對已采集的數據進行大規模動態隨機復制,將數據量從幾百條增至百萬條。本實驗在集群環境和單機環境下的訓練時間的對比如圖5所示。

圖5 集群和單機環境下運行時間的對比

可以看出,實驗所用的數據規模相對少的環境下,單機環境下的處理速度較快于集群處理速度,這是因為Spark在分塊和任務調度方面耗費了一些時間,所以導致并行處理效率略低于串行處理。但是隨著數據規模從十萬條逐步擴大到數十萬條,集群環境下的執行時間要明顯低于單機環境下的執行時間,由此可看出并行處理具有較為顯著的優勢。

(2) 加速比與節點間的關系。Spark計算框架能夠對大量數據進行快速處理,而且Spark的處理能力與數據量和集群的節點數相關聯。加速比[16]不僅能對Spark系統的性能和成效進行分析,還可以將并行環境和串行環境下的運行速度進行定量的對比分析。

本實驗的訓練數據分別采用50 MB、512 MB、1 024 MB的加速比進行比較。所得結果如圖6所示,數據規模較小時,加速比隨著節點數的增多反而降低,進而證明本并行VPMCD適合大規模數據處理。數據量較大時,相同的數據規模下加速比隨著節點數的增多而提升,節點數相同時,加速比隨著數據量的擴充而提高,表現出Spark平臺對大規模數據處理的優良性能。

圖6 不同數據下加速比和節點數的關系

4 結 語

傳統的局部放電模式識別方法難以處理海量的監測數據,難以滿足智能電網的需求,本文將Spark計算框架運用到變壓器海量數據監測上,對放電信號提取其φ-q-n圖譜的PRPD特征構成相關特征向量作為實驗樣本,并行實現VPMCD算法完成了放電類型的分類。對實驗結論進行詳細的分析,可以表明變量預測模型模式識別方法的識別精度高于SVM和BP神經網絡模型,數據規模較大時,Spark并行處理數據速度遠快于傳統的串行處理方法。

猜你喜歡
模式識別模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
紫地榆HPLC指紋圖譜建立及模式識別
中成藥(2018年2期)2018-05-09 07:19:52
淺談模式識別在圖像識別中的應用
電子測試(2017年23期)2017-04-04 05:06:50
第四屆亞洲模式識別會議
3D打印中的模型分割與打包
可拓模式識別算法中經典域的確定方法
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
第3屆亞洲模式識別會議
主站蜘蛛池模板: 亚洲va在线∨a天堂va欧美va| 亚洲国产精品日韩欧美一区| 91精品国产91久久久久久三级| 精品视频在线一区| 最新国产你懂的在线网址| 在线观看亚洲天堂| 亚卅精品无码久久毛片乌克兰| 国产一区二区免费播放| 亚洲 欧美 偷自乱 图片| 久久无码免费束人妻| 视频一区亚洲| 免费欧美一级| 欧洲欧美人成免费全部视频 | 国产精品成人一区二区| 成年人免费国产视频| 成人伊人色一区二区三区| 99久久精品国产麻豆婷婷| 国产视频入口| 好紧好深好大乳无码中文字幕| 日韩高清一区 | 国产永久免费视频m3u8| 中文国产成人精品久久一| 日本黄色不卡视频| 91精品国产综合久久香蕉922 | 激情综合婷婷丁香五月尤物| 久久九九热视频| 国模私拍一区二区| 亚洲国产成人超福利久久精品| 午夜性爽视频男人的天堂| 亚洲高清资源| 国产精品林美惠子在线播放| 久久女人网| 一区二区日韩国产精久久| 亚洲欧美日韩久久精品| 久久亚洲天堂| 高清免费毛片| 精品综合久久久久久97超人该| 2020国产在线视精品在| 中文字幕有乳无码| 福利视频一区| 四虎亚洲国产成人久久精品| 国产在线精彩视频二区| 欧美日韩理论| 午夜精品福利影院| 国产色图在线观看| 亚洲国产欧美国产综合久久| 污视频日本| 亚洲精品欧美重口| 久久天天躁狠狠躁夜夜2020一| 日韩在线欧美在线| 操国产美女| 国产极品美女在线播放| 成人日韩视频| 香蕉eeww99国产在线观看| 狠狠色狠狠综合久久| 四虎AV麻豆| 日韩乱码免费一区二区三区| 福利视频久久| 亚洲香蕉在线| 国产成人毛片| 国产原创演绎剧情有字幕的| 三级视频中文字幕| 国产呦精品一区二区三区网站| 午夜日本永久乱码免费播放片| 日韩人妻少妇一区二区| 99视频免费观看| 日韩精品无码一级毛片免费| 国产精品免费入口视频| 亚洲人成网址| 女人18毛片久久| aa级毛片毛片免费观看久| 日韩A级毛片一区二区三区| 亚洲天堂成人在线观看| 亚洲 欧美 偷自乱 图片| 伊人查蕉在线观看国产精品| 亚洲欧美极品| 国产精品视频猛进猛出| 成人午夜精品一级毛片| 国产在线观看精品| 一级片免费网站| 天堂网国产| 亚洲欧美极品|