中圖分類號:TP393 文獻標志碼:A 文章編號:1001-5922(2025)05-0186-04
Abstract:In order to make up for the problem of long SVM training time,a 1/4 hyperspherical SVM QSSVM model realizedby DBN was constructed to realizethe anomaly detection of the online testfunction of SF6 digital meter. Firstly,the DBN wasused to reduce the dimensionality of high-dimensional data,and then the analysis method of QSSVM and sliding window model was used to achieve efcient testing of abnormal problems.The results showed that the accuracy of QSSVM continued to improve when the window was expanded.With a window of 1Oo,QSSVM could reduce computation time by nearly half relative to SVM.When the sample dimension was increased,QSSVM still had excellent detection performance,and the detection rate was as high as 94.16% . This study is helpful to improve the anomaly detection ability of SF6 digital meter data,and has good practical promotion value Key words: wirelesssensor network ;gas anomaly detection;deep belief network ;support vector machine
目前最為廣泛使用的仍然是機械式的SF6傳統表計,具備很高的可靠度,可以確保滿足測試精度要求,但并不能高效傳輸測試壓力,無法對數據進行集中控制,不能對變電站實現自動管理[14]。為更好地發揮各類傳感器數據的作用,需要對這些檢測數據進行高效分析,從而提供有益的參考價值,也可以將異常數據作為改善監測環境的重要依據[57] O
通過近鄰處理算法計算確定本節點與鄰近節點樣本之間的距離,當測試結果與相鄰節點參數存在顯著偏差時可以判斷此參數屬于異常狀態。由于參數距離計算需要較長時間,無法適應大規模傳感器網絡應用需求[8-9]。統計分析方法需要根據歷史數據的分布特征,構建合適的統計模型,如果數據與此模型不符合時說明發生了異常
。而處理大維度數據集時,采用此方法構建形成的統計模型與實際情況存在較大偏差[12]。通過分類的方式并結合歷史數據完成訓練過程,同時分類處理待檢測數據,同時構建所需的模型,不符合所有歸類條件的數據將被作為異常數據而去除[13-14]。 。
選擇單類支持向量機SVM方法開展異常檢測是當前檢測領域的一項重要技術。但SVM同樣含有缺陷問題,因為訓練期間要對非線性規劃內容進行計算,隨著數據維度的增大,需要花費更長的訓練時間[15-16]。為克服上述缺陷,設計了一種建立在DBN基礎上的1/4超球面支持向量機QSSVM模型。先通過DBN對高維數據實施降維后再采用QSSVM和滑動窗口模型相融合的分析方法來實現對異常問題的高效測試。通過測試發現,采用新算法能夠滿足大規模高維傳感器的數據處理需求,從而減小時間復雜度并能夠更加準確測定異常數據
1背景知識及問題描述
1.11/4超球面支持向量機(QSSVM)
SVM在模型訓練期間需求解二次規劃問題,增大了時間復雜度,可以把二次規劃的過程轉換成線性規劃的模式,使時間復雜度顯著減小[17]。QSSVM先將樣本參數進行映射后使其轉換到高維空間中,之后將空間中包含各樣本的圓心點轉移至坐標原點處,再沿正坐標軸方向建立1/4超球面,通過QSSVM進行分類的模型如圖1所示[18]


將式(1)的對偶算法表示為以下的形式:

以式(2)線性規劃計算時可獲得更低算法復雜度。再把式(2)轉變成以下的形式:

考慮到樣本節點 x 不能利用簡單式子來表達其在高維特征空間內跟原點之間的距離,這使得在現階段只能采用QSSVM進行離線式異常檢測。
1.2 深度信念網絡(DBN)模型
DBN模型見圖2所示。

BP神經網絡可以比較計算結果和期望數據,同時按照由頂層往下的方式進行調整以達到優化訓練結果的作用[19]
另一方面也可以利用DBN來實現對數據進行降維處理的過程,把
的參數通過DBN數據壓縮后轉換為低維向量
,符合
利用DBN對輸入參數無監督降維,并將特征參數輸入QSSVM,采用這種處理方式能夠顯著減小計算的復雜度。
2 傳感器異常測試
先構建由DBN、QSSVM組成的混合模型,可以同時具備訓練與測試功能,之后通過滑動窗口模型完成異常問題的在線測試。
圖3給出了通過深度信念網絡來實現的異常測試算法一—偽代碼程序。
1. input : X,Y(1:n) ,W_size
2. output : F
3.DBN_M←trainDBN(X) ;
4. X←degradation(DBN_M,X);
5.X_label←QSSVM(X) ;
6.X_normalremove(X,X_label);
7.WinitWindow(X_normal,W_size)
8.fori=1:n
9.Y(i)←degradation(DBN_M,Y(i))
10.W←updateWindow(W,Y(i),W_size) ;
11.Y(i)_label(i) ←QSSVM(W) ;
12.F(i) arrow abnormal(Y_label(i));
13.W←adjust(W,Y(i)_label(i));
14.endfor
15.Return F
采用該算法輸入訓練參數 X ,確定測試結果,得到測試結果 Y(1:n) ,采用該算法輸入訓練參數 X ,確定測試結果 Y(1:n) , n 是在各時刻下獲得測試結果,接著輸出異常值 F(1:n) ,其中, F(n) 為 n 時識別的異常樣本。具體計算過程是先利用訓練集樣本完成DBN網絡參數優化,進而利用DBN對數據 X 實施降維,得到降維后數據 X ,這些參數處在第4行。接著對QSSVM測試集 X 進行標簽分配,得到標簽取值等于1時,則判斷此數據正常,當取值等于-1時,代表出現異常數據,將結果記錄在第5行。隨后去除集合 X 異常參數,形成包含正常參數的數據集(
),該集合處在第6行;利用
初始化滑動窗口,在第7行。通過循環處理方式測試n時刻參數 Y(1:n) ,位于8~14行;該算法進行每次循環時都先利用DBN來完成Y(i)的降維過程,生成 Y(i) ,位于第9行;更新第10行滑動窗口數據,為QSSVM模型配備新窗口參數W,獲得標簽YO(i),處在第11行。接著,將檢測出的異常樣本存入F集合,該過程位于第12行,繼續調節窗口,并去除異常參數。最后,為下輪測試做好準備,此過程處在第13行。
3 實驗結果分析
3.1 數據集與實驗設置
測試數據來自UCI機器學習庫,共存在4組傳感器測試參數,分別為48維Forest與110維GAS測試數據、320維DAS參數和540維HAR檢測結果進行測試。先選取由連續時間組成的1000個樣本,之后對800個隨機樣本進行訓練。對所有樣本實施歸一化使其轉變為[0,1]之內的數,之后加入[0,1]區間內的隨機異常數據。
3.2 實驗結果與評價
3.2.1 算法效率及窗口大小影響
表1所示為模型在異常數據檢測階段花費的時間。

由表1可知,隨著窗口增加,獲得了更高的QSSVM準確率,這是因為當窗口尺寸增加后,所涵蓋的樣本范圍也隨之增多。計算球面半徑時,可以融合更多樣本數據,從而提高半徑精度。根據表2數據可以看出,隨著窗口擴大時,所有算法的運行時間都發生了一定程度的增加。特別適當窗口達到100時,QSSVM只需SVM的一半處理時間。此外還可以發現,一旦窗口在呢個價值某臨界點,準確度出現了減小的現象,為確保算法滿足計算效率要求,進行準確度測試時,設置QSSVM算法滑動窗口為100。
3.2.2 檢測率(DR)
圖4所示為以不同算法對各比率維度的異常參數進行測試,同時表2給出了各窗口下的QSSVM準確性。


觀察圖4測試數據可以明顯看出,樣本中存在高維異常數據時,檢測率出現顯著變化。QSSVM針對Fores、GAS數據的處理性能比K-means、FCM更差。提高樣本維度后,QSSVM依然表現出理想檢測效果。相對而言,K-means的檢測性能發生了一定程度的下降。運用QSSVM進行檢測的準確率達到94.23% 。FCM則一直保持較高檢測率,提高樣本維度后,并不能有效檢測到其中的部分低維異常參數,導致FCM召回率下降,該結果顯示并非所有異常參數都能夠被準確檢測。
4結語
(1)窗口增大后,獲得了更高的QSSVM準確度。在窗口為100的情況下,QSSVM相對于SVM可以降低近一半的計算時間。
(2)隨著樣本集中異常值占比提高時,檢測率顯著增大。隨著樣本維度的增加,QSSVM依然可以實現很高的檢測精度,獲得高達 94.16% 的檢測率。
【參考文獻】
[1] 曾福平,朱可馨,馮孝軒,等.SF6故障分解及特征組分檢測研究進展[J].高電壓技術,2023,49(8):3240-3257.
[2] 李青云,高宇鵬,楊倩倩.基于分片重傳鏈路感知的無線傳感器網絡能耗控制方法[J].傳感技術學報,2023,36(7):1136-1142.
[3] 孔凡珺,馬徑坦,諶珉灝,等.SF6壓力對GIS典型缺陷局部放電檢測靈敏度的影響[J].電力工程技術,2023,42(3) :233-241.
[4] 尹凱強,陳功,安韻竹,等.氣壓和溫度對SF6氣體絕緣性能的影響研究[J].電瓷避雷器,2023(2):71-77.
[5] 鮑毅,王正剛.基于移動Sink的無線傳感器網絡能量高效的駐留點路由算法[J].中南民族大學學報(自然科學版),2022,41(6):734-739.
[6] 王立峰,馬超,牛永光,等.基于大數據背景下電站設備狀態監測及故障檢修管理系統仿真設計[J].粘接,2022,49(10):176-179.
[7] 宋緒國,高國慶,蘇叢,等.蓄水電站水污染環境下職工健康狀況監測系統設計[J].粘接,2020,43(7):54-58.
[8] 馬娜,陳亮,魯方林,等.基于改進人工魚群算法的配電站三維空間的傳感器優化布置[J].電力科學與技術學報,2021,36(1):145-151.
[9] 饒芳,譚建軍,徐鵬飛,等.基于光伏電站的無線傳感網絡惡意節點識別與隔離研究[J].現代電子技術,2016,39(17) :82-83.
[10] 蔣瑋,王曉東,楊永標,等.電動汽車電池組智能管理及其無線傳感器網絡路由協議[J].電力系統自動化,2015,39(18):62-68.
[11] 汪義旺,宋佳,張波,等.基于無線傳感器網絡的光伏組件監測系統[J].計算機測量與控制,2014,22(1):36-38.
[12] 謝麗君.基于無線傳感器網絡的儲能系統設計[J].儲能科學與技術,2022,11(11):3724-3725.
[13] 吳冰瑞,陸玲霞.應用于無線傳感器網絡的低面積LDPC譯碼器[J].傳感器與微系統,2022,41(11):77-80.
[14] 葛仕杰,汪烈軍,李永明.基于混沌的無線傳感器網絡分組加密算法[J].計算機工程與設計,2022,43(9):2456-2463.
[15] 吳海波,施式亮,念其鋒.瓦斯濃度流數據實時異常檢測方法[J].計算機與數字工程,2019,47(5):1086-1090.
[16] 王振昊,王布宏.基于SVDD的ADS-B異常數據檢測[J].河北大學學報(自然科學版),2019,39(3):323-329.
[17] 張建文,王恩俊,陳煥栩,等.基于自回歸模型和超球面支持向量機的局部放電模式識別[J].電工電能新技術,2016,35(9):29-34.
[18]張英鋒,馬彪,朱愿,等.基于超球面支持向量機的綜合傳動狀態判別[J].吉林大學學報(工學版),2012,42(1) :13-18.
[19]李錦鍵,王興貴,楊維滿,等.基于改進遞歸深度信念網絡的CSP電站短期出力預測[J].太陽能學報,2022,43(7) :225-232.
[20]肖勇,馬喆非,羅鴻軒,等.基于深度信念網絡與數據聚合模型的智能電表數據異常檢測方法[J].南方電網技術,2021,15(1):99-106.
(責任編輯:蘇帆)