遲福建 李桂鑫 孫闊



摘 要:由于惡性數據鏈干擾配電網的信息輸出和轉發控制能力,因此需檢測配電網信息物理系統中的惡性數據鏈。根據惡性數據時間序列節點融合惡性數據鏈能量特征,并構建其高維映射結構,通過高維映射結構擬合惡性數據,獲取惡性數據鏈。采用譜特征提取方法建立惡性數據鏈譜特征量模型,實現配電網信息物理系統惡性數據鏈的分類檢測。仿真結果表明,采用該方法進行配電網信息物理系統惡性數據鏈檢測的自適應性較好,分辨能力較強,在配電網信息物理系統惡性數據鏈檢測識別中具有很好的應用價值。
關鍵詞:配電網;信息物理系統;惡性數據鏈;檢測
中圖分類號:TM64?????? 文獻標識碼:A
Detection and Identification of Malignant Data
Link in Distribution Network Cyber Physical System
CHI Fu-jian, LI Gui-xin, SUN Kuo
(State Grid Tianjin Electric Power Company,Tianjin 300000,China)
Abstract:Because the malignant data link interferes with the information output and forwarding control ability of the distribution network, it is necessary to detect the malignant data link in the distribution network cyber physical system. According to the energy characteristics of malignant data link fusion by time series nodes of malignant data, the high dimensional mapping structure is constructed, and the malignant data chain is obtained by fitting malignant data by high dimensional mapping structure. The spectral feature extraction method is used to establish the spectral feature model of malignant data chain, and the classification and detection of malignant data link in distribution network cyber physical system is realized. The simulation results show that the method has good adaptability and strong resolution in the detection of malignant data chain in distribution network cyber physical system. The detection and recognition of malignant data chain in cyber physical system has good application value.
Key words:distribution network; cyber physical system; malignant data link; detection
配電網是由物理網絡、信息設備和計算單元模塊共同組成的一種信息物理系統,其具有運行方式多樣、兼容性大等優點,但在配電網信息物理系統進行配電過程中,受到配電網信息物理系統使用環境以及設備技術指標參量的影響,導致配電網信息物理系統中產生惡性數據[1]。而配電網信息物理系統的惡性數據主要是指用戶的不正常扣費信息、惡意攻擊數據以及個人資料泄露等內容。惡性數據的存在,不僅為阻礙配電網系統運行效率,還對電力用戶造成經濟損失。為此,需在該系統中增添惡性數據檢測的設備,實現系統的多級控制,進行信息流的準確識別與發送。但該做法會使系統結構更復雜,且開銷較大,導致配電網信息物理系統的運行產生不確定性,因此,為提高配電網的信息輸出和轉發控制能力,研究配電網信息物理系統惡性數據鏈檢測方法,在配電網的優化設計中具重要意義[2,3],目前在配電網信息物理系統理論分析領域,國內外已經取得一些初步的研究成果。
文獻[4]中提出一種基于改進混沌分區算法的配電網信息物理系統惡性數據鏈快速提取方法,利用混沌分區算法進行配電網信息物理系統惡性數據鏈檢測,但該方法進行配電網信息物理系統惡性數據鏈檢測的自適應性差,計算開銷較大。文獻[5]中提出基于分布式大數據融合的配電網信息物理系統惡性數據鏈檢測識別方法,采用多層次的配電網信息物理系統惡性數據鏈傳感器分布式陣列采集方法,進行配電網信息物理系統惡性數據鏈檢測,但該方法的抗干擾性差,但該方法進行配電網信息物理系統惡性數據鏈檢測的收斂性差。
針對上述問題,提出了配電網信息物理系統惡性數據鏈快速提取算法。算法具體內容如下:
(1)考慮惡性數據的周期性,計算該數據的時間序列節點距離,獲取其高維映射結構,為惡性數據檢測的準確率提供限制環境,增強檢測準確率;
(2)通過惡性數據的多重共線性特征線性擬合,得到惡性數據鏈;
(3)計算惡性數據的平均互信息量,構建譜特征量提取模型,為惡性數據的識別提供可能性;
(4)計算合并簇中惡性數據鏈的負載量,據此進行惡性數據鏈特征模糊聚類,將特征相似數據融合為一體,節省數據檢測的時間開銷;
(5)檢測算法可行性及有效性。
經仿真實驗分析,本方法在配電網信息物理系統惡性數據鏈的檢測和識別能力上,具有優越性能。
1 配電網信息物理系統惡性數據鏈采集和
統計分析模型
為提升惡性數據檢測的實用性,所研究配電網適用環境為多用戶小區,考察電壓控制、有功出力控制與功率因數調節應用場景中產生的惡性數據,而數據內容包含電網進行上述場景操作過程中產生的用戶的不正常扣費信息、惡意攻擊信息以及個人資料泄露的信息等。為檢測與識別配電網信息物理系統惡性數據鏈,首先需要采集系統中的惡性數據,根據惡性數據的時間序列節點距離構建高維映射結構,并通過映射結構進行惡性數據的擬合,最終獲取惡性數據鏈。
1.1 惡性數據的高維映射結構
為實現配電網信息物理系統惡性數據鏈檢測與識別,采集配電網信息物理系統惡性數據,其中在配電網進行電壓控制、有功出力控制與功率因數調節時所產生的惡性數據從結構上可分為周期性結構和非周期性結構[6],并構建配電網信息物理系統惡性數據傳感網絡模型。首先假設傳感網絡模型中惡性數據特征的分布時間序列為{Mn},n=1,2,…,N,分布時間序列中每個簇有一個簇頭節點(SN)和若干簇內節點(V0),通過歐氏距離公式進行惡性數據時間序列節點之間的距離求解,計算公式如下:
d(i,j)=(xi-xj)2+(yi-yj)2 (1)
其中,xi,yi,xjyj分別表示配電網信息物理系統中惡性數據時間序列節點i與節點j的橫坐標與縱坐標,d(i,j)表示兩節點之間的歐氏距離。
根據惡性數據時間序列節點距離,結合大數據融合方法,進行惡性數據能量特征的相似度融合[7],得到融合結果為:
E(L)=LEi (2)
其中,Ei表示惡性數據節點(中間節點)i的負載量;L為惡性數據特征的傳輸鏈路集。其中配電網信息物理系統中的傳輸負載信息發送給i節點的負載量為:
C(nj)=Eilδ+E(L)?? (3)
式中,E(L)為相似度融合結果,δ為負載比值,l為傳輸鏈個數。根據負載量融合結果,挖掘配電網信息物理系統惡性數據的屬性分區特征,采用多模融合方法在配電網信息物理系統中實現惡性數據采集。根據采集到的惡性數據進行數據特征量的頻譜偏移特性提取,對提取的譜特征量采用機器學習算法進行配電網信息物理系統惡性數據譜特征匹配,結合大數據輸出時間延遲,得到配電網信息物理系統惡性數據信息重組的特征空間,其表達式為:
Xn={Xn,Xn-τ,Xn-2τ,…,Xn-(d-1)τ} (4)
在信息重組的特征空間中挖掘配電網信息物理系統惡性數據的平均互信息量,得到互信息分布集合為:
Ri={R1,R2,R3,…,Rd} (5)
式中, Rd表示互信息分布的d個信息量。采用并行挖掘方法,挖掘配電網信息物理系統惡性數據特征的關聯規則[8],對互信息分布矩陣進行酉分解,得到特征分解的向量集為:
Tr={X1,X2,…,Xm}(6)
式中,Xm表示信息重組的特征空間的m個向量。采用奇異值特征分布式融合方法對配電網信息物理系統惡性數據進行高維映射,得到在高維映射空間內的配電網信息物理系統惡性數據的數據結構模型,該模型可用二維矩陣模型描述:
V=C(nj)∑T∑(RTiRi)(7)
式中,T表示惡性數據處理時間。通過式(8)得到配電網信息物理系統惡性數據的高維映射結構,在該結構上可進行數據的統計分析。
1.2 惡性數據的線性擬合
基于配電網信息物理系統惡性數據的高維映射結構,對惡性數據的尺度和時延等參量進行自適應學習和智能檢測,實現配電網信息物理系統惡性數據的譜峰搜索[9]。其中,配電網信息物理系統惡性數據的尺度參量為:
Si=Lεfsd2V (8)
式中,εfs代表惡性數據特征參數;d代表時延參數。惡性數據的時延參量集合為:
di={Xd+1,Xd+2,…Xd+m}(9)
式中,Xd+m為在m序列中的時延參數集合,采用關聯規則挖掘方法進行配電網信息物理系統惡性數據的結構重組,惡性數據的時延參量滿足類間平衡性,由此構建配電網信息物理系統惡性數據序列分析模型[10]。采用相關性的特征數據挖掘方法,進行檢驗統計分析,并對配電網信息物理系統惡性數據進行聚類處理。配電網信息物理系統惡性數據分布式傳感器存儲介質中,輸出負載w的均衡調度模型為:
ηwkω=diTwkTk>w,k∈Rw,w∈W(10)
其中,Twk代表惡性數據的快速提取的檢驗統計量。配電網信息物理系統惡性數據的快速提取的檢驗統計量Twk可以表示為:
Twk=Emink∈RwΗwh,kηw=
-1θln ∑k∈wexp ηwkω,w∈W,h∈H(11)
式中,ηw表示線性擬合值,θ是檢驗調節參數,配電網信息物理系統惡性數據的多重共線性特征線性擬合需滿足Twk<Ηwh,k,其中,配電網信息物理系統惡性數據的頻譜峰值ξwkω可以表示為:
Ηwh,k=min ξPrTwk≤ξ≥ω=
ETwk+γwkωk∈Rw,w∈W(12)
式中,γwk表示最大峰值擬合值,ξ表示多重閾值。最后,對配電網信息物理系統惡性數據采用廣義最小二乘法進行線性擬合[11],獲取完整的惡性數據鏈,擬合過程為:
ETx(L,d)=Lηwkω+Si,S>QSi,S≤Q (13)
在數據擬合過程中,將配電網信息物理系統數據的特征空間區域分為S和Q,設配電網信息物理系統惡性數據的內生性譜特征量S的解向量由{s1,s2,…,sn}構成,那么配電網信息物理系統惡性數據的熵分布概率為Ps(si),i=1,2,…,n,Q由大數據模糊測試集的解向量{q1,q2,…,qn}構成,綜上分析,完成惡性數據的擬合。通過對惡性數據的擬合,為配電網信息物理系統惡性數據鏈的檢測奠定理論基礎[12]。
2 惡性數據鏈檢測與識別
2.1 惡性數據鏈譜特征量模型
對獲取到的惡性數據鏈采用譜特征提取方法分析配電網物理系統惡性數據鏈的樣本分布特征,根據分布特征,進行惡性數據鏈檢測。對應的配電網信息物理系統惡性數據鏈快速提取的檢測概率為Pq(qj),j=1,2,…,n。在極限學習訓練下,構建配電網信息物理系統惡性數據鏈特征重組模型:
H(s)=-∑ni=1Ps(si)log 2Pq (14)
式中,Ps(si)表示配電網信息物理系統惡性數據鏈特征分布概念集si出現在仿射分區區域S的概率,類似地,Pq表示配電網信息物理系統惡性數據鏈特征的本體特征概念集。
初始化簇中心到簇內點的數據鏈A,得到配電網信息物理系統惡性數據鏈的平均互信息量分別為:
qw=∑k∈RwH(s)w,w∈W (15)
構建配電網信息物理系統惡性數據鏈模型,對多載波配電網信息物理系統惡性數據鏈進行頻譜分解,采用鏈路隨機分配方法進行配電網信息物理系統惡性數據鏈輸出傳感序列的均衡控制,得到配電網信息物理系統惡性數據鏈特征分解子序列表示為:
r2(n)=Aexp [j(qwT+θ),
n=0,1,…,(N-3)/2 (16)
根據r1(n)和r2(n)進行(N-1)/2點離散變換,提取配電網信息物理系統惡性數據鏈的譜特征量,譜特征量提取模型為:
Uk=∑ni=1Twi+r2(n)H(s)? (17)
式中,Twi表示數據鏈在不同輸出負載時的提取時間,在此基礎上,可根據提取的譜特征量進行惡性數據鏈的分類檢測[13]。
2.2 配電網信息物理系統惡性數據鏈的分類檢測
根據譜特征體系結果,進行配電網信息物理系統惡性數據鏈檢測,采用神經網絡分析方法,進行配電網信息物理系統惡性數據鏈檢測優化,得到合并簇中惡性數據鏈的負載量:
R1(k)=r2(n)exp (-jω0Tp/2),
k=0,1,…,(N-3)/2? (18)
R2(k)=Akexp (jφk),
k=0,1,…,(N-3)/2? (19)
其中,ω0為配電網信息物理系統惡性數據鏈的負載預測誤差,Tp為時間窗口,Ak為配電網信息物理系統惡性數據鏈的特征偏移幅值,φk為輸出擴展相位。對配電網信息物理系統惡性數據鏈進行線性預測,根據全局尋優結果,得到數據塊在各合并簇上最大長度,對配電網信息物理系統惡性數據鏈進行自適應盲分離處理,給定目標函數的解空間是從Rn到R,得到配電網信息物理系統惡性數據鏈集聚簇離群點U∈Rn,即根據上述建立的譜特征量提取模型在簇內點的數據鏈A中尋找一個點,采用自適應神經網絡學習算法進行配電網信息物理系統惡性數據鏈特征模糊聚類,當數據聚類的判決閾值滿足:
0≤pk+1≤R2(k)-pk≤1 (20)
初始化N個數據聚類中心,采用模糊聚類分析方法,進行配電網信息物理系統惡性數據鏈特征聚類處理,快速提取配電網信息物理系統中的惡性數據鏈:
min imize12‖w‖2+C∑ni=1ξisubjecttoyi-(w'Φ(xi)≤ε-ξiξi,≥0,i=1,2,…,n;C>0(21)
式中,Φ(xi)表示惡性數據信息重組的特征空間函數,C表示判決閾值,ξi表示頻譜集的峰值。至此,實現配電網信息物理系統惡性數據鏈快速提取。
3 仿真實驗與結果分析
為測試本方法在實現配電網信息物理系統惡性數據鏈智能檢測中的性能,進行仿真實驗。
實驗建立在Matlab 7仿真工具基礎上,采用Intel(R)Core(TM)2 Duo CPU 2.94 GHz處理器,配電網信息物理系統惡性數據鏈分布的陣列為200*400,對配電網信息物理系統惡性數據鏈的采樣帶寬長度為12 s。
在Oracle電力系統信息庫中選取大小為1024 MB的任意電力信息數據169個,排除可用性較差的實驗數據、特征點較弱的信息數據以及數據鏈特征點連貫性較差的信息數據,剩余100個初始樣本數據,同時向其中加入大小為27 MB的不正常扣費信息、惡意攻擊數據以及個人資料泄露等惡性數據信息,對初始樣本序列采樣的周期長度為T=0.16 s,配電網信息物理系統惡性數據鏈的基頻頻率為100 kHz,根據上述仿真環境和參數設定,將本文算法應用至電網客戶用電質量檢測中,并以某小區的配電網使用情況為例,分析監測管理系統中惡性數據運行行為,進行配電網信息物理系統惡性數據鏈檢測識別。首先分析該小區的原始配電網物理系統數據鏈的樣本分布情況,分布情況如圖1所示。
分析圖1可知,在配電網信息物理系統中,惡性數據鏈是由惡性初始數據和惡性終止數據組合而成,且呈集合狀聚集在一起。以惡性數據鏈為研究樣本,在云計算環境下,進行配電網信息物理系統惡性數據鏈快速提取,提取配電網信息物理系統惡性數據鏈的譜條紋特征,結果如圖2所示。
通過圖2可知,采用本方法進行配電網信息物理系統惡性數據鏈快速提取,提取的數據鏈具有很高的分辨能力,提高了對配電網信息物理系統惡性數據鏈的準確檢測和識別能力,得到配電網信息物理系統惡性數據鏈特征數據檢測準確率,其中配電網信息物理系統惡性數據鏈檢測與識別的準確率計算公式為:
G(s)=sMTTD(F2e+86.35Fe+14230) (22)
式中,s代表偏差變化率;Fe代表隸屬度函數。
根據式(22),在信息大小為25 MB的范圍內進行惡性數據鏈的挖掘,分別采用不同方法進行惡性數據鏈的挖掘準確率進行對比,對比結果如圖3所示。
分析圖3結果得知,隨著迭代次數的增大,對快速提取的準確性不斷提升,采用本方法進行配電網信息物理系統惡性數據鏈檢測的準確度達到100%,比傳統方法的平均準確率分別提高14.6%和13.4%。測試不同數據規模下的數據快速提取的時間開銷,得到對比結果見表1,分析表1結果得知,本方法進行配電網物理系統惡性數據鏈檢測的時間開銷較短,提高了數據監測識別的實時性。
根據表1可知,在進行惡性數據鏈的檢測與識別過程中,本方法的時間開銷較少,很大程度上優化了惡性數據鏈的檢測與識別的效率。
4 結 論
為提高配電網信息物理系統的故障診斷和分析能力,需對配電網信息物理系統的惡性數據鏈進行檢測和識別,提出了配電網信息物理系統惡性數據鏈快速提取算法。采用并行挖掘方法,進行配電網信息物理系統惡性數據鏈特征的關聯規則挖掘,并對配電網信息物理系統惡性數據鏈進行聚類處理。采用鏈路隨機分配方法進行配電網信息物理系統惡性數據鏈輸出傳感序列的均衡控制,實現配電網信息物理系統惡性數據鏈快速提取。研究得知,本方法進行配電網信息物理系統惡性數據鏈檢測識別的準確性較高,惡性數據鏈提取能力較好,時間開銷較小。
參考文獻
[1] 賈亦敏,史麗萍,嚴鑫.改進人工魚群算法優化小波神經網絡的變壓器故障診斷[J].河南理工大學學報(自然科學版),2019,38(2):103-109.
[2] 李勇,陳雨,蔡曄,等.基于信息物理接口矩陣的IEC61850變電站自動化系統可靠性分析[J].電力自動化設備,2019,39(1):84-90.
[3] 曹文彬,王先培,田猛,等.基于KELM和AT的SF6變壓器故障診斷[J].變壓器,2018,55(12):72-76.
[4] 張曉宇, 王天偉, 李燕, 等. 火電機組燃燒系統智能綜合優化控制研究[J]. 中國電機工程學報, 2019, 39(9): 2544-2552.
[5] 賀桂有,王永剛.高密度電阻率成像與聯合剖面法在輸電線路隱伏巖溶探測中的綜合應用[J].工程地球物理學報,2019,16(1):53-60.
[6] 徐舒瑋,邱才明,張東霞,等.基于深度學習的輸電線路故障類型辨識[J].中國電機工程學報,2019,39(1):65-74.
[7] 王謙.基于網絡流量異常檢測的電網工控系統安全監測技術[J].網絡安全技術與應用,2017(10):129.
[8] 張孝乾.含風電場的電力系統靜態電壓穩定性研究[J].電工技術,2018(24):111-114.
[9] 許海,楊尚瑾,金雪芬,等.基于潮流及短路計算的電力系統Ward等值實現方法[J].電力系統保護與控制,2018,46(24):104-110.
[10]張敏昊,叢浩熹,舒想,等.DBDS和十六硫醇對變壓器絕緣紙協同劣化作用的微觀機制研究[J].中國電機工程學報,2018,38(24):7156-7165.
[11]方超,謝君甫,張強.基于UCD3138的模塊電源數字控制技術研究[J].工業控制計算機,2017,30(2):134-136.
[12]王虹富,陶向紅,李柏青,等.基于虛擬中點功率的潮流估算模型[J].中國電機工程學報,2018,38(21):6305-6313.
[13]許賢澤,劉靜,施元,等.基于Spark和梯度提升樹模型的短期負荷預測[J].華中科技大學學報(自然科學版),2019,47(5):84-89.