張 鑫,龐 詔
(國(guó)網(wǎng)寶雞供電公司,陜西 寶雞 721000)
電力無(wú)線通信網(wǎng)絡(luò)指在電力信息生成、傳輸、消耗等環(huán)節(jié)中,利用智能化設(shè)備,將電力信息進(jìn)行可靠性傳輸。利用電力無(wú)線通信網(wǎng)絡(luò),能夠?qū)崿F(xiàn)電網(wǎng)異常信號(hào)采集、通信等目標(biāo),對(duì)于智能電網(wǎng)的建設(shè)具有重要作用。目前,電力通信網(wǎng)絡(luò)信息數(shù)據(jù)呈爆炸式增長(zhǎng),網(wǎng)絡(luò)信息中的異常數(shù)據(jù)也隨之增加,影響了電力網(wǎng)絡(luò)信息的高質(zhì)量傳輸。針對(duì)此類(lèi)問(wèn)題,研究人員設(shè)計(jì)了多種異常值檢測(cè)方法。其中,基于信息熵的電力無(wú)線通信網(wǎng)絡(luò)信息異常值快速檢測(cè)方法,與基于深度學(xué)習(xí)的電力無(wú)線通信網(wǎng)絡(luò)信息異常值快速檢測(cè)方法的應(yīng)用較為廣泛。
基于信息熵的電力無(wú)線通信網(wǎng)絡(luò)信息異常值快速檢測(cè)方法,主要是利用熵理論推斷電力網(wǎng)絡(luò)異常情況,根據(jù)熵的估算量,確定網(wǎng)絡(luò)信息熵的取值范圍,從而檢測(cè)出網(wǎng)絡(luò)信息異常值[1]。基于深度學(xué)習(xí)的電力無(wú)線通信網(wǎng)絡(luò)信息異常值快速檢測(cè)方法,主要是結(jié)合卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)與長(zhǎng)短期記憶(Long Short Term Memory,LSTM)的混合檢測(cè)方法,通過(guò)識(shí)別電力信息網(wǎng)絡(luò)存在的異常值,分析檢測(cè)模型中不同異常值的檢測(cè)平衡性,從而提高檢測(cè)準(zhǔn)確率[2]。這2 種方法均能檢測(cè)電力網(wǎng)絡(luò)異常值,但是具體使用過(guò)程中更傾向于在靜態(tài)網(wǎng)絡(luò)的理想環(huán)境中進(jìn)行檢測(cè),在動(dòng)態(tài)網(wǎng)絡(luò)環(huán)境中存在一定的檢測(cè)誤差[3]。因此,設(shè)計(jì)了一種在動(dòng)態(tài)網(wǎng)絡(luò)環(huán)境下的電力無(wú)線通信網(wǎng)絡(luò)信息異常值快速檢測(cè)方法。
電力通信網(wǎng)絡(luò)中存在配電、用電業(yè)務(wù),受到電網(wǎng)規(guī)模的影響,網(wǎng)絡(luò)異常信息文本特征提取較為困難,存在較多的重復(fù)信息,影響異常信息檢測(cè)效果[4]。因此,文章將網(wǎng)絡(luò)信息中的異常關(guān)鍵詞進(jìn)行量化,剔除重復(fù)無(wú)意義的異常文本特征。在電力無(wú)線通信網(wǎng)絡(luò)中,以聚合系數(shù)與特征路徑長(zhǎng)度來(lái)衡量異常值。在異常信息文本向量中,文本由異常信息特征組成,每一個(gè)異常信息特征對(duì)應(yīng)一個(gè)權(quán)重值[5]。文章將信息特征與權(quán)重值一一對(duì)應(yīng),避免出現(xiàn)重復(fù)信息特征提取的問(wèn)題。異常信息文本特征權(quán)重的計(jì)算公式為
式中:Iq為異常信息文本特征權(quán)重;N為網(wǎng)絡(luò)異常信息出現(xiàn)在全部文本中的次數(shù);n為包含異常信息特征文本的數(shù)量。
當(dāng)電力通信網(wǎng)絡(luò)信息中出現(xiàn)2 個(gè)相似的文本時(shí),將二者合并,避免特征重復(fù)提取。異常信息相似度的計(jì)算公式為
式中:d(I1,I2)為I1、I2這2 個(gè)異常信息的檢測(cè)相似度;xi、yi為I1、I2這2 個(gè)異常信息的歐式距離。
I1、I2這2 個(gè)異常信息的特征向量在距離上越近,相似度越高。將相似度較高的信息合并,可以更好地通過(guò)文本特征區(qū)分網(wǎng)絡(luò)信息異常值。
動(dòng)態(tài)網(wǎng)絡(luò)是從電力信息的實(shí)際出發(fā),評(píng)估異常信息的異常特性,不但可以解決未知的不確定性,還能夠客觀地反映網(wǎng)絡(luò)當(dāng)前面臨的異常威脅。從現(xiàn)實(shí)意義來(lái)看,動(dòng)態(tài)網(wǎng)絡(luò)能夠彌補(bǔ)靜態(tài)網(wǎng)絡(luò)的異常威脅防御空白。文章在動(dòng)態(tài)網(wǎng)絡(luò)環(huán)境中對(duì)網(wǎng)絡(luò)信息異常情況進(jìn)行網(wǎng)絡(luò)層面的分析,電力信息網(wǎng)絡(luò)節(jié)點(diǎn)的異常因子關(guān)系如圖1 所示。

圖1 電力信息網(wǎng)絡(luò)節(jié)點(diǎn)異常因子關(guān)系
如圖1 所示,在電力信息網(wǎng)絡(luò)中,節(jié)點(diǎn)異常因子包括網(wǎng)絡(luò)節(jié)點(diǎn)配置脆弱性、節(jié)點(diǎn)資產(chǎn)異常威脅等異常值。其中,節(jié)點(diǎn)資產(chǎn)所在位置為網(wǎng)絡(luò)核心層;網(wǎng)絡(luò)節(jié)點(diǎn)配置脆弱性所在位置為接入層;異常所在位置為匯聚層。通過(guò)檢測(cè)電力信息網(wǎng)絡(luò)節(jié)點(diǎn)異常因子所在位置,確定異常值檢測(cè)的動(dòng)態(tài)評(píng)估閾值。在動(dòng)態(tài)網(wǎng)絡(luò)環(huán)境中,將已知的異常信息文本與正常信息文本進(jìn)行同時(shí)檢測(cè)訓(xùn)練,結(jié)合動(dòng)態(tài)評(píng)估閾值,構(gòu)造出閾值函數(shù),表達(dá)式為
式中:D為閾值函數(shù)的表達(dá)式;ε(Iq,Iz)為實(shí)際檢測(cè)到的異常值修正函數(shù);Iz為正常信息文本的特征權(quán)重;Rt為異常值動(dòng)態(tài)評(píng)估的最大閾值;St為異常值動(dòng)態(tài)評(píng)估的最小值。在ε(Iq,Iz)確定的情況下,滿(mǎn)足Rt與St之間的關(guān)系,即可確保動(dòng)態(tài)網(wǎng)絡(luò)異常檢測(cè)閾值的有效性。
文章動(dòng)態(tài)評(píng)估網(wǎng)絡(luò)的安全環(huán)境,通過(guò)設(shè)定網(wǎng)絡(luò)異常值的檢測(cè)閾值,提升網(wǎng)絡(luò)信息安全。根據(jù)隱變量的條件概率,計(jì)算異常信息對(duì)數(shù)似然函數(shù)的條件期望,形成電力無(wú)線通信網(wǎng)絡(luò)信息異常值快速檢測(cè)模型,表達(dá)式為
式中:Q為電力無(wú)線通信網(wǎng)絡(luò)信息異常值快速檢測(cè)模型;p為條件概率;γ為檢測(cè)模型的觀測(cè)參量;θ為動(dòng)態(tài)網(wǎng)絡(luò)環(huán)境響應(yīng)度。
完整的異常值數(shù)據(jù)通過(guò)對(duì)數(shù)似然函數(shù)的條件期望得到,條件期望被最大化時(shí),θ為最大狀態(tài),能夠在異常值出現(xiàn)的瞬間進(jìn)行檢測(cè),異常值檢測(cè)時(shí)間較短,能夠?qū)崿F(xiàn)異常值的快速檢測(cè)[9]。此時(shí),動(dòng)態(tài)網(wǎng)絡(luò)中的電力異常信息轉(zhuǎn)入模型后進(jìn)行細(xì)化,根據(jù)歷史檢測(cè)的異常問(wèn)題特征,獲取異常節(jié)點(diǎn)的位置,從而確保異常值檢測(cè)精準(zhǔn)度。
在動(dòng)態(tài)網(wǎng)絡(luò)環(huán)境下,將電力無(wú)線通信網(wǎng)絡(luò)信息采樣節(jié)點(diǎn)隨機(jī)化,檢測(cè)節(jié)點(diǎn)被通信網(wǎng)絡(luò)完全覆蓋。將檢測(cè)節(jié)點(diǎn)進(jìn)行前驅(qū)、后繼、后備等處理,使其處于周期性變化形式[10]。在隨機(jī)節(jié)點(diǎn)變化的狀態(tài)下,均勻隨機(jī)地檢測(cè)網(wǎng)絡(luò)中的任意節(jié)點(diǎn),從而避免漏檢、錯(cuò)檢等問(wèn)題。電力無(wú)線通信網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)如圖2 所示。

圖2 電力無(wú)線通信網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
如圖2 所示,黑色圓點(diǎn)為正常網(wǎng)絡(luò)信息節(jié)點(diǎn),白色圓點(diǎn)為異常網(wǎng)絡(luò)信息節(jié)點(diǎn)。異常節(jié)點(diǎn)根據(jù)當(dāng)前覆蓋網(wǎng)的覆蓋情況,將骨干覆蓋網(wǎng)中的正常節(jié)點(diǎn)替換為簇覆蓋網(wǎng)中的正常節(jié)點(diǎn)。2 個(gè)覆蓋網(wǎng)的正常節(jié)點(diǎn)一一對(duì)應(yīng),增強(qiáng)網(wǎng)絡(luò)信息檢測(cè)的健壯性。此時(shí),將簇覆蓋網(wǎng)中的異常節(jié)點(diǎn)與正常節(jié)點(diǎn)順序打亂,隨機(jī)選擇覆蓋網(wǎng)中的采樣節(jié)點(diǎn)進(jìn)行檢測(cè),確保電力無(wú)線通信網(wǎng)絡(luò)的異常檢測(cè)隨機(jī)均勻性,從而完成均衡網(wǎng)絡(luò)負(fù)載的任務(wù)。
為了驗(yàn)證本文設(shè)計(jì)的網(wǎng)絡(luò)信息異常值檢測(cè)方法是否滿(mǎn)足準(zhǔn)確性需求,對(duì)文章設(shè)計(jì)方法進(jìn)行了實(shí)驗(yàn)分析。最終的實(shí)驗(yàn)結(jié)果以文獻(xiàn)[1]中基于信息熵的電力無(wú)線通信網(wǎng)絡(luò)信息異常值快速檢測(cè)方法、文獻(xiàn)[2]中基于深度學(xué)習(xí)的電力無(wú)線通信網(wǎng)絡(luò)信息異常值快速檢測(cè)方法,以及本文設(shè)計(jì)的動(dòng)態(tài)網(wǎng)絡(luò)環(huán)境下的電力無(wú)線通信網(wǎng)絡(luò)信息異常值快速檢測(cè)方法進(jìn)行對(duì)比的形式呈現(xiàn)。
本次實(shí)驗(yàn)的數(shù)據(jù)準(zhǔn)備階段中,包括了數(shù)據(jù)采集與數(shù)據(jù)標(biāo)準(zhǔn)化2 個(gè)步驟。在數(shù)據(jù)采集階段,直接選擇了UCI 數(shù)據(jù)集中的數(shù)據(jù),包括KDDCUP99、duration、service、urget 等子集。本次實(shí)驗(yàn)對(duì)3 個(gè)數(shù)據(jù)子集的50 000 條數(shù)據(jù)進(jìn)行分析,利用Weka 自帶的unsupervised_attribute_Normalize 方法對(duì)異常值與正常值的屬性進(jìn)行歸一化處理,使網(wǎng)絡(luò)信息異常值與正常值均在動(dòng)態(tài)網(wǎng)絡(luò)環(huán)境的隨機(jī)區(qū)域,確保實(shí)驗(yàn)的有效性。在數(shù)據(jù)采集與處理完成之后,對(duì)異常值檢測(cè)準(zhǔn)確率Pc、異常值檢測(cè)召回率Rc、調(diào)整蘭德指數(shù)ARI 進(jìn)行計(jì)算。
異常值檢測(cè)準(zhǔn)確率Pc的計(jì)算公式為
式中:TP為正確檢測(cè)的網(wǎng)絡(luò)信息樣本數(shù)量;FP為異常值被錯(cuò)誤檢測(cè)為正常網(wǎng)絡(luò)信息樣本的數(shù)量。
召回率Rc的計(jì)算公式為
式中:Rc為異常值檢測(cè)召回率;TTP為正常網(wǎng)絡(luò)信息樣本被錯(cuò)誤檢測(cè)為異常值的數(shù)量;FN為漏檢網(wǎng)絡(luò)信息樣本數(shù)量。
調(diào)整蘭德指數(shù)ARI 計(jì)算公式為
式中:ARI 為調(diào)整蘭德指數(shù);RI為蘭德指數(shù);E(RI)為RI的檢測(cè)閾值。調(diào)整蘭德指數(shù)可以衡量網(wǎng)絡(luò)信息異常值分布的吻合情況。該指數(shù)越大,異常值檢測(cè)結(jié)果與真實(shí)情況越吻合。
Pc、Rc、ARI 都是判斷網(wǎng)絡(luò)信息異常值快速檢測(cè)的關(guān)鍵指標(biāo),這些指標(biāo)越大,異常值檢測(cè)效果越精準(zhǔn)。
文章隨機(jī)選取出duration、service、urget 共3 種網(wǎng)絡(luò)信息數(shù)據(jù)集。數(shù)據(jù)集中的網(wǎng)絡(luò)信息正常值與異常值雜亂無(wú)章,可以確保實(shí)驗(yàn)的真實(shí)有效性。以Pc、Rc、ARI 為異常值檢測(cè)效果判定指標(biāo),并將文獻(xiàn)[1]中基于信息熵的電力無(wú)線通信網(wǎng)絡(luò)信息異常值快速檢測(cè)方法的性能指標(biāo)、文獻(xiàn)[2]中基于深度學(xué)習(xí)的電力無(wú)線通信網(wǎng)絡(luò)信息異常值快速檢測(cè)方法的性能指標(biāo),以及本文設(shè)計(jì)的動(dòng)態(tài)網(wǎng)絡(luò)環(huán)境下的電力無(wú)線通信網(wǎng)絡(luò)信息異常值快速檢測(cè)方法的性能指標(biāo)進(jìn)行對(duì)比。實(shí)驗(yàn)結(jié)果如表1 所示。
使用文獻(xiàn)[1]中基于信息熵的電力無(wú)線通信網(wǎng)絡(luò)信息異常值快速檢測(cè)方法之后,Pc在0.73 ~0.86波動(dòng);Rc在0.82 ~0.84 波動(dòng);ARI 在0.75 ~0.79 波動(dòng)。由此可見(jiàn),使用該方法之后,異常值檢測(cè)存在一定程度的誤差,很難將全部的信息異常值檢測(cè)出來(lái),影響電力網(wǎng)絡(luò)的正常通信。
使用文獻(xiàn)[2]中基于深度學(xué)習(xí)的電力無(wú)線通信網(wǎng)絡(luò)信息異常值快速檢測(cè)方法之后,Pc、Rc、ARI 在0.85 ~0.91 變化,較之文獻(xiàn)[1]的檢測(cè)方法存在大幅度的提升,但與網(wǎng)絡(luò)檢測(cè)需求存在較大的差異,急需進(jìn)一步優(yōu)化。
使用本文設(shè)計(jì)的動(dòng)態(tài)網(wǎng)絡(luò)環(huán)境下的電力無(wú)線通信網(wǎng)絡(luò)信息異常值快速檢測(cè)方法之后,Pc、Rc、ARI均超過(guò)了0.95,趨近于1。由此可見(jiàn),使用本文設(shè)計(jì)的方法較之文獻(xiàn)[1]、文獻(xiàn)[2]中的方法均存在不同程度的提升,異常值檢測(cè)效果更佳,符合研究目的。
隨著智能電網(wǎng)的建設(shè),配電自動(dòng)化系統(tǒng)趨向網(wǎng)際互連協(xié)議化,網(wǎng)絡(luò)信息管理難以適應(yīng)數(shù)據(jù)增長(zhǎng)需求,出現(xiàn)了較多的網(wǎng)絡(luò)信息異常值。文章在動(dòng)態(tài)網(wǎng)絡(luò)環(huán)境下,設(shè)計(jì)了電力無(wú)線通信網(wǎng)絡(luò)信息異常值快速檢測(cè)方法。從信息異常特征、檢測(cè)模型、負(fù)載均衡等方面,分析與檢測(cè)電力網(wǎng)絡(luò)的通信信息異常情況,為電網(wǎng)終端運(yùn)行提供了業(yè)務(wù)保障。

表1 實(shí)驗(yàn)結(jié)果