張夢凡,史普鑫,孟繁林,張 賁,耿 琳
(國家電網(wǎng)華北電力調(diào)控分中心,北京 100053)
近年來,電力網(wǎng)絡(luò)的規(guī)模逐漸增加,為我國各地區(qū)經(jīng)濟(jì)發(fā)展提供了優(yōu)質(zhì)的電力保障。信息通信的發(fā)展與電網(wǎng)的智能化程度密切相關(guān)[1]。電力通信網(wǎng)絡(luò)是電力系統(tǒng)智能化的重要組成部分。通信網(wǎng)絡(luò)的環(huán)境復(fù)雜、業(yè)務(wù)眾多、服務(wù)質(zhì)量需求多樣化,對電力通信網(wǎng)絡(luò)的可靠性和安全性提出了挑戰(zhàn)[2]。
在國內(nèi)外電力通信網(wǎng)絡(luò)研究中,基于快速傅里葉變換 (fast Fourier transform,FFT)的概率神經(jīng)網(wǎng)絡(luò)故障診斷模型[3]方法建立了電力信息網(wǎng)絡(luò)模型,研究了通信網(wǎng)絡(luò)與電網(wǎng)各自運(yùn)行的進(jìn)程和業(yè)務(wù)數(shù)據(jù)的交互,分析了網(wǎng)絡(luò)拓?fù)淠P偷南嗨菩?。但該方法沒有考慮到電網(wǎng)不同的運(yùn)行方式,以及二次設(shè)備動(dòng)作對網(wǎng)絡(luò)故障的影響。基于深度學(xué)習(xí)的網(wǎng)絡(luò)故障診斷系統(tǒng)[4]采用蒙特卡洛模擬方法,對通信網(wǎng)絡(luò)鏈路的有效性和耦合網(wǎng)絡(luò)的可靠性進(jìn)行分析,提高了通信誤碼鏈路的有效性。但該方法忽略了通信網(wǎng)絡(luò)與電力網(wǎng)之間的耦合程度,只考慮了單側(cè)網(wǎng)絡(luò)節(jié)點(diǎn)的重要程度。輸氣網(wǎng)絡(luò)故障對供氣安全的影響[5]方法通過構(gòu)建級聯(lián)故障的網(wǎng)絡(luò)物理系統(tǒng)模型,分析了輸電網(wǎng)絡(luò)和信息物理耦合網(wǎng)絡(luò)在不同拓?fù)浣M合下的可靠性,完成了通信網(wǎng)絡(luò)的故障定位。但該方法未考慮多屬性決策對節(jié)點(diǎn)重要度的影響,對復(fù)雜網(wǎng)絡(luò)拓?fù)涮卣鞯淖R別不全面。
本文針對電力通信網(wǎng)絡(luò)設(shè)計(jì)了智能運(yùn)維故障診斷系統(tǒng),以保證電力通信網(wǎng)絡(luò)的高靈活性和可靠性,并確保電力系統(tǒng)中生產(chǎn)控制業(yè)務(wù)、信息管理業(yè)務(wù)、電力調(diào)度和控制等業(yè)務(wù)的正常運(yùn)行。
智能運(yùn)維故障診斷系統(tǒng)對網(wǎng)絡(luò)中的網(wǎng)絡(luò)節(jié)點(diǎn)進(jìn)行故障診斷,使網(wǎng)絡(luò)節(jié)點(diǎn)不會(huì)受到攻擊或感染惡意程序,以保障通信網(wǎng)絡(luò)中關(guān)鍵的業(yè)務(wù)類信息流正常傳輸,從而提升網(wǎng)絡(luò)資源利用率。這將為重點(diǎn)業(yè)務(wù)提供保障,以確保電力通信網(wǎng)絡(luò)的高效運(yùn)行[6]。
系統(tǒng)整體架構(gòu)設(shè)計(jì)如圖1所示。

圖1 系統(tǒng)整體架構(gòu)設(shè)計(jì)
系統(tǒng)通過對電力通信網(wǎng)絡(luò)節(jié)點(diǎn)進(jìn)行監(jiān)測和預(yù)警,確保通信網(wǎng)絡(luò)正常運(yùn)行。在分析網(wǎng)絡(luò)節(jié)點(diǎn)故障的過程中,系統(tǒng)需對故障點(diǎn)進(jìn)行定位,以提出合理的智能運(yùn)維方案,從而完成網(wǎng)絡(luò)節(jié)點(diǎn)故障的排除。系統(tǒng)的故障診斷模型中融合了智能化算法,借助計(jì)算機(jī)高效的計(jì)算能力提高了網(wǎng)絡(luò)故障檢測與診斷的效率。系統(tǒng)通過數(shù)據(jù)挖掘技術(shù)獲取數(shù)據(jù)之間的內(nèi)在聯(lián)系,并在復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)中進(jìn)行精確的自動(dòng)化檢測和診斷[7]。
系統(tǒng)基于Apache Hadoop開源框架進(jìn)行設(shè)計(jì)、開發(fā),通過整合大量的服務(wù)器資源完成海量網(wǎng)絡(luò)數(shù)據(jù)的存儲(chǔ)和處理。多個(gè)服務(wù)器之間相互保存多個(gè)備份。在對通信網(wǎng)絡(luò)節(jié)點(diǎn)監(jiān)測數(shù)據(jù)的統(tǒng)計(jì)和分析中,系統(tǒng)使用Hadoop生態(tài)交互卷(Hadoop interactive volumes in ecology,HIVE)數(shù)據(jù)分析和處理工具,并提供相應(yīng)語言進(jìn)行數(shù)據(jù)查詢。HIVE的計(jì)算引擎將結(jié)構(gòu)化查詢語言(structured query language,SQL)語句轉(zhuǎn)化為可執(zhí)行的并行計(jì)算框架的計(jì)算任務(wù)[8]。
系統(tǒng)進(jìn)行故障診斷前,使用卷積自編碼器提取通信網(wǎng)絡(luò)節(jié)點(diǎn)狀態(tài)特征,對原始特征進(jìn)行變換,并提取出非冗余的特征向量,從而為處理高維特征空間提供強(qiáng)大支持[9]。通過模型的運(yùn)算變換得到節(jié)點(diǎn)監(jiān)測數(shù)據(jù)映射的新特征集合,可以提高特征數(shù)據(jù)獲取的準(zhǔn)確性,從而在為通信網(wǎng)絡(luò)故障診斷提供支持的同時(shí)緩解了系統(tǒng)數(shù)據(jù)的存儲(chǔ)壓力。系統(tǒng)前端界面使用了螞蟻數(shù)據(jù)可視化工具。該工具可將數(shù)據(jù)統(tǒng)計(jì)分析結(jié)果、數(shù)據(jù)計(jì)算結(jié)果、節(jié)點(diǎn)狀態(tài)和故障診斷結(jié)果通過圖形和圖表的形式表現(xiàn)出來。數(shù)據(jù)庫中單個(gè)數(shù)據(jù)項(xiàng)以圖元素的形式進(jìn)行表達(dá)。結(jié)構(gòu)化的通信網(wǎng)絡(luò)參數(shù)數(shù)據(jù)模型指導(dǎo)大量圖元素匯集成數(shù)據(jù)圖像,使系統(tǒng)用戶能夠理解不同維度的數(shù)據(jù)表達(dá),從而完成更加復(fù)雜和高級的運(yùn)維方案分析。
為實(shí)時(shí)感知當(dāng)前電力通信網(wǎng)絡(luò)中網(wǎng)絡(luò)節(jié)點(diǎn)的狀態(tài)、協(xié)助系統(tǒng)完成網(wǎng)絡(luò)監(jiān)測和故障診斷,本文設(shè)計(jì)了網(wǎng)絡(luò)感知模塊,以采集網(wǎng)絡(luò)節(jié)點(diǎn)的網(wǎng)絡(luò)參數(shù)。網(wǎng)絡(luò)感知模塊采用了擴(kuò)頻調(diào)制技術(shù),可以根據(jù)發(fā)送節(jié)點(diǎn)和接收節(jié)點(diǎn)間的距離和功率限制條件選擇合適的數(shù)據(jù)速率,從而完成網(wǎng)絡(luò)性能的優(yōu)化。
感知網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。

圖2 感知網(wǎng)絡(luò)結(jié)構(gòu)
感知網(wǎng)絡(luò)結(jié)構(gòu)包括了網(wǎng)絡(luò)感知模塊、感知網(wǎng)關(guān)、網(wǎng)絡(luò)服務(wù)器和應(yīng)用服務(wù)器等。網(wǎng)絡(luò)感知模塊與感知網(wǎng)關(guān)通過網(wǎng)狀拓?fù)浣Y(jié)構(gòu)連接。網(wǎng)絡(luò)感知模塊以STM32F103ZET6作為微控制單元。網(wǎng)絡(luò)感知模塊內(nèi)部的射頻收發(fā)器使用SX1278芯片[10],支持遠(yuǎn)距離無線電(long range radio,LoRa)、高斯頻移鍵控(Gauss frequency shift keying,GFSK)、頻移鍵控(frequency-shift keying,FSK)、最小頻移鍵控(minimum-frequency shift keying,MSK)等多種調(diào)制方式。電壓在100 mW內(nèi)波動(dòng)輸出功率為20 dBm。網(wǎng)絡(luò)感知模塊的硬件結(jié)構(gòu)如圖3所示。

圖3 網(wǎng)絡(luò)感知模塊的硬件結(jié)構(gòu)示意圖
圖3中,射頻通信模塊由射頻收發(fā)器和其他外圍電路組成。射頻通信電路中使用了Hi2115芯片,支持約束型應(yīng)用協(xié)議(contrained application protocol,CoAP)和用戶數(shù)據(jù)板協(xié)議(user datagram protocol,UDP)/傳輸控制協(xié)議(transmission control protocol,TCP),通過Modbus協(xié)議實(shí)現(xiàn)串口到網(wǎng)絡(luò)的雙向數(shù)據(jù)傳輸[11]。模塊硬件板卡預(yù)留的8路數(shù)據(jù)采集接口和RS-485總線接口能夠兼容多種網(wǎng)絡(luò)傳感器,極大地提高了模塊的傳感器驅(qū)動(dòng)能力[12]。為降低電力通信網(wǎng)絡(luò)中噪聲信號對模塊感知精度的影響,在硬件設(shè)計(jì)中考慮到抗干擾的設(shè)計(jì),加入隔離電路以實(shí)現(xiàn)雙向隔離和光電隔離。隔離電路如圖4所示。

圖4 隔離電路
圖4中:雙向隔離芯片選擇ADUM1250;光電隔離器使用LTV816STAI芯片。在網(wǎng)絡(luò)感知模塊的兩端使用光耦和隔離電源進(jìn)行電氣隔離,可以消除某些采集通道噪聲對模塊的影響[13]。通過雙向隔離芯片隔離模塊中外部信號和內(nèi)部信號,可以確保外部信號不和主控單元直接相連,使處理器更穩(wěn)定。這將保證感知模塊的采集網(wǎng)絡(luò)參數(shù)的精度不受影響,使模塊具有較強(qiáng)的抗干擾能力,并且模塊內(nèi)部之間不會(huì)受到彼此的干擾。
當(dāng)前,電力通信網(wǎng)絡(luò)的應(yīng)用場景較為復(fù)雜,通信網(wǎng)絡(luò)向異構(gòu)化和密集化方向發(fā)展,對網(wǎng)絡(luò)故障檢測和診斷提出更高的要求。本文將生成對抗網(wǎng)絡(luò)(generative adversarial networks,GAN)的思想引入網(wǎng)絡(luò)故障檢測與診斷領(lǐng)域。本文基于GAN構(gòu)建故障診斷模型,通過少量帶有標(biāo)簽的數(shù)據(jù)集獲取大量數(shù)據(jù)集用于故障診斷模型的訓(xùn)練[14-15],并利用生成器和判別器分別對網(wǎng)絡(luò)參數(shù)樣本進(jìn)行生成和分類。基于GAN的網(wǎng)絡(luò)故障診斷過程如圖5所示。

圖5 基于GAN的網(wǎng)絡(luò)故障診斷過程
圖5中的GAN包括了2個(gè)模型,分別是生成模型和判別模型。生成模型接收1個(gè)服從某分布的隨機(jī)變量。判別模型用于區(qū)別生成的樣本和真實(shí)的樣本[16]。GAN中使用了多層感知器。網(wǎng)絡(luò)的優(yōu)化目標(biāo)函數(shù)為:
(1)

通過式(1)可完成GAN的博弈。生成模型從真實(shí)數(shù)據(jù)中取樣。判別模型根據(jù)真實(shí)數(shù)據(jù)的分布規(guī)律進(jìn)行學(xué)習(xí)。
網(wǎng)絡(luò)故障診斷模型先確定不同通信網(wǎng)絡(luò)狀態(tài)的對應(yīng)特征,再對故障進(jìn)行識別。不同網(wǎng)絡(luò)狀態(tài)的輸入向量為S=[P1,P2,…,PN],對應(yīng)的網(wǎng)絡(luò)狀態(tài)可表示為C={fc1,fc2,…,fcn}。當(dāng)電力通信網(wǎng)絡(luò)出現(xiàn)某個(gè)類型的故障時(shí),故障期間的網(wǎng)絡(luò)狀態(tài)向量為:
(2)

(3)
式中:max(Pi)為收集的網(wǎng)絡(luò)參數(shù)中出現(xiàn)的最大值。
通過式(3)可確保輸入的網(wǎng)絡(luò)參數(shù)值的動(dòng)態(tài)范圍相似。本文在故障診斷模型的GAN的判別模塊中引入1個(gè)基本約束,并在超參數(shù)控制范圍內(nèi)對權(quán)重進(jìn)行裁剪。得到的優(yōu)化目標(biāo)函數(shù)為:

(4)

通過式(4)可得到優(yōu)化后的目標(biāo)函數(shù)。預(yù)測的網(wǎng)絡(luò)狀態(tài)與真實(shí)的網(wǎng)絡(luò)狀態(tài)之間的差異可表示為:
(5)

通過式(5)可以計(jì)算實(shí)際值與預(yù)測值之間的差異。本文將預(yù)測值代入損失函數(shù),可得:
(6)

通過式(6)可計(jì)算最終損失值。
綜上所述,經(jīng)過預(yù)處理的網(wǎng)絡(luò)參數(shù)輸入GAN中進(jìn)行數(shù)據(jù)擬合,可得網(wǎng)絡(luò)狀態(tài)的性能指標(biāo);對模型復(fù)雜度進(jìn)行權(quán)衡,可以進(jìn)一步提高故障診斷模型效率。
為驗(yàn)證本文研究的網(wǎng)絡(luò)故障診斷方法的有效性,本文模擬真實(shí)網(wǎng)絡(luò)進(jìn)行環(huán)境的搭建。仿真的試驗(yàn)環(huán)境中設(shè)置了不同的網(wǎng)絡(luò)狀態(tài)類別。試驗(yàn)環(huán)境如圖6所示。

圖6 試驗(yàn)環(huán)境
試驗(yàn)環(huán)境條件如下:中央處理器(central processing unit,CPU)采用AMD2600;主頻為3.40 GHz;運(yùn)行內(nèi)存為16 GB;顯卡為GTX1070TI;顯存為8 GB;操作系統(tǒng)為Windows 10;軟件版本為Tensorflow1.14。其中:系統(tǒng)類型為3個(gè)小區(qū)的試驗(yàn)環(huán)境;小區(qū)半徑為500 m;系統(tǒng)帶寬為5 MHz;頻率復(fù)用為軟頻率復(fù)用;基站發(fā)射功率為43 dBm;用戶數(shù)量為50~100個(gè);仿真時(shí)間為60 000 s。
試驗(yàn)中使用的數(shù)據(jù)為電力通信網(wǎng)業(yè)務(wù)數(shù)據(jù)流的統(tǒng)計(jì)特征數(shù)據(jù),包含了所有可用統(tǒng)計(jì)特征的特征集合。試驗(yàn)數(shù)據(jù)集中的230個(gè)特征表示1個(gè)業(yè)務(wù)數(shù)據(jù)流。數(shù)據(jù)集的數(shù)據(jù)類型包括了Web瀏覽、郵件、文件傳輸、網(wǎng)絡(luò)狀態(tài)、數(shù)據(jù)庫、多媒體等多種業(yè)務(wù)類型。
試驗(yàn)數(shù)據(jù)集如表1所示。

表1 試驗(yàn)數(shù)據(jù)集
本文在進(jìn)行故障檢測試驗(yàn)前,利用故障診斷算法模型對各網(wǎng)絡(luò)狀態(tài)下的小樣本數(shù)據(jù)進(jìn)行學(xué)習(xí),并使用文獻(xiàn)[3]系統(tǒng)和文獻(xiàn)[4]系統(tǒng)的故障診斷模型進(jìn)行對比測試。文獻(xiàn)[3]系統(tǒng)模型使用了隨機(jī)森林算法(以下稱為“方法1”)。文獻(xiàn)[4]系統(tǒng)模型使用了貝葉斯分類器(以下稱為“方法2”)。本文設(shè)定各系統(tǒng)的故障診斷模型的訓(xùn)練次數(shù)為50~200次。各方法在不同特征數(shù)下的網(wǎng)絡(luò)故障診斷準(zhǔn)確率如表2所示。

表2 故障診斷準(zhǔn)確率
故障診斷準(zhǔn)確率變化曲線如圖7所示。

圖7 故障診斷準(zhǔn)確率變化曲線
對比3種方法故障診斷模型在不同訓(xùn)練次數(shù)和特征數(shù)下的診斷準(zhǔn)確率可知,本文方法的故障診斷模型的訓(xùn)練時(shí)間更短,在較少訓(xùn)練次數(shù)的情況下具有更好的故障診斷效果。當(dāng)訓(xùn)練次數(shù)為50次時(shí),本文方法的故障診斷準(zhǔn)確率為95.2%。當(dāng)訓(xùn)練次數(shù)增加到140次時(shí),本文方法的故障診斷準(zhǔn)確率增加到99.4%。當(dāng)訓(xùn)練次數(shù)達(dá)到200次時(shí),本文方法的故障診斷準(zhǔn)確率最高為99.8%。
方法1和方法2在訓(xùn)練次數(shù)較少的情況下,模型的故障診斷效果不好,故障診斷準(zhǔn)確率在94%以下。方法1的準(zhǔn)確率最低為92.1%,在訓(xùn)練次數(shù)達(dá)98次以上時(shí)的準(zhǔn)確率才超過95%,并且準(zhǔn)確率最大不超過98%。方法2的準(zhǔn)確率最低為91.3%,在訓(xùn)練次數(shù)達(dá)到125次時(shí)準(zhǔn)確率超過方法1,訓(xùn)練次數(shù)最大時(shí)的故障診斷準(zhǔn)確率為98.4%。
為驗(yàn)證本文方法在訓(xùn)練過程中的性能,本文將迭代次數(shù)設(shè)定為2 000次、訓(xùn)練時(shí)間設(shè)定為300 s,并以卷積神經(jīng)網(wǎng)絡(luò)作為對比進(jìn)行測試。在訓(xùn)練過程中的模型損失值對比如圖8所示。

圖8 模型損失值對比
由圖8可知,本文方法的損失函數(shù)收斂更加穩(wěn)定,模型的損失值在較短時(shí)間內(nèi)快速下降,模型的診斷效果逐漸穩(wěn)定。當(dāng)?shù)螖?shù)為1 000次時(shí),本文方法的模型損失值下降到0.1以下,表明本文方法能夠較好地區(qū)分出真實(shí)樣本和生成樣本。當(dāng)?shù)螖?shù)在1 500次后,本文方法的模型損失值最低為0.03。卷積神經(jīng)網(wǎng)絡(luò)的收斂速度較慢。當(dāng)?shù)螖?shù)在500次時(shí),卷積神經(jīng)網(wǎng)絡(luò)的模型損失值為0.43。當(dāng)?shù)螖?shù)在1 000~1 500次時(shí),卷積神經(jīng)網(wǎng)絡(luò)的模型損失值出現(xiàn)明顯波動(dòng),最高超過0.15。在訓(xùn)練過程中,卷積神經(jīng)網(wǎng)絡(luò)會(huì)產(chǎn)生與原始數(shù)據(jù)集不一致的數(shù)據(jù),導(dǎo)致故障診斷效果不穩(wěn)定。
本文為電力通信網(wǎng)絡(luò)設(shè)計(jì)了智能運(yùn)維故障診斷系統(tǒng),通過系統(tǒng)的故障診斷和運(yùn)維有效緩解故障傳播所造成的危害,從而為電力通信網(wǎng)絡(luò)提供了更加靈活、滿足多樣化功能和需求的診斷策略。系統(tǒng)故障診斷模型中加入了GAN,先根據(jù)網(wǎng)絡(luò)故障的小數(shù)據(jù)量信息、通過網(wǎng)絡(luò)訓(xùn)練后生成大量可靠數(shù)據(jù)集,再進(jìn)行模型的訓(xùn)練和測試,以完成故障診斷與預(yù)測。
本文提出了一些有效的解決方法,但同時(shí)也有需要改進(jìn)和解決的問題。如當(dāng)故障診斷模型的結(jié)構(gòu)發(fā)生改變時(shí),模型的診斷準(zhǔn)確率可能會(huì)受到影響。后續(xù)研究還需進(jìn)一步加強(qiáng)模型的泛化能力和穩(wěn)定性。