李 鵬,李 丹,李喜旺,高 宇
1(中國科學院大學,北京 100049)
2(中國科學院 沈陽計算技術研究所,沈陽 110168)
3(國家電網東北分部,沈陽 110180)
4(美國加州州立大學富勒頓分校,加利福尼亞州 92834)
隨著信息化的不斷發展,很多行業都從信息技術中受益.電力行業調度系統也從傳統的人工監測、人工控制慢慢轉變為融自動化監測與自動化控制為一體的自動化系統.電力調度自動化系統主要擔負著對所屬各電廠數據采集、存儲以及電廠的啟停調度.其安全性與穩定性直接影響著電力調度網的運行質量.傳統的電力調度系統的安全性與穩定性監測主要依靠技術工程師對設備進行定期檢修和事后維修[1,2].定期檢修的時機完全依靠經驗進行分析,而電力調度自動化系統功能與結構都比較復雜,存在諸多不確定因素,很難依靠主觀經驗確定合適的檢修時機,較大的檢修周期會增加系統出故障的可能性,較小的檢修周期又會增加檢修成本.當系統出現故障后再進行維修的事后維修策略則更加無法保證系統的安全穩定運行.因此在系統出現故障之前通過對設備各運行指標進行監測,然后建立設備狀態評估模型進行有效的評估顯得格外重要.
許麗佳等[3,4]將隱馬爾可夫模型應用于電子設備的狀態監測和健康評估,但是受隱馬爾可夫模型假設的限制,導致模型評估結果的準確性不高.神經網絡具有自學習、自適應以及強大的非線性化逼近能力,張璇[5]利用BP神經網絡模型進行電力通信網絡設備的狀態評估,但是傳統的BP神經網絡為”黑盒模型”,可解釋能力較弱.倪麗等[6]利用模糊綜合評判理論進行電力變壓器的狀態評估,但是因為模糊評判理論沒有學習能力,并且建立模糊關系矩陣比較困難,因此評估結果的準確率不高.文獻[7]將模糊理論與支持向量機結合進行設備狀態的評估,但是支持向量機學習算法對于所用模糊參數的調整能力較弱,無法充分發揮模糊理論的作用.
電力調度自動化設備狀態受諸多評價指標的影響,同時各評價指標之間也存在著復雜的聯系,針對此類非線性評估問題,神經網絡模型強大的非線性擬合能力能夠很好的予以解決,然而評價指標與設備狀態之間的關系并不是確定的,而是模糊的,難以精確表達的,考慮到模糊模型在模糊表達知識上的優越性,本文將模糊理論與神經網絡進行結合應用到設備狀態評估當中,模型的非線性擬合能力以及模糊表達能力的都得到較大提升,提高了評估模型的準確率.
模糊神經網絡將模糊理論與神經網絡進行結合[8,9],將模糊概念和模糊推理引入神經網絡,一方面提高了神經網絡的可解釋性和靈活性,另一方面利用神經網絡的學習算法設計和調整模糊系統的相關參數[10],實現了模糊系統的自適應功能.
如圖1所示,傳統模糊神經網絡一般分為五層[11].第一層為輸入層,節點個數為輸入變量的個數;第二層為模糊化層,將輸入變量進行模糊化;第三層為模糊規則層,節點個數為模糊規則數;第四層為反模糊化層,用于將模糊量進行去模糊化;第五層為輸出層.

圖1 傳統模糊神經網絡結構
本文在對設備進行狀態評估時,將第四層直接作為輸出,輸出層共四個神經元節點,每個神經元節點代表設備的一種狀態,神經元節點的數值代表設備對這種狀態的隸屬度.這樣具有四個輸出層節點的四層模糊神經網絡如圖2所示,詳細介紹如下:
第一層為輸入層,xi,i=1,2,,n,代表n個輸入變量,本文中指影響設備運行狀態的性能指標,如CPU溫度、內存占用率、網絡丟包率等,第一層的作用是直接將輸入傳遞到第二層.
第二層為模糊化層: 用于計算輸入變量對不同模糊集的隸屬度.該層神經元的作用是將第一層的輸入變量xi劃分為mi個模糊度,因此共m個 神經元,m=m1+m2+ +mn.該層神經元與第一層神經元之間的連接權值都為1,隸屬函數作為每個神經元的激活函數.考慮到高斯型隸屬函數在處理非二值輸入和空間映射方面具有較大優勢[12],因此選擇式(1)所示的高斯型隸屬函數作為模型的隸屬度函數:


圖2 四層模糊神經網絡結構
其中,μij表示第i個輸入變量隸屬與第j個模糊集的隸屬度 函數;cij為隸屬函數μij的中心值;σij為隸屬函數μij的寬度值.
第三層為模糊規則層,也稱為“與”層,該層神經元的個數表示模糊規則數.每個神經元與上一層的mi個神經元中的一個節點相連,因此共R=m1+m2+ +mn個神經元,每個連接的權值為1.每個神經元內部進行“與”操作,即“AND”操作,也就是求每個輸入變量的隸屬度的最小值,通過式(2)進行計算:

第四層為反模糊化層,也稱為“或”層,該層神經元的個數表示模糊集合的個數,本文中表示設備可能的狀態.該層神經元與上一層神經元之間為全連接,權值ωjk為需要調整的參數,神經元的輸出值表示設備對這個狀態的隸屬度.

采用均方誤差函數作為該模糊神經網絡的損失函數:

由式(5)-(7)可以發現模型需要進行調整的參數有三種:cij,σij和ωjk,這三種參數可以通過如下方法進行迭代更新:


其中,η表示學習率,t表示迭代的次數.
針對電力自動化設備健康評估,設備不同狀態下不一定會出現某些顯而易見的現象,實際情況更多的是設備的某些參數偏高或者偏低,而在設備健康評估時,一般依靠經驗來處理這些“偏高”或者“偏低”的模糊概念.為解決此類具有模糊性以及參數難以定量描述的問題,本文引入模糊理論進行處理.模糊神經網絡能夠將輸入進行模糊化處理然后進行模糊推理,由于設備健康評估的影響因素如溫度、占用率等具有很強的模糊性難以定量描述,采用模糊神經網絡將輸入通過隸屬函數進行處理,從而可以進行定量描述,很好的適應了設備健康評估問題.
在復雜系統中,每個對象對于集合的隸屬關系并不是明確的,而是相對模糊的[14].電力調度自動化系統就是一個相對復雜的系統,在這個系統中有數量龐大的IT設備,設備的評價指標有很多,如溫度、網口狀態、網絡流量、內存使用率、硬盤使用率、CPU負荷率等[15],這些指標量更適合用模糊理論進行分析,用模糊集合描述評價指標,用數據指標的隸屬度描述當前運行情況.神經網絡具有較強的自學習功能,可根據歷史數據學習結果來調整系統運行參數,針對個體設備提供更準確的、更具個性化的健康評價.本文采用的將模糊概念和神經網絡結合的模糊神經網絡模型可以極大提升電力調度自動化設備健康評估的效果.
將模糊神經網絡模型應用到電力調度自動化設備健康評估的具體流程如圖3所示,具體步驟如下:
(1)整理存儲的設備6個月內的運行信息,包括:CPU溫度、硬盤溫度、板卡溫度、網口狀態、網絡流量、網絡延遲、內存使用率、硬盤使用率、CPU使用率、網絡丟包率、設備運行時間11個指標.
(2)對設備的運行狀態進行劃分等級.根據專業人員的分析和歷史經驗的總結,將設備運行狀態分為四個等級,如表1所示.
(3)通過計算設備各運行指標之間的皮爾遜相關系數,刪除部分冗余特征.皮爾遜相關系數是衡量兩個隨機變量之間線性相關程度的指標,描述的是一種非確定性相關系數[16],計算公式如式(8)所示:

其中,Cov(X,Y)表示隨機變量X與Y的協方差矩陣,μX,μY分別表示隨機變量X與Y的期望,σX,σY分別表示隨機變量X與Y的方差.相關系數r的取值范圍為[-1,1],絕對值越大說明兩個隨機變量的相關程度越高,r大于0表示正相關,r小于0表示負相關,r等于0表示不相關.通過利用皮爾遜相關系數篩選最終用于訓練模型的特征包括: CPU溫度、硬盤溫度、板卡溫度、內存使用率、CPU使用率、網絡丟包率、設備運行時間7個指標.

圖3 電力調度自動化設備健康評估流程

表1 設備狀態分級
(4)因為各指標的值域不同,因此需要對各指標進行歸一化處理,歸一化計算公式如式(9)所示:

其中,Xmax表 示屬性X的最大值,Xmin表示屬性X的最小值.各特征經過歸一化處理后,數值范圍都變換到[0,1]之間,這不僅可以消除量綱的差異還可以加速模型的收斂速度[17].
(5)初始化需要訓練的模型參數,主要包括三類參數:cij,σij和ωjk.其中cij表 示隸屬函數的中心值,σij為隸屬函數的寬度值,ωjk為模糊規則層與反模糊層之間的連接權重.
(6)更新模型參數直到滿足模型訓練的結束條件.傳統的模型終止條件有兩種,一種是當模型的輸出值與真實值的誤差小于設置的閾值時終止模型訓練,另一種是當迭代次數到達設置的次數時終止訓練.本文在此基礎上增加模型訓練的早停技巧,即當模型在測試集上的誤差增大時,提前停止訓練模型,這樣可以有效的避免模型的過擬合問題.
(7)保存模型.當模型訓練完成之后需要將模型保存到文件中,以便之后的模型使用.采用python語言的pickle模塊將模型序列化存儲到本地文件中,當使用模型時,對序列化后的文件進行反序列化處理,即可恢復原始模型進行使用.
為了體現本文所用方法在電力自動化機房設備健康評估方面的有效性,對傳統神經網絡的模型效果和本文所用模型效果進行了對比,通過實驗結果顯示,本文所采用模型的效果優于傳統神經網絡模型的效果.
利用6個月內共計17 280個設備運行數據進行模型的搭建,將17 280個數據劃分為訓練集、驗證集和測試集,如表2所示.每一條數據包含4個設備運行信息和3個設備硬件信息,如表3所示.

表2 數據集劃分
利用上述處理好的實驗數據進行模型訓練,模型的訓練集均方根誤差和測試集均方根誤差如圖4所示,縱坐標表示均方根誤差RMSE,橫坐標表示迭代次數,可以看出模型的訓練誤差隨著迭代次數的增加整體趨勢是不斷減小的,但是測試誤差先是不斷減小然后又有上升趨勢,其原因就是模型發生了過擬合,因此需要提前終止模型訓練,根據結果分析,選取迭代75輪時的模型作為最終的模型.

表3 設備監測特征

圖4 訓練誤差與測試誤差
傳統的三層BP神經網絡,激活函數為Sigmoid函數,此類BP神經網絡模型無法有效處理模糊輸入信息同時無法利用已有的專家知識.本文所采用的模糊神經網絡模型將神經網絡與模糊理論有機的結合起來,不僅可以處理模糊信息同時具有較強的學習能力與自適應能力,通過圖5的結果對比可以看出本文所用的模糊神經網絡模型效果要優于傳統的三層BP神經網絡模型,說明模糊神經網絡更加適用于電力自動化機房設備的健康評估.
本文首先介紹了模糊理論與神經網絡的相關概念,接著分析了將二者進行結合的模糊神經網絡的原理,然后將模糊神經網絡應用到電力調度自動化系統設備健康評估中.具體操作包括: 數據的收集、特征的選取以及模型的搭建,并且比較了本文所建立的四層模糊神經網絡模型和傳統三層BP神經網絡模型的效果,實驗結果表明,本文所建立的模型極大的提升了設備健康評估的效果,針對IT設備可以給出更加精確的評估,對于電力自動化機房的正常運行具有重要意義.雖然本文所建立的模型效果優于傳統的三層BP神經網絡模型,但是還有較大的提升空間,比如選取更加有效的反映設備狀態的特征,選取更加合適的算法學習率和模型的初始參數,這些問題都可以進一步提升模型對設備狀態的評估效果,這將是下一步需要進行完善的.

圖5 傳統神經網絡與模糊神經網絡結果對比