鄭俊翔,施正釵,周泰斌,陸千毅,黃達鐵
(國網浙江省電力有限公司溫州供電公司,浙江 溫州 325000)
隨著能源電力行業數字化與智能化轉型的趨勢,海量監控告警信息資源喚醒已成為能源互聯網形態下調度部門建設多元融合高彈性電網的重要舉措[1]。傳統SCADA(數據采集與監控)系統上窗告警信息的缺陷等級判斷依賴于設備監控人員主觀經驗,存在效率較低、誤分類等問題。為幫助監控人員快速、準確掌握上窗告警信息,實現告警信息的缺陷辨識與風險分析,為調控缺陷故障處置提供輔助決策,利用深度學習和NLP(自然語義處理技術)對告警信息進行數據挖掘,可以提升缺陷影響程度定級的效率和準確性,促進人工智能技術在設備監控大數據平臺的應用[2-3]。
在針對設備監控告警信息文本的相關研究中,曹靖等[4]建立了一種基于語義框架的缺陷文本挖掘模型,解決了非結構化表述無法精準提取的問題,通過變壓器缺陷文本算例驗證了所提挖掘技術的可行性與有效性。邵冠宇等[5]提出了一種基于依存句法分析的電力設備缺陷文本信息辨識方法,提升了語義分析的準確性。文獻[6-7]提出了一種基于BiLSTM-Attention 的電網設備故障文本分類,對變壓器、真空斷路器等故障缺陷表象進行智能判斷,提升了缺陷分類識別準確率。上述文獻針對設備故障缺陷詳細文本的分類都只側重于事后分析及數據精益化管控,而上窗告警信息的實時性診斷則具備了為調控人員缺陷故障處置提供輔助決策與電網風險預警能力[8]。
部分國內專家學者對于SCADA 實時告警信息文本開展了研究。汪崔洋等[9]提出了一種基于告警信息文本挖掘診斷方法,并應用于電力調度故障快速處置。文獻[10]提出了一種將改進BM(字符串匹配)算法與結線分析相結合的設備監控告警信息故障診斷知識圖譜構建方法,實現了告警信息解析判別和智能輔助決策。文獻[11]設計了一種基于GRU(門控循環單元)神經網絡的電網告警信息分類系統,在準確率與LSTM(長短期記憶網絡)算法相近的基礎上,計算將更為高效,系統將告警信息分為變位、告知、事故、異常等4類,并通過混淆矩陣進行設備運行風險評估。
為進一步提高深度學習在告警信息文本的缺陷辨識和風險分析能力,提出一種基于自然語義分析的電網告警信息文本缺陷風險預警方法:將基于BiLSTM-Attention 神經網絡的語義分析技術[7]與模糊化缺陷風險評估方法相結合,對告警信息文本進行數據預處理,利用word2vec 進行詞嵌入向量表征;通過注意力機制突顯對告警信息與缺陷程度相關的特征,得到告警信息的語義特征向量;在歸一化層實現告警信息缺陷等級分類。BiLSTM-Attention 神經網絡具有能提取雙向語義信息、賦予重要判斷信息權重的雙重優勢,可有效提升語義理解準確性。經實驗測試和應用分析表明:基于該方法的判斷模型能夠精準實現告警信息的缺陷分類定級,以準確度、微平均值作為評價指標,相比典型人工智能算法具有更優分類效果,并實現了告警信息的缺陷風險預警。
基于BiLSTM-Attention 神經網絡方法能挖掘海量告警信息中的內涵語義特征,在缺陷文本記錄辨識、缺陷程度分類等任務中,性能指標較為優越[7]。因此,將設備監控告警信息分類過程視為非結構化文本數據的語義識別與分類,結合文獻[7]給出的改進算法與評價指標,提出基于BiLSTM-Attention 的電網告警信息分類算法流程如圖1 所示。

圖1 告警信息文本分類算法流程
1.2.1 文本預處理
SCADA 系統監控告警信息是對變電站設備故障、異常、越限、變位和告知的綜合描述語句[8]。本文主要面向異常告警信息(包括誤發故障信號),此類信號對電網運行影響較大,將被診斷為缺陷(以下統稱“告警信息”)。因此,針對SCADA 系統上窗非結構化文本告警信息(異常)進行預處理,對告警信息內容進行文本分詞、清洗辨識電力設備名詞實體、標準化等3 個步驟,得到一組同告警信息匹配聯系的缺陷關鍵詞,如:母聯開關、變壓器、重合閘、保護裝置、合并單元等,預處理的對比結果如表1 所示。

表1 告警信息文本預處理
1.2.2 詞嵌入層
本文采用的word2vec 模型是一種典型的NLP 模型,它是由Google 公司于2013 年開源推出的詞向量計算工具[12],包括預處理模塊和淺而雙層的神經網絡2 個部分,其特點是可從SCADA系統海量告警信息中以無監督學習方式提取詞向量之間存在的語義信息,然后通過神經網絡層輸出電力設備實體特征的分布式表征,具體結構如圖2 所示。

圖2 word2vec 模型
結合文獻[12]給出的word2vec 詞嵌入方法,將告警信息文本的形式化表示定義為:

式中:xi表示文本S 中的第i 個詞匯。
對于每個詞xi來說,以圖1 中告警信息“帶溪變110 kV 母聯開關油壓低重合閘閉鎖”為例,存在詞向量矩陣:Wword∈。在訓練過程中,給定告警信息在輸入BiLSTM 層之前,需進行預處理,使用該詞向量矩陣將每個詞進行詞向量表征轉化,最后得到給定告警信息電力設備實體名詞的詞向量表征,如式(2)所示。

因此,對于給定告警信息文本Sf將被轉為一個具有缺陷程度信息的實數矩陣embs={e1,e2,…,eT},并輸入模型的下一層。
1.2.3 BiLSTM 神經網絡層
在深度學習和自然語義處理技術領域中,對于長文本信息,BiLSTM 方法能提取雙向語義信息,能更加充分利用從后往前的反向特征信息[13],BiLSTM 模型結構如圖3 所示。

圖3 BiLSTM 模型
本文利用雙向LSTM 網絡門控機制,主要由存儲單元狀態ct、輸入門it、輸出門ot等構成:

式中:it為輸入門;ct為存儲細胞狀態;ot為輸出門;xt為t 時刻的輸入;ht-1為t-1 時刻的輸出值;σ 為Sigmoid 激活函數;W 為輸入權重矩陣。
將某一告警信息文本Sf各個詞xi的向量表征矩陣embs={e1,e2,…,eT}作為BiLSTM 網絡門控的隱狀態輸出,按位置規則拼接后作為各個時刻細胞的輸入。對于給定告警信息文本“帶溪變110 kV 母聯開關油壓低重合閘閉鎖”,有如下步驟:
Step1:通過word2vec 詞嵌入進行告警信息預處理,然后進入雙向LSTM 網絡提取語義特征環節。
Step2:以正方向的LSTM 先提取告警信息的正向特征,例如由“帶溪變→110 kV→母聯開關→油壓低→重合閘→閉鎖”得到正向的隱狀態,即。
Step3:以反方向的LSTM 先獲得告警信息的反向的特征提取,例如由“帶溪變←110 kV←母聯開關←油壓低←重合閘←閉鎖”得到反向的隱狀態,即。
Step4:分別得到正向和反向的特征提取之后,再將正向LSTM 輸出的與反向LSTM 輸出的在各個位置輸出的隱狀態進行按位置拼接,得到一個完整的隱狀態序列:

通過將正向與反向的隱狀態序列拼接,實現了BiLSTM 能提取雙向語義信息的特點,使模型具備聯系缺陷重要程度挖掘告警信息文本整句話中正序與反序的重要信息能力,確保了缺陷特征內容不丟失。最后,BiLSTM 網絡層輸出的隱藏狀態集合表征為H:[h1,h2,…,hT]。
1.2.4 注意力機制層
注意力機制源于人類視覺對重點區域的關注,通過模擬人腦注意力集中于特定區域情況,來獲取更多有效價值信息,提升語義理解準確性[14]。
在注意力機制模型中,n 時刻由BiLSTM 模型輸出的告警信息文本中缺陷重要程度特征向量對最終狀態的注意力概率分布an:


式中:詞嵌入的表征能力隨著an和hn值的增大而變強,同時注意力機制中獲得的告警信息缺陷重要程度判別特征信息也越多。
最后,通過輸出層的Softmax 計算,得到告警信息缺陷類型標簽維度為1×4,其概率分布為:

式中:T 為缺陷類型標簽數,T=4,包括一般缺陷、重要缺陷、緊急缺陷以及其他;V 為告警信息庫在訓練過程中產生的權重。
對于輸入到BiLSTM 層中的每個電力設備實體名詞,在訓練集中都有特定的標簽,即為電力設備實體的類別;通過式(10)計算每個輸出標簽的概率,得到概率最高的標簽即為該告警信息的缺陷程度判別結果。
告警信息文本分類過程實則缺陷分類診斷,在處理流程中,經過歸一化層得到維度的向量表示,得到概率分布與之對應的標簽包括:一般缺陷(0.1)、重要缺陷(0.2)、緊急缺陷(0.5)、其他(0.2),因此告警信息文本“帶溪變110 kV 母聯開關油壓低重合閘閉鎖” 所對應的概率為最大的“0.5”,其分類類別為“緊急缺陷”。
本文構建的基于語義分析的缺陷風險預警體系流程如圖4 所示,告警信息文本分類產生缺陷診斷結果后,進入缺陷風險預警定級環節,生成匹配的風險預警等級,充分挖掘告警信息的數據價值,為缺陷故障處置提供輔助決策。

圖4 基于語義分析的缺陷風險預警體系流程
在告警信息上窗且系統被判定為重要、緊急缺陷后,調控員需要關注消缺工作可能導致相關設備產生的N-1 風險,主要有:根據事故預想下的電網拓撲,評估系統是否存在減供負荷、斷面越限、線路重載、系統解裂、重要用戶全停等情況。
因此,本文選取負荷損失、線路設備過載、斷面越限、重要用戶全停4 個指標來評價設備停役消缺過程中存在的N-1 風險[15]。
(1)減供負荷指標RL
作為風險預警的常用指標,該指標反映電網事故期間實際負荷量減少的程度,本文以減供負荷總量為衡量,如式(12)所示。

式中:Pi為節點i 減供的負荷量;n 為受影響減供的節點總數。
(2)線路重載指標RE
線路重載指標是指線路實際電流值超過標準額定電流的程度。本文重載線路規定為負載值大于其額定值50%閾值,如式(13)所示。

式中:Ii為第i 條重載線路的實際負載值;Ii,n為第i 條重載線路的額定值;n 為重載線路的數量。
(3)斷面過載指標RT
潮流斷面過載指標反映區域一組輸電線路因缺陷停役導致電力系統其他線路組存在斷面有功潮流越限情況,如式(14)所示。

式中:Pi為斷面i 的線路有功潮流;Pr,i為輸送功率的控制值;s 為線路回數。
(4)重要用戶全停
重要用戶由地級市以上地方人民政府有關部門依據相關文件確定。
根據國家電網《安全事故調查規程》中對電力事故的定義,參考文獻[16-17]給出的定級策略,結合浙江省市域電網規模特點,將告警信息以缺陷嚴重程度進行評估,本文提出了一種基于模糊化電力事故等級的市域電網告警信息缺陷風險定級策略,具體見表2。

表2 缺陷風險預警定級方案
(1)五級風險預警:當減供負荷大于80 MW、線路重載或過載RE大于120%、斷面過載指標RT大于20%、特級或一級重要用戶全停,以上任一情況發生即觸發五級風險預警。
(2)六級風險預警:當減供負荷大于30 MW、線路重載或過載RE在100%~120%、斷面過載指標RT在10%~20%、二級重要用戶全停,以上任一情況發生即觸發六級風險預警。
(3)七級風險預警:當減供負荷大于5 MW、線路重載或過載RE在90%~100%、斷面過載指標RT在5%~10%、臨時重要用戶全停,以上任一情況發生即觸發七級風險預警。
在浙江省市域電網規模體量下,調控員主要關注事故調查規程中的五級、六級、七級電網事件,構建模糊化的風險預警指標,完成對上窗告警信息缺陷診斷后的風險預警定級。解決了監控人員在缺陷診斷上報后,調度人員需對設備缺陷產生的N-1 風險進行二次判斷,從而延誤缺陷最佳處置時機的問題。
從告警信息出發,融入智能化缺陷診斷與缺陷風險評估,從而構建基于海量監控數據的多維度監控告警事件化預警分析體系,增強調控員電網感知預測能力,提升風險管控水平。
在計算機硬件方面,本實驗在Linux 操作系統下進行深度學習的模型訓練,配置具體信息見表3。

表3 硬件配置
在軟件配置方面,本模型使用Python 代碼進行編寫。
(1)實例選取SCADA 系統中4 750 條告警信息中的異常信號作為研究對象。告警信息包含變電站、電壓等級、設備名稱、異常元器件、異常現象等信息。缺陷程度分為一般缺陷、重要缺陷和緊急缺陷。
本文將4 750 條信息以0.8∶0.2 的比例劃分訓練集和測試集,最終得到的各類別數目見表4。

表4 各類別統計數目
(2)在實驗評價指標中,混淆矩陣與準確率作為最直觀的分類性能評價指標,并融入精準率P、召喚率R、微平均F1值來評價二分類問題。
準確率定義:缺陷重要程度判斷預測正確的結果占總告警信息庫的百分比。
精確率P 定義:缺陷程度判斷正確占缺陷程度判斷全部預測為正的百分比。
召回率R 定義:缺陷程度判斷正確占缺陷程度判斷全部實際為正的百分比。
F1值定義:精確率P 和召回率R 的調和均值,其值越高表示分類診斷性能越優,其表達如式(15)所示。

本文結合微平均F1指標F1Micro,其計算方法為:將N 分類問題轉化為N 個二分類混淆矩陣問題[18],從而合計得到Tp,Fp,FN值以計算精準率P、召喚率R、微平均F1值。此處累加得到的F1值即為F1Micro值。
3.3.1 模型性能對比分析
首先結合電力設備缺陷名詞集對BiLSTM 模型進行預訓練,使損失值呈下降趨勢,而F1Micro值、訓練集和測試集的準確率呈上升趨勢,最終結果趨于穩定。在預訓練完成后,將告警信息測試集數據輸入模型,其測試結果準確率和F1Micro值分別為97.65%和0.974 6。
本文中特征表示階段通過固定告警信息訓練集與測試集的分配方式來保證多組算法模型測試對比的科學性。與深度學習CNN(卷積神經網絡)、BiLSTM 模型實驗結果進行對比,得到3 種深度學習測試模型的F1Micro值以及對應的準確率,如表5 所示。

表5 深度學習模型性能對比
表5 分析結果顯示,融入注意力機制的BiLSTM-Att 模型比BiLSTM 和CNN 模型在告警信息文本挖掘時的性能更為優越,F1Micro指標為0.974 6,較BiLSTM 和CNN 模型指標分別提升2.03%和3.29%;測試集準確率為97.65%,準確率分別提升2.14%和3.30%;訓練集準確率高達99.71%,準確率分別提升2.29%和2.80%。融入注意力機制的BiLSTM-Attention 模型比傳統BiLSTM 模型更能關注到缺陷重要程度相關的告警信息中的最關鍵信息,并賦予權重,從而表現出更優分類性能。
在運用訓練好的BiLSTM 模型基礎上,注意力機制具備賦予關鍵的電力實體名詞較大的權重,提高語義理解的準確性,本質目標就是在深度學習過程中重點關注告警信息文本中對缺陷等級診斷有決定性意義的關鍵短語,從而達到缺陷的智能化高效分類定級。
3.3.2 基于語義分析的缺陷風險預警應用
將基于BiLSTM-Attention 神經網絡的語義分析技術與模糊化缺陷風險評估方法相結合,運用訓練好的BiLSTM 模型,通過注意力機制完成缺陷診斷分類,最后利用缺陷評估方案完成N-1 風險定級和預警,如表6 所示。

表6 基于語義分析的缺陷診斷與風險預警結果(部分)
以SCADA 上窗告警信息“大安變220 kV 嘉安43Q4 線開關SF6氣壓低閉鎖”為例,缺陷嚴重程度為緊急,調度預期處置結果為向省調申請將線路停役,大安變將由220 kV 嘉大43Q3 線路單供,在N-1 故障情況下,通過模糊化缺陷風險預警策略觸發五級風險預警,以供調控員輔助決策,組織220 kV 終端變防全停技術、管理措施等。
為實現對SCADA 系統海量告警信息的缺陷辨識和風險分析,將基于BiLSTM-Attention 神經網絡的語義分析技術與模糊化缺陷風險評估方法相結合,提出了一種基于自然語義分析的電網告警信息文本缺陷風險預警方法。
該方法實現了告警信息缺陷分類診斷,且準確度、微平均值評價指標較CNN 和BiLSTM 算法更為優越,為設備監控人員高效、準確進行告警信息診斷定級提供輔助決策。告警信息實時缺陷診斷與智能風險分析相結合,實現了告警信息的缺陷風險預警,提升了電網安全風險管控水平,為調控人員異常缺陷處置提供了輔助決策。采用人工智能NLP 技術對告警信息加以缺陷辨識和風險分析,作為后續基于知識譜圖的電網調度智能化缺陷診斷、故障分析、處置策略實施的技術鋪墊,為拓展電網調控領域的設備監控大數據智能分析平臺提供了理論指導。