999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于雙向圖神經網絡的變壓器故障知識圖譜構建

2023-10-12 00:42:10栗佳初朱永利
電力科學與工程 2023年9期
關鍵詞:變壓器特征故障

栗佳初,朱永利

(華北電力大學 計算機系,河北 保定 071003)

0 引言

變壓器作為重要的輸變電設備,其健康狀況直接影響電力系統安全運行[1]??焖偾覝蚀_地了解變壓器信息,可以提升變壓器檢修和維護的效率[2],進而保證用戶的用電質量。

電力變壓器運維方案的制定通常依賴專家經驗[3,4],從而導致運維措施可解釋性弱,且效率不高。目前,電力系統已積累了大量的故障處理案例,由于其記錄方式主要為非結構化的文本,故知識的結構化程度不高[5]。因此,有必要設計更精細、豐富的知識表示方法,形成變壓器故障知識表示網絡,以進一步為智能運維提供數據支撐及理論支持[6]。

知識圖譜的概念于2012 年被提出,其初衷是為了改善搜索結果。知識圖譜具備強大的學習和推理能力,所以迅速受到了學術界和工業界的廣泛關注[7-9]。

構建知識圖譜的基礎是信息抽取,即從非結構化的文本數據中提取出與事件有關的信息,并以結構化的形式存儲、展現。目前,相關學者對知識圖譜開展了大量研究[10-13]。

信息抽取的準確性直接影響知識圖譜的構建質量。文獻[14]提出一種關系抽取神經網絡模型,用雙向長短期記憶網絡(Bidirectional long short-term memory network,BiLSTM)模塊進行實體提取,將卷積層用于關系分類,將BiLSTM 層產生的信息傳遞到卷積層以提升關系分類的精度。文獻[15,16]使用BERT(Bidirectional encoder representation from transformers)預訓練模型提取字符的特征,通過軟標簽嵌入進行全局關系預測。文獻[17,18]將關系抽取問題轉化為多頭選擇問題。文獻[19]提出GraphRel 模型,采用LSTM 抽取信息,并使用雙向圖神經網絡(Bidirectional graph convolutional networks,BiGCN)進行關系推理,使模型在NYT數據集上比之前的模型精度提高了3.2%。

上述研究多是在英文數據集上開展的,流程基本固定:用BiLSTM 挖掘字符間的依賴特征,用條件隨機場(Conditional random field,CRF)進行實體的分類,關系提取使用卷積網絡或者將其轉化為多頭選擇問題。

受上述文獻的啟發,本文使用預訓練模型BERT 提取字符特征,然后使用BiLSTM 提取文本上下文特征,用CRF 進行實體識別,用多頭選擇判定實體間關系,以關系矩陣作為節點特征的鄰接矩陣,最后用BiGCN 根據鄰接矩陣對節點特征進行再次更新,糾正錯誤的實體關系。

1 變壓器故障知識圖譜構建方法

1.1 本體層設計

在人工智能領域,本體這一概念被用于刻畫知識,由類、關系、屬性3 部分組成。

在變壓器故障知識圖譜中,故障診斷的知識由事件邏輯來表達,其語料庫涉及故障現象、故障原因、檢測方法、維修方法。

首先,定義事件參數。構成事件的元素主要有:對象(object)、觸發詞(trigger)、狀態(state)。對象指發生故障的設備,如鐵芯、套管等。觸發詞指事件觸發元素,如出現、導致等。狀態一般是對發生故障設備的描述,如受潮、損壞等。

然后,定義事件參數的類概念和關系。為了保證節點的一致性,類的屬性也看作節點。類概念主要描述了事件參數定義;關系則主要描述了觸發詞的定義和事件之間的邏輯關系。

變壓器故障事件和參數模型如圖1 所示。

圖1 變壓器故障事件和參數模型Fig. 1 Transformer fault event and parameter model

從圖1 可知:故障事件包括故障原因事件、故障現象事件、故障檢測事件和故障維修事件。故障原因與故障現象之間的關系是“導致(lead to)”;故障維修方法與故障原因之間的關系是“維修(fix)”;故障檢測事件與故障現象之間的關系是“檢測(detect)”。每個事件包括對應的故障部件和狀態,均為事件的參數。

變壓器故障語料庫主要由故障事件構成,宏觀上可分為變壓器結構部分和故障描述部分。結構部分主要分為3 個層次:設備、子設備、零件。設備主要指變壓器,子設備主要指鐵芯、繞組、油箱等變壓器的功能部件。零件指螺栓、外殼等不可再分的組件。在對故障事件的描述中,部分故障現象同時也是故障原因,比如絕緣墊塊潮濕造成鐵芯多點接地。墊塊潮濕既是現象又是造成鐵芯多點接地的原因。

概念類被定義之后,類之間就會存在相應的類關系。本文設計的事件關系主要包括:consist_of,lead_to,detect,fix,has_attribute 和appear。其中,consist_of 表示設備結構之間的關系,has_attribute表示設備與屬性之間的關系;這2 種關系描述的是變壓器知識的定性關系。lead_to 表示狀態間的事件邏輯關系,detect 表示檢測方法與設備故障狀態之間的關系,fix 表示維修方法與設備故障狀態之間的關系;這3 種屬于事件邏輯關系。除此之外,設備狀態值可能會導致設備屬性值發生變化,因此設備狀態與設備屬性之間也存在lead_to 關系。

1.2 標注策略

借鑒英文數據集的標注方法,將信息提取任務轉化為文本的標注任務。標注包含實體類別層、關系層、關系位置層。實體層采用BIO 的標注方式,B 表示一個實體的開頭,I 表示一個實體的中間和尾部,O 表示非實體。

實體主要包括故障設備、狀態、檢測方法、維修方法。其中檢測方法和維修方法屬于較長的實體,模型需要具備足夠的記憶能力才能取得好的效果。

根據上文提出的本體模型,本文共涉及8 個實體類別、7 個關系類別。8 個實體類別分別為:

equipment,sub-equipment,component,state,gas,attribute,detect_method,fix_method。7 個關系類別分別為:appear,lead_to,consist_of,has_attribute,generate,detect,fix。關系類別按尾實體先后位置依次標記在頭實體最后一個字符上,如附錄所示。

網絡模型的輸入為變壓器故障診斷文本,輸出為實體和關系標簽。根據標簽可以將非結構化的文本轉化為有意義的圖結構。

在收集的案例語料中,每個故障都有其對應的故障原因和故障表示。此外,還存在不同的故障原因可以引起相同或相似的故障現象,以及一個故障原因可以引起多種不同的故障現象的情況。因此當故障相同時,對應的故障原因和故障現象并不完全一致。

2 聯合抽取模型

本文使用中文BERT 通過微調學習文本的詞向量,并將其作為堆疊BiLSTM 層的輸入,以捕捉文本的深層語境特征;CRF 用來識別實體;最后,根據關系矩陣用BiGCN 更新節點特征。信息抽取模型框架如圖2 所示。

圖2 信息抽取模型框架Fig. 2 Framework of information extraction model

CRF 被用來劃分全局最優標簽序列,基于字符依賴性特征序列M,輸出標簽序列Y。標簽序列和特征序列的聯合概率分布如式(1)所示。

式中:A為標簽之間的轉移概率矩陣,由訓練得到;Yi為第i個字符的預測標簽。

從式(2)中可以得到M和Y的條件概率。

式中:Y′為一個可能的標簽序列;f(M)為所有可能的標簽序列的集合。

在訓練CRF 時,以最大似然估計作為損失函數來最大化P(Y|M),如公式(3)(4)所示。

在實體類別預測過程中,使用維特比算法預測最佳標簽序列。

為了緩解錯誤的實體分類對關系識別造成的影響,將BiLSTM 的輸出特征與預測標簽向量進行拼接,記為向量Z。關系概率計算為:

式中:δ為sigmoid 激活函數;p(ci,r,cj)為字符ci與cj之間存在關系r的概率;“⊕”表示計算各個關系的概率值;Wv,W f,Wb分別為全連接層權重矩陣、前向關系權重矩陣、后向關系權重矩陣。

在訓練過程中,最小化交叉熵損失作為優化目標,如式(6)。

式中:n為字數;m為關系類別的數量;q(ci,r,cj)為實體ci和cj之間存在關系的概率;p(ci,rk,cj)為實體ci和cj之間的每個關系的概率。

常規的信息抽取方法沒有考慮關系對實體識別的影響。考慮到關系的確定能夠幫助模型更好地識別實體,例如關系類別如果為“fix”則頭尾實體分別為“fix_method”和“state”,因此本文引入了BiGCN,將字符的深度上下文特征作為節點特征,以上一階段對關系的預測結果作為鄰接矩陣,再次進行實體關系的聯合抽取。

傳統的GCN 無法建模方向,但是知識圖譜三元組中定義了頭實體和尾實體。根據關系的方向,鄰接矩陣被分為前向鄰接矩陣和后向鄰接矩陣,如公式(7)—(9)所示。

BiGCN 運算后的節點特征先與鄰接矩陣相乘,再經過激活函數。節點特征最終的更新公式如式(10)所示。

考慮關系概率對節點特征更新影響的優點是,可以有效糾正模型前期積累的錯誤特征,增強模型的識別能力。

3 實驗驗證

3.1 實驗平臺與數據

本文的實驗環境:操作系統為Win10,CPU為intel core i5-7300,GPU 為2080ti;軟件python 3.7,pytorch1.7.0。

電力變壓器公開的運維文檔與事故處理報告較少。本文從《電力設備預防性試驗規程》等文獻中摘取與變壓器運維相關的描述故障原因和故障現象的語句。

在此基礎上,進一步標注實體關系,得到數據集,含2 456 條語句,63 070 個字符。將其中80%用作訓練,其他用作測試。具體數據統計如表1 所示。

3.2 模型參數設置

模型的參數直接決定著模型的識別能力。本文參數通過搜索確定。搜索范圍和最終選定的參數(加黑)如表2 所示。

表1 數據統計信息Tab. 1 Data statistics

表2 模型參數設置Tab. 2 Model parameter settings

3.3 實驗結果與分析

3.3.1 對比實驗

為了驗證本文方法的優越性,選擇算法1[18]和算法2[19]作為對比算法。以準確率P和F1分數作為評價指標。實驗結果如表3 和圖3 所示。

表3 實驗結果Tab. 3 Experimental results %

圖3 各算法F1 分數及損失對比Fig. 3 Comparison of F1 scores and losses of each algorithm

從表3 和圖3 可以看出,本文提出的模型在變壓器運維文本的信息抽取任務中具有明顯的優勢。

結果分析:

相比算法1。本文算法將BiLSTM 的輸出特征與預測標簽向量進行拼接,緩解了錯誤的實體分類對關系識別造成的影響,且考慮關系概率對節點特征更新的影響,可以有效糾正模型前期積累的錯誤特征。

相比算法2。本文算法使用預訓練模型BERT獲取詞向量,更好地考慮了上下文字義和語境意義;針對本文語料,通過微調模型獲得更優的性能。

3.3.2 消融實驗

為了驗證BiGCN 對模型信息提取能力的影響,選擇BERT-BiLSTM-CRF(算法3)作為對比算法。相比本文模型,算法3 僅去掉BiGCN 更新節點特征的過程,其他參數設置、模型結構與本文模型保持一致。

消融實驗結果見表4。

表4 消融實驗結果Tab. 4 Ablation experimental results %

由表4 可知,加入BiGCN 模塊的模型獲得了3.1 個百分點的聯合F1分數提升。BiGCN 可以推斷和糾正錯誤的實體關系,聯合抽取提高了實體識別和關系識別兩個子任務的相關性,性能獲得明顯的提升。

4 變壓器故障知識圖譜的可視化與應用

將通過上述方法提取到的三元組存儲在neo4j 圖數據庫中。該庫以節點和關系為對象存儲圖結構數據,可以使用Cypher 語言進行快速查詢。

同時開發線上網站,提供知識圖譜自動化構建服務。用戶輸入要處理的文本,后端會調用模型進行信息抽取,然后返回構建好的圖譜。

在關系查詢界面,支持3 種查詢方式:根據頭節點、關系查詢尾節點,根據頭節點、尾節點查找最短路徑,根據關系、尾節點查找頭節點。

針對變壓器運維過程中信息關聯性弱及決策生成效率低的問題,為提高決策生成服務能力,系統首先將輸入問題轉化為查詢圖,將其表述為狀態和動作的搜索問題。查詢圖由4 種類型的節點組成:基礎實體,存在變量,λ變量,聚合函數。基礎實體是存在于知識圖譜中的實體。存在變量和λ變量不是基礎實體。最終將可以映射到λ變量的所有實體作為答案。聚合函數旨在對實體進行過濾。首先從知識圖譜中檢索基礎實體及關系,構造查詢圖[20]。以“鐵芯發生過熱故障的處理方法?”為例,查詢邏輯形式為:

λx.?y.method(x,y) ∧appear(鐵芯,過熱)∧

fix(y,過熱) ∧detect(y, 過熱)

鐵芯和過熱為2 個基礎實體,之間的關系為“appear”。y表示存在變量,描述構造關系。x表示λ變量,即答案節點,用于映射查詢檢索到的實體。聚合函數的約束是返回的節點類型,為fix_method。x、y都是方法實體,代表鐵芯過熱的維修措施或者需要進行的檢修試驗。檢索到的實體由聚合函數篩選,返回鐵芯過熱的維修措施給運維人員。運維人員核驗與完善生成的處理方法,生成運維報告。

5 結論

本文基于電力變壓器運維相關文獻,提出一種基于BERT-BiLSTM-CRF-BiGCN 的知識圖譜構建方法,主要結論如下:

1)設計了變壓器故障知識圖譜本體層,包含8 種本體、7 種關系?;诒倔w對故障診斷文本進行標注,建立了實體和關系聯合提取數據集。

2)提出實體和關系聯合提取方法,首先通過BERT 預訓練模型學習詞向量,堆疊BiLSTM 模塊,根據深度語境更新字符特征,再使用BiGCN結合關系矩陣糾正錯誤的實體關系。模型聯合F1分數可以達到89.94%,明顯優于對比模型。

3)開發軟件提供線上知識圖譜自動化構建、實體查詢、關系查詢和決策生成的服務,提升變壓器運維決策生成的效率。

猜你喜歡
變壓器特征故障
理想變壓器的“三個不變”與“三個變”
故障一點通
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
開關電源中高頻變壓器的設計
抓住特征巧觀察
奔馳R320車ABS、ESP故障燈異常點亮
一種不停電更換變壓器的帶電作業法
變壓器免維護吸濕器的開發與應用
故障一點通
主站蜘蛛池模板: 久久天天躁夜夜躁狠狠| 色综合久久无码网| 成人免费黄色小视频| 亚洲欧美另类日本| 蜜桃臀无码内射一区二区三区| 色综合天天操| 亚洲va视频| 无码高潮喷水专区久久| 丁香亚洲综合五月天婷婷| 日韩午夜片| 亚洲精品第五页| 国产综合精品日本亚洲777| P尤物久久99国产综合精品| 久久精品无码一区二区国产区| 四虎在线观看视频高清无码| 国产乱子伦无码精品小说 | 国产成本人片免费a∨短片| 国产性爱网站| 99精品国产电影| 亚洲一欧洲中文字幕在线| 亚洲一区二区约美女探花| 欧美国产日韩在线观看| 美女扒开下面流白浆在线试听| 久久免费精品琪琪| 波多野结衣的av一区二区三区| 2020精品极品国产色在线观看 | 久久人搡人人玩人妻精品| 人妻丰满熟妇AV无码区| 女同久久精品国产99国| 日本精品影院| 无码不卡的中文字幕视频| 在线亚洲精品福利网址导航| 99视频在线看| 波多野结衣中文字幕久久| 美女无遮挡拍拍拍免费视频| 国产sm重味一区二区三区| 亚洲人成人无码www| 国产精品视频猛进猛出| 国产又大又粗又猛又爽的视频| 国产黑人在线| 国产美女精品一区二区| 毛片三级在线观看| 天天综合色网| 人人妻人人澡人人爽欧美一区 | 国产在线视频福利资源站| 亚洲天堂久久久| 2022国产91精品久久久久久| 中文无码精品a∨在线观看| 亚洲欧洲国产成人综合不卡| 无码福利视频| 青青操国产视频| 一区二区三区精品视频在线观看| 久久综合色视频| 欧美一区福利| AV在线天堂进入| 9久久伊人精品综合| 97在线免费| 亚洲av无码久久无遮挡| 国产精品偷伦在线观看| 亚洲人成影视在线观看| 欲色天天综合网| 国产玖玖玖精品视频| 久久天天躁狠狠躁夜夜躁| 91久久国产综合精品女同我| 在线综合亚洲欧美网站| 1769国产精品视频免费观看| 国产96在线 | 午夜免费视频网站| 免费A级毛片无码免费视频| 亚洲IV视频免费在线光看| 国产精品亚洲片在线va| 欧美另类图片视频无弹跳第一页| 国产主播喷水| 国产色婷婷| 国产剧情国内精品原创| 国产日韩精品一区在线不卡| 亚洲欧美在线精品一区二区| 亚洲欧洲日韩综合| 在线亚洲天堂| 亚卅精品无码久久毛片乌克兰| 无码一区二区三区视频在线播放| 99热这里只有精品2|