999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種知識圖譜的電力設備缺陷檢索方案設計與實現

2022-02-21 10:42:24楊迪梁懿王秋琳陳新梅陳恩光王燕蓉
微型電腦應用 2022年1期
關鍵詞:電力設備

楊迪, 梁懿, 王秋琳, 陳新梅, 陳恩光, 王燕蓉

(1.國家電網有限公司,北京 100000;2.福建億榕信息技術有限公司,福建,福州 350003)

0 引言

在電力行業中,電力系統的日常管理和運維離不開電力相關信息系統的支撐,電力信息系統具有規模龐大且復雜度較高的特點,信息系統局部出現問題極易使電網的安全穩定運行狀態受到影響。這就對電力從發電、輸電到用電的全過程,尤其是電力設備缺陷的監控能力提出了更高的要求,及時發現運行狀態下電網中電力設備的缺陷、故障以及對設備狀態的回查是保證電網安全穩定運行的重要環節,監控電力設備需基于信息化系統實現。

1 系統分析

由于電力設備缺陷記錄較為復雜,增加了準確檢索缺陷記錄的難度,部分電力相關規范以表格形式總結了缺陷及其對應現象,但難以對復雜多樣的缺陷情況進行全面歸納,且易受到巡檢人員經驗的局限,以自然語言形式描述的缺陷記錄則增加了計算機對其理解的難度。文本的檢索效果取決于語義分析和表示的有效性,傳統電力設備缺陷文本的語義框架主要基于人工經驗確定并采用二維表形式,文本表示則基于框架的填充實現,過于依賴人工經驗,缺乏靈活性及對復雜電力設備缺陷情況的適應性,缺少對缺陷記錄的多樣化表達,目前運用機器學習算法已成為避免人工經驗局限的有效手段,對缺陷記錄中的詞級別規律通過計算機的使用完成自動挖掘過程,再以具有一定規律性的詞的統計特征為依據對文本進行表示,但此種特征選取方法受到是否出現關鍵詞或詞的出現頻率的限制,解釋性不足,且對關鍵詞內在邏輯的考慮不足,易局限于字面特征。缺陷文本在記錄設備缺陷時根據實際情況完成,文本間的邏輯關系較為明確[1]。本文在現有研究成果的基礎上,為有效彌補語義框架二維表結構的不足,將文本信息及其關系使用知識圖譜進行表示,基于缺陷文本信息內在邏輯,結合運用語言處理及機器學習等技術,實現對構建知識圖譜所需信息(存儲于缺陷語料中)的自動提取,再基于自動構建的知識圖譜完成了一種缺陷記錄檢索方法的設計。

2 電力設備缺陷知識圖譜的構建

2.1 知識圖譜技術

2.1.1 知識圖譜概述

作為一個知識庫,知識圖譜以知識網絡的形式通過關系聯結和組織實體與屬性,實體—關系—實體(或屬性)三元組是構成知識圖譜的基本單元,實體和屬性的存在形式在采用圖的形式表示知識圖譜為節點,關系對應連接兩節點的有向邊,三元組結合時則基于共有的實體或屬性實現,在此基礎上構成網狀結構的知識圖譜。知識圖譜分為開放域(不限定知識領域,主要用于搜索引擎)和封閉域(只能應用于特定行業)兩類,專業性不強的開放域知識圖譜的應用深度受到局限,知識專業性較強的封閉域知識圖譜的實體、屬性和關系能夠進行限定和窮舉,針對性較強、應用比較深入[2]。

2.1.2 知識圖譜的構建

該過程通常分為知識抽取、知識融合、知識加工3部分,知識抽取以非或半結構化數據作為主要抽取對象(包括數據的實體、屬性和關系)構成知識圖譜的基本元素,知識融合負責實體消歧(用于區分存在多種含義的實體名稱)和共指消解(用于合并相同含義和指代的名/代詞)處理數據的實體,接下來在現有結構化數據中加入經整合后的實體、屬性和關系,形成知識圖譜,在知識圖譜持續應用過程中需對其數據質量和應用效果進行動態評估,根據不斷發展豐富的知識完善和修正知識圖譜[2]。

2.2 設備缺陷知識圖譜的構建

在日常巡檢和試驗電力設備過程中,已積累了大量設備缺陷記錄,在經分級、消缺等缺陷處理后,相應的缺陷及處理記錄的利用率不高,并且設備缺陷情況具有復雜多變的特點,導致缺陷處理工作對工作人員知識與經驗的依賴程度較高。根據某條缺陷記錄對相同情況的歷史記錄進行檢索,可參考之前的經驗及處理方法對該缺陷進行相應處理,進而提高實際缺陷管理工作質量和效率。電力設備缺陷記錄的部件、現象、程度等通常使用基于自然語言的單個句子形式進行記錄,其知識圖譜屬于封閉域知識圖譜,根據電力設備缺陷記錄的特點基于上述知識圖譜構建過程進行修改:(1)考慮到作為缺陷部件屬性的缺陷現象同時具有缺陷程度等屬性,對實體間關系、屬性間關系及實體與屬性關系進行抽取;(2)有明確術語規范的電力行業基本沒有實體歧義問題,因此取消了實體消歧步驟,但需進行共指消解(因為屬性會出現同義詞現象),由于封閉域數據量較小,應先共指消解再抽取關系,以確保獲取更多的關系訓練樣本;(3)國家電網公司的輸變電設備缺陷用語規范可作為進行關系抽取時的訓練樣本,該規范對部分三元組采用表格形式進行了歸納,提高了結構化數據的利用率,關系抽取后為避免出現冗余,需篩選處理關系,提高知識圖譜的后續應用質量;(4)通過整理與合并各三元組形成圖結構的缺陷知識圖譜。具體構建過程[3]如圖1所示。

圖1 設備缺陷知識圖譜的構建

2.3 實體/屬性抽取

該部分主要負責完成對缺陷記錄中表示實體/屬性的詞的抽取與詞性標注,可采用電力專業詞典對能夠窮舉的實體和屬性進行直接的匹配與抽取,具體步驟為:(1)先基于詞典和隱馬爾可夫模型對設備缺陷記錄進行分詞,并結合運用電力專業詞典保證準確率;(2)接下來在電力專業詞典中逐一檢索語料中的詞,有匹配項則抽取該詞表示的實體/屬性;(3)對語料中所有詞進行詞性標注,并將全部詞分為描述設備及部件的名詞(表示實體)、描述缺陷現象的動詞(表示屬性)、描述缺陷程度的副詞(表示屬性)、描述缺陷程度的量詞(表示屬性)、未在詞抽取中被抽取出的詞(非實體非屬性)5類,對應詞性分別為En、Pv、Pad、Pq和按原詞典標注[3]。

2.4 共指消解

共指消解主要負責完成全部表示實體/屬性的同義詞的查找(無需考慮代詞),具體步驟為:(1)先按詞性進行分類,由于同義詞的詞性相同,可按照4種詞性將全部的詞劃分為4個集合后,再對集合進行同義詞識別;(2)向量化處理,對缺陷記錄使用word2vec方法進行訓練,得到記錄中全部詞對應的詞向量,在此基礎上通過計算余弦相似度完成對詞間的相似程度的判斷;(3)篩選詞對,向量化處理時,對于句中位置鄰近的詞或上下文相似的詞會表現出較高的余弦相似度,所尋找的同義詞為同位詞對,而其對應的兩個詞出現在同一條缺陷記錄中的概率較小,為完成同位詞對的有效篩選,可刪除出現于同一條記錄中的詞對;(4)形成同義詞表,由含有相同詞的同位詞構成,在所形成的若干個同義詞集中各選一個詞作為集合的標準化名稱[4]。

2.5 關系抽取與關系篩選處理

各實體/屬性間的關系及關系類型通過關系抽取完成識別過程,可對關系結合實體/屬性的詞性進行限定,具體如表1所示,關系抽取轉化為分類問題,訓練集由國家電網公司的輸變電設備缺陷用語規范提供,為提高監督訓練較少訓練樣本方法的分類效果,采用半監督協同訓練方法,先形成待分類的詞對再對關系進行分類,即按照表1的4種詞性組合的詞對在所有詞的兩兩組合中篩選后進行關系分類。

表1 實體/屬性間的關系類型

關系篩選主要負責刪除冗余的包含關系,考慮到實際工作過程中存在未嚴格按照規范逐級記錄的問題,對于一些非直接包含的關系在關系抽取時,易被識別有包含關系,出現的結構如圖2所示。可采用知識推理識別“主變”與“風扇”間的包含關系,在對全部間接包含關系進行表示時,會使知識圖譜的復雜性顯著提高,需對間接包含關系進行統一刪除,具體對各具有包含關系的實體檢測兩實體間的連通路徑,存在另一條路徑則刪去兩者間的包含關系[5]。

圖2 包含關系的實例

3 電力設備缺陷記錄檢索

3.1 檢索的實現

對于一種缺陷情況,缺陷檢索主要負責在缺陷記錄集中找出與其一致的全部記錄,可逐條匹配給定的缺陷與記錄集的記錄,并輸出成功匹配的結果,兩條缺陷情況的描述一致,意味著在知識圖譜中該記錄所對應的實體和屬性連成的完整樹一致,只需找出并對比各缺陷記錄對應的完整樹即可,在記錄缺陷部位不完整時,尋找對應的完整樹以構成完整的實體路徑時,需通過已有信息對缺少的實體進行推理,缺少關鍵缺陷部位信息難以對缺陷主體進行明確定位,如缺陷記錄沒有唯一對應的完整樹,給出代表關鍵信息缺失的錯誤提示1;多記缺陷信息時,給出表示關鍵信息矛盾的錯誤提示2[6]。

3.2 缺陷記錄檢索過程

知識圖譜結構如圖3所示。圖3中,節點a至i、j和k分別對應En和Pv詞性的實體和屬性,節點m和l分別對應pq和Pad詞性的屬性,先通過分詞和詞性標注某條缺陷記錄,再尋找其完整樹,然后規范化處理記錄中全部詞得到標準名稱(對照同義詞表完成)。規范化后記錄的實體/屬性由節點b,c,d,i,j,m和l表示,在知識圖譜中以黃色節點標記,確定缺陷記錄完整實體路徑的流程如圖4所示。先輸入與被標記的j匹配的i,記為節點N;令有序集合S為空集,對N向上的未搜索過的路徑采用深度優先搜索方法完成搜索過程,從N出發依次經過i,f,e,g節點對邊1→2→3進行搜索,得到由{i,f,e,g}構成的有序集合R,但有被標記的實體節點不在R中;繼續搜索新路徑,退回節點e搜索邊4→5獲取由{i,f,e,b,a}構成的新路徑R,同樣有被標記的實體節點不在R中;繼續搜索新路徑,退回節點f搜索邊6→7→8→5獲取由{i,f,d,c,b,a}構成的新路徑R,此時S為空集,R涵蓋全部被標記的實體節點,令S=R;繼續搜索不存在新路徑,S非空,故輸出節點有序集合S,在c和d未被標記的情況下,表明無法判斷f對應的實體是源于d或e對應的實體,此時S為非空集,輸出錯誤提示1;e被標記會混淆f對應實體的來源,S仍為空集,輸出錯誤提示2;連接完整實體路徑S中全部節點和被標記屬性節點得到缺陷記錄完整樹由{a,b,c,d,f,i,j,l,m}構成[7]。

圖3 知識圖譜結構示例

圖4給出實體路徑確定的計算框圖。

圖4 完整實體路徑確定流程

4 算例分析

為測試本文檢索方法的效果,以某電網公司變壓器缺陷記錄提供3 000條作為實驗對象,隨機平均分為3份,分別作為訓練集(包含所有正確記錄)、待檢索的語料庫、測試集,以訓練集作為非結構化數據來源構建知識圖譜時,構建KG1(不加入結構化數據信息)和KG22(加入輸變電設備缺陷用語規范包含的結構化數據信息)個知識圖譜模型,然后逐條輸入測試集的記錄,檢索通其匹配的全部記錄。進行缺陷記錄檢索時,對比LSI和LDA模型的效果,通過準確率、召回率、F1(兩者的綜合效果)值評價檢索效果[7]。

(1)自動構建知識圖譜的結果與分析

采用訓練集完成知識圖譜的自動構建,并加入輸變電設備缺陷用語規范包含的結構化數據信息,得到的變壓器缺陷知識圖譜由614條邊和490個節點構成,出現在缺陷語料中的表示實體/屬性的詞均能被抽取出來,基于1 000條訓練記錄訓練,判別兩兩構成的詞對是否為同義詞,共指消解準確率的統計結果為94.8%,對于出現頻率較低的詞難以準確識別出同義詞,或將相似的近義詞誤判斷為同義詞。關系抽取準確率的統計結果為92.2%,因為在記錄語料中某些詞對對應的實例較少,并且機器學習模型存在一定的不確定性。不斷增加的訓練記錄數量能夠改善詞頻過低、實例過少等問題,提高構建知識圖譜的準確性。構建完知識圖譜后,在檢索時只進行圖搜索即可。

(2)缺陷記錄檢索結果

針對測試集1 000條缺陷記錄,分別采用本文模型、LSI和LDA對其在語料庫中的匹配記錄進行檢索,并取測試記錄的混淆矩陣的平均值,得到的結果如表2所示。相比于其他2個模型,本文模型的準確率、召回率和F1值較高,通過結構化數據的加入實現了檢索效果的有效提升,知識圖譜充分結合了電力領域的知識,可準確識別關鍵信息,具有較強的同義詞匹配及知識推理能力。以表3中記錄的匹配為例,采用上述3K模型判斷各組2條缺陷記錄的匹配情況,結果如表4所示。A1和A2只相差一個詞,但描述的卻是不同的缺陷,2條記錄不匹配但在字面上很相似,知識圖譜模型實現了在不同完整樹中定位兩條記錄,進而實現了對其不匹配結果的準確判斷;B1和B2沒有相同的詞,但描述了同一缺陷現象,LSI和LDA模型同一難以識別字面相差較大的2條記錄文本,知識圖譜模型通過節點連接實現了準確的推理過程。

表2 不同模型的檢索結果

表3 2組缺陷記錄實例

表4 2組記錄匹配關系的判斷結果

5 總結

本文通過使用知識圖譜技術完成了一種電力設備缺陷記錄檢索方案的設計,構建了一種缺陷記錄檢索方法,詳細介紹了構建知識圖譜與檢索缺陷記錄的過程,采用知識圖譜的圖搜索方法實現對設備缺陷的檢索過程,本文基于知識圖譜的檢索方法取得了較佳的效果,使缺陷檢索質量及效率得到有效提升,為現有缺陷的處理提供支撐。

猜你喜歡
電力設備
更正
探討電力設備運維管理及安全運行
河北冀州國昊電力設備科技有限公司
公民與法治(2022年5期)2022-07-29 00:48:10
加強電力設備運維云平臺安全性管理
高壓電力設備試驗方法及安全措施的研究
電力設備材料招標管理分析
基于電力設備全壽命周期成本最優的檢修策略研究
電子測試(2017年15期)2017-12-18 07:19:48
電力設備運維管理及安全運行探析
基于壓縮感知的電力設備視頻圖像去噪方法研究
電力設備紅外測溫多點精確定位控制系統設計
電源技術(2015年2期)2015-08-22 11:28:24
主站蜘蛛池模板: 男女精品视频| 99ri国产在线| 亚洲AⅤ无码国产精品| 人人艹人人爽| 久久亚洲中文字幕精品一区| 亚洲精品无码久久毛片波多野吉| 四虎影院国产| 亚洲视频一区| 伦伦影院精品一区| AV无码一区二区三区四区| 久久黄色视频影| 成人午夜免费观看| 深爱婷婷激情网| 2021国产精品自拍| 97狠狠操| 亚洲自偷自拍另类小说| 亚洲精品片911| 网友自拍视频精品区| 十八禁美女裸体网站| 真实国产乱子伦视频| 亚洲精品制服丝袜二区| 99久久这里只精品麻豆| 欧美在线观看不卡| 国产成熟女人性满足视频| 国产精品久久久免费视频| 国产成人精品亚洲77美色| 国产免费a级片| 国产成人久久综合777777麻豆| 91成人在线观看| 成人在线观看一区| 国产精品内射视频| 国产午夜小视频| 国产精品亚欧美一区二区| 亚洲有无码中文网| av免费在线观看美女叉开腿| 免费一级成人毛片| 免费中文字幕一级毛片| 亚洲天堂精品在线观看| 依依成人精品无v国产| 国产成年女人特黄特色大片免费| 99青青青精品视频在线| 精品国产香蕉伊思人在线| 午夜福利在线观看入口| 婷婷六月综合| 在线日韩日本国产亚洲| 亚洲欧美日韩高清综合678| 国产香蕉一区二区在线网站| 免费在线色| 波多野结衣无码AV在线| 久久精品娱乐亚洲领先| 欧美成人午夜视频| 亚洲第一色网站| 成人一级免费视频| 伊人久久婷婷| 久久男人视频| 国产精品永久免费嫩草研究院| 欧美色综合久久| 日本高清免费一本在线观看| 四虎影视无码永久免费观看| 国产黄色免费看| 久久99精品久久久久久不卡| 成人一级黄色毛片| 久久精品波多野结衣| 国产一级无码不卡视频| 久久精品国产免费观看频道| 婷婷丁香在线观看| 91精品国产无线乱码在线| 国产无码性爱一区二区三区| 国产三级国产精品国产普男人 | 国产丝袜啪啪| 亚洲五月激情网| 国产亚洲视频在线观看| 国产欧美亚洲精品第3页在线| 亚洲A∨无码精品午夜在线观看| 色九九视频| 免费三A级毛片视频| 国产全黄a一级毛片| 久久精品66| 黄色网站不卡无码| 国产日韩精品欧美一区灰| 99精品一区二区免费视频| 国产福利一区视频|