李彥儒,王慧芳,陳 昊,張佳麗,江 帆,謝雅雯
(1.浙江大學 電氣工程學院,杭州 310027;2.國網浙江省電力有限公司金華供電公司,浙江 金華 321017;3.國網浙江省電力有限公司新興科技有限公司,杭州 310000)
隨著經濟的快速發展,電網設備持續增加,巡檢任務的工作量和工作難度與日俱增。電網設備持續增加,智能化、自動化技術不斷引入電網[1-2],為提高巡檢人員的工作效率和準確性提供了支持。
電力設備缺陷記錄是描述電力設備從發現到消除缺陷這一閉環工作過程中相關信息的記錄,通常包括發現人、發現時間、缺陷內容、缺陷等級、消缺人和消缺時間等內容。其中大部分內容是客觀的不易出錯,主觀性強也最易出現問題的是缺陷內容和缺陷等級。缺陷內容是對缺陷情況的描述,俗稱缺陷文本[3-4],通常包括缺陷發生的部位、現象和程度等的詳細描述;缺陷等級是對電力設備缺陷嚴重程度的判斷,國家電網有限公司發布的輸變電一次設備缺陷分類標準(以下簡稱“標準”)[5]中將其分為一般、嚴重和緊急3 類。巡檢人員發現缺陷時,需要撰寫缺陷文本并進行缺陷評級,且兩者應相對應。缺陷文本不僅是缺陷評級的依據,還是后續消缺處理的依據。然而,目前缺陷文本的質量缺乏剛性約束,內容詳略由記錄人員的經驗和習慣決定[6],因此常出現文本質量問題,如描述不準確、重點不突出和表述模糊等,即質量問題有個性化特點。這種情況不僅使缺陷發現者難以提高認知并快速獲得經驗,還影響消缺人員對缺陷的理解,甚至影響消缺資源的配置和處理效率,對消缺工作產生不利影響。因此,急需智能化工具為電力設備缺陷文本的質量保證與評級工作提供有效的幫助與指導。
目前,基于NLP(自然語音處理)與人工智能的缺陷文本質量保證和評級研究已經取得了很多成果[7-12]。在質量保證方面,文獻[7]提出了3種質量評價指標,通過基于層次-自適應灰色關聯分析法的評價方法對缺陷文本進行打分;文獻[8]提出了電力設備缺陷文本知識圖譜的構建方法,并根據缺陷文本在知識圖譜上的路徑查找結果,判斷質量是否合格。在缺陷評級方面,文獻[9]設計了基于CNN(卷積神經網絡)的缺陷自動評級模型,取得了較好的分類精度和效率;文獻[10]采用基于注意力機制的Bi-LSTM(雙向長短期記憶網絡)模型,也取得了較好效果;文獻[11]提出了基于“左貪心”出棧規則和神經網絡依存關系狀態轉移模型,查找相似的歷史缺陷進行缺陷評級;文獻[12]將標準表示成樹結構,運用樹路徑匹配算法與缺陷文本匹配,實現缺陷評級。這些研究都取得了很好的成果,為后續研究提供了方法參考,但是還沒有進行工程化的應用開發。
本文針對電力設備缺陷文本質量保證和評級工作缺少智能化工具的問題,提出開發基于標準和歷史缺陷的電力設備缺陷文本質量保證與評級軟件,進行了需求分析、流程設計和關鍵模塊的詳細設計,并運用算例展示了應用效果。
電力設備缺陷文本質量保證與評級軟件(以下簡稱“軟件”)應為用戶(如巡檢人員)提供完成工作流程的功能,并對可能出現的困難提供幫助。為此,分析用戶與軟件之間的信息交流關系,繪制數據流圖如圖1 所示。圖1 中,用戶輸入缺陷文本,軟件進行文本質量分析。若質量合格,軟件繼續進行缺陷評級,將缺陷等級和評級依據返回給用戶;若質量分析發現存在質量問題,則把具體的質量問題及修改建議返回給用戶。用戶依據返回結果對缺陷文本進行修改,修改完畢重新提交給軟件,由軟件重新進行質量分析,如此反復,直到軟件判斷缺陷文本質量合格,最終完成缺陷評級。

圖1 數據流
因此,軟件應具備以下兩大功能:對錄入或修改后的缺陷文本進行質量分析,對不合格的文本給出修改建議,直到質量合格才能進行評級,進而實現缺陷文本質量的智能管控;對質量合格的缺陷文本進行缺陷自動評級,并給出相應的評級依據。
上述缺陷文本質量分析與自動評級的依據主要有兩類:
1)國家電網有限公司總結已有缺陷情況發布的標準。標準中的缺陷文本結構清晰,缺陷等級判斷準確,因此標準對于缺陷文本的研究,特別是缺陷評級起到至關重要的作用。但是標準往往包含一些重要或常見缺陷,因而難以覆蓋所有缺陷,具有準確而不全面的特點。
2)已上報缺陷匯總得到的歷史缺陷。絕大多數的現場缺陷通常都能從中找到相同或相近的缺陷文本,因此參考歷史缺陷對于經驗和知識不足的巡檢人員來說,具有全面性[13]。特別是對于還未被納入標準的缺陷,歷史經驗成為對其評級的主要參考來源。然而,歷史缺陷由于是人工輸入和評級的,難免帶有主觀性,規范性和嚴謹程度難以保證,因而具有全面但不一定準確的特點。
由此可見,兩類依據的優缺點是互補的。因此,在進行缺陷文本的研究時,既要考慮標準,又要考慮歷史缺陷,若缺陷在標準覆蓋范圍內,則以標準為依據;否則以歷史缺陷為依據。
由需求分析知,需分別針對標準和歷史缺陷兩類依據來實現需要的2 個功能。由于依據不同,實現方法存在差異,為此主要有4 個關鍵功能模塊:基于標準的文本質量分析、基于標準的缺陷評級、基于歷史缺陷的文本質量分析、基于歷史缺陷的缺陷評級。然而,關鍵功能模塊的使用流程與用戶期望的軟件交互過程有關,為此提出兩種可能的交互流程,如圖2所示。

圖2 軟件流程設計
流程1考慮標準準確而不全面的特點,輸入文本直接進入基于標準的質量分析模塊后,很可能由于不在標準覆蓋范圍內而被判斷為存在質量問題。此時即使依據標準給出修改建議,也往往與實際缺陷情況不符,難以修改。為此,用戶可以選擇是否直接進行基于歷史缺陷的質量分析,若選擇是,則進行基于歷史缺陷的質量分析;否則進行基于標準的質量分析。兩類質量分析若發現存在質量問題,則分別針對各自的依據給出修改建議;否則分別進行缺陷評級并給出評級結果和依據。
流程2考慮標準的優先級高,為此按優先級順序,對缺陷文本直接進行基于標準的質量分析。若質量合格,則基于標準進行缺陷評級,并輸出評級結果和依據;若質量不合格,則自動進行基于歷史缺陷的質量分析。若基于歷史缺陷的質量分析認為質量合格,則進行基于歷史缺陷的評級,并同時輸出基于標準的修改建議和基于歷史缺陷的評級與依據,供用戶參考并決定是否還要進行向標準靠攏的缺陷文本修改;若基于歷史缺陷的質量分析認為質量不合格,則同時輸出基于標準和基于歷史缺陷的兩種修改建議,供用戶綜合參考后修改缺陷文本。
上述兩種流程都可以通過輸入或修改缺陷文本反復觸發,直到獲得缺陷等級和評級依據。在反復修改和觸發流程的過程中,用戶不僅能不斷積累經驗獲得專業方面的提升,還能保證缺陷文本質量和評級準確,為下一步的消缺工作提供有價值的指導。至于具體選擇哪種流程,可以由用戶根據自己對標準和當前缺陷的熟悉程度決定,通過軟件界面上設置的動作按鈕實現,選擇單一分析模式“基于歷史缺陷分析”或“基于標準缺陷分析”則進入流程1;選擇“綜合分析”則進入流程2。
在軟件要實現的兩個功能中,缺陷自動評級相對簡單,找到與輸入文本相同或相近的標準和歷史缺陷,獲得其缺陷等級即可。但是對于文本質量分析,質量合格與不合格的文本在相似度上的差別可能比較微小,尤其是設備、部件等關鍵信息還有簡稱和代稱等情況,都會影響輸入文本中有效信息的識別精確度。考慮到缺陷文本中的缺陷位置描述存在層級關系,有一定的邏輯性,因此可以用樹結構或圖結構對其進行表示,進而基于邏輯關系開展文本質量分析研究,從而提高文本質量分析的效果。
3.1.1 文本質量分析
標準中的缺陷文本層級關系非常清晰,可以采用樹結構表示。參考文獻[12]的方法,根據標準的設備分層和從屬關系,將其轉化為根節點之下的8層樹結構:第1層是10種設備類型;第2—5層是由大到小的設備部件層級;第6層是缺陷現象;第7 層是缺陷程度;第8 層是缺陷等級。因此,標準樹上每條完整的樹路徑對應一條標準。將標準樹的各層數據按照設備類型分別存儲在對應的10個Excel文件中,調用這些Excel文件即可生成標準樹。
進行基于標準的文本質量分析時,假設設備類型已由用戶選擇,據此進行初始化的定義工作,包括:統計設備類型包含樹路徑的總數N;定義匹配到樹路徑的數量M,初值賦為N;定義樹路徑匹配的備選節點的層數i,初值賦為1,即設備類型層;定義匹配到的備選節點數量K,初值賦為1,即只有設備類型這一個備選節點。用戶輸入缺陷文本后,軟件先對輸入文本進行分詞,設備類型作為首層備選節點,將它的子節點與輸入文本進行匹配,將匹配到的節點加入下一輪匹配的備選節點,從上到下逐層進行匹配,匹配過程即是逐步縮小輸入文本對應的標準范圍的過程,一直匹配到第7層,即得到完整的樹路徑,匹配到的第7層節點數即為匹配到的樹路徑數量。若匹配到的樹路徑唯一,說明輸入文本質量合格;否則輸出匹配結果和建議。詳細的基于標準的文本質量分析過程采用如圖3所示流程。

圖3 基于標準的文本質量分析過程
匹配結果有以下3種:
1)M=1,說明匹配到唯一一條標準,輸入文本質量合格,該標準即為評級依據。
2)M=N,說明沒有匹配到任何節點,只能建議用戶進行基于歷史缺陷的質量分析。
3)1 3.1.2 缺陷自動評級 輸入文本被基于標準的文本質量分析判定為合格,說明它在標準樹上能夠匹配到唯一一條標準。那么,這條標準的缺陷等級就是輸入文本的缺陷等級,標準即為評級依據,將它們反饋給用戶即可。 3.2.1 文本質量分析 由于歷史缺陷的復雜性和不規范性,對其中的有效信息進行研究相對困難。文獻[8]提出了構建電力設備缺陷文本知識圖譜的方法,知識圖譜方便實現邏輯推理[14],為基于歷史缺陷的文本質量分析提供了方法。 文獻[8]中定義了組成知識圖譜的4 類實體詞匯:描述電力設備的名詞En、描述缺陷現象的動詞Pv、描述缺陷程度的副詞Pad、描述缺陷程度的量詞Pq以及它們之間的關系,不同實體詞通過具體的關系形成三元組。據此可以將知識圖譜以三元組表的形式進行存儲,在使用時通過調用三元組存儲文件即可生成所需的電力設備缺陷文本知識圖譜。在知識圖譜圖結構上,實體詞對應節點,關系對應節點間的有向邊,一條合格的缺陷文本對應唯一一條完整的路徑[8]。因此輸入文本在知識圖譜上的路徑查找結果可以作為其是否合格的判斷依據,要求: 1)完整的路徑必須有En 和Pv 節點,且有En節點與Pv節點相連接。 2)存在Pad或Pq節點時,它們必須與Pv節點相連接。 3)En節點之間形成單樹支。 這為路徑查找和文本錯誤類型的定義提供了基礎。 同樣假設設備類型已由用戶選擇,用戶輸入缺陷文本后,軟件先對輸入文本進行分詞、詞性標注、同義詞轉化,并標記輸入文本在知識圖譜上對應的節點,根據節點進行路徑查找。分詞和詞性標注需要使用電力本體字典[15]文件輔助jieba分詞,文件中每一行是一個實體詞及其詞性,如“主變壓器En”;同義詞轉化是由于知識圖譜中共指消解的需求,參照同義詞文件將同義的實體詞轉化為標準詞,每一行是一組同義詞,每行的首個詞匯是標準詞,如“壓力釋放閥 釋壓閥”代表“釋壓閥”的標準詞是“壓力釋放閥”。這2個文件在構建知識圖譜過程中已形成并使用[13]。進行路徑查找時,先檢查這些節點是否符合要求1)和要求2),依據是三元組表中的實體詞間的關系;然后根據要求3)從與Pv節點相連接的En節點(缺陷現象發生的位置)開始自下而上的查找En 節點間的路徑。路徑查找結果有如下3 種:路徑唯一存在,說明輸入文本質量合格;路徑不唯一,無法確定發生缺陷現象的位置的具體信息,文本質量不合格,對含有多個上級的En 節點進行提示,返回“En節點+對象不唯一”;有一些En節點孤立于路徑之外,說明它們包含的部件不應該發生這樣的缺陷現象,輸入文本可能存在問題,返回“En 節點+無對應現象”。 詳細的基于歷史缺陷的文本質量分析過程采用過程設計語言進行描述,具體如下: ge(t設備類型) 選擇設備類型所對應的三元組存儲文件生成該設備類型知識圖譜 ge(t輸入文本) 對輸入文本進行分詞、詞性標注、同義詞轉化 標記輸入文本在知識圖譜上對應的節點 對節點類型是否符合要求進行判斷 if沒有Pv節點then 質量不合格,輸出“缺現象或現象未錄入” else if沒有En節點then 質量不合格,輸出“缺對象” end if 對Pv節點與其他節點間的關系是否符合要求進行判斷 if對于某一個Pv節點沒有與它相連接的En節點then 質量不合格,輸出“Pv節點+無對應對象” else if 存在Pq 節點and 對于某一個Pq 節點沒有與它相連接的Pv節點then 質量不合格,輸出“Pq節點+無對應現象” else if 存在Pad 節點and 對于某一個Pad 節點沒有與它相連接的Pv節點then 質量不合格,輸出“Pad節點+無對應現象” end if 查找En節點間的路徑 if存在多條路徑then 質量不合格,對所有路徑進行分析,找出所有含有多個上級的En 節點,輸出“En 節點+對象不唯一” else if存在孤立于路徑之外的En節點then 質量不合格,輸出“En節點+無對應對象” end if 質量合格,得到輸入文本在知識圖譜上的路徑 end基于歷史缺陷的質量分析 3.2.2 缺陷自動評級 文獻[13]認為,若兩條缺陷文本在知識圖譜上對應的路徑一致,則它們描述的缺陷情況完全一致。據此提出根據質量合格的缺陷文本的路徑檢索出與其路徑相同的所有歷史缺陷,這些歷史缺陷的缺陷等級可以作為輸入文本的評級依據。 在軟件測試過程中發現,根據知識圖譜進行的缺陷評級存在以下問題: 1)歷史缺陷數量較多,查找出所有歷史缺陷的路徑后,再與輸入文本的路徑進行對比則耗時較長,且部分歷史缺陷由于存在文本質量問題而無法查找到路徑。 2)歷史缺陷中,存在實體信息完全相同但缺陷等級不同的情形,是不同評級人員的經驗和判斷不同造成的。 針對問題1),可以先對所有歷史缺陷進行路徑查找,將能夠查找到完整路徑的缺陷文本與它們的路徑和缺陷等級保存在單獨的文件(如Excel表)中。以后使用時,只需將輸入文本的路徑查找結果與該文件中的路徑相對比,就能夠根據路徑的一致性,檢索出與輸入文本描述情況一致的所有歷史缺陷,繼而根據它們的缺陷等級進行輸入文本的缺陷評級。 針對問題2),對查找到的所有歷史缺陷的缺陷等級進行數量統計,選擇數量最多或者數量相等時情況最重的等級推薦為缺陷評級。對于評級依據,不僅要反饋3種缺陷等級統計到的具體數量信息,還應向用戶展示檢索到的所有歷史缺陷。 采用某公司提供的5 000 條變壓器缺陷記錄,構建電力設備缺陷文本知識圖譜。以其中出現的缺陷現象“呼吸器硅膠變色”為例,在這些缺陷記錄中尋找到一些詳略不一的缺陷文本,用來展示軟件的信息反饋情況。輸入的缺陷文本編號及內容,輸出的質量分析、缺陷評級與反饋信息結果如表1所示。 對于軟件而言,當輸入文本被基于標準的文本質量分析認為合格時,流程2的反饋信息與流程1中“基于標準缺陷分析”模式的反饋信息相同;不合格時,流程2的反饋信息是流程1中兩種模式的反饋信息的加和。因此,對于同一條輸入文本,表1只同時展示流程1中兩種模式的反饋信息。 表1 輸入文本在兩類研究依據下的質量分析、缺陷評級情況與反饋信息 在基于標準的質量分析被認為不合格時會反饋匹配到多條標準,它們在標準樹的較高層級普遍是相同的,從某一層級開始出現差異,因此使用加粗字體表示對開始出現差異的層級進行特殊標記。在完成基于歷史缺陷的缺陷評級后,會向用戶反饋檢索到的所有歷史缺陷。考慮篇幅,在這兩種情況下均僅展示其中的1條標準或歷史缺陷作為示例。 文本1信息非常不完整,兩類依據的文本質量分析都認為它不合格,無法進行缺陷評級。基于標準的文本質量分析一共匹配到了4 條相關標準,出現差異的第一層是“油浸變壓器”的下一層,可能是“本體”或“分接開關”;而基于歷史缺陷的文本質量分析,從發生缺陷現象的En節點開始向上一級節點進行查找,發現“呼吸器”有多個上級之后,給出的修改建議為“呼吸器對象不唯一”。 文本2 相較于文本1 增加了中間層級“有載開關”,設備層級關系更加精確。由標準樹層級的邏輯性,能夠找到發生缺陷現象的部位是有載開關的呼吸器。然而,文本2沒有描述“硅膠變色”的程度,因此標準樹第7 層的兩個節點都成為備選節點,匹配到2條標準,判斷質量不合格。考慮到不同缺陷現象的詳略差別,基于歷史缺陷的文本質量分析不強制要求存在缺陷程度的描述,認為其合格之后,根據歷史缺陷的缺陷等級數量統計情況,將數量最多的“一般”作為評級結果。 文本3相較于文本2雖然增加了關于缺陷程度的描述“超過2/3”,卻不夠詳細,在基于標準的文本質量分析中,沒有與第7層節點匹配,仍然不合格。但是對于基于歷史缺陷的文本質量分析,由于記錄人員普遍性的省略,這種詳略狀況的描述已經可以幫助文本3 增加一個與Pv 節點“變色”相連接的Pq節點,從而改變了檢索到的歷史缺陷。 文本4在基于標準的文本質量分析中能夠找到缺陷現象發生的部位,并且由于缺陷程度描述“自上而下”匹配到了第7 層的節點,因此匹配到了唯一一條標準,質量合格,缺陷評級為“嚴重”。通過對比文本3、文本4可知,標準中對于缺陷程度的描述(標準樹第7層)通常比較詳細,采用文本相似度或關鍵詞匹配法難免會錯判,導致較多輸入文本被判斷為不合格,因此有必要提供兩個流程供用戶選擇。文本4在基于歷史缺陷的評級中,統計到“一般”與“嚴重”的數量相同,選擇情況較重的“嚴重”作為缺陷等級,與基于標準的評級一致。由此可以合理推測,存在歷史缺陷的數量統計結果與標準的缺陷等級不相符的情況,即標準中缺陷等級為“嚴重”的缺陷文本4,在歷史缺陷的數量統計結果可能是“一般”最多,故而被評級為“一般”。因此對于基于歷史缺陷的評級結果不可全信,在標準覆蓋范圍內應該堅持以標準為主。 本文提出開發基于標準和歷史缺陷的電力設備缺陷文本質量保證與評級軟件,并進行了需求分析、流程設計和關鍵模塊的詳細設計。應用算例展示反饋信息來表明軟件的應用效果和實用價值。該軟件通過交互方式實現了輸入缺陷文本的質量智能管控和自動評級功能,為電力設備缺陷閉環管理和運檢智能化水平的提升提供了有力支撐。3.2 基于歷史缺陷的文本質量分析和缺陷自動評級
4 算例展示

5 結語