沈文斌,張家瑞
(1.徐州市三新供電服務有限公司邳州分公司工程技術中心,江蘇 徐州 221300;2.徐州市三新供電服務有限公司邳州分公司綜合管控中心,江蘇 徐州 221300)
在現代化社會中,電力對于人們來說是非常重要的,無論是生活還是工作都與電力有著密不可分的關系。電力對于企業來說更是尤為重要,因此,要不斷加強電力安全工作的實施,能夠為企業安全生產提供有效保障。電力安全事故的發生不利于社會和諧、穩定的發展,且會對相關電力用戶的安全造成極大的危害。特別是對于一些高樓層的建筑物來說,一個大廈的運轉與電力是分不開的,若用電檢查工作效果不好,就不能為其提供安全用電的保障,會出現很多安全隱患問題,進而產生電力安全事故,為有效預防此類事故的產生,可通過事理圖譜的引用來實現有效預防和管控,進而才能避免火災等災害的發生。事理圖譜作為新型電力安全事故預控的理念與技術,關于其在電力事故預控方面的研究,屬于新型研究議題,進而能夠體現出本次研究的創新性。
從事理圖譜原理來看,知識通過特定領域描述、關系及過程而形成,這種組織形式的形成自從1962年以來,就通過不斷的形式發展與變更而成為如今的知識圖譜。在進入21世紀后,最早提出的知識圖譜理念是由谷歌團隊所提出,該理念的出現隨即引發了大量專家學者的高度關注。最初,這一理念的形成主要是為全面提升搜索引擎效率及水平,以此來豐富其功能性,目的就是通過提升用戶搜索質量,以此來使其感受到更具科技性的搜素體驗,同期最初設計理念一樣,事理圖譜通過實際應用,早已實現這一理念。隨著時間的推移,其應用領域不斷拓展,尤其是在計算機網絡應用方面,不同的搜索網站以知識圖譜這一體系作為基準來實現搜索范圍及領域內容的拓展,以此來優化并升級了搜索網站的性能,使其更具實用性。
近年來,在信息化技術的推動下,關于事理圖譜的研究再次成為專家學者們重點研究的事項,在各大技術論壇方面,有相關學者明確指出了知識圖譜與事理圖譜的發展轉變,代表了科學技術質的發展,并一再強調事理圖譜的出現,能夠更加深入地了解事件和事件間演化規律與事理邏輯。在事件定義方面,在自動內容抽取測評會議上,事件被認為是一個動作的發生或狀態的變化,事件大多被表示為謂語+論元的結構,從而更加適合事理圖譜的應用,其能夠形成完善的問答系統。2018年,某大學科研部門首次提出了金融事理圖譜的概念,其運用的語料已為騰訊、網易等大型企業網站廣泛運用,同時,在開放領域新聞文本中能夠借助事理圖譜的創設方式來使其涵蓋多件事件節點及約不同的因果關系,這些工作證明了事理圖譜的實用性。而對于電力安全事故的防控來說,因其能夠預測事件走向的特性,進而就能為有效預防與管控電力安全事故提供保障。
對于電力事故的預控在說,在事理圖譜應用方面,其主要體現在以下5個階段。
1)以運用python編程為主導來采集電力事故相關數據信息,通過對數據信息的整理與分析,并以運用北京工業大學自然語言處理平臺LTP工具中Pyltp模塊實現文本中詞句的分析。在具體分析中,形式以分句分詞及去除停用詞的方式為主。
2)從電力事故的角度來看,其文本數據信息大多為半結構化數據,每1個事故文本中都涵蓋了1條事故的事件鏈,而這些事件鏈則是若干個事件槽所組成。對此,在具體分析事故事件鏈放慢,需進行標識詞設計,并從文本中采集來每個事故的事件鏈,通過句型結構來對事件槽進行分類,以此來深入探究電力安全事故中事件槽的具體關系。
3)借助Word2vec訓練的方式來分析事件槽詞向量,主要以相似度計算法為基準來進一步了解電力事故中的泛化事件槽。
4)以熱力圖矩陣為主導進行泛化記錄,以此來認定其為電力事故中事件槽次數權重,借助Neo4j圖數據庫構建以事件槽節點與事件槽關聯關系為邊、權重為邊屬性的電力事故事理圖譜。
5)以階段3為基準,通過事件槽泛化歸類且根據所構建的事理圖譜來對整個電力安全事故進行推演與預測,進而為預控電力安全事故的策略提供參考依據[1]。
前文提點每一件電力安全事故中的文本的都有1條事故具體內容的半結構化數據文本,其主要涵蓋的內容就有事故概率、事故原因、事故類型及事故結果等等,這些內容中的文本句式形成1條完善的事件鏈,而事件鏈中涵蓋了電力安全事故的各類信息,在具體事例圖譜的構建中,還需通過事件標識詞的設計來實現事件鏈的提取,表1為某電力安全事故中,應用事例圖譜實踐標識詞設計的相關事項[2]。

表1 事件標識詞
1)概念圖譜,以規則模板抽取的事件槽可能屬于同一類表達含義,概念事理圖譜的過程可見圖1。

圖1 概念圖譜
2)相似度算法,由于電力安全事故中所涉及的領域內容較多,且事故原因較為復雜,在進行相似度計算方面,若是以采取聚類法的方式為主,則會導致聚類簇不斷增加,最終會不斷提升選取難度。為避免此類現象的產生,此次研究將以改進電力安全事故中文本詞句的方式來進行相似度計算[3]。
在計算詞語相似度方面,事件槽分詞后式子表達為e={w1,w2,…,wi},每個分詞w可根據Word2Vec來進行轉對應的詞向量vec的轉變,而根據余弦相似度的計算能夠獲取至少兩個詞語間相似度,具體計算公式如(1)所示:
式中:sim(wi,wj)代表了至少兩個詞語間的相似度;而i與j代表序號;vecik則是詞向量veci第k個分量值的體現;vecjk是詞向量vecj第k個分量值;x代表詞向量分量個數[4]。
在事件槽相似度方面,需要以詞語相似度的計算為基準來進行事件槽相似度計算,具體可見式(2):
式中:sim(e1,e2)為事件槽e1與e2相似度;通過處理2個事件槽分詞則可得出分詞集合S與(Di,Sj)]代表相似度高的M個詞語的相似度之和;sim(Di,Sj)代表了集合D中第i個分詞與集合S中第j個分詞間的相似度。
以國家能源局公布的2015至2021年間305起電力安全事故文本數據為基準。
根據事件標識詞和規則模板提取事件鏈和事件槽,形成420條因果事件槽對和688條電力安全事件槽對。
3.2.1 電力事故事件槽泛化
步驟1:在運用事件槽相似度算法前,對事件槽中描述公司名、地點、數字和時間等干擾詞語進行停用,提高泛化精度。
步驟2:隨機選取一事件槽,運用公式(2)計算該事件槽與其他事件槽相似度,相似度大于0.60的泛化為同一類。
步驟3:從剩余事件槽中隨機再選一事件槽,重復步驟2來進行能事件槽泛化,泛化流程具體可見下頁圖2。

圖2 泛化流程示意圖
3.2.2 電力事故事理圖譜構建
電力事故事理圖譜的構建采用Neo4j圖數據庫顯示,事件槽泛化后,共計370個節點,550條邊。
從上述研究分析來看,在電力事故安全預控方面,通過構建事理圖譜,以運用采集與整理各類數據信息的方式和設計事件標識詞為基準,根據相關規則模板來進行事故事件鏈與事件槽的提取,進而能夠得出其中的因果關系,并以相似度算法為準來進行計算[5]。由于此類學術研究參考文獻資料較少,本次研究重點以突顯理論敘述為主導來體現出事理圖譜在電力安全事故預控方面應用的實效性,從而能夠進一步了解事理圖譜在電力安全事故應用中的相關事項[6]。總的來說,為了有效避免電力安全事故的產生,不僅要重視事理圖譜的應用,在此基礎上,還需不斷加強供電人員自身的安全意識,且通過開展專業化培訓的方式來使其更加了解事理圖譜構建與應用的相關事項,使其能夠在實際工作中更加合理且嫻熟的進行事理圖譜的運用,以此來有效預控電力安全事故的產生。