黎穎,劉晶,易滿成,彭政,馬逢強,俞思帆,黃薇蓉,徐炫東,劉健欣
(廣州市供電局,廣東廣州,510000)
近年來,計算機技術不斷發展,供電企業的信息化程度也在不斷提高。網絡技術被逐漸應用于供電局的生產信息管理系統[1-3],工作票應用填寫和智能校驗模塊應運而生。工作票制度是保證電網維護、檢修、試驗等工作中人身與設備安全的重要措施,關聯電網運行、維護檢修等多項業務。工作票中涵蓋工作任務、工作設備、工作時間、工作手續等豐富的信息,并且工作票包含的部門角色非常多,流程復雜,任一環節管控不到位都將帶來安全風險[4-5]。因此,研究電網工作票智能填寫與校驗方法具有非常重要的意義。
目前不少電網運行單位的工作票仍采用手工開票與校驗的方式,且工作票流轉各環節高質量決策的依據不足,主要存在如下弊端:作業時間集中、電網接線復雜、作業環境不明確等因素,對工作票填寫與審核質量造成較大影響[6-7];由于工作票作業總體時間受生產計劃時間、安全措施布置時間、其他指令性工作安排沖突等約束,對開票審票效率提出更高要求;工作票簽發、接收、許可、監督、評價等環節難以快速獲取作業風險、設備狀態、停電沖突、人員履職能力等支撐信息,難以對工作必要性、可行性等充分評估,增加工作票管理各環節決策的難度[8-9]。工作票管理業務場景具有“海量、高頻、復雜”的特征,因此需深入研究工作票管理業務體系、挖掘智能化應用功能來支撐工作票執行與管理的智能化與自動化[10-12],這是作為大數據與業務融合的切入點之一。
為提高工作票管理系統的智能化,解決工作票高質量決策依據不足造成的弊端,提出了一種基于歷史票聯想的電網工作票智能填寫與校驗方法。該方法可顯著提高工作票填寫正確率和風險預估準確率,并且減少調度人員的工作量。
工作票由檢修相關人員、工作時間、工作地點、工作內容及電網安全措施構成。應用算法對工作票中的信息進行文本挖掘[13-15],獲得該工作票信息的關鍵詞,工作人員可參考該關鍵詞,使工作票的填寫變得有規律可尋。
根據工作票大數據研究現狀以及電力公司對工作票大數據挖掘和智能化處理的需求,按照CRISP-DM流程進行數據挖掘工作,如表1所示。

表1 數據挖掘工作流程
工作票文本包括問題描述、問題解決方案等字段。為了讓計算機理解這些自然語言,需要利用合適的文本表示方法對工作票文本進行向量化表示,方便進行工作票的數據挖掘。向量空間模型將文本表示為帶權重的空間向量,通過計算向量之間的相似性來度量文本的相似性[16-17]。常見的詞語權重計算方法有詞頻(Term Frequency, TF)、TFIDF(Term Frequency-Inverse Document Frequency)等方法。本文采用TF-IDF方法計算詞權,計算公式如式1所示。

其中,wi,j指特征詞i在文檔di中的權重,它由詞i在文檔di中出現的頻率tfi,j和逆向文檔頻率dfi計算得出。
首先計算工作票文本中提取的所有單詞的TF-IDF分數。取前k個得分最高的單詞作為工作票的特征保留。接下來表示每張工作票的特征向量v(di),如式2所示。

每張工作票的特征向量為k維,分別表示每個特征詞在文本中的權重大小。
歷史票聯想的工作票決策模型是通過調用工作票數據知識庫[18]、計算工作任務的文本相似度來實現。
首先要進行歷史票參數優選,參數優選流程如圖1所示。①根據計算工作票數量和種類的需求,進行知識分析,獲取基礎信息;②利用關聯規則算法搜索知識庫中的規則,判斷知識庫中是否有計算工作票數量的規則,若有,繼續執行,否則回到步驟①;③判斷此工作票計算規則能否滿足精確推理要求,如果滿足,繼續執行,否則,進入步驟⑤;④進行精確推理,獲得優選參數并返回給工作票應用;若存在計算工作票數據的多個結果,則根據不同結果排序給出可信度最高的工作票數據結果;⑤檢測是否產生新的規則知識,若是,則保留推理規程,進行知識庫更新[19]。

圖1 歷史票參數優選流程圖
當用戶在點擊智能開票時,會計算用戶所填工作任務與知識庫工作任務之間的相似度,若該值高于一定閾值,如90%,則可認為這兩個工作任務的安全措施內容是可通用的,將該歷史工作票的安全措施返回即可[20]。如圖2所示為文本相似度TF-IDF模型。

圖2 文本相似度TF-IDF模型
計算文本相似度即為歷史工作票聯想功能。當下達對某個開關的檢修任務時,可通過聯想功能調用歷史數據知識庫,將與本次任務相關信息與知識庫中信息一一對比,分別計算歷史數據與本次任務的相似度,進而提取相似度最高的信息關鍵詞,這些關鍵詞構成了本次任務工作票的主要內容。
以廠站第一種工作票圖3為例,作業類型是開關投產前試驗,圖4是廠站接線拓撲圖。接口會傳過來工作票ID、廠站第一種工作票、110kVxx變電站、10kVxx開關投產前試驗這四個字段。

圖3 廠站第一種工作票

圖4 廠站接線拓撲圖
(1)對工作任務進行正則校驗,對應的工作票類型為廠站第一種工作票,作業類型為開關投產前試驗的正則校驗規則,假設校驗通過。
(2)提取工作任務中的關鍵信息并進行查詢,對應的工作票類型為廠站第一種工作票,作業類型為開關投產前的工作任務。
(3)安全措施字段中,例如應投切的相關直流電源(空氣開關、熔斷器、連接片)、低壓及二次回路、應設遮欄、應掛標示牌(位置)、是否需線路對側接地、是否需辦理二次設備及回路工作安全技術措施單、其他安全措施和注意事項等,這些字段基本都是相似的,根據典型工作票提前梳理并存儲于數據表,在用的時候直接查詢取值。
最終,工作票類型為廠站第一種工作票、作業類型為開關投產前試驗的工作任務,對應的安全措施生成。
為解決傳統工作票在流轉各環節時高質量決策依據不足的弊端,提出了基于歷史票聯想的電網工作票智能填寫方法。主要結論如下:
(1)采用TF-IDF方法挖掘歷史工作票數據,可有效獲得歷史票信息的關鍵詞,使工作票的填寫變得有規律可尋。
(2)將歷史票關鍵詞聯想與廠站拓撲設備的內在關聯相結合,可以輔助判斷各類作業風險的相對大小,為作業人員配置和選取監督地點提供支撐依據。
(3)對比傳統工作票填票方式,智能填票方法可有效促進電網工作票填寫的全面性和精確性,降低電力系統工作的出錯率。