摘要:電力領域在發展中不斷積累數據資源,如何依據電力企業發展需求高效使用相關資源,引導電力領域朝著故障恢復及電網調度自動化方向發展,成為電力領域語義搜索系統研究與構建方向,使傳統電力領域檢索體系得以優化,彌補以往不支持語義推理及業務語言等缺陷。本文通過對電力領域語義搜索系統構建方法進行分析,以期為助力電力系統優化發展提供依據。
關鍵詞:電力領域;語義搜索系統;構建方法
當今社會“互聯網+”成為各個行業發展必由之路,借助信息技術提高行業管理質量、生產效率、經濟收益,在互聯網資源加持下完善現有運營體系,相較于其他行業來講電力領域與信息技術的融合相對滯后,受傳統搜索技術影響,許多電力領域無法支持語義搜索創新與發展,這主要是源于電力領域缺乏自然語言處理技術、知識庫構建技術、查詢語義化理解等技術,在此背景下需對其語義搜索系統予以優化,使其能靈活運用IT技術,在推理引擎加持下實現電力領域語義搜索系統構建目標。
一、知識圖譜建模
作為一種先進科學技術知識圖譜建模形式需依據客觀需求予以靈活創設,為保障電力領域語義搜索系統構建科學有效,本文選擇本體框架針對相關知識予組織管理,以數據庫形式存儲數據,圍繞核心概念建模,得到基礎框架后,配以相應的語義處理工具,使電力領域內各種關系及概念更加清晰,體現屬性、整體部分、實例、繼承等關系,為實現電力領域語義搜索目標奠定基礎。[1]
二、知識獲取
知識圖譜具有極強囊括能力,可從各個方面得到電網調度知識,相關知識主要源于非關系型文本及數據庫,其中前者富含電力企業檔案及其計算機網頁,RDF能和關系型數據庫進行映射,并結合自動化技術得到本體數據,確保數據與電力領域語義搜索系統運行實況相關聯,對其屬性等進行定義。依據電力領域語義搜索系統運行需求,結合技術人員操作目標,在數據庫中提取相關信息,將數據轉變為XML文件,對非結構化信息進行分詞,使其更為具體且易于理解,依據相關屬性、本體中的類以及實體進行文件格式轉換獲取RDF文件,其中處于XML文件內子節點可生成實體、對象屬性成為遍歷子節點,呈依次遞歸狀態,借助Jena APL技術予以落實相關知識獲取目標,將所得文件存儲在RDF數據庫內,即電力領域語義搜索知識存儲體系。
在獲取非結構化知識時需采用自然語言處理技術,針對相關知識先進行分詞處理,在得出富有屬性、實體及類的數據后科學區分歧義詞,以“云南天真好”為例,在傳統分詞系統內會將使其劃分為“云南/天真/好”,使詞匯分類出現錯誤,為保障分詞精準需在領域知識及相關模式支持下分詞,先由電力領域語義搜索系統服務用戶對非結構化短語進行定義,得出相關分詞模式,通常情況下將短語分為三段,例如在搜索設備故障信息時,可將其劃分為某電力領域(企業)/故障設備/故障類型,借助與之相對應的數據庫,在領域知識支持下完成語義搜索任務。[2]
為提高語義搜索能效電力領域需從實際出發對知識庫進行運維與管理,結合電力領域發展實況允許構建全新致知識庫,用以完善現有語義搜索系統,通過不斷吸納新知識,使相關數據庫變得充盈,為消除歧義確保領域知識庫可以有效發揮其功能奠定基礎。
三、語義搜索
在RDF數據庫內存儲知識圖譜運行系統,以SPARQL作為電力領域語義搜索系統構建語言,并支持相關技術與實踐操作,例如電力領域工作人員向獲悉有關變壓器運行及其故障相關記錄時,則可借助SPARQL語言進行推理,將變壓器概念進行延展,使其在子概念中達成語義搜索目標,相較于關鍵詞檢索,語義搜索輻射范圍更廣,與子相近的語義均可納入搜索結論中,同時結論可遵照一定邏輯進行排列,通過查詢術語、語義度量等技術,得出與語義搜索意圖最貼切的結果,其中語義度量負責權衡各個語義搜索結論相似程度,并依據相似度取值進行排序,也可依據該程序進行回溯,查詢排列返回結論。為提高語義搜索效率,使其更加符合當前電力領域應用需求,技術人員可依據該領域日常運營實況,設計若干搜索及查詢條件,如因雷擊發生故障的裝備,變壓器數量>15的電力系統,某地變電站總數,某變電站設備種類,30歲以下電力工程師等,其搜索廣度、深度可見一斑,還可結合電力領域發展需求,由技術人員負責添加查詢條件,賦予語義搜索系統無盡“生命力”,確保該系統能與時俱進發揮積極效用。
四、結語
綜上所述,電力領域語義搜索系統建設方法并非千篇一律,需要技術人員不斷學習,提升自身技術應用與創新實力,結合該領域發展需求,積極融合先進IT技術,完善現有語義搜索系統,為滿足電力領域運營需求夯實技術基石。
參考文獻:
[1]姬源,謝冬,周思明,等.電力領域語義搜索系統的構建方法[J].計算機系統應用,2016(4):9196.
[2]李衛東,涂瑩,陳蕾,等.基于異構多源特征的營配合業務管控平臺[Z].國網浙江省電力公司,浙江創維自動化工程有限公司,2015.
作者簡介:祁蓉蓉(1986),女,甘肅張掖人,本科,主要工作電力土建設計,研究方向:電力系統。