999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向電力項目的知識圖譜構建及應用研究

2024-06-03 18:21:47張思慧胡廣林魏國旺
現代信息科技 2024年6期

張思慧 胡廣林 魏國旺

收稿日期:2023-07-31

DOI:10.19850/j.cnki.2096-4706.2024.06.025

摘? 要:文章針對電力公司在項目管理過程中存在的項目數量多、范圍廣、管理鏈條長、項目各階段數據難以深度融合和應用的問題,基于語義網、知識圖譜、自然語言處理等人工智能技術,對項目管理智能化提升的關鍵技術進行了研究,提出了項目智能化管理提升的技術方案,包括以項目為中心的知識表示、知識存儲、知識服務應用三部分內容,基于技術方案撘建了知識圖譜平臺,并總結了該技術在項目時序圖譜構建、項目智能問答兩個場景的應用及成果,明確了基于知識圖譜提升項目效率效益,支撐精準投資,促進精益管理的研究方向。

關鍵詞:知識圖譜;項目時序;標簽推薦;智能問答

中圖分類號:TP391? ? 文獻標識碼:A? ? 文章編號:2096-4706(2024)06-0115-07

Research on Knowledge Graph Construction and Application for Electricity Power Projects

ZHANG Sihui, HU Guanglin, WEI Guowang

(Beijing Guodiantong Network Technology Co., Ltd., Beijing? 100070, China)

Abstract: Aiming at the situation that the electricity power companies encounter problems such as a large number of projects, a wide range of projects, a long project management chain, and difficulties in deep integration and application of data at various stages in the process of project management, this paper researches the key technologies for intelligent improvement of project management based on artificial Intelligence technologies such as Semantic Web, Knowledge Graph, and natural language processing. It proposes a technical solution for the improvement of intelligent project management, including three parts of project-centered knowledge representation, knowledge storage, and knowledge service application. Based on the technical solution, it builds the Knowledge Graph platform and summarizes the application and achievements of the technology in the two scenarios of timing map construction of project and Intelligent Q&A of project. In summing up it may be stated that the research direction of improving project efficiency and benefits based on Knowledge Graph, supporting accurate investment, and promoting lean management is clarified.

Keywords: Knowledge Graph; project timing; label recommended; Intelligent Q&A

0? 引? 言

知識圖譜是人工智能的一個分支,對可解釋人工智能具有重要作用,近幾年,隨著知識表示和機器學習等技術的快速發展,知識圖譜相關的技術取得了突破性進展,特別是知識圖譜涉及的知識抽取、表示、融合、推理、問答等技術以及知識服務技術,都得到了快速的發展。這些技術的進步使知識圖譜在工業、電力行業受到廣泛的關注,并取得顯著成果。谷歌、微軟、百度等互聯網公司率先構建了大規模通用化知識圖譜,提供基于實體和關系的語義搜索,可以更好地理解和幫助用戶進行查詢[1]。知識圖譜還在智能決策系統、推薦系統和智能問答系統中起到了重要作用,知識圖譜不僅具有巨大的應用價值,而且具有重要的理論價值。

基于知識圖譜推理、探索挖掘等技術,實現了項目數據資源的網絡化表達,一方面將孤立的數據資源建立關聯關系,有助于跨地域、跨專業的數據共享和檢索利用,提高了企業數據資產化管理水平;另一方面為用戶提供快速檢索、數據收集、精準推薦等個性化服務,提高信息檢索效率,輔助提升項目管理決策分析水平,為電網發展賦能、賦值、賦智[2]。

1? 電力項目管理現狀及問題

電力企業項目管理特點突出,一是項目數量多,項目投資數千億,執行項目達數十萬;二是項目管理分布廣,項目專項多達16類,分布在公司各專業;三是項目全過程管理鏈路長,涉及各專業、各單位、各層級。

當前政府監管日趨嚴格,電力改革、國企改革進入關鍵突破期,公司加快推進戰略目標落地,促進產業升級,推進管理體制變革,這都對公司項目管理提出了更高的要求,為了提升管理效率效益,要支撐精準投資,促進精益管理,銜接外部監管,提高管理透明度,規范信息發布渠道。在中臺架構體系基本建成的基礎上,提出重點推動服務深化、數據貫通、智慧賦能,為適應改革發展新形勢,全面提升項目管理數字化水平。助力全面跨越,共享服務需要進一步迭代建設,強化數字化運營、精準化管控和智能化決策,為各類業務服務、為各級管理賦能。

為了適應改革發展新形勢,響應公司項目管理改革創新要求,實現公司項目全景可見、投資精準、決策規范、協同高效、風險可控、降本增效的總體目標,需建立統一、規范的全鏈條全口徑項目管理流程,構建風險防范及預警機制,推進項目管理數字化轉型,驅動發展方式、管理模式變革[3]。加強項目管理意義重大,項目作為公司經營管理的最小單元,是落實中央決策部署、服務經濟社會發展的重要載體,是推動公司“一體四翼”發展布局落地、促進公司高質量發展的重要抓手;在管理上,要聚焦效率效益,聚焦規劃落地,切實提升投入產出水平。

2? 項目知識圖譜關鍵技術研究

2.1? 項目知識圖譜構建技術

知識圖譜是以圖的形式來描述知識和建模,以表現客觀世界中的概念和實體及其之間關系的知識庫[4]。知識圖譜由結點和邊組成,結點可以是實體,如知識圖譜、人工智能,邊可以代表實體的屬性,如項目的名稱和分類,也可以是實體之間的關系,如朋友、師生。

知識圖譜旨在從數據中識別、發現和推斷實物與概念之間的復雜關系,是事物關系的可計算模型。知識圖譜構建涉及知識建模、關系抽取、圖存儲、關系推理、實體融合等多方面的技術,而知識圖譜應用則涉及語義搜索、智能問答、語言理解、決策分析等多個領域[5],事物關系的可計算模型如圖1所示。

圖1? 事物關系的可計算模型

2.1.1? 項目結構化數據知識抽取技術

項目相關的結構化數據包括項目屬性特征信息,如項目名稱、項目編碼、電壓等級、專項類型、項目標簽等,這些知識和信息來源于支撐企業業務的關系數據庫中,通過定義直接映射規范,確定關系數據庫表與類、屬性、實體的映射關系,將數據庫表結構和數據直接轉換為RDF(Resource Description Framework, RDF)數據[6]。

2.1.2? 項目非結構化數據知識抽取技術

項目管理過程中存在大量以自由文本和文件形式存在的非結構化數據,如項目內容信息、項目《可行性研究報告》文件等。通過實體和關系抽取,實現從項目文本信息中提取實體信息的元素,包括項目名稱、單位、投資、解決問題、關聯設備等,以及兩個或多個實體間的語義關系。本文所述采用基于規則模板的抽取和智能模型的方式實現對非結構化項目文本的實體和關系信息抽取,具體內容如下。

1)基于模板的關系抽取,該類方法基于語言學的知識,結合語料的特點,基于專家經驗確定具有固定格式的描述文本,較適用于小規模、限定領域的實體關系抽取問題上[7]。例如項目關聯的電網設備通常描述為“武寧站1#主變、南武線”,變電站、變壓器、線路名稱表現出較為突出的模板屬性,針對此類型項目信息,模板構建簡單,可以比較快在小規模數據集上實現關系抽取[8]。

2)基于統計模型的方法。針對電力公司歷年項目可行性研究報告數據,分別利用條件隨機場(CRF)、LSTM-CRF實體識別模型(長短時記憶神經網絡(Long Shot-Term Memory Neural Network, LSTM)與CRF相結合進行實體識別),將WORD、PDF、WPS等非結構化數據,通過數據標注、關系提取等方式,實現內容信息的結構化提取[9],LSTM-CRF實體識別模型如圖2所示。

圖2? LSTM-CRF實體識別模型

2.1.3? 知識存儲

從數據模型的角度來看,知識圖譜的本質是一種圖數據。目前表示知識圖譜的兩種圖數據模型主要為RDF圖和屬性圖,在RDF三元組集合中,每個資源具有一個唯一的ID;一個RDF圖定義為三元組(s,p,o)的有限集合;每個三元組可表述為一個陳述句,s為主語,p是謂語,o是賓語;(s,p,o)代表資源s與資源o具有關聯關系p,或表示資源s具有屬性p且取值為o [1]。

三元組表是將知識圖譜存儲到關系數據庫中最簡單、最直接的辦法,其原理就是在關系數據庫中建立一張具有三列的表,表的模式為:三元組表(主語,謂語,賓語),將構建的知識圖譜中的每一項三元組存儲為三元組表中的一行記錄。面向RDF的三元組數據庫是專門為了存儲大規模RDF數據而開發的知識圖譜數據庫,其支持標準RDF的標準查詢語言SPARQLA。在項目知識圖譜構建及應用場景中,綜合考慮語義分析需求、組件的兼容性及易擴展性的因素,選取語義網RDF模型作為電力項目知識圖譜的知識表示模型,使用支持RDF存儲的三元組數據庫及開源MongoDB數據庫組件實現對電力項目知識圖譜數據的存儲[10]。

2.2? 知識圖譜和智能問答

基于知識圖譜的知識問答(Knowledge-based Question Answering, KBQA)是智能問答的核心,是一種人機交互的自然方式。知識問答依托大型知識庫(例如知識圖譜、結構化數據庫等),將用戶的通過自然語言描述的問題,轉化為結構化查詢語言,直接從知識庫提取出用戶想要的答案。知識問答主要聚焦于解決事實型問答,事實型問題按類型分為單知識點問題(Single-hop Questions)和多知識點問題(Multi-hop Questions),按問題的領域分為垂直領域問題和通用領域問題[11]。本文所述電力項目智能問答場景,相較于通用領域或開放領域,內容的垂直度較高,知識圖譜規模更小,精度更高,故選取基于語義分析和意圖識別的方法,在基于語義解析的方法訓練過程中,問題模型會對標注數據中蘊含的語法和解析規律進行隱式的學習,使得模型具有更好的可解釋性,以實現針對項目有效信息檢索式的知識問答[12]。

3? 知識圖譜技術框架

3.1? 總體架構

基于上述項目知識圖譜關鍵技術的研究和探索,構建知識圖譜平臺,整體功能結構設計從上到下分為三層,分別是應用層、核心層和數據層。

數據層:通過規范的流程處理,抽取關系型數據并統一存儲為符合RDFS/OWL標準的三元組數據[13]。

核心層:針對數據消費場景,提供數據處理過程中的算法和知識圖譜分析算法。

應用層:基于數據和核心算法能力,提供圖譜管理、概念管理、屬性管理、數據管理、圖分析等多種業務應用場景,項目知識圖譜技術框架如圖3所示。

3.2? 工作流程

工作流程如下:

1)用戶首先建立圖譜schema,也就是一個業務領域內的數據模型,包含這個領域內有意義的概念類型、概念屬性和關系。

2)關聯結構化數據來源,由于原始數據往往存在臟數據和格式問題,一般需要人工介入清洗處理。

3)在數據抽取中,將schema概念與數據關聯,導入調增好格式的結構化數據,這些數據大多為各業務系統核心數據,這種數據結構基本完整或清洗程度較低,稍做結構調整即可進入圖譜使用。

4)隨著數據的增長或多個數據來源時存在數據沖突問題,這時候通過屬性相似度、實體相似度等方法將描述同一個概念、實體的信息融合起來。

5)提供可視化的知識地圖呈現知識圖譜的內在關系,同時提供了基于節點、關系的數據挖掘分析工具,知識圖譜構建工作流程如圖4所示。

4? 項目知識圖譜應用成果

4.1? 項目時序圖譜構建

按照本文2.1節所述的知識圖譜構建方法,收集歷年項目基本信息、項目文件數據,針對項目特征,如名稱、編碼、專項類型、標簽等構建概念模型;從項目資源、項目規劃、項目儲備等各業務數據中抽取數據信息,完成實體項目知識圖譜構建。

4.1.1? 本體建模

針對項目知識圖譜本體建模分為兩種模式,一種是圖形化的本體建模方式,通過拖拉拽的方式完成電力項目涉及概念、屬性、關系的定義,并將建模成果以圖形化方式展示;另一種是支持用戶通過Excel定義本體,并快速導入系統,并支持本體在不同系統之間的數據遷移,建模成果圖形化展示如圖5所示。

4.1.2? 數據存儲

基于屬性圖模型對數據進行了存儲,并通過多種索引方式,實現對圖數據的存儲和快速讀取。

4.1.3? 實體融合

知識融合包括實體鏈接和實體合并,通過知識融合消除實體歧義,剔除冗余和錯誤數據,從而提高知識的質量。實體沖突的原因有多種,如實體名稱沖突、同一屬性的值不同、同一個關系指向的實體不同。平臺在實體融合功能中提供了自動融合算法融合和手動融合兩種方式,項目實體融合對比情況如圖6所示。

4.1.4? 圖譜構建

融合電網公司16類項目專項,設計包括:名稱、編碼、分類、單位、類型在內的30個概念并構建其關聯關系,項目概念關聯關系如圖7所示。結合8個項目環節特征,抽取各環節數據,形成項目時序圖譜,項目時序圖譜如圖8所示。

4.1.5? ?圖譜分析

將知識圖譜數據運用可視化技術將實體、關系以一種復雜網絡展現并對其計算分析[14]。實現針對項目圖譜關鍵路徑、圖譜實體分布、圖譜知識探索三種場景的分析。

1)關鍵路徑分析。支持用戶為多個實體設置不同步長,平臺根據用戶選擇實體和步長信息,可以自動計算出符合步長的多個路徑連線,實體路徑分析如圖9所示。

2)實體分布分析。以圖的形式按比例展示圖譜中各概念下實體數量分布情況,支持對其篩選過濾。

3)圖譜知識探索。支撐對特定實體模糊查詢,并展示該實體的具體項目圖譜信息,并支持各節點的展開和下鉆。

4.2? 客服智能問答

在實現各類型數據進行融合關聯的基礎上,將用戶檢索意圖計算排序,按優先級進行數據組合排列,充分理解搜索語境、精準反饋數據資源,自動選擇最優展示呈現方式,優化基于全量數據的智能化搜索及分析服務能力,構建項目客服智能問答應用場景。

4.2.1? 意圖識別

智能識別用戶查詢意圖,通過對用戶的輸入進行分詞,識別其查詢的目標意圖,并將其識別的查詢檢索意圖對應到知識圖譜的概念槽位,項目智能問答解析流程如圖10所示。

4.2.2? 智能機器人

構建項目一句話問答、項目關鍵詞搜索、標簽關聯查詢項目、合規規則解釋等智能問答和貼簽服務,支撐項目信息智能查詢及檢索[15]。

1)如輸入“打開標簽查詢服務”,機器人會打開標簽查詢服務頁面;如輸入“儲備超時”,機器人會展示“儲備項目超時”的規則詳情,或輸入“儲備項目超時的規則說明”展示其規則說明及規則解釋信息。

2)根據“電壓等級”“專項類型”“規則名稱”查詢對應的合規規則的異常項目明細。如輸入“110 kV電網基建儲備超時的項目明細”,機器人會打開合規明細頁面并傳入相應的參數,您可以點擊查詢按鈕進行查詢。

5? 結? 論

本文總結了近年在電力項目管理領域應用和構建知識圖譜的技術、研究和實踐成果,基于CRF和LSTM-CRF實體識別模型,提出了項目知識圖譜產品架構及流程設計,并針對該架構在電力公司項目時序圖譜構建、項目客服智能問答場景的應用進行了研究和探索,實現了針對項目全過程時序圖譜的構建,項目標簽智能推薦和智能問答。

參考文獻:

[1] 王昊奮,漆桂林,陳華鈞.知識圖譜:方法、實踐與應用 [M].北京:電子工業出版社,2019.

[2] 喬泰.下一代企業:人工智能升級企業管理 [J].互聯網經濟,2016(8):26-31.

[3] 駱瑞玲.電力企業投資計劃管理中的問題及對策 [J].科技與創新,2016(19):54.

[4] 孫晨,付英男,程文亮,等.面向企業知識圖譜構建的中文實體關系抽取 [J].華東師范大學學報:自然科學版,2018(3):55-66.

[5] 王穎,錢力,謝靖,等.科技大數據知識圖譜構建模型與方法研究 [J].數據分析與知識發現,2019,3(1):15-26.

[6] 王鑫,鄒磊,王朝坤,等.知識圖譜數據管理研究綜述 [J].軟件學報,2019,30(7):2139-2174.

[7] 張敏杰,徐寧,胡俊華,等.面向變壓器智能運檢的知識圖譜構建和智能問答技術研究 [J].全球能源互聯網,2020,3(6):607-617.

[8] 蔣逸雯,李黎,李智威,等.基于深度語義學習的電力變壓器運維文本信息挖掘方法 [J].中國電機工程學報,2019,39(14):4162-4172.

[9] 周博通,孫承杰,林磊,等.基于LSTM的大規模知識庫自動問答 [J].北京大學學報:自然科學版,2018,54(2):286-292.

[10] 賈海鋒,王冰潔,王浩,等.從通用知識圖譜中剖析電力知識圖譜的應用 [J].電力設備管理,2021(11):206-207+234.

[11] MANNING C D. Computational Linguistics and Deep Learning [J].Computional Linguistics,2015,41(4):701-707.

[12] MANNING C D,RAGHAVAN P,SCH?TZE H. An Introduction to Information Retrieval [M].Cambridge:Cambridge University Press,2009.

[13] 李文鵬,王建彬,林澤琦,等.面向開源軟件項目的軟件知識圖譜構建方法 [J].計算機科學與探索,2017,11(6):851-862.

[14] 劉津,杜寧,徐菁,等.知識圖譜在電力領域的應用與研究 [J].電力信息與通信技術,2020,18(1):60-66.

[15] 徐沐霖,邱濤.人工智能在電力系統中的應用 [J].電子技術與軟件工程,2017(8):257.

作者簡介:張思慧(1986—),女,漢族,山東煙臺人,中級工程師,碩士,研究方向:項目管理業務咨詢、人工智能技術;胡廣林(1983—),男,蒙古族,遼寧沈陽人,中級工程師,碩士,研究方向:項目管理業務咨詢、人工智能技術;魏國旺(1988—),男,漢族,山東聊城人,初級工程師,本科,研究方向:項目管理業務咨詢。

主站蜘蛛池模板: 亚洲欧美日韩动漫| 国产欧美日韩精品第二区| 国产爽妇精品| 免费jjzz在在线播放国产| 波多野结衣一区二区三区四区视频| 国产网友愉拍精品| 免费一级无码在线网站| 国产精品夜夜嗨视频免费视频| 中文字幕亚洲精品2页| 中文无码影院| 色天天综合| 美女内射视频WWW网站午夜| 婷婷六月综合| 第九色区aⅴ天堂久久香| 无码久看视频| 秋霞国产在线| 九色在线视频导航91| 九九精品在线观看| 97久久免费视频| 亚洲第一区欧美国产综合| 青青草一区| 国产18页| 国产主播在线观看| 国产欧美日韩免费| 亚洲国产成人精品无码区性色| 91色老久久精品偷偷蜜臀| 国产成人免费高清AⅤ| 久久人人97超碰人人澡爱香蕉| 毛片基地美国正在播放亚洲| av色爱 天堂网| 国产手机在线小视频免费观看 | 22sihu国产精品视频影视资讯| 久精品色妇丰满人妻| 免费a在线观看播放| 国产精品亚洲五月天高清| 永久毛片在线播| 国外欧美一区另类中文字幕| 99热最新在线| 亚洲天堂视频在线播放| 欧美三级视频在线播放| 亚洲综合一区国产精品| 不卡午夜视频| 青草娱乐极品免费视频| 国产成人亚洲精品无码电影| 99人妻碰碰碰久久久久禁片| 成人在线观看一区| 波多野结衣无码中文字幕在线观看一区二区 | 国产91色| 亚洲日韩日本中文在线| 亚洲免费福利视频| 婷婷丁香色| 国产免费怡红院视频| 在线毛片网站| 在线色国产| 丁香婷婷综合激情| 色亚洲成人| 中字无码av在线电影| 国产成人综合久久精品下载| 青青草a国产免费观看| 小说区 亚洲 自拍 另类| 欧美精品在线视频观看| 日本欧美一二三区色视频| 久久精品国产精品一区二区| 亚洲精品男人天堂| 成人在线观看不卡| 国产JIZzJIzz视频全部免费| 欧美三级自拍| 精品综合久久久久久97超人| 国产精品冒白浆免费视频| 色综合天天娱乐综合网| 亚洲精品国产日韩无码AV永久免费网 | 亚洲高清中文字幕| 欧美α片免费观看| 黑人巨大精品欧美一区二区区| 亚洲国产AV无码综合原创| 制服丝袜无码每日更新| 中日无码在线观看| 精品国产一区二区三区在线观看| yy6080理论大片一级久久| 精品国产一区二区三区在线观看 | 激情综合图区| 免费国产高清精品一区在线|