摘 要:知識圖譜是大數據時代知識表示的重要方式之一,是實現認知智能的關鍵技術。本文分析了煤礦安全領域的知識來源,利用Neo4j構建了煤礦安全領域知識圖譜,從而為該領域智能搜索、智能問答等應用提供知識支持。
關鍵詞:知識圖譜;煤礦安全;知識庫;智能搜索
DOI:10.16640/j.cnki.37-1222/t.2019.09.084
1 引言
煤炭是我國當前和今后很長一段時間重要的戰略資源,其在一次性能源消費中約占70%以上。近年來,煤炭開采安全事故時有發生,據統計數據表明,我國在2007年至2016年的10年間共發生煤礦安全生產事故706起(較大事故以上),造成死亡人數為4935人。現有煤礦安全管理依據有法律法規、規章制度、專業規程、操作規程等,安全管理手段有安全監測控制、生產信息管理、業務信息管理等。隨著煤礦安全生產信息化的不斷發展,各種監測監控數據、設備狀態數據、生產自動化數據、安全業務管理數據,為安全生產管理提供了有力的數據支撐,但數據的多源、異構、量大也為知識集成和共享帶來了困難。
知識圖譜于2012年5月17日被Google正式提出,知識圖譜是大數據時代知識表示的重要方式之一,是實現認知智能的關鍵技術。知識圖譜作為一種語義網絡,包含實體、概念、屬性、關系等信息,使得機器理解與解釋成為可能。而本體(Ontology)能夠為知識圖譜提供基本的數據模式(schema),即概念和概念之間的關系。知識圖譜在本體基礎上,具有更加豐富的語義關系,尤其是在實體信息和實體關系表示方面,更加靈活和多樣化。目前,隨著智能信息服務應用的不斷發展,知識圖譜已被廣泛應用于智能搜索、智能問答、個性化推薦等領域,而在知識圖譜構建過程中首要解決的問題即為知識的建模以及知識表示方法。
2 煤礦安全管理領域知識來源
煤礦安全管理領域知識來源主要分為三類:結構化數據、半結構化數據、非結構化數據。其中半結構化的數據和非結構化的數據可通過實體抽取、關系抽取和屬性抽取后同結構化數據進行知識融合。
(1)結構化數據來源。目前,大部分煤礦企業的信息化經歷了數字礦山、感知礦山階段的建設,正向智慧礦山邁進。數字礦山是以礦山核心網絡為基礎,建設礦山應用軟件,實現安全生產信息化、綜合自動化和在線數據監測;感知礦山是以數字礦山為基礎,以物聯網技術、VR技術、無線傳輸技術等為手段開展的更深層次的信息化建設,為煤礦企業積累了大量的安全生產數據。這些長期積累的數據構成了煤礦安全管理領域結構化數據的主要來源。
(2)半結構化數據來源。多年來國家或地方政府針對煤礦安全生產方面制定很多法律、法規和標準,為煤礦安全生產的實施提供了基礎保障。在法規方面,如《中華人民共和國煤炭法》、《中華人民共和國礦山安全法》、《安全生產法》、《安全生產監督管理信息隱患排查治理數據規范》、《煤炭安全規程》、《防治煤與瓦斯突出規定》、《煤礦井下緊急避險系統建設管理暫行規定》等,在標準規范方面,如《爆破工崗位操作標準》、《皮帶傳送機司機崗位作業標準》、《風鉆打眼工崗位操作標準》、《采掘安全檢查員崗位作業標準》、《機電、運輸安全技術規范》等。法律法規和標準規范作為煤礦安全管理中重要的參考依據,通常以半結構化和非結構化的形式保存和管理,
(3)非結構化數據來源。國家安監監察總局下發的(2017)96號文《煤礦安全培訓規定》中,明確規定煤礦企業是安全培訓的責任主體,應當依法對從業人員進行安全生產教育和培訓。目前,煤礦企業安全培訓的內容大致包括有:《安全生產法律法規》、《煤礦建設與生產技術》、《礦井通風與災害防治》、《安全管理與安全培訓》、《搶險救災與事故處理》、《自救互救與創傷急救》等,培訓涉及的相關資料主要以文件的方式保存。
3 煤礦安全管理領域知識圖譜構建
3.1 構建過程
知識圖譜構建過程主要有兩種方式:自頂向下(top-down)與自底向上(bottom-up)。本文針對煤礦安全領域,主要采用“自頂向下”的方式構建領域知識圖譜。知識圖譜構建過程如圖1所示。
3.2 知識圖譜構建
本文采用圖數據庫的方式實現知識圖譜的存儲,圖數據庫的數據模型以節點和關系來體現。本文通過從多種數據源中提取知識,在Neo4j圖數據庫中創建了煤礦安全領域知識圖譜,如圖2所示。
4 結束語
綜上,本文分析了煤礦安全領域知識圖譜數據的主要來源,通過構建煤礦安全領域的知識圖譜,為煤礦安全領域智能搜索,智能問答,個性化推薦提供知識支持。
參考文獻:
[1]于群,代帆.簡論安全生產社會中介服務機構的形成與管理[J].中國安全科學學報,2004,14(08):42-45.
[2]諸利一,呂文生,楊鵬等.2007-2016年全國煤礦事故統計及發生規律研究[J].煤礦安全,2018,49(07):237-240.
[3]AMIT S.Introducing the knowledge graph[R].America: Official Blog of Google,2012.
作者簡介:吳雪峰(1980-),男,江蘇濱海人,碩士,講師,研究方向:知識圖譜、人工智能。