厲彥柏,趙國靜,曠文敏,孫儉,王東坡
(1.中國石油集團安全環保技術研究院有限公司,北京 102200;2.北京辰安科技股份有限公司,北京 100094;3.清華大學 工物系,北京 100084)
石油化工行業的生產經營在很大程度上促進了經濟的發展,也為人們的日常生活提供了必需的石油化工產品。石油是我國各個領域發展不可或缺的能源[1]。針對近年來石油化工行業頻發的危險化學品安全生產事故,我國在危險化學品安全生產事故應急救援能力仍存在短板。如何利用專業知識結合科技化手段提升救援人員在危險化學品安全生產事故中的應急救援決策能力,提升應急救援能力,已經成為石油化工行業亟需解決的難題。
知識圖譜技術作為重要的智能化技術之一,在文獻檢索中的知識智能問答、個性化檢索、知識推薦等方面逐步得到較好的應用,但是在石油化工行業危險化學品安全生產事故應急救援未見報道。本文針對石油化工行業中頻發的危險化學品安全生產事故,探索知識圖譜技術及智能檢索平臺在危險化學品安全生產事故應急救援過程中的應用,包括危險化學品安全生產事故應急救援知識體系建立、知識圖譜構建技術、基于知識圖譜的智能檢索平臺搭建及應用為事故救援提供科學、準確的救援信息和知識,提升事故救援能力,最大限度地減少事故損失。
知識圖譜是一種用圖模型來描述知識和建模世界萬物之間的關聯關系的技術方法[2],本質是事物關系的可計算模型,基本用途是建立知識之間的直接關系,便于快速搜索和決策[3-4]。
文本基于危險化學品安全生產事故應急救援業務需求,對危險化學品安全生產事故應急救援知識體系進行梳理,將危險化學品安全生產事故應急救援知識體系劃分為企業信息、危險化學品應急處置知識、事故知識、決策知識、社會救援力量、企業救援力量、救援輔助信息等部分。知識體系來源于商業購買專業知識、政府/集團搜集、用戶系統填報等多種方式。危險化學品安全生產事故應急救援知識體系建立采用自頂向下結合自底向上的方法[5-7],如圖1所示,建立石油化工行業企業危險化學品安全生產事故和應急救援之間的直接關系,能夠在突發事故發生后為應急救援決策提供準確、可靠的知識信息支持,幫助救援人員更好的進行應急輔助決策。

圖1 危險化學品安全生產事故應急救援知識體系關系圖
當危險化學品安全生產事故發生時,針對企業自身情況、周邊環境以及事故特點,能夠做出正確的輔助決策和救援措施,達到快速、有效救援的目的。將企業信息納入知識體系中,企業信息包括企業名稱、地址、安全管理人員、聯系方式、企業危險化學品種類、周邊環境等。
危險化學品是指具有毒害、腐蝕、爆炸、燃燒、助燃等性質,對人體、設施、環境具有危害的劇毒化學品和其他化學品。依據《危險化學品目錄》(2021版)規定危險化學品共計有2 828類,在事故發生時了解危險化學品的應急處置特性,采取相應的措施正確、及時地進行處理,能最大程度挽救人員生命和財產損失。危險化學品的應急處置知識包括化學品名稱、成分/組成信息、危險性概述、急救措施、消防措施、泄漏應急處置、操作處置與儲存、接觸控制/個體防護、理化特性、穩定性和反應活性、毒理學資料、生態學資料、廢棄處置、運輸信息、法規信息及其他信息。
危險化學品安全生產事故具有突發性強,不易控制,污染環境,破壞嚴重,救援難度大,專業性強等特點,將危險化學品安全生產事故類型納入知識體系中。典型的危險化學品安全生產事故類型包括危險化學品泄漏擴散事故、大型儲罐火災事故、液池火災事故、噴射火災事故、火球火災事故、蒸汽云爆炸事故、壓力容器爆炸事故、固體爆炸事故。針對不同危險化學品在不同場景下,發生不同類型的事故時,有針對性的分析事故的發展態勢,為事故的人員疏散、指揮作戰等關鍵的輔助決策信息,提高救援效率和準確度。
危險化學品安全生產事故發生之后,根據相關的應急預案啟動應急響應流程[8],現將企業的現場處置方案、企業綜合預案、政府應急處置預案納入知識體系中的決策知識。石油化工企業應根據 GB/T 29639—2020《生產經營單位生產安全事故應急預案編制導則》[9],在風險評估的基礎上由企業自身或第三方服務機構進行應急預案的編制,并且按照《生產安全事故應急預案管理辦法》[10]嚴格實施應急預案。企業應將存在或可能發生的事故風險種類、發生的可能性以及嚴重程度及影響范圍有效識別出來,并將所有的危險因素和風險管控措施體現到應急預案中,并按照政策要求及時修訂和完善預案內容,保證預案具有可操作性。
現將企業救援力量和社會救援力量納入知識體系中,以保障在事故發生時更合理的調配相關資源,多方位的救援力量具有資源豐富、組織靈活的優勢。企業救援力量主要是指企業自身救援隊伍和救援物資。社會救援力量包括周邊企業的救援隊伍和救援物資、政府的救援隊和救援物資、相關的救援專家等。
救援輔助信息為救援過程不可缺少的信息,應急救援決策需要解決的問題往往是無序的、突變性的,根據現場實際情況進行靈活的調整就變的尤為重要,通過將輿情信息、交通信息、氣象信息、事故案例等信息納入知識體系中,將現場復雜多變的信息展現出來,為決策者提供更精準的輔助決策。
知識體系是一個不斷更新的過程,在每一次更新的知識體系均要經過知識存儲、知識表示、知識抽取、知識挖掘、知識融合、知識推理等過程形成知識圖譜[11],如圖2所示,進而用于知識搜索、語義檢索、知識點關聯推薦、可視化展示等應用。

圖2 知識圖譜構建過程
基于大數據存儲技術,為滿足知識圖譜的構建和應用,需要實現將來源于TXT文件、WORD文件、XML文件、CSV文件、Excel文件、數據庫等多源異構知識進行存儲。涉及圖數據庫存儲、分布式對象存儲、分布式列數據庫、內存數據庫、數據倉庫、分布式文件系統等技術。其中,圖數據庫存儲以圖形的“節點”象征實體,節點間的“邊”代表實體間的關系,能夠快速解決復雜的關系問題[12],是本文知識圖譜構建的關鍵技術之一。
知識表示是將知識體系中實體、屬性、事件和關系進行關聯起來,便于知識推理和知識計算的應用[13]。本文采用W3C推薦的語義網(semantic web)的知識表示方法,其中URI(uniform resource identifier,統一資源標識符)/IRI(internationalized resource identifiers,國際化資源標識符)為網絡鏈接,XML(extensible markup language,可擴展標記語言)和RDF(resource description framework,資源描述框架)為資源表示框架,SPARQL(SPARQL protocol and RDF query language,基于RDF數據模型的查詢語言和數據獲取協議)為知識查詢語言,RDFS(RDF schema,基于RDF的術語和概念)和OWL(web ontology language,編程語言)為支持推理的表示框架。
知識抽取是對原始數據進行規范化處理,對從不同來源、不同結構的數據進行知識抽取并轉化為RDF三元組、多元組事件和時序信息,最終形成結構化數據存入到知識圖譜[14],知識抽取過程如圖3所示。原始數據包括結構化數據、非結構化數據、半結構化數據。鏈接數據或數據庫中的結構化數據通過圖映射技術或D2R技術將關系數據映射到RDF三元組中并進行存儲。半結構化數據可以利用機器學習算法,尋找數據之間存在的規律,經過解析引擎或自然語言處理的方式,將半結構化數據轉換為結構化數據。從非結構化數據中提取出所需關鍵信息,利用信息抽取技術,以結構化形式數據進行存儲。

圖3 知識抽取過程
知識挖掘是指對數據采用自動或半自動的技術手段,從大量的、模糊的、不完全的數據中獲取實體及新的實體鏈接和新的關聯規則等信息。常見的知識挖掘技術包括實體鏈接與消歧、知識規則挖掘、知識圖譜表示學習等。其中,實體鏈接與消歧為知識的內容挖掘,將有歧義的實體通過實體鏈接的方式映射到一個無歧義的目標實體。知識規則挖掘屬于結構挖掘,包括基于歸納邏輯編程、基于統計關系學習、基于關聯規則挖掘三種實現方法。知識圖譜表示學習是將RDF三元組知識、多元組事件知識、時序信息知識的各種關系映射成綜合的向量空間,依據用戶畫像進行綜合匹配,進而完成定向推薦功能。
知識融合是將多個來源的關于同一個實體或概念的描述信息融合起來,數據質量和數據規模是知識融合技術需要面臨的兩大難題。知識融合分為數據預處理、分塊、負載均衡、記錄鏈接、結果評估、結果輸出等步驟。數據預處理采用語法正規化和數據正規化對數據進行歸一化處理,以提高后續鏈接精確度。對于數據體量非常大的知識體系,利用Hash函數或者鄰近分塊等方法對所有實體進行分塊,并將匹配的候選項的大小盡量縮小,通過負載均衡來提升分塊性能。依據初步篩選數據的實體屬性建立融合標識符,找到等價實體進行記錄鏈接,從而判斷數據之間的屬性相似度,對屬性相似度均達到閾值條件的數據進行融合,并進行結構輸出。
知識推理是基于RDF語法,在已有知識圖譜的基礎上推斷出新的知識或者結論。為提高知識圖譜計算性能,知識推理機制應具有高效率的搜索和匹配機制、可控制性、可觀測性和啟發性。
在危險化學品安全生產事故應急救援過程中,針對初步研判會商、處置方案生成以及常態下專業知識學習等場景常常因信息查詢不便捷、分布零散、無專業背書而導致耗時長、效果差的問題,以專業危險化學品安全生產事故應急救援知識體系,以知識圖譜構建技術為支撐,建立知識圖譜智能檢索平臺,平臺架構如圖4所示。搭建的知識圖譜智能檢索平臺架構體系分為知識體系層、數據支撐層、基礎支撐層、業務應用層和用戶層,同時配置標準規范體系和安全保障體系兩大保障體系,以確保平臺安全、穩定的運行。

圖4 基于BIM的工人不安全行為預警系統架構
知識體系層:從商業購買專業知識、政府/集團搜集、用戶系統填報等多種方式獲取的知識,包括:企業信息、危險化學品應急處置知識、事故知識、決策知識、社會救援力量、企業救援力量、救援輔助信息等部分信息,利用知識圖譜技術采用自頂向下結合自底向上的方法構建危險化學品安全生產事故應急救援知識體系。
數據支撐層:不斷更新的知識體系經過知識存儲、知識表示、知識抽取、知識挖掘、知識融合、知識推理等技術構建知識圖譜。通過人工智能、語義識別、自然語言處理、意圖識別、深度學習等技術算法支撐平臺應用。
基礎支撐層:地理信息系統、操作系統、應用中間件、云計算和存儲資源、數據庫管理系統。
用戶層:為應急管理部門、化工園區、集團企業、現場指揮部的消防官兵、企業內主要負責人和安全管理人員等肩負日常安全管理以及事故應急指揮處置職責的部門各級領導與指揮系統的操作人員使用,以便進行有科學、有效的應急輔助決策。
業務應用層:包括用戶管理、知識管理、搜索交互、搜索糾偏、語義檢索、知識點關聯推薦、可視化展示,其中語義檢索包括精準搜索、通用搜索等功能。同時配置用戶登陸、日志管理、崗位管理、角色管理、接口管理、機構權限管理等輔助用戶管理應用。
(1)用戶管理:平臺管理人員依據用戶所屬機構和工作崗位,建立組織機構樹,由平臺管理人員對用戶名稱、賬號和密碼等進行合理分配和管理,平臺用戶可以通過登錄頁面登陸平臺。依據用戶特點設置為單位管理人員、單位負責人、決策指揮人員、現場救援人員等用戶角色,依據用戶角色進行功能模塊的權限分配。
(2)知識管理:知識體系為智能檢索平臺的數據支撐體系,知識體系的實時更新維護為應急救援決策中的關鍵性因素。智能檢索平臺對企業信息、危險化學品應急處置知識、事故知識、決策知識、社會救援力量、企業救援力量、救援輔助信息進行管理,由系統管理人員對知識體系進行更新與維護,從而保障平臺中知識信息的時效性、科學性,輔助用戶在應急場景找到有專業背書的輔助決策知識。
(3)搜索交互:搜索交互主要包括搜索前的搜索引導,搜索中的補全與搜索后的相關搜索等功能,搜索交互效果示意如圖5所示,通過搜索交互輔助用戶降低搜索門檻,提高搜索效率。搜索引導為搜索前通過點擊類目了解各類目下的意圖列表,點擊具體意圖可了解對應的常見語句和規范查詢并完成對應搜索。搜索補全即通過點擊自己的搜索歷史與其他用戶的搜索日志中含有相關收入內容的搜索問句,完成搜索。相關搜索為完成搜索后,通過點擊其他用戶的相關搜索,完成搜索。

圖5 搜索交互效果示意圖
(4)搜索糾偏:對通過語音和鍵入的方式輸入的與危險化學品安全生產事故應急救援決策領域不相關的內容搜索進行糾偏,平臺可支持全拼、混淆音字的糾偏識別,搜索糾偏示意圖如圖6所示。

圖6 搜索糾偏效果示意圖
(5)語義檢索:基于深度學習等人工智能技術的語義識別,實現查詢語句的智能解析實現語義檢索功能,包括通用搜索和精準搜索。通用搜索:通過搜索語句進行基于關鍵字的全文檢索與排序,找到用戶可能關注的信息。精準搜索:通過語義識別智能理解搜索語句意圖,將意圖作為整體進行搜索并組織對應知識,以輔助用戶進行應急救援決策,如圖7所示。精準搜索包括判斷類搜索、屬性搜索、實體搜索等功能。用戶通過判斷類搜索可以詢問知識圖譜智能檢索平臺判斷類問題,平臺給出危險化學品安全生產事故應急救援決策知識體系適用范圍的是否類答案及其對應理由。用戶通過屬性搜索詢問知識圖譜智能檢索平臺屬性類問題,并給出對應知識信息。用戶通過實體搜索詢問知識圖譜智能檢索平臺實體類問題,給出對應知識體系的實體列表,并對相關內容基于標簽進行排序。

圖7 精準搜索示意圖
(6)知識點關聯推薦:根據用戶的歷史搜索記錄,采用多層次關聯規則,自動為用戶推薦類似的知識點,用戶可以依據推薦的知識點,快速鎖定自己感興趣的內容,節省搜索時間。
(7)可視化展示:將檢索結果通過前端頁面進行展示,將知識體系中各知識點之間的關聯聯系和數據信息通過圖像和文字的形式進展展示,有利于用戶進行審閱,如圖8所示。

圖8 知識圖譜可視化展示
(1)專業權威的知識體系:從商業購買專業知識、政府/集團搜集、用戶系統填報等多種方式獲取的知識,利用知識圖譜技術采用自頂向下結合自底向上的方法構建具有專業權威的危險化學品安全生產事故應急救援知識體系。
(2)知識圖譜構建:不斷更新的知識體系經過知識存儲、知識表示、知識抽取、知識挖掘、知識融合、知識推理等過程構建知識圖譜。
(3)智能檢索平臺搭建:基于危險化學品安全生產事故應急救援決策知識體系,知識圖譜構建技術結合人工智能、語義識別、自然語言處理、意圖識別、深度學習等技術,建立知識圖譜智能檢索平臺,利用專業知識結合科技化手段提升救援人員在危險化學品安全生產事故中的應急救援決策能力,提升應急救援能力。