李 欣,馮小芳,金福才
(1.北京經緯信息技術有限公司,北京 100081;2.中國鐵道科學研究院集團有限公司 電子計算技術研究所,北京 100081)
鐵路調度應急預案是鐵路調度應急指揮的指導性方案,是鐵路調度人員應對突發事件的行動指南。鐵路調度應急預案管理水平關系調度應急指揮的效率及應急處置的成效。鐵路應急處置大多是由多工種業務人員共同參與、配合完成,但全面掌握相關業務知識的專業人員極少,導致應急預案編制缺乏系統性;另一方面,現有的鐵路調度應急預案對多源應急信息資源缺乏系統梳理和有效組織,造成相關信息資源整合困難,制約了鐵路調度應急預案管理能力。
目前,國內針對鐵路應急預案數字化方案已開展了一些研究。文獻[1]提出融合本體與深度學習的應急預案數字化方法,運用深度學習算法,從應急事件消息文本中提取關鍵信息,并用本體方法對事件處理流程進行分析和梳理,自動生成數字化鐵路應急預案;文獻[2] 研究提取應急預案指定要素核心內容的數字化預案轉化方法,利用工作流引擎實現應急預案編寫、評審、發布、使用、修訂、廢止的全生命周期管理,提高應急預案的適用性與可操作性。
知識圖譜(Knowledge Graph)本質上是一種揭示實體之間關系的語義網絡,為海量、異構、動態數據的表達、組織、管理及利用提供一種非常有效方式,可快速、準確地實現信息關聯搜索。目前,知識圖譜廣泛地應用于醫療、政務、電商、金融等領域,為智能問答、商品推薦、金融風險識別等提供實用工具。文獻[3]通過語義匹配、圖神經網絡、路徑多跳、邏輯多跳等知識圖譜多跳問答推理方法,研究智能問答的解決方式;文獻[4]提出“預訓練+知識向量服務”模式,設計知識圖譜預訓練模型,極大地提高了商品分類、同類商品挖掘、商品推薦等應用的性能;文獻[5]通過圖分析、圖挖掘等技術,發現深層風險關聯,增強風險賬戶識別能力。
本文研究運用知識圖譜概念和方法,結合鐵路應急救援場景,對鐵路調度應急預案所涉及的多源信息資源進行分析和整合,實現相關信息的關聯存儲與有序組織,為鐵路調度應急預案的綜合展示與規范化管理提供有利條件。
知識圖譜采用可視化方式,系統、形象地展示領域知識的整體框架、核心概念實體及其關聯關系,是一種綜合應用數學、圖形學、信息可視化技術、信息學等學科的理論方法。
知識圖譜是由節點和邊組成的圖,節點表示各個知識點,邊是知識點之間的關聯關系,形成網狀知識結構,能夠顯式、直觀地表達知識的關聯關系,可有效避免信息遺漏,也便于快速檢索相關知識。
通常,知識圖譜采用圖數據庫實現領域知識的關聯存儲,相較于關系型數據庫,圖數據庫更適于構建復雜關系網絡,使機器具備認知、理解領域知識的能力,實現智能解決業務問題的目的。
知識圖譜的構建過程主要包括知識抽取、知識融合、知識存儲3 個步驟,從多源信息中抽取概念、屬性、關系,并封裝成知識單元,融合語義表達不同但表示同一對象的概念、屬性,將整理的知識及其關聯存儲為圖。一般將知識圖譜劃分為實體層和數據層2 個層面,采用自頂向下和自底向上相結合的方法進行構建,基本流程如圖1 所示。

圖1 知識圖譜構建流程
依照知識圖譜的一般構建方法,鐵路調度應急預案知識圖譜構建過程為:先識別出鐵路調度應急預案涉及的相關實體概念,定義其屬性及其關系,然后完成鐵路調度應急預案數據的抽取、融合與存儲。
實體指的是事物基礎、本源的規范化概念,是實際存在的起作用的組織或機構、行為的發起者或執行者。實體是概念、屬性、關系的集合,根據經驗知識進行概念層次劃分、要素屬性識別、關聯關系定義,完成實體層的構建。
2.1.1 主要實體概念
在鐵路調度應急預案中,實體概念主要為應急處置任務的4 個核心要素,包括應急事件、與應急處置相關的機構崗位職責、應急處置流程、應急處置評價。
(1)應急事件是因自然災害、設備故障等因素對列車運行造成影響,需要調度人員采取故障處置、現場救援等措施實施干預的事件。
(2)機構崗位職責主要以調度所和應急指揮中心為核心,以二者的管轄機構、平行單位為輻射半徑,會合與鐵路應急處置相關的路外其他行業機構,機構內設置有應急處置的崗位職責。
(3)應急處置流程是指對于發生的應急事件,有關部門按其崗位職責需完成的指定任務。按照應急處置流程的不同階段,將應急處置任務劃分為事前、事發、事中、事后4 個層次,可為每個階段設定不同的目標和任務[6],如表1 所示。

表1 應急處置流程概念實體的層次劃分
(4)應急處置評價是對應急事件綜合處理情況的各項評定,包括應急處置流程核心階段的完成情況評價、相關部門履職情況評價等。
2.1.2 實體屬性定義
每個實體具有多個基本屬性,其每個基本屬性可設置一到多個屬性值。
(1)應急事件實體的屬性包括事件類型、等級、發生時間、線路地點、發生原因、影響情況、應急措施等。
(2)機構崗位職責實體的屬性包括部門名稱、部門職責、崗位名稱、崗位職責、人員信息等。
(3)應急處置流程實體的屬性包括流程名稱、流程內容、流程進度等。
(4)應急處置評價實體的屬性包括評價項目、評價標準、評價結果、評價分析等。
2.1.3 實體關系定義
鐵路調度應急預案中,除因果、跟隨、并發、互斥、順序等一般實體關系外,還包括表達隸屬、協同、信息指令傳達等領域業務邏輯的實體關系[7],各類關系的含義,如表2 所示。按照上述實體關系的定義,梳理出如圖2 所示的鐵路調度應急預案知識圖譜實體層結構。

表2 鐵路調度應急預案實體關系含義說明

圖2 鐵路調度應急預案知識圖譜實體層結構
按照不同知識來源,將鐵路調度應急預案涉及的多源異構信息資源進行數據抽取、數據融合與知識存儲,構建鐵路調度應急預案知識圖譜數據層。
2.2.1 數據抽取
鐵路調度應急預案涉及的數據來源較多,數據類型多樣。除信息系統的結構化數據外,還有諸如從氣象局網站獲取的天氣信息這類半結構化數據,以及處置現場圖像、視頻、事后總結分析等的非結構化數據。
(1)結構化數據一般存儲于關系型數據庫,因字段定義明確,一般通過設置字段映射規則,實現從數據庫中自動抽取實體、屬性及關系。
(2)半結構化數據本身存在一定結構但需要進一步提取整理,可利用包裝器(Wrapper)進行抽取,由包裝器從HTML 網頁中爬取數據,并重新組裝為結構化數據。
(3)非結構化數據一般通過已知實體對非結構化內容進行標注,轉化為有監督學習的問題[8-9]。圖像、視頻類非結構型數據可通過實體標注后進行分類抽取;文本型非結構化數據的抽取較為困難,以最小粒度的實體概念屬性進行語義相似度校驗,將關鍵信息抽取出來,例如應急規章制度文件中抽取具體場景的規章制度條款。
2.2.2 數據融合
對于非結構化文本數據,因中文描述的多樣性,相同的內容可能存在多種表述,導致抽取的數據存在冗余。可通過計算語義相似度,對孤立的實體概念、屬性和關系進行數據融合處理[10]。以地點和天氣為例,非結構化文本數據融合結果前后對比,如表3所示。

表3 非結構化文本數據融合示例
2.2.3 知識存儲
將結構各異的多源數據轉化為由開始節點、關系、結束節點3 個元素組成的結構化數據,建立關系三元組<實體1,實體關系,實體2>。以跟隨關系為例,應急處置流程總是跟隨應急事件發生,對應的三元組關系可表示為<應急處置流程,跟隨,應急事件>,以此建立實體關系集合。
對于屬性和關系較為豐富的結構化數據,采用圖數據庫方式存儲更有優勢[11]。將關系三元組<實體1,實體關系,實體2>中的實體1 和實體2 存儲為節點,屬性關系、語義關系存儲為邊,將結構化知識三元組映射為圖中的節點和邊,以便于使用圖查詢語言和圖挖掘算法實現基于知識圖譜的具體應用[12-13]。
以自然災害啟動應急預案為例,采用上述方法完成應急事件、機構崗位職責、處置流程、應急評價等應急預案核心實體概念及關聯關系的形式化表達,將相對孤立、零散的多源數據轉化為相互關聯的知識結構體,構建鐵路調度應急預案的知識圖譜。
鑒于鐵路調度應急預案的核心要素與環節較多,內部關系復雜,采用實體結構圖對鐵路調度應急預案知識體系進行梳理。以自然災害霧天行車場景為例,對處置過程中各部門崗位職責、關聯信息以及外部資源等進行剖析,形成應急預案知識體系,如圖3 所示。

圖3 霧天行車場景的應急預案相關實體結構圖
根據應急預案的相關概念實體結構圖,對應急預案場景涉及的多源異構數據進行抽取、融合及存儲,形成鐵路調度應急預案知識圖譜。以霧天行車場景為例,鐵路調度應急預案知識圖譜如圖4 所示。

圖4 霧天行車場景的應急預案知識圖譜
針對霧天行車場景的應急預案知識圖譜構建好之后,可以便利地綜合展示預案相關信息,減少人工查找和匯集信息的工作量,應用如圖5 所示。

圖5 霧天行車場景的應急預案展示
在大霧天氣啟動應急預案的應用場景中,通過將應急事件與對應場景處置的應急專家、相應故障的應急規章、歷史案例及處置流程等多項信息建立起關聯,實現了特定類型的應急預案的綜合管理。在啟動應急響應后,可以迅速參照響應規章制度進行工作部署,按照處置流程的提示逐步執行;處置過程中遇到難題時,能馬上聯系到具有相應應急救援場景處置經驗的專家,召開分析會診,快速查閱到可供參考歷史案例等。
總之,知識圖譜可以根據信息的內在關聯性實現應急預案相關信息資源的整合和結構化展示,實現鐵路調度應急預案的綜合管理,使應急預案相關信息資源的使用更加便利化,更好地支持應急指揮快速決策,支持應急處置工作從容有序開展。
知識圖譜概念和方法為領域知識的提取、融合和組織管理提供了有效的方法。依照知識圖譜的構建方法,本文研究提出鐵路調度應急預案的概念層次劃分、要素屬性識別、關聯關系定義,將鐵路調度應急預案相關信息資源組織成概念明確、結構清晰、聯系緊密的知識體系;在此基礎上,研究鐵路調度應急預案的數據抽取、數據融合與知識存儲方法,實現異構多源數據的規范、有序組織與存儲,為應急預案相關信息資源的有效利用與綜合展示提供良好條件。
鐵路調度應急預案涉及的信息多種多樣,目前還沒有度量各類信息與應急預案關聯的緊密程度,由此造成信息大量存儲,不利于數據的高效利用。因此,今后需要對如何量化應急預案數據關聯性開展深入研究,以提高鐵路調度應急預案的綜合管理、自主學習、關聯性分析水平,為鐵路應急調度指揮提供更加完備、有效的決策參考。