劉 琴,李佑文,褚紅健
(1.國電南京自動化股份有限公司,江蘇 南京 210032;2.南京國電南自軌道交通工程有限公司,江蘇 南京 210032)
城市軌道交通行業復雜的城市軌道交通網、龐大的客流量、設施設備的復雜多樣性等逐漸成為造成應急事件的主要因素,為各軌道交通運營公司的安全運營與管理工作帶來了巨大的壓力。由于城市軌道交通在人們的日常出行中起著至關重要的作用,在運營階段,任何應急事件的發生都可能對運營造成嚴重的后果,輕則增加運營成本和耽誤乘客出行,嚴重的甚至會威脅到乘客的生命和財產安全。而現狀是城市軌道交通系統在應急事件方面還沒有系統化的體系結構,無法做到真正的區域資源共享,往往造成問題解決不及時、效率低下等問題。因此,為了能在應急事件發生時盡快解決問題,系統將根據可能的應急事件類型,事先設計好應急預案,存儲到預案庫中;將系統運營過程中,實際發生過的應急事件及其采用的應急預案,存儲在案例庫中。然而,城市軌道交通應急事件類型較多,而且存在很多的不確定性,案例庫、預案庫的信息會很多,當應急事件發生時,如何獲得最佳的應急預案,實現自適應預案和智能流程,仍然是一個難題[1]。
基于上述問題,本文提出了一種基于文本分析的應急事件輔助決策方法,基于實時數據和機器學習,結合當前應急事件與歷史數據分析結果,快速適應場景,為站務人員推送最佳應急預案,實現自適應預案和智能流程,提高應對復雜情況的效率與準確性,解決快速響應與靈活流程之間的矛盾,保證軌道交通安全運營[2]。
應急事件發生后,工作人員將應急事件信息匯總,形成一個文檔,根據匹配模型,在應急預案庫中匹配度較高的應急預案。若有匹配度較高的預案,則采用此預案,在執行過程中對重要環節進行人工考證,確保預案的可行性以及發現存在的問題并及時改正。應急事件處理結束后,對其整個應急處理流程進行梳理、分析、總結,對此次應急事件對應的應急預案進行修正,進一步完善預案庫。若沒有匹配度高的預案,工作人員則根據現場實際情況給出一份符合實況的應急預案。
應急事件突發性強,短時間內難以獲得可靠的事件信息,給工作人員留的反應時間短,為了盡可能地減少損失,要盡快地啟動應急預案。因此,如何提高預案匹配的準確度成為研究的重點。預案匹配在整個應急輔助決策流程中發揮著重要的作用,本文將文本分析應用到應急輔助決策中,提出基于文本分析的應急輔助決策方法,具體流程如圖1所示。該方法在預案匹配中更加合理,從而幫助工作人員快速地找出最優的應急預案[3]。

圖1 應急輔助決策流程
對語料庫中的每個文檔建立基于Gibbs Sampling的LDA模型,獲得每個文檔對應應急預案的分布以及每個文檔中詞的分布,進一步獲得每個文檔中對應于不同應急預案的關鍵詞。
利用TF-IDF方法,挑選出區分度較高的關鍵詞,獲得當前應急文檔d的關鍵詞wi的計算公式為:

從應急事件案例庫、預案庫中獲得應急事件的文檔數據,所有的文檔數據使用NLPIR漢語分詞系統進行分詞處理,對分詞后的數據進行數據清洗,將清洗后的數據整合成文檔,構成一個大的語料庫D。
首先,語料庫中的每篇文檔d中的每個詞隨機賦予一個主題z,其中n表示文檔d中的第n個詞,z表示主題,Z表示主題數。統計每個主題z中詞的數量以及每個文檔下出現主題z中詞的數量,每輪使用Dirichlet分布的期望公式,計算P(zn|z-n,d,w),即排除當前詞的主題分布,根據其他所有詞的主題分布估計當前詞分配到各個主題的概率Wdn;得到當前詞屬于所有主題的概率分布后,根據此概率分布為當前詞選定一個主題;重復上述步驟,直到Gibbs Sampling收斂,即每個文檔下主題分布θd和每個主題下詞的分布βz收斂。統計語料庫的主題-詞的共現頻率矩陣,根據這個主題-詞的頻率矩陣,獲得所有詞的主題概率分布。
針對一個特定文檔d中的第i關鍵詞wi,令該關鍵詞對應的應急預案為j,其對應的公式為:pj(wi|d)=p(wi|j)×p(j|d)。
枚舉所有的應急預案,其中j表示應急方案,pj(wi|d)表示文檔d中第i關鍵詞對應某個應急預案j的概率;p(wi|j)表示應急預案j中出現關鍵詞wi的概率;p(j|d) 表示文檔d對應應急預案為j的概率。
根據文檔中實際采用的應急預案,獲得不同應急預案的關鍵詞,構建不同應急預案關鍵詞集合T={t1,t2,…,tZ},ti表示對應第i個應急預案的關鍵詞集合。每個關鍵詞歸屬不同應急預案的比重不同。
按照LDA獲得的文檔A對應每個應急預案的概率不同,而真實情況下,文檔A對應的應急預案是確定的,則將PAi(A實際對用的應急預案i)修正為1,則將文檔對應每個應急預案的概率作為對應關鍵詞集合的隸屬度。
采集當前應急事件的數據,整合成一個文檔,利用TF-IDF方法,獲得該文檔的關鍵詞條,即此應急事件的關鍵詞。
將關鍵詞條與案例庫、預案庫數據處理獲得的不同應急預案關鍵詞集合進行匹配,通過求和方式獲得與每個預案的關聯度。
基于3.3節中獲得某個應急事件文檔d中關鍵詞wi對應某個應急預案j的概率pj(wi|d),從而獲得文檔d中所有關鍵詞對應某個應急預案j的概率;進一步地獲得所有文檔中所有關鍵詞對應每個應急預案的概率。
將當前應急事件的一個關鍵詞wi與某個應急預案j中包含的關鍵詞集合進行匹配,如果應急預案j中存在匹配的關鍵詞y,則認為關鍵詞wiv歸屬于此應急預案j的概率等于關鍵詞y歸屬于應急預案j的概率即pj(wi)=pj(y),因此當前應急事件與某個應急預案j的關聯度如下公式所示:
Cj=∑wk∈Spj(wk)
其中,wk表示當前應急事件的某些關鍵詞,S表示當前應急事件關鍵詞中與應急預案j的關鍵詞集合相匹配的關鍵詞集合。
基于3.5節中獲得當前應急事件與所有應急預案的關聯度,認為與某應急預案關聯度越高,采取該應急預案的可能性越強,選擇關聯度最高的應急預案作為最佳的預案;而當應急事件與所有應急預案的關聯度都偏低時,則認為此應急事件未發生過,沒有相關的應急預案可以采用,需要現場工作人員根據實際情況,制定一份符合實況的應急預案。
基于3.1節至3.6節所闡述的基于文本分析的應急輔助決策方法,預案推送全流程如下:當系統監聽到信號產生應急事件時,執行應急輔助決策,匹配出最優的應急預案,實現預案推送,具體流程如圖2所示。

圖2 應急預案推送流程
本文設計基于主題摘要的應急事件與預案相似度評估方法,建立融合用戶偏好的預案優先級評價機制,開發基于相似度評估和優先級評價的預案推薦決策,支持按事件影響等級智能化推薦最佳預案,有效支撐應急事件的精準處置,以期最大程度降低應急事件對運營單位和乘客可能造成的損失。
然而,本文所提出的一種基于文本分析的應急輔助決策方法對預案數據量的要求較高,語料庫中的預案種類越多,應急事件的覆蓋面越廣,匹配到的應急預案精確度越高。因此,本文提出的方法還需進一步優化,實現預案的組合和重組,減少人工參與,提高智能匹配的精確度。
隨著城市軌道交通地鐵智能化的發展,地鐵公司對地鐵運營安全性的要求越高。地鐵作為一種大型的公共交通工具,一旦發生應急事件,將直接威脅乘客生命安全和社會正常運行。本文提出的一種基于文本分析的應急輔助決策方法,能夠獲取應急管理的參考信息,有效提升應急輔助決策能力,幫助地鐵運營及時做好應急處置,降低應急事件的影響力度,減少人員損傷。此外,隨著事后的應急總結和事件分析學習,可以進一步完善預案庫、案例庫,進一步優化輔助決策方法。