趙瓊,何健,武曉偉,邢小璐
?
大規(guī)模突發(fā)事件決策支持系統(tǒng)的研究與實現(xiàn)
趙瓊,何健,武曉偉,邢小璐
摘 要:為應對各類異常事件,政府已經(jīng)擁有比較完善的匯報機制如安全巡防員、110報警電話等,也有比較健全的各類應急預案。但是對于大規(guī)模異常事件,由于事件的復雜性和突發(fā)性,使得決策者很難判斷事件的真實情況,因此,啟用相應應急預案是一個復雜的決策過程。大規(guī)模突發(fā)事件決策支持系統(tǒng)通過學習大規(guī)模突發(fā)事件的警報內(nèi)容,利用社交網(wǎng)絡上的相關信息,建立大規(guī)模突發(fā)事件信息分析模型及實時監(jiān)測系統(tǒng)。在突發(fā)事件發(fā)生之后,對于相關信息進行即時分析,抽取各類觀點并計算其可信度,為政府應急機構提供即時、客觀、全局的決策依據(jù)。
關鍵詞:大規(guī)模突發(fā)事件;決策支持系統(tǒng);政府應急機構
隨著我國城市化進程的不斷加速,城市人口密度增大,結(jié)構趨于復雜化。新興大中城市在給市民帶來生活便利及就業(yè)崗位的同時,也更容易面臨各種大規(guī)模突發(fā)事件,其中既包括海嘯、地震、臺風等自然災害,也包括大規(guī)模恐怖襲擊等人為災害。這些大規(guī)模突發(fā)事件通常具有如下特性:(1)成因相對復雜(尤其是人為災害);(2) 涉及城市面積相對較廣;(3)各區(qū)域受影響嚴重程度不同,所需應對資源類別、數(shù)量也各不相同。我國雖然已有比較完善的突發(fā)事件匯報機制(如安全巡防員、報警電話等),也有比較完備的災害處理預案,但政府應急機構在處理此類事件時仍會面臨決策困難的問題。
在應對大規(guī)模突發(fā)事件時,利用信息化技術建立大規(guī)模突發(fā)事件決策支持系統(tǒng),通過對社交平臺的分析了解輿情和事件實時狀況,結(jié)合對大規(guī)模歷史事件的學習,使政府應急機構盡快了解事件的全面情況,可以正確判斷復雜的形勢,總攬全局、協(xié)調(diào)各方面,及時果斷準確地制定針對突發(fā)事件的對策,盡可能的減小突發(fā)事件造成的危害。
1.1 相關概念
決策支持系統(tǒng)是綜合運用了管理學、運籌學、控制論等多方面知識,借助于計算機科學技術實現(xiàn)的信息化的系統(tǒng)。
決策支持系統(tǒng)能夠幫助決策者準確全面地認識事件情況,將計算機的知識封裝,把分析技術與傳統(tǒng)的數(shù)據(jù)存儲和檢索方式結(jié)合起來,使非計算機專業(yè)人員能夠簡易便捷的使用該系統(tǒng)。決策支持系統(tǒng)雖然能夠為決策者提供有效及時的信息,但并不代表決策者的意愿,系統(tǒng)并不一定能夠為決策者提供最優(yōu)的解決方式,但是能夠為其提供較為良好的方案,讓決策者參考方案,得出最終的決定。
在實現(xiàn)的過程中,決策支持系統(tǒng)包含了知識庫管理系統(tǒng)、數(shù)據(jù)庫管理系統(tǒng)、模型庫管理系統(tǒng)等多方面的知識,將這幾個方面結(jié)合起來,應用到多個方面,如人口管理、產(chǎn)業(yè)動態(tài)、宏觀經(jīng)濟監(jiān)測等。
1.2 研究水平及發(fā)展趨勢
在我國,國家公布了一些舉措和方案,能夠在突發(fā)事件發(fā)生時提供指導性方針。自2006年成立國務院應急辦以來,發(fā)布了一系列以《國家突發(fā)公共事件總體應急預案》為代表的應急預案,使得應急進入“國家”層面,在全國建立起了規(guī)范有效的應急框架體系,對于突發(fā)事件的處理卓有成效。但是由于缺乏信息流通的平臺和有效的信息分析,決策者有時不能全面準確地判斷形勢,使得決策還是存在瑕疵,在許多時候都無法對局勢做出最佳的處理。
在國外,許多國家的政府都有自己的應急機構。例如,美國的聯(lián)邦緊急事務管理署,俄羅斯的緊急情況部。以美國為例,其面對突發(fā)事件的預案已經(jīng)非常成熟。聯(lián)邦跨部門運作計劃(Federal Interagency Operational Plans)闡述了聯(lián)邦政府如何分配資源和保證其國家準備目標(National Preparedness Goal),國家準備目標是指在面對會對國家造成巨大的威脅和危害時,預防(Prevention)、保護(Protection)、減緩(Mitigation)、反應(Response)、恢復(Recovery)的能力。其中的聯(lián)邦跨部門運作計劃的反應篇(Response Federal Interagency Operational Plans)可以作為突發(fā)事件發(fā)生后,聯(lián)邦政府采取行動的指南。
但是從歷史上大規(guī)模突發(fā)事件的情況來看,可以發(fā)現(xiàn)國內(nèi)外的政府應急機構缺少可以在短時間內(nèi)整合信息和分析信息的平臺。在面對突發(fā)事件時,短時間內(nèi)決策者只能得到相對局部、片面的信息,無法做出相應的決策。
隨著近年來互聯(lián)網(wǎng)的發(fā)展,社交網(wǎng)絡(如人人、微博、微信等)因為能夠充分滿足人們的交友需求而受到青睞。在大規(guī)模突發(fā)事件爆發(fā)后,很多目擊者更傾向于通過社交網(wǎng)絡向公眾傳遞事件現(xiàn)場及自身狀況。這對于災害情報收集提供了新的渠道,而且該渠道收集的信息往往更及時。為此,我國已有很多政府及企業(yè)采用輿情系統(tǒng)來動態(tài)地發(fā)現(xiàn)、監(jiān)測及追蹤網(wǎng)絡輿情。這些系統(tǒng)通過采集各大新聞網(wǎng)站及社交網(wǎng)站,從海量文本信息中提取一段時間內(nèi)最熱門的人或事,以及某個具體事件在一段時間內(nèi)的變化過程,包括關注數(shù)量,正負面情緒等。
然而由于網(wǎng)絡輿情仍需要一定形成時間且現(xiàn)有輿情系統(tǒng)單純從在線資料中抽取事件信息,這些系統(tǒng)均存在時效問題。而突發(fā)事件發(fā)生后的前30分鐘是政府最需要了解情報的階段,對災情做出正確的判斷有助于各項工作開展,然而大規(guī)模輿情形成并被探測到往往所需時間更多。因此,在大規(guī)模突發(fā)事件發(fā)生時雖然有一定有用的災害描述被傳上網(wǎng)絡,但由于輿情系統(tǒng)本身的局限卻無法及時為災害應對負責人提供相關信息。
2.1 系統(tǒng)目標
大規(guī)模突發(fā)事件決策支持系統(tǒng)為了能夠盡快的對當前事件作出反應,當災害初期具體成因還不明確時,利用網(wǎng)絡輿情得到的信息,再結(jié)合報警信息及歷史事件的知識庫,對大規(guī)模突發(fā)事件進行綜合判斷,得出決策支持結(jié)果。
為了以最快速度將大規(guī)模突發(fā)事件的詳細面貌呈現(xiàn)在決策者的面前,以幫助決策者進行決策,減少因決策不當而造成的不必要的經(jīng)濟損失或人員傷亡,減少大規(guī)模突發(fā)事件對于社會安定的影響,本項目將重點研究以下問題:
(1)學習現(xiàn)有報警、災害匯報數(shù)據(jù),得到突發(fā)事件發(fā)生時信息的特征。
(2)研究從已有警報信息中提取關鍵詞,獲取關聯(lián)詞等技術,以便到網(wǎng)絡中尋找相關信息,準確收集事件警報信息。
(3)研究為各種災害信息(包括報警以及網(wǎng)絡信息)分類,生成小結(jié),同時研究計算其可信度與支持度的技術。
(4)開發(fā)一個自動化決策支持系統(tǒng):自動從報警信息中發(fā)現(xiàn)事件并在網(wǎng)絡中豐富事件描述,最后自動形成事件描述,對于相互矛盾的描述,每類呈現(xiàn)可信度與支持度。
2.2 系統(tǒng)架構
為了避免時效性過低、系統(tǒng)負載過大等問題,目標系統(tǒng)以報警信息(110、巡防員或應急反應人員等報警)為基礎,當確認大事件發(fā)生之后再從互聯(lián)網(wǎng)查找更多描述以豐富事件具體內(nèi)容,并形成事件簡報。系統(tǒng)的基本模型,共分為準備、監(jiān)測和匯報3個循環(huán),如圖1所示:

圖1 大規(guī)模突發(fā)事件決策支持系統(tǒng)架構圖
準備循環(huán)的目的是學習歷史警報信息形成突發(fā)事件資料庫。歷史警報既包括正例(大事件中的報警內(nèi)容),也包括反例(普通事件的報警內(nèi)容)。機器學習可分為兩種,監(jiān)督學習和非監(jiān)督學習。監(jiān)督學習準確性較高,但伴隨著較高的人力投入以及僅能識別人為確認的信息;非監(jiān)督學習恰好相反。為了發(fā)揮這兩種學習算法的優(yōu)點,“重大事件學習模塊”同時運用兩種學習方法:利用監(jiān)督學習來準確發(fā)現(xiàn)已知事件;同時采用非監(jiān)督學習來發(fā)現(xiàn)一些隱性(之前未曾發(fā)生或未被掌握)重大事件。“重大事件資料庫”中包含各種已知及未知事件的語言特征供發(fā)現(xiàn)模塊評價當前警報。為了進一步提高準確度,準備循環(huán)可以根據(jù)人工反饋進行進一步學習。
監(jiān)測循環(huán)主要根據(jù)重大事件資料庫的語言特征對最近一段時間的報警信息進行分析以判斷警報涉及內(nèi)容是否為重大事件。如果確認為重大事件,則抽取目標事件的特征(如事件名稱、發(fā)生地點、發(fā)生時間等),并以此特征啟動重大事件匯報循環(huán)。
為保證警報系統(tǒng)核心“重大事件匯報模塊”的通用性,匯報循環(huán)既可以由事件發(fā)現(xiàn)模塊啟動,也可以由人工輸入目標事件特征來手動啟動。考慮到報警人的局部視野及情感偏差,僅從報警內(nèi)容中了解事件全貌往往不夠。因此警報系統(tǒng)從互聯(lián)網(wǎng)的社交網(wǎng)絡及新聞媒體中豐富事件描述。為了更高效的從互聯(lián)網(wǎng)獲得信息,系統(tǒng)具有統(tǒng)一的搜索接口。當確認事件發(fā)生時,系統(tǒng)可向搜索接口提供相應關鍵詞及篩選條件(地點、時間等),由搜索接口獲取相應的新聞、博文及討論內(nèi)容。匯報模塊從這些文本中抽取相應主題(不同人,不同地點對于事件嚴重情況的描述)以及這些主題的支持度和可信度。根據(jù)這些主題,匯報模塊利用摘要生成工具為事件決策者還原事件的全貌。考慮到重大事件往往是一個演進的過程,匯報循環(huán)應可以根據(jù)決策團隊的反饋(或是新的報警內(nèi)容)來更新目標事件特征,然后重復信息搜索及主題、摘要提取過程,為決策者提供實時事件更新。
為了完成該系統(tǒng),需要搜索引擎技術、實體名識別、句法分析、語義分析、文本模型(包括文本表示、權重和相似度計算等)、文本分割、文本聚類及類排序、指代關系處理、自動摘要等技術。其中一些關鍵技術的具體研究方案如下:
3.1 實體名識別
實體名識別是查詢分析中非常重要的模塊。它包含了兩個部分:1.如何發(fā)現(xiàn)一個實體名,即如何判斷一個字符串是否代表一個實體。2.標志該實體名,即當發(fā)現(xiàn)實體名后,將該實體名分為哪一類別。實體名分為名字(姓名、地名、機構名)、數(shù)字(日期、時間、百分比和貨幣)兩大類。目前中文實體識別的方法主要有:基于規(guī)則的方法、基于統(tǒng)計的方法、規(guī)則和統(tǒng)計相結(jié)合的方法等。
應用于各類型的系統(tǒng)和研究中的自然語言處理的各種形式模型種類繁多,包括基于短語結(jié)構語法的形式模型、基于合一運算的形式模型、基于依存和配價的形式模型、基于格語法的形式模型、基于詞匯主義的形式模型、語義自動處理的形式模型、系統(tǒng)功能語法、語用自動處理的形式模型、概率語法、Bayes公式與動態(tài)規(guī)劃算法、N-元語法和數(shù)據(jù)平滑、隱馬爾可夫模型(HMM)、統(tǒng)計機器翻譯的形式模型。
在本系統(tǒng)的實現(xiàn)中使用基于機器學習的實體名識別方法。通過積累,在擁有經(jīng)過詞性標注和實體名識別的中、英文語料庫的基礎上,進行比較充分的機器學習。在系統(tǒng)實現(xiàn)過程中使用了兩種方案:其一是用神經(jīng)網(wǎng)的方法。實體名識別的實質(zhì)可認為是一個函數(shù),它以各種特征信息為輸入?yún)?shù),輸出值為特定的實體名類型。這種判決函數(shù)很容易聯(lián)想到用神經(jīng)網(wǎng)來實現(xiàn),只要給定足夠的樣本,使神經(jīng)網(wǎng)充分地學習,一旦學習過程完成后,對任意給定的輸入,即可求得相應的輸出;其二是基于自動標注的方法,用隱馬爾可夫模型方法進行初始的標注,再利用錯誤驅(qū)動的方法加以修改。
3.2 基于知識庫的語義分析
系統(tǒng)研究了實用意義下的語義分析,通過語義分析獲得雖然是淺層的但是卻很有價值的信息。實現(xiàn)的方法是通過知識庫來進行語義標注。
根據(jù)國際ACE會議的定義,事件抽取需要找到相應的觸發(fā)動詞,發(fā)生的時間、地點,參與的人物等信息,一般一個事件范圍不超過一個句子。大規(guī)模事件抽取方式利用語義角色標注可以很好的完成,系統(tǒng)能夠找出每個事件對應的觸發(fā)動詞,然后標注出它的各種語義角色作為事件的參數(shù),并根據(jù)參數(shù)的特點,進一步確認是否為需要的事件。在實際應用中,參數(shù)往往是較長的人名、地名、機構名、時間和數(shù)字等,因此,對這些實體的識別變得異常重要,實體的識別準確率提高,語義角色標注的性能也將隨之提高。
3.3 文本模型
文本模型是大規(guī)模文本處理非常基本的因素,確定了文本模型也就基本確定了文本的內(nèi)部表示、權重和相似度計算,以及文本的排序策略。系統(tǒng)采用經(jīng)典的向量空間模型作為本項研究的文本模型,并針對本項任務進行必要的改進。
系統(tǒng)在文本表示、權重計算和相似度計算改進原有的文本模型,對互聯(lián)網(wǎng)中的大規(guī)模文本進行數(shù)據(jù)挖掘,選取特征項為詞項是常用的選擇,這樣文本是一個非常高維度的向量,使用SVD奇異值分解、LDA主題模型對文本進行降維處理。
在權重計算上,一方面根據(jù)文檔本身的結(jié)構化信息,如標題、顯示風格等和網(wǎng)頁中的鏈接信息來修改基本的權重公式;另一方面則研究了文本長度的歸一化方法。
實時性是大規(guī)模文本處理的基本要求,這就決定了不能采用過于復雜的相似度計算方法。目前,系統(tǒng)根據(jù)向量的余弦相似度公式來計算文本之間的相似度。該計算公式未考慮特征項之間的相互作用,而只是簡單地把它們累加在一起,也就是說,不同的特征項被認為是正交的。在本系統(tǒng)中使用組合方法生成彼此更獨立的特征項,其中包括了自動聚類、線性變換和詞匯語義索引技術。
3.4 文本聚類
文本聚類是一種無監(jiān)督的機器學習算法,它將相似的文本分到一個組中,每一個組叫做一個類。類中的文本是相似的,類間的文本是不相似的。文本聚類的方法有很多種,有以K-MEANS為代表的劃分方法,BIRCH的層次方法,以及一些概率模型的方法。
在系統(tǒng)中多次用到了聚類的方法,例如,對歷史的報警信息進行聚類,對互聯(lián)網(wǎng)上的海量文本進行聚類等等。為了對不同的信息進行聚類,系統(tǒng)對現(xiàn)有的方法進行了改進,如對微博使用短文本聚類。面對大數(shù)據(jù)量、高維特征等問題,通過犧牲精確度的概率方法以及降維方法來完成分析。
大規(guī)模突發(fā)事件決策支持系統(tǒng)的研究與實現(xiàn),能夠應用在政府應急機構中,為政府處理大規(guī)模的突發(fā)事件提供強有力的支持,達到及時了解事件情況,通過對歷史突發(fā)事件的學習和參考,對當前的局勢做出準確的判斷。雖然系統(tǒng)目前仍然存在著一些不足,如在實現(xiàn)過程中警報數(shù)據(jù)的來源目前是一些非準確數(shù)據(jù)等,但是大規(guī)模突發(fā)事件決策支持系統(tǒng)仍然具有重要的現(xiàn)實意義,值得深入的探索。
參考文獻
[1] 曾思軼.我們有備而來——細數(shù)我國災害應急機制的形成過程[J].百姓, 2008 (6):6-10.
[2] 曾平輝,王海軍.公共危機下政府應急機制的缺失及對策探析[J].惠州學院學報,2007,27(5):40-44.
[3] Federal Emergency Management Agency [EB/OL]. (2014-12-11).https://www.fema.gov/
[4] EMERCOM of Russia [EB/OL]. (2014-12-11). http://en.mchs.ru/
[5] Security Homeland. Response Federal Interagency Operational Plan [G/OL]. 2014,8.
[6] 馮志偉.自然語言處理的形式模型[M].中國科學技術大學出版社,2010,3,4
Research and Implementation of Large-scale Emergencies Decision Support System
Zhao Qiong, He Jian, Wu Xiaowei, Xing Xiaolu
(Software School, Public Performance and Information Research Center, Fuan University, Shanghai 201203, China)
Abstract:In response to various anomalous events, the governments already have perfect emergency mechanisms such as security scouts, 110. They also have all kinds of contingency plans. However, for large-scale emergencies, it is difficult to know the real situation of them for policymakers due to the complexity and suddenness. So the process of choosing a suitable contingency plan is very complicated. Large-scale Emergencies Decision Support System has the function of monitoring and analysis on large-scale emergencies through machine learning and public opinion monitoring. Once the emergencies happen, the system can do real-time analysis through the relevant information. Thus all kinds of opinions can be extracted and credibility can be calculated. The system can provide immediate, objective and global information for the government to make policy accordingly.
Key words:Large-scale Emergencies; Decision Support System; Government Emergency Institution
收稿日期:(2015.04.21)
作者簡介:趙 瓊(1991-),女,復旦大學,軟件學院,復旦大學公共績效與信息化研究中心,碩士研究生,研究方向:電子商務與電子政務,上海,201203 何 健(1989-),女,復旦大學,軟件學院,復旦大學公共績效與信息化研究中心,碩士研究生,研究方向:電子商務與電子政務,上海,201203武曉偉(1992 -),男,復旦大學,軟件學院,復旦大學公共績效與信息化研究中心,碩士研究生,研究方向:電子商務與電子政務,上海,201203邢小璐(1991 -),男,復旦大學,軟件學院,復旦大學公共績效與信息化研究中心,碩士研究生,研究方向:電子商務與電子政務,上海,201203
文章編號:1007-757X(2016)01-0051-03
中圖分類號:TP311
文獻標志碼:A