黃 星,王紹玉,2
災害應急狀態終止的隨機決策與仿真
黃 星1,王紹玉1,2
(1.哈爾濱工業大學管理學院,150001哈爾濱;2.哈爾濱工業大學建筑學院,150001哈爾濱)
為確定災害應急狀態終止時間,通過對應急狀態終止狀態影響因素的分析,將應急狀態分為應急緊張狀態和應急穩定狀態2種,針對各狀態指標先期的統計數據,結合馬爾科夫過程,尋找出應急狀態進入穩態概率分布的最大時間N,然后運用最優停止理論在N中尋找出應急狀態終止的最優時間,并建立應急狀態終止的馬氏鏈決策-最優停止理論模型.基于馬氏鏈的災害應急狀態終止模型能較準確地對應急狀態終止時間進行量化決策,且計算簡便,易于計算機實現,具有較強的可操作性,所提出的模型為掌握應急所處狀態和對應急狀態終止時間進行決策提供了理論支持.
應急狀態終止;馬氏鏈模型;穩態分布;最優停止;狀態概率
應急狀態的終止屬于應急響應機制的最后一環,也是應急管理從應急的緊張狀態轉為應急穩定狀態并進入常態的關鍵,過早或過晚結束都可能導致嚴重的次生災害和巨大的財物浪費.
目前,應急管理機制的研究成果主要集中于以下幾個方面:一是對應急管理機制基本框架的研究,閃淳昌等[1]以應急管理全過程為主線,提出應急管理機制建設的20個具體內容;鐘開斌[2]根據機制所體現的不同功能將應急機制劃分為社會動員、恢復重建和災害應急評估等9種機制;二是從不同方法上對單個機制進行大量研究,如CORRIVEAU[3]從信息流的角度對應急聯動決策進行研究,FIEDRICH等[4]從應急物資動員機制的角度提出震后應急物資優化配置及響應模型,陳安等[5]基于有限情形的秘書問題.從以上文獻來看,鮮有涉及應急狀態終止問題,已有文獻也是基于隨機效益值為已知情況下尋找最優停止時間的,這對事中緊急救援決策的指導意義不大.本文從影響應急狀態終止的多因素角度,運用馬爾科夫決策和最優停止理論構建有限情形的應急狀態終止模型,為應急管理決策提供方法支撐.
在馬爾科夫過程中,給定系統的初始狀態,如果把時間n看成“現在”,把時刻0,1,…,n-1看成過去,把時刻n+1看成“將來”,那么馬爾科夫性說明,在已知系統“現在”所處狀態條件下,系統“將來”到達某種狀態的條件概率與“過去”所經歷的狀態無關,系統根據一定的概率分布在各個狀態之間轉移,“將來”的狀態具有隨機性,這跟應急系統因應急能力和不確定因素制約造成應急效率高低的隨機性類似[6-8].
1.1 應急狀態衡量指標
一般來講,應急狀態衡量指標主要從災害本身控制、需求提供和人員臨時安置(包括陸續救出的埋壓傷亡人員的安置)、應急成本和社會影響因素等方面提取.其中,社會影響因素(如公眾恐慌度)一般持續時間較長,很難定量,而且在有限的應急期間恐慌度變動除受災害等級、救援效率等因素影響之外,主要是通過長期的自我調節和心理援助等方式予以消除,故本文不將社會因素作為應急狀態衡量指標;根據災害應急的弱經濟性特點,應急成本也不宜作為影響應急狀態衡量指標.綜上,本文將災害控制、應急物資需求滿足和災區人員臨時安置作為災害應急狀態的衡量指標.
在應急狀態發生概率計算方法上,災害控制指標是指災害發生后導致災害影響范圍或損失的繼續蔓延或擴大,可根據前期統計數據或參照案例將單位時間發生的情況按一定規則劃分為2個等級(應急緊張狀態和應急穩定狀態),并分別統計每個狀態等級上發生的頻率,如洪災,可先將單位時間內擴大的受災面積劃分為2個等級,然后把每個等級上出現的頻率作為轉移概率,沒發生計為零;同理,疫情災害可按感染人數變動來計量,地震災害按災后發生的余震次數來計量;應急物資需求滿足是指每次應急物資供給量與需求量的比率,其狀態發生概率的計算方法與災害控制指標類似;災區人員臨時安置指標主要是對比單位時間實際安置人數和計劃安置人數,將比率按不同狀態劃分為2個等級,并將每個等級上統計出的頻率作為狀態轉移概率.
1.2 基本假設
假設2 設應急緊張狀態的概率為P(X= 1),應急穩定狀態的概率為P(X=2).每個狀態衡量指標的初始狀態有2種:應急緊張狀態和應急穩定狀態,而3個指標的應急初始狀態應是應急緊張狀態和應急穩定狀態的排列組合.
假設3 設災害控制在2種狀態之間的一步轉移概率元素分別為ε11、1-ε11和ε21、1-ε21,應急物資需求滿足在2種狀態之間的一步轉移概率元素分別為η11、1-η11和η21、1-η21,災區人員臨時安置在2種狀態之間的一步轉移概率元素分別為μ11、1-μ11和μ21、1-μ21.
1.3 應急狀態終止的最大停止時間

其中,

假設應急系統的初始狀態經過n單位時間段的轉移后的狀態向量為

由C-K方程有:

故經n階段后,應急狀態的概率分布可由初始狀態和一步轉移概率算出.由以上所給條件可推出P(Xn)的分布函數表達式:


同理

重大災害發生后,應急指揮中心采取緊急救援的概率為百分之百,故可設定應急初始狀態的概率分布為P(X0)=[(111)(000)],則有

式(5)為隨機過程X經n單位時間后應急狀態的概率向量,經過若干個有限單位時間的概率轉移后,應急狀態處于1或2的概率將趨于穩態,且穩態概率與初始狀態無關.設穩定狀態下的概率為π,則當應急系統達到穩定狀態時,有條件立,則每個衡量指標達到穩定狀態后的穩定概率為:

整個應急系統達到穩態時的狀態向量為:

根據災害應急特點,當應急狀態達到穩定狀態,說明災區應急工作達到了常規計劃狀態,而常規計劃狀態也表明應急狀態結束,否則災害應急仍會處于相對緊張狀態,故應急系統達到穩態時的時間可看作災害最大計劃停止時間N,而災害應急的最優停止時間應包括在N內.
2.1 基本假設
假設2[9-10]設一列隨機變量,稱之為報酬函數序列.對每一個n,Xn是Fn可測的,記Xn∈Fn,稱{Xn,Fn}為隨機序列.稱取值為{1,2,…,+∞}的隨機變量t為停時,若有?n,{ω:t=n}∈Fn成立,還有P(t<∞)=1,則稱t為停止規則,全體停時記為ˉH,全體停止規則記為H.
假設3 如果序貫地觀察到隨機變量y1,y2,…,yn,報酬函數序列Xn與y1,y2,…,yn對應,且
2.2 應急效益衡量指標及最優標準的提出
通常來看,時間和成本是影響災害應急效益的關鍵指標,設在災害應急中,每天都有應急物資提供,每天都有應急成本發生.應急時間效益指標主要突出于應急物資的及時提供上,當應急物資需求提出后,應急系統快速高效地提供所需應急物資,這是保證災害應急任務順利完成的決定性指標之一,故應急物資平均滿足時間(Mt)是其衡量指標之一,平均應急物資滿足時間越短,時間效益值越大;應急成本效益指標主要由應急物資運輸成本和應急物資成本組成,數據統計時,按每天發生成本求和即可,故應急成本(C)也應是關鍵衡量指標(見表1),應急成本越小,應急成本效益值越大.由于Mt、C指標在整個災害應急中具有相對獨立性,很難用一個綜合指標來統一計量,只能根據最優停止規則分別決策,為了簡便這里重點介紹Mt指標的最優停止方法,在最后決策時只需比較兩指標分別決策時的最優停止時間的大小,選取最大的停止時間作為應急狀態終止的最優停止時間,因為只有這兩個指標全部達到最優后才可以結束應急狀態,否則,災害應急效益不能達到最優.

表1 應急狀態終止最優停止決策的衡量指標
記M(1),M(2),…,M(N)為M在N天內取值的一個降序排列,屬于絕對排名,其中M(1)最大,M(N)最小;這個絕對排名只有N結束后才可以得到,在進行隨機決策時并不能事先知道這個絕對排名,做決策時只能對已過去的n天進行排名,這樣一來每次決策時會得到一列相對排名,也就是說,每次隨機決策會得到一個1,2,…,N的任意排列,隨機決策的目的就是既要找到效益值最大且排名靠前的概率最大.這樣一來,應急狀態終止的最優停止問題就轉化為求解以下兩個標準的問題:一是使應急狀態終止時間選在M值最大的概率最大;二是使應急狀態終止時間選在M值絕對排名的平均值最小.
2.3 兩個標準停止規則的構造
令Ω={(a1,a2,…,aN)},其中(a1,a2,…,aN)是(1,2,…,N)的一個排列;yn=(a1,a2,…,an),an的相對名次為yn中小于an的個數,設Fn= σ(y1,y2,…,yn).對標準1,取報酬序列:

但它不滿足Fn可測的要求,令

對任意停止規則t有:

其中,P(at=1)表示選擇停止規則t時,M恰好排名第一的概率,也就是M最大的概率,于是{Xn,Fn}的最優停止問題的最優規則應為

其中

滿足此條件的最小r也就是r?的取值,符合式(13)的r?后第一個最大的M值所對應的時間t即為應急最優終止時間[11-12].為了計算簡便,也可以通過對式(13)求極限求得r?,由式(14)有下式成立:


最優規則為


其中1≤n≤N-1.
對標準2的算法可設計為:
Input:N


2.4 應急狀態終止的最優時間決策
在應急狀態終止決策中,上述2個標準的最優規則既可以單獨使用,也可以相互補充,單獨用標準1時,在確定r?值后,立即知道int[r?]天前不宜終止,只有在int[r?]后第1次出現最大時間效益值M所對應的時間t時,才有理由終止應急狀態,這個t的確切值只有在事后才能明確,這對事后災害應急評估有較大作用,但對應急物資需求預測和對災害中后期進行統籌安排的指導作用不大;因此,實踐中,在知道了N和r?值后,應急狀態終止時間的決策范圍已經大大縮小了,這時可采取案例驗證的方法估計出int[r?]后第1次出現最大M值出現的時間,也可以取(int[r?],N)∩(a,b)交集的時間區間,記為(c,d),然后取c,d的均值作為最優終止時間.同理,按照以上決策方法,可決策出成本效益的最優停止時間.
現以2008年“5·12”汶川大地震部分重災區為例.實例仿真分為2個階段:一階段用馬氏鏈模型尋找應急狀態達到穩定狀態時的最大應急狀態終止時間點N,規定初始階段以每5 d為1單位.在指標狀態劃分上,“災害控制指標”主要統計從5月13日到5月17日的余震次數,其仿真數據見表2,并根據1980年編制的《中國地震烈度表》中所列舉的不同地震烈度的強弱影響,規定每日發生2次5度以上地震和1次6度以上地震為應急緊張狀態,其余為應急穩定狀態;“應急物資需求滿足指標”主要統計初始階段每次應急物資及時提供量與需求量的比率,為了簡化數據收集難度,這里選用最能影響應急狀態的醫用物資作為仿真數據,并規定滿足率平均為75%以下為應急緊張狀態,滿足率平均為76%以上為應急穩定狀態,在實際地震救援中,這個規定是比較合理的,仿真數據見表3;“災區人員臨時安置指標”主要統計初始階段計劃安置人數與實際安置人數的比率(包括當天救出的傷亡人員的安置),規定84%以下為應急緊張狀態,85%以上為應急穩定狀態,仿真數據見表4;二階段是求解最優終止時間,這階段只需根據N值按兩個標準的最優規則求解即可.
3.1 應急狀態的穩態隨機分布
根據表2~4數據,計算各狀態指標在初始階段的頻率,得到應急狀態的一步轉移概率矩陣向量:


表2 汶川地震5月13日-17日余震統計

表3 汶川地震初始階段醫用物資供需統計

表4 汶川地震初始階段災區臨時人員安置情況

圖1 應急狀態指標和應急系統的概率轉移分布
由前面式(6)~(8)可以分別得出各衡量指標狀態轉移分布,見圖1(a)~(c).圖1(a)為災害控制指標的概率轉移分布,狀態達到穩定分布后P(X1=1)=0.33,P(X1=2)=0.67,歷經11個單位時間段的轉移,共55 d;圖1(b)為應急物資需求滿足指標的概率轉移分布,應急物資需求滿足指標狀態達到穩定分布后P(X2=1)=0.44,P(X2=2)=0.56,歷經13個單位時間段的轉移,共65 d;圖1(c)為災區人員臨時安置指標的概率轉移分布,災區人員臨時安置指標狀態達到穩定分布后P(X3=1)=0.46,P(X3=1)=0.54,歷經11個單位時間段的轉移,共55 d.3個狀態指標中,應急物資需求滿足達到穩定分布的時間較長,為加快應急狀態終止速度,需重點從提高應急物資籌集與配送能力入手,但單個指標達到穩態后不能作為應急系統的最大計劃停止時間,只有應急系統的狀態達到一個相對靜止的穩態后才可以確定應急狀態終止的最大計劃時間N,故根據式(9)得到圖1(d)所示的應急系統的狀態轉移概率分布曲線,從圖1(d)可知,應急系統歷經15個單位時間段的轉移后,應急緊張狀態和應急穩定狀態的概率分布呈現穩態分布,此時P(Xn=1)= 0.25,P(Xn=2)=0.75,最大應急計劃停止時間N=75.
3.2 最優停時決策
1)根據標準1,在前27 d不能做出應急狀態終止決策,只有在27 d后出現最大的時間效益值M(應急物資平均滿足時間Mt最小)的第1 d(l)應急狀態才可以終止,此時的M值相對于已經發生天數是最大值,并非絕對排名,故選取27 d后第1 d出現最大M值時終止的概率最大為0.276.
2)根據標準2算法設置程序語言,輸出表5的結果.由表5,tn取值為1所對應的時間序列為{22,23,…,37},說明應急狀態終止的最優停止時間應選擇在(a,b)=(22,37)之間,此區間中排名最大的M所對應的時間點即為最優終止時間;前21 d中所有tn取值為0,說明前21 d不應終止應急狀態.
3)應急狀態終止決策.由標準1求出最優停止時間的關鍵變量為r?=27.59,表明前27 d不應做出應急狀態終止決策,由標準2求出的最優停止時間范圍為(a,b)=(22,37),表明應急狀態終止時間應在此范圍內選擇.決策時,標準2可作為標準1的驗證,兩種標準可單獨使用,但無論采用哪種標準進行決策,都需要尋找出第1次出現的最大時間效益值,因為事前并不知道每天的效益值,故只能通過不斷縮小時間范圍來提高決策的準確度,在方法上可綜合標準1和標準2的結論,取(int[r?],N)∩(a,b)交集,記為(c,d),則有(c,d)=(27,37),這樣,可進一步縮小決策范圍;理論上,只要在此區間找出第1次出現的最大效益值,則所對應的時間就可大致確定為應急狀態終止時間,在實踐中,可把區間的中間點確定為應急狀態終止時間.同理,可決策出成本效益的最優停止時間.如果采用兩個衡量指標分別決策的最優停止時間不同,一般應以時間效益指標決策結果為準,這符合災害應急特點.

表5 Vn和tn輸出情況
運用馬氏鏈決策過程對應急狀態終止的最大計劃停止時間N進行了研究.將最優停止理論引入到應急狀態終止決策中,提出兩類求解最優停止時間的標準和方法,為在(0,N)尋找最優停止時間提供保證,并從災害應急的時間效益和成本效益的角度構建應急狀態終止的最優停止模型,有效地將應急狀態終止時間的決策范圍大大縮小.影響應急狀態終止的指標很多,本文只從易于統計的幾個指標入手,這樣會降低災害應急狀態終止決策的準確性,而且在最優停止理論的引入中只從單因素的角度構建理論模型,模型運行結果只能決策出最優停止時間的關鍵變量,不能決策出關鍵變量后第1次出現最大效益值的時間,下一步研究需配合精度較高的預測手段實現應急狀態終止更為有效的決策.
[1]閃淳昌,周玲,鐘開斌.對我國應急管理機制的總體思考[J].國家行政學院學報,2011,46(1):8-12.
[2]鐘開斌.應急管理機制辨析[J].中國減災,2008,35(4):30-31.
[3]CORRIVEAU G M.A cross-jurisdiction and multi-agency information modelforemergencymanagement[D]. Manitoba:University of Manitoba,2000,35(6):223-231.
[4]FIEDRICH F,GEHBANER F,RICKERS U.Optimized resourceallocationforemergencyresponseafter earthquake disasters[J].SafetyScience,2000,35(1/2/3):41-57.
[5]陳安,武艷南.基于最優停止理論的應急狀態終止機制設計[J].中國管理科學,2010,18(4):173-182.
[6]CHEN W H,GUAN Z H.Delay-dependent output feedback stabilization of Markov jump systems with time delay[J].IEEProceedings-ControlTheoryand Applications,2004,151(5):561-566.
[7]LI Hongyi,CHEN Bing,ZHOU Q,et al.Robust stability for uncertain delayed fuzzy Hopfield neural networks with Markov jumping parameters[J].IEEE Transactions on Systems,2009,39(1):94-102.
[8]MAO Z,JIANG B,SHI P.H∞fault detection filter design for network control system model by discrete Markov jump system[J].IET Control Theory and Applications,2007,1(5):1336-1343.
[9]金治明.最優停止理論及其應用[M].長沙:國防科技大學出版社,1995:4-29.
[10]THOMAS J L.Optimal stopping with sampling cost:the secretary problem[J].Ann Probability,1981,9(1): 167-172.
[11]YI D Y.From optimal stopping problems over tree sets to optimal stopping problems over partially ordered sets[J].Journal of Mathematical Research&Exposition,1998,18(1):30-32.
[12]CHE Zhuming,JIN Zhiming.TI-Kth choice problem[J].SO-National University of Defense Technology Journal,1995,17(4):143-147.
[13]徐健康,鄧興光,李華,等.汶川地震四川省醫用物資保障工作情況[J].中國循證醫學雜志,2008,8(11): 905-912.
(編輯 趙麗瑩)
Random decision and simulation for the state termination of disaster emergency
HUANG Xing1,WANG Shaoyu1,2
(1.School of Management,Harbin Institute of Technology,150001 Harbin,China;2.School of Architecture,Harbin Institute of Technology,150001 Harbin,China)
To determine the stop time of disaster emergency,the states of emergency were divided into two kinds of states,including emergency tension state and emergency stationary state after analyzing the influence factors of emergency termination states.Firstly,the maximum time N was found out by Markov decision model after the emergency state going into the stable phase,and then the optimal stop theory was used to solve the question of the emergency termination to find the most optimal termination time during the N,finally,the Markov chain's decision model of emergency state termination was established,which could accurately solve the question of the quantification decision of the end time of emergency state,and the calculation was simple. Markov model provided the theory support for emergency termination decision.
emergency state termination;Markov chain model;steady state distribution;the optimal stop;state probability
O232
A
0367-6234(2014)04-0013-07
2012-11-07.
國家自然科學基金資助項目(71372091).
黃 星(1979—),男,博士研究生;王紹玉(1956—),男,教授,博士生導師.
黃 星,huangxing6213@126.com.