□張昊宇 陳 安 [中國科學院科技政策與管理科學研究所 北京 100049]
應急救災三方博弈模型研究
□張昊宇 陳 安 [中國科學院科技政策與管理科學研究所 北京 100049]
基于大型災害應急救災的特征,提出了用于研究中央政府、地方政府和災民行為的三方博弈模型。首先證明了在滿足一定的假設條件下,此三方博弈存在納什均衡并對均衡點進行分析,其次,研究了此模型框架下的道德風險問題,指出由于政府和災民的相互不信任導致救災效率未達到帕累托最優(yōu),并同時給出改進效率的一些建議,最后對此三方博弈模型的優(yōu)缺點進行分析。
三方博弈; 納什均衡; 應急救災; 應急管理; 道德風險
近年來,地震、火山以及海嘯等大規(guī)模突發(fā)事件在全球頻繁發(fā)生,不僅造成了巨大的物質財產(chǎn)損失,而且對人們的生命健康和安全造成了嚴重威脅。
在現(xiàn)階段頻發(fā)的大規(guī)模突發(fā)事件中,絕大部分突發(fā)事件具有地域性特征,即發(fā)生在某一地方政府管轄的區(qū)域內(nèi),如汶川地震等,這使得地方政府要在極短短時間內(nèi)籌集大量的救災物進行應急救災工作。但是,考慮到突發(fā)事件爆發(fā)的偶然性、突然性以及強破壞性等特點,地方政府不可能獨自完成大量應急救災物資的籌備、存儲和運輸工作,這必然要求具有更加強大的資源籌措和調(diào)配能力中央政府的援助[1]。然而,考慮到政府提供的人力資源相對于龐大的救災需求來說總是不足的,數(shù)量龐大的災民群體在整個應急救災過程中的作用也是不能忽略的。除此之外,政府和災民間高效的信息溝通以及良好的合作對于提高救災效率也起到重要作用。但是,并不是所有的災民都會選擇盡最大努力配合政府救災工作,這種主觀能動性除了受個人性格、道德等因素影響外,還受到多種因素的制約,如政府對于救災的重視程度、投入救災資源的多少以及對災民的態(tài)度等。
已有許多學者應用博弈理論來研究應急救災和恢復重建過程中各個主體的行為[2]。這些研究可分為兩類:一類是關于應急管理論中博弈論的理論研究,另一類是直接利用博弈論對具體的突發(fā)事件(如電力、交通事故等)中各方行為進行分析的實踐研究。
在理論研究方面,姚杰、計雷等構建了一個用來描述和分析“決策者”和“突發(fā)事件”之間相互作用的博弈論模型。在此模型中,“突發(fā)事件”被假設為“理性人”,其根據(jù)“效用最大化”準則選擇自己的行為,并且假設“突發(fā)事件”獲得的“效用”與其造成的損失成正比關系,即“突發(fā)事件”總是向最壞方向發(fā)展,總是選擇“損失最大化”的行為。同時,本模型還嘗試分析了動態(tài)應急決策方案如何生成的問題[3]。陳安、趙淑紅將應急管理的參與者分為“主體”和“客體”兩類,其中,“主體”主要指那些在應急管理過程中具有主觀能動性的參與者,包括政府、救災者、災民和媒體等,而“客體”主要指“突發(fā)事件”本身。除此之外,他們還基于貝葉斯后驗概率對模型進行了改進,并利用模型對任何兩個參與者博弈行為進行分析[4]。徐兵在博弈論框架下,運用囚徒困境模型,以SARS為例分析了我國公共危機管理組織體系中存在的困境問題,提出破解方法,同時,運用委托代理模型分析公共危機管理中地方政府的虛假智力問題,并基于機制設計理論和錦標制度機制給出建立科學的激勵和評估機制的方法[5]。
現(xiàn)階段,關于博弈論在應急管理中的實踐研究很少,田廓,曾鳴基于對電網(wǎng)應急管理典型環(huán)節(jié)的分析,定義了電網(wǎng)事故與電網(wǎng)管理者的博弈關系,并構建了以決策者期望效用最大化為目標的期望效用函數(shù),根據(jù)貝葉斯法則解得電網(wǎng)動態(tài)應急管理方案決策的精練貝葉斯均衡解,由此提出電網(wǎng)應急管理的動態(tài)決策框架[6]。向紅艷,張卓在分析高速公路交通事故特點的基礎上,采用動態(tài)博弈技術將交通事故過程分為若干個階段,研究了每一個階段交通事故狀態(tài)的變化及狀態(tài)轉移的概率矩陣,對救援決策者與交通事故之間的博弈過程進行了分析,根據(jù)動態(tài)博弈的路徑,計算了每條博弈路徑的救援保障率與救援成本,在滿足一定的保障率約束的條件下,按照成本最低的原則,選擇最優(yōu)博弈路徑作為救援預案[7]。
上面提到的研究絕大部分是圍繞兩個參與者展開,但是,應急管理中大部分的博弈過程不僅僅局限在兩方,通常是在多方之間進行。基于此,本研究試圖將兩方博弈推廣到三方博弈,即研究地方政府、中央政府和災民之間三者的行為特征。之所以選擇中央政府、地方政府和災民作為博弈的參與者,一方面考慮到這三者是應急救援和恢復重建過程中最容易產(chǎn)生利益沖突的群體,另一方面,中央政府、地方政府和災民是應急管理過程中最基礎、最核心的參與者,可以作為三方博弈向n方博弈擴展的基礎。與此同時,本研究對存在于模型中的道德風險問題進行了深入分析,并提出了減弱道德風險的負面影響,提高救援效率的幾條可行性建議。本研究還引入了中央政府對地方政府的“懲罰變量”,并對懲罰變量如何影響救援效率進行分析,從而為應急管理中的獎懲機制設計提供理論基礎。
(一) 模型要素
區(qū)域性巨災:發(fā)生在某一區(qū)域的,損失極為嚴重的特大型自然災害。一般來說,在這類災害發(fā)生后,地方政府無力獨自應對救災工作,需要中央政府在人力、物力和財力上予以支持。汶川地震即為典型的這類災害。
參與者:本模型假設應急救災過程中有且僅有三方參與博弈,包括中央政府、地方政府和災民。在災害發(fā)生后,中央政府在迅速做出反應,派出專家組趕赴災區(qū),進行災害評估和救援工作。與中央政府相比,地方政府的行動較為遲緩,之所以給定這種反應速度上的假設,有以下幾方面的原因:首先,中央政府無論在融資方面,還是在救災資源(包括救災者、救援物資等)的儲備和籌措上,都遠遠強于地方政府,這使得在災害發(fā)生后,中央政府比地方政府能更迅速地籌措和配置救災資源;其次,在某些情況下,本文所研究的“區(qū)域性巨災”對地方政府所在區(qū)域的人力和物質財產(chǎn)打擊是巨大的,甚至有可能導致地方政府陷入癱瘓,一旦如此,地方政府便不可能第一時間展開有效的救援工作,從另一個方面講,即使地方政府在災害發(fā)生后立即籌備救災物資并運送到災區(qū),這些救災物資與整個救災過程的巨大需求相比,也是可以忽略的;再次,對于地方政府而言,在不可抗拒的巨災發(fā)生后,其一般會進入一種“消極等待”狀態(tài),因為在地方政府看來,中央政府對于這類巨災的救援工作應擔負更大的責任。
本研究將災民的“自救”行為視為整個救災成功與否的關鍵因素之一,這是因為在實際的救災過程中,不論中央政府和地方政府如何努力籌措救災資源,尤其是直接進行救災工作的人力資源,對于災害的巨大需求而言都是遠遠不足的,而此時災民的自救便可發(fā)揮重要的作用。災民不僅可以提供龐大的人力,而且熟悉環(huán)境,以及信息的獲取難易程度都較政府組織的人力資源具有極大的優(yōu)勢,一旦這種自救的主觀能動性得到充分發(fā)揮,對于整個救災的意義是不言而喻的。但是,考慮到災民自身的“理性人”特征,這種主觀能動性并不是一直處于最高點,它會受到政府行為的影響,本文采用“努力程度”來度量這種主觀能動性的大小。
(二) 博弈過程
整個救災的三方博弈過程見圖1,具體分析如下:

圖1 三方博弈流程圖
區(qū)域性巨災突然爆發(fā),中央政府迅速派出專家隊伍趕赴災區(qū),對災情進行評估以便確定災害等級;在災害等級確定后,中央政府決定救災投入的力度,用變量“Ic”表示,這里的救災投入包括物質援助(如救災帳篷、救災食品等)以及精神層面的支持(包括提供災后心理輔導,普及救災醫(yī)療知識等)。除此之外,本模型引入懲罰變量“P”,用來度量一旦救災失敗,中央政府給地方政府的懲罰,這種懲罰可能是指對地方政府主要領導人的撤職處分或者其他行政、財政等處罰。
災民根據(jù)所觀測到的中央政府的Ic和P,確定自身的“努力程度”,即在救災中發(fā)揮出來的自救、協(xié)助救災等主觀能動性的大小,假設這種主觀能動性不為博弈的其他參與者(中央政府和地方政府)所知,并用變量e來表示。同時,定義衡量災民因努力而付出代價的函數(shù),即成本函數(shù)C(e),本模型假設成本函數(shù)僅與努力程度e有關,并假設成本隨努力程度增加而增加,即C'(e)>0,且滿足邊際成本遞增的性質(成本函數(shù)為凹函數(shù)),即C''(e)>0。
同樣,地方政府觀察中央政府的Ic和P,決定投入力度Il,這里的Il同樣包括救災資金和救援物資等[8]。
本模型假設此博弈過程只有一個階段,且最終救災結果只能處于“成功”或者“失敗”兩種狀態(tài),并 假 設 救 災 成 功 概 率 為 α(Ic)β(Il)γ(e),其 中α(Ic),β(Il),γ(e)分別由中央政府投入Ic,地方政府投入Il以及災民的努力程度e決定的三個概率函數(shù)。從救災成功概率的定義形式可以看出,中央政府投入、地方政府投入以及災民自身努力三個要素缺一不可,只要有一項投入為零,必然導致整個救災過程的失敗。
關于 α(Ic),本模型假設其滿足幾條性質:
(1)0 ≤ α(Ic)≤ 1,即概率在[0,1]區(qū)間內(nèi);
(2)α' (Ic) > 0,即隨著投入的增加,由投入決定的成功概率逐漸增大;
(3)α' '(Ic) < 0,即隨著投入的,成功概率表現(xiàn)出邊際遞減的性質。
一旦救災成功,本模型假設中央政府、地方政府和災民均獲得各自的收益,分別記為否則,三者的收益均為0。在本模型中,我們不考慮的具體值大小,而僅關心實現(xiàn)這種收益的可能性,即概率大小。從下面的分析過程可以看出,這種處理能夠使對三者行為的分析更為簡便和有效。
在博弈過程中,我們假設博弈參與人(中央政府、地方政府和災民)具有共同知識,即對整個博弈的規(guī)則和過程,以及不同決策下各自的贏得值具有相同的認知。除此之外,本模型還假設此博弈過程是信息不完全的,這表現(xiàn)在災民的成本函數(shù)C(e)(也可認為是自身的努力程度e)只為其個人所知,中央政府和地方政府不能觀測到。
(三) 參與者決策
中央政府的期望收益(期望贏得)用變量Uc表示,且Uc的計算過程如下:

表1 中央政府期望收益的概率分布
Uc計算公式如下:

采用同樣的方法可以計算出地方政府和災民的期望收益Ul和Uv,

本模型假設 Uc≥ 0,Ul≥ 0,Uv≥ 0,,即期望收益(這里的期望收益不僅僅指物質利益,還包括聲譽、社會認可度等非物質利益)非負,否則博弈各方將選擇退出此博弈過程;同時,期望收益非負性的假設和傳統(tǒng)經(jīng)濟學中“理性人”的假設相一致,即如果參與者不能獲得某一收益,參與者將不會參與博弈過程。
各博弈參與方的期望收益匯總,如表2所示。

表2 博弈各方期望收益(贏得)匯總
這一部分重點分析博弈過程中均衡狀態(tài)如何形成。一般來說,應急救災博弈中的中央政府可以認為是一個“斯塔克爾貝格領導者”(Stackelberg Leader)。所謂“斯塔克爾貝格領導者”,是指那些掌握博弈中其他參與者反應函數(shù),且自身行為會對其他參與者造成影響,并且基于對這種影響的考慮而做出使其效用最大化行為的主導型參與者。此博弈過程中的中央政府基于地方政府和災民的利己動機而選擇 Ic,P的值,并假設中央政府利用“逆向歸納法”做出決策?!澳嫦驓w納法”又被稱為“逆推法”,是求解動態(tài)博弈均衡的一種比較經(jīng)典的方法。所謂“動態(tài)博弈”是指博弈參與人的行動存在著先后次序,并且后行動的參與人能夠觀察到前面的行動,而“逆向歸納法”則是從動態(tài)博弈的最后一步往回推,以求解動態(tài)博弈的均衡結果。
盡管博弈中的Il和e兩個變量不是同時做出決策的,但可以把地方政府和災民的決策行為看作是無次序的,即可以認為兩者同時做出決策。之所以可以這樣處理,是因為不論對中央政府,還是地方政府來講,災民的努力水平變量e是不可觀測的,而中央政府一旦做出決策,其Ic和P的值則可以被地方政府和災民觀測到。
為了研究此博弈如何達到均衡狀態(tài),對地方政府期望收益函數(shù)關于投入變量Il,災民收益函數(shù)對努力水平變量e分別求一階導數(shù)并令其為0,具體如下:
對地方政府的期望收益函數(shù)對其投入變量Il求一階偏導數(shù),

對災民的期望收益函數(shù)對其努力水平變量求一階偏導數(shù),


中央政府期望效用函數(shù)對其投入變量Ic求一階偏導數(shù),


中央政府期望效用函數(shù)對其懲罰變量P求一階偏導數(shù),

下面證明在此模型的假設下,博弈過程的均衡狀態(tài)總是存在的。
定理1:此博弈模型存在均衡解。
證明:考慮地方政府如何決定Il以及災民如何決定e。
對地方政府的期望收益函數(shù)Ul關于其投入變量Il求二階偏導數(shù),

從博弈均衡狀態(tài)的求解過程可以看出,只要地方政府和災民之間的子博弈均衡存在,則整個博弈過程存在均衡解。由式(5)和式(6)可以看出,地方政府和災民的期望收益函數(shù)具有凹形,根據(jù)“納什均衡點存在理論”可知,此子博弈存在均衡狀態(tài),故整個三方博弈過程存在均衡解。
考慮到地方政府和災民在做出決策時存在“簽約后機會主義”行為(這里所謂的“簽約”是指地方政府對災民承擔救災責任,災民有義務在救災過程中進行配合并實施自救,這里可以認為是約定俗稱的一種協(xié)議,當然,現(xiàn)實中不會真正簽署此類協(xié)議),這種行為會導致救災過程中的“道德風險”問題,即地方政府和災民都認為對方應該承擔更大的責任,表現(xiàn)為地方政府的投入比其應該的投入要少,災民會比起應該的努力水平低,總之,雙方均不會“全力以赴”來進行救災工作,進而造成救災的無效率。
下面證明存在此種博弈的救災工作確實是無效率的。
證明:

首先,現(xiàn)階段博弈論理論研究大部分集中在兩個參與者之間,很少涉及三個參與者之間的博弈關系分析,而本研究嘗試將兩方博弈推廣到三方,構建了應急救災過程中中央政府、地方政府和災民三方的博弈模型,在利用“后向歸納法”求解模型均衡解的基礎上,對博弈的均衡點進行研究。
其次,本研究證明了應急救災過程中的可能存在的道德風險問題,指出由于地方政府和災民之間的相互不信任造成的應急救災效率的損失,即雙方都存在機會主義行為,都不會主動地增加各自的投入或努力水平,即便這能夠使得博弈各方的效率都得到提升。為了減輕道德風險造成的效率損失,可以考慮改變中央政府對地方政府的威脅力度(即調(diào)整變量P)或者提高信息的透明程度以及信息在各方之間傳遞的準確度和效率。
然后,本研究還有許多亟待解決的問題,比如本模型假設應急救災過程是單階段的,但現(xiàn)實中,這是一個多階段博弈過程,需要引入更復雜的數(shù)學工具進行建模以及求解;除此之外,本模型忽略了地方政府和中央政府在救災投入上的討價還價過程,而這恰恰是理論和實踐研究所關注的重點,因此,將討價還價模型引入三方博弈過程將是下一階段的重要工作之一。
[1] 陳安, 陳寧,倪慧薈. 現(xiàn)代應急管理理論與方法[M].科學出版社,2009:20-25.
[2] 陳安,馬建華,李季梅,亓菁晶. 現(xiàn)代應急管理應用與實踐[M]. 科學出版社,2010: 35-39.
[3] 姚杰,計雷,池宏. 突發(fā)事件應急管理中的動態(tài)博弈分析[J]. 管理評論, 2005,17(3): 46-50.
[4] 趙淑紅. 應急管理中的動態(tài)博弈模型及應用[D]. 開封:河南大學,2007: 29-37.
[5] 徐兵. 基于博弈理論的我國公共危機管理中若干問題研究[D]. 上海:同濟大學,2008:6-37.
[6] 田廓,曾鳴,王晶晶等.于精練貝葉斯均衡的電網(wǎng)動態(tài)應急管理[J]. 電力,2009,37(1): 103-106.
[7] 向紅艷,張卓. 高速公路交通事故緊急救援的預案生成模型[J]. 大連交通大學學報,2009,30(3):9-11.
[8] ELITZUR R,GAVIOUS A. Contracting, signaling, and moral hazard:a model of entrepreneurs, ‘a(chǎn)ngels,’ and venture capitalists[J]. Journal of Business Venturing, 2003,18(6):713-718.
編輯 何 婧
Interpret the Jumping Events of Foxconn from Sociological Perspective
ZHANG Hao-yu CHEN An
(Institute of Policy and Management, Chinese Academy of Sciences Beijing 100049)
Based on the characteristics of large-scale emergency disasters relief, this paper presents a tripartite game model to research the behaviors of the central government, the local government and victims. The study characterizes the optimal state of equilibrium among the players and provides insights into the related institutional arrangement. Next, the study analyses the moral hazard problems of the local government and victims.It shows that the outcome of the game is not efficient and some suggestions are given to enhance the efficiency.Finally, it analyses the merits and shortcomings of the model and presents some concrete proposals for improvement.
tripartite game model, Nash equilibrium, emergency disaster relief, emergency management, moral hazard
D523
A
1008-8105(2011)03-0024-05
2011 - 05 - 04
張昊宇(1986-)男,中國科學院科技政策與管理科學研究所碩士研究生;陳安(1970-)中國科學院科技政策與管理科學研究所研究員. .