李 婧,姜雪晴
首都經濟貿易大學經濟學院,北京 100070
新冠肺炎疫情的暴發是第二次世界大戰結束以來最嚴重的全球公共衛生突發事件之一,對人類健康和經濟增長造成前所未有的損害,共克時艱成為恢復生產和生活秩序的關鍵。2020年5月18日,習近平總書記在第73屆世界衛生大會開幕式上呼吁各國共同構建人類衛生健康共同體,反映了全球抗擊公共衛生危機的強烈愿望和對人類命運共同體的基本訴求。
然而,各國政府和公眾對公共衛生危機的認知和反應是不同的。牛津大學對新冠肺炎疫情期間政策響應的追蹤結果顯示,自2020年以來,中國各省一直保持著輕級措施和指導方針的基線,例如核酸檢測、佩戴口罩和檢測體溫等要求[1];美國各地區的抗疫嚴格程度和政治差異一直存在,東北部和民主黨領導的州采取了比中西部和共和黨領導的州更嚴格的防疫政策,且自2021年初以來,對新冠肺炎疫情的政策反應程度降低[2]。輿觀(YouGov)調查網對疫情下的行為追蹤結果顯示,2020年7月之前,英國人戴口罩的比例尚不到40%;意大利在2020年3月9日宣布“封城”之后,公共場所戴口罩的人數快速增加,之后一直保持不低于80%的戴口罩率(1)Personal measures taken to avoid COVID-19[EB/OL]. (2021-03-07) [2021-09-08]. https://yougov.co.uk/topics/international/articles-reports/2020/03/17/personal-measures-taken-avoid-covid-19.。由此可見,政府的權威性、規章制度的明確統一性、監督的力度和個人習慣等因素可以影響公眾對公共衛生管理的認知和行為選擇。
應對公共衛生危機需要龐大的公共服務支出,包括增加醫療衛生投入、保障居民的基本生活需求和為企業提供融資。許多發達國家開始實施全民基本收入式的經濟救助政策(2)全民基本收入是由政府直接平等發放給所有公民財政補助的一項制度安排,幫助維持其基本生活,人人有份。。如2020年3月27日,特朗普簽署2萬億美元經濟救助法案,其中年收入低于7.5萬美元的每個單身成年人均可獲得1 200美元的援助[3]。研究表明,經濟合作與發展組織(OECD)為抗擊疫情將產生至少17萬億美元的額外負擔[3],其后果是發展中的重債國經濟陷入嚴重的衰退,疫情的疤痕效應(scarring effect)可能持續存在(3)疤痕效應形容低迷的宏觀經濟環境對勞動力市場產生長期的負面影響,這里指疫情下失業的增加使未來失業的可能性增加或后續工資減少。。國際貨幣基金組織2021年10月發布的《世界經濟展望》顯示,2022年全球實際GDP增速預測值顯著低于疫情前水平,發展中國家尤甚。然而,病毒的頑固和變異使抗疫異常艱難。當前,新冠病毒變異毒株迅速在全球傳播,全球經濟和生活秩序恢復需要更長的時間。因此,提高公眾防控意識、支持政府防疫措施、確保公眾合作參與是實現疫情成本最小化的關鍵。
達成合作和集體行動是經濟學研究的重要問題。奧爾森[4]62-67指出,大多數情況下,小集團比大集團更有凝聚力,更具有效性。在國際社會這個“大集團”內部,雖然各國和地區具有共同的利益追求,但并不一定會自愿和自動地組織起來采取集體行動。應對新冠肺炎疫情作為一項集體選擇,起先是權宜之計,而后成為慣例,最后成為決定經濟績效的制度安排[5]118-123。中國取得的抗疫成果來之不易,得益于中國自上而下的統一行動。首先是有法可依?!吨腥A人民共和國傳染病防治法》《突發公共衛生事件應急條例》等為疫情治理提供了可靠的法律法規依據,政府可依法應對突發公共衛生事件,對不主動及時如實報備、不按照規定居家健康監測或集中隔離、不配合防控措施和不配合調查等妨礙疫情防控工作的行為依法予以嚴懲。公民能夠自覺做到不聚集扎堆、配合體溫檢測、出門戴口罩等防控措施就是守法遵規??梢哉f,法治正在成為中國全民戰“疫”的公約數以及同心抗疫的關鍵詞(4)在戰“疫”大考中不斷進步:中國抗疫治理能力的生動實踐[EB/OL]. (2020-04-28)[2021-04-26]. http://politics.people.com.cn/n1/2020/0428/c1001-31690423.html.。其次是公眾積極合作。公民能夠自覺做好防護、保持社交距離,這些要求起初都是社會倡導,隨后成為疫情期間的行為準則和公民習慣。政府號召力作為一種柔性力量,凝聚、動員并引導各個階層、各類群體和各方力量參與到疫情防控工作中。中國正是以這種剛柔并濟的方式較早形成了穩定且有效的全民抗疫模式。政府依法治理、社會正面倡導、公民積極響應是中國戰勝疫情的“三重奏”。2020年10月國際貨幣基金組織發布的《世界經濟展望》指出,較早采取積極抗疫措施的國家承擔較小的疫情成本,較快地恢復了社會經濟秩序,實現復工復產。中國也因此取得了2020年全球唯一經濟正增長和2021年經濟復蘇企穩的成就。
當前,世界各國抗擊疫情基本上還是以自救為主,將中國抗疫的舉國體制,特別是將公眾合作的經驗分享給全世界,是實現國際間守望相助、取得抗疫勝利的關鍵。為此,本文將新冠肺炎疫情作為公共衛生事件的典型案例,基于演化博弈模型,探討在零約束和懲罰機制下的不同演化穩定策略,研究公眾在疫情期間行為選擇的不同場景,提出建立全球衛生健康共同體的合作機制。
新冠肺炎病毒傳染率高、隱蔽性強、影響范圍廣,新冠肺炎疫情是一場具有典型特征的公共衛生危機。公共衛生事件中的公眾合作博弈適用于新冠肺炎疫情下公眾選擇的場景。在社會倡導下,個人有自主權選擇合作策略(共同參與防護,如戴口罩、測體溫、居家隔離等)或非合作策略。非合作情況下公眾感染病毒的風險增加,地區的疫情防控局勢持續緊張,社會成本增加。但某些人也會采用非合作策略,即利用“搭便車”享受疫情風險降低的好處。
演化博弈模型最初是為了解決進化生物學中的實質性問題產生的[6]。在生物學中,模型自然地假設動物短視、隨機匹配和遺傳傳播[7]。演化博弈論的優勢體現在三個方面。一是突破了傳統經濟人假設。傳統博弈理論認為經濟人是完全理性的,而演化博弈對行為人理性的要求較低,即有限理性,如自然界的動物群體,有能力學習或模仿,這一假設符合當前社會現實。在該模型中,行為人總是缺少確定或完備的信息,缺少預見、優化分析與決策能力,但是他們會通過對上一期的學習和模仿決定本期的選擇,個體的選擇過程受周圍環境影響,最后差異化的個體趨向于選擇同一個策略,實現系統均衡。二是關注重復博弈,即動態過程。靜態博弈是一場所有博弈方同時或可看作同時選擇策略的博弈,是類似田忌賽馬的一次性博弈,而演化博弈是一場重復博弈,用動態的框架來分析系統均衡及達到均衡的過程,從而更準確地描述系統的發展變化。三是可呈現動態調整過程和路徑依賴。傳統博弈強調行為主體達到的是瞬間均衡,而演化博弈下的均衡是在多次博弈后實現的,整個過程不斷地進行動態調整,且存在路徑依賴。因此,演化博弈在模擬實際經濟問題方面有相當大的潛在優勢,會比傳統博弈模型提出更豐富的預測[7]。
此外,演化博弈還具有適用于研究群體行為特征的其他優勢。教育心理學認為,行為人在“處群”中才能學習和模仿,即“相觀而善”。同時,大規模行為人的參與可以容納個別參與者的突變行為。正如在生物進化中,只有一種基因的突變在種群中流行時才會持續存在。本文選擇演化博弈模型來分析公眾合作,正是基于其在行為人假設、動態模擬等方面的優勢。在研究一國的公眾合作時,個體的自我防疫活動會形成行為的自動化序列,最后演化發展成集體行為,而集體的行為不會突然發生變化。可見,演化博弈模型恰好適應本文分析的場景。
演化博弈論應用范圍廣泛,特別適用于研究不同場景下的社會合作。例如,Zhang等[8]曾運用該假說研究綠色發展中的合作問題,證明了若要保證地方政府間合作治霾的穩定性,上級政府的監管和行政處罰是必須的。也有研究將該模型應用于國際合作領域,如李鵬[9]基于合作意愿差異化的視角,利用該模型判斷中國與中亞各國家能源合作的可能性,得出需要重點加強中國與哈薩克斯坦合作的結論。此外,演化博弈模型還可用于討論企業決策,如孔令夷[10]應用演化博弈工具研究了非對稱內外資方專利權交易和商業化應用的合作行為,以及不同成本、不同資助等條件對雙方互惠交易的影響。基于以上研究,本文將繼續發揮演化博弈模型的優勢,將合作場景拓展到一國之內的公共衛生合作,并從單個民眾的選擇出發,探索微觀行為特征及導致的宏觀結果。
基于以上分析,本研究有以下前提假設:
假設1:一國之內存在兩個群體的博弈。
異質性是演化模型中的重要因素。個體雖然眾多,但只有合作或不合作兩種選擇,該研究可簡化為兩個群體之間的雙方博弈。兩個群體的劃分是隨機的,但最終形成的兩個群體肯定存在差別。正如同樣的居家隔離場景對不同的人意味著不同的成本和收益,這是將現實中的個體差異凝聚為兩個群體的異質性。這樣既考慮了公眾間的差異,又能簡化模型使二維演化博弈模型適用于合作場景,滿足研究需要。
假設2:個體通過“搭便車”獲得的收益比例是相同的。
在“搭便車”的假設基礎上,本文繼續假設“搭便車”收益占社會總收益的份額不變。首先,在一個復雜的群體系統中,社會很難監測到每個人的行為,社會公眾是一個共同體,疫情的蔓延干擾每一個人的正常生活,產生不必要成本,控制疫情自然是群體訴求。然而,抗疫成功后的整體收益是公共可分的,人人有份,因此總有些未嚴格自我防護的“投機者”幸運地享受到疫情管制放松后自由出入和經濟復蘇的社會收益?!按畋丬嚒眴栴}威脅群體聯盟的穩定性[11]205-221。本文在此基礎上假設“搭便車”獲得的收益比例不變,這說明社會整體收益越高,“搭便車”收益也越高。兩者的線性關系簡化了“搭便車”收益的函數形式,方便支付矩陣的計算,且這種函數形式的變化不影響整體分析的邏輯。
假設3:研究區域是一個封閉的系統。
本文排除系統外部因素的影響,只討論一國內部博弈,假設境外輸入可控。事實上,嚴防境外輸入本就是現實中的防疫要求。自2020年2月起,由于國際旅行通道限制,跨國人員流動有限,防疫重點是本土疫情,這一假設符合中國的抗疫實際。
假設4:個體之間不存在懲罰或獎勵機制。
強調參與者受到的懲罰或者激勵只來自第三方,包括不限于政府、社區對不合作者的懲罰,不考慮參與者之間的互相評價機制。合作方不會對非合作方進行道德評判、施加輿論壓力等。首先,由于個人隱私信息受到保護,因此人與人之間互相不了解具體行程及健康情況。其次,在公共場合,通常相關單位或部門會安排專門的工作人員對佩戴口罩和測量體溫進行監督和管理,如地鐵和公交車的執勤人員。當前,有很多場合還會免費發放口罩,體現防護第一的理念與規則。部門管理表現得比個人之間的互相監督及評價更加突出,是防疫強調的重點。誠然,在防疫過程中,其他人的負面評價能一定程度約束不合作者,增加其拒絕合作的成本,但從中國的防疫經驗來看,普通民眾相互評價總是出現在疫情暴發后,如埋怨感染者出行時間不合適、不該聚會等。
假設5:個體感染病毒的可能性相同。
設定每個人感染新冠肺炎病毒的概率是一樣的,不考慮個體間年齡、健康狀況等差異。假設疫情傳播速度很快,每個人幾乎都會被感染,且被感染的概率趨于一致。
本文所有變量的定義和取值范圍見表1。

表1 變量設定
首先,因兩個群體之間存在異質性,疫情防控的態度、采取的措施、社會角色都不相同,所以從整體收益中獲得的比例也不一樣。若整體收益為1,將獲得較高收益的群體記為A,其異質性程度為m,合作時獲得的收益為m;將獲得較低收益的群體記為B,其異質性為1-m,合作時獲得的收益為1-m。數量關系上,0.5≤m<1,0<1-m≤0.5。
然后,考察某一群體內部決定合作或非合作的概率。設群體A選擇進行自我防護的概率為x,群體B的合作概率為y。變量x、y的數值會隨著博弈過程的動態演進發生變化。當兩個群體合作時,該國會獲得疫情控制下社會的凈收益,設為r。而當兩個群體均拒絕合作,都不參與疫情防控工作,自然帶來社會的沖突成本,設為c1。例如,雙方均不自我防護,社會陷入防控無序狀態,政府和有關部門需要投入更多的防控成本。一旦個體受到感染,必須盡快隔離治療,由此產生治療成本c2。不進行自我隔離等行為無疑會增加感染的概率,設為δ。由此,公眾拒絕自我隔離時的社會總成本為沖突成本和感染成本之和,表示為c1+δc2??紤]到不合作行為的嚴重影響,均不合作時的總體成本大于合作時的凈效益,即c1+δc2>r。
此外,“搭便車”獲得的收益會隨著凈收益的增加而增加,本文將“搭便車”收益占總凈收益的比例設為λ。通過“搭便車”獲得的收益應該小于合作策略下任一方的收益,因此,λ的取值滿足0<λ<1-m。在存在懲罰機制的演化模型中,將政府對拒絕參與防疫的群體進行的懲罰設為K,該值大于0。
1. 演化穩定策略的求解
假設無外力干擾,兩個群體的成本收益將按照雙方的異質性程度進行分攤。本文將零約束條件下的演化博弈模型稱為模型一,此時的支付矩陣見表2。

表2 模型一的支付矩陣
公眾相信疫情和自然災害一樣是一次性的,但必須考量社會損失。學理上,經濟人總是通過衡量預期成本和收益選擇最優策略。同樣地,疫情下的公眾通過權衡自己能在疫情更快控制后獲得的凈收益做出選擇。表2展示了公眾在不同場合下能獲得的凈收益分布。已知兩個群體將按照各自的異質性程度,即m和1-m的比例共享社會總預期凈收益。若一方合作,而另一方拒絕合作,“搭便車”會使合作方受損,此時選擇自我防護的群體的凈收益減少了λr,為mr-λr,λr是“搭便車”一方獲取的額外收益。因此,非合作方獲得的凈收益則為(1-m+λ)r。最壞的情況是雙方都拒絕合作,那么疫情傳播就會產生“多米諾骨牌”效應,導致更高的社會損失,群體A和B根據異質性程度承擔各自的損失。

(1)
(2)
當群體A以x的概率選擇合作策略,則以1-x的概率選擇非合作策略時,其獲得的平均預期收益(UA)為
(3)
將式(1)~(3)代入群體A的復制動態方程(replicator dynamics equation),得到式(4)。其中,復制動態方程是演化博弈模型的核心,表現了在長期動態變化過程中某一群體采取合作策略的人數比例的動態變化速度,或該群體在動態演化過程中選擇具體演化策略的概率變化。
x(1-x)[(1-y)m(c1+δc2)-λr]
(4)
(5)
(6)
當群體B以y的概率選擇合作策略,以1-y的概率選擇非合作策略時,其獲得的平均收益(UB)為
(7)
將式(5)~(7)代入群體B的復制動態方程,得到
y(1-y)[(1-x)(1-m)(c1+δc2)-λr]
(8)
均衡狀態下,群體A和B選擇結果局部穩定,即合作概率x,y不再隨著時間的變化而變化,表示為F(x)=F(y)=0。
當F(x)=dx/dt=0時,x=0,x=1,y*=1-λr/[m(c1+δc2)]。
當F(y)=dy/dt=0時,y=0,y=1,x*=1-λr/[(1-m)(c1+δc2)]。
由方程解可知,模型一的均衡點共有5個,即(0,0)、(1,0)、(0,1)、(1,1)和(x*,y*),分別對應群體A和群體B的合作概率,前4個均衡點依次代表(不合作,不合作)、(合作,不合作)、(不合作,合作)和(合作,合作)的策略組合,(x*,y*)表明群體A選擇合作概率為x*,群體B選擇合作的概率為y*的選擇組合。本文將通過雅可比矩陣(Jacobi matrix)判斷演進過程中動態系統均衡點的局部穩定性,最終確定演化穩定策略(evolutionary stable strategy,ESS)。
雅可比矩陣是將一階偏導數以一定方式排列形成的矩陣,模型一對應的雅可比矩陣為

(9)
該矩陣的行列式值為
DetJ=(1-2x)[(1-y)m(c1+δc2)-λr](1-2y)[(1-x)(1-m)(c1+δc2)-λr]-
x(1-x)m(c1+δc2)y(1-y)(1-m)(c1+δc2)
(10)
該矩陣的跡為
trJ=(1-2x)[(1-y)m(c1+δc2)-λr]+(1-2y)[(1-x)(1-m)(c1+δc2)-λr]
(11)
模型一的演化穩定結果見表3。

表3 模型一中均衡點的演化穩定結果
將均衡點依次代入式(10)(11),結果顯示當(x,y)等于(1,0)或(0,1)時,符合雅可比矩陣行列式值大于0且跡小于0的要求,這是該點為ESS的充分條件。(0,1)和(1,0)均為零約束條件下的演化穩定策略解,這意味著在零約束條件下,最終演化結果為群體A和群體B總有一方選擇合作,積極參與疫情防護,而另一方拒絕合作,不愿約束自我行為,同時總有部分公眾存在“搭便車”行為。模型一對應的相圖如圖1所示。

圖1 模型一的相圖:混合策略
橫軸為x(t),是群體A選擇合作策略的概率;縱軸為y(t),是群體B選擇合作策略的概率。O(0,0)、A(1,0)、B(1,1)、C(0,1)、D(x*,y*)(5)D(x*,y*)的位置是不確定的,但其肯定位于封閉區域OABC內。本文只是近似選擇了中心一點,以便繪制的相圖較為直觀。是該模型的5個局部均衡點,其中O(0,0)代表雙方都不選擇合作,B(1,1)代表雙方都選擇合作。OABC圍成的區域是該模型的混合策略空間。當初始狀態點落入OABD區域內時,最終系統會演化至A(1,0)的穩定狀態;當初始狀態點落入OCBD區域內時,系統最終會演化至C(0,1)的穩定狀態。在沒有第三方介入的情況下,兩個群體的選擇策略并沒有向B(1,1)移動,表明兩方均不選擇合作抗疫。雙方都不合作的點O(0,0)意味著高昂的社會成本,該情景不會發生。在尋優的過程中,博弈系統最終向一方選擇合作策略而另一方選擇非合作策略的方向發展,雙方合作策略沒有形成。
雖然疫情防控利國利民,符合個人和群體利益要求,但自我防護帶來的集團收益是公共可分的,國民共同享有,不管其之前是否有效參與了防控。個體行為的利益最大化并不能保證集體行動利益的最大化。國家作為“大集團”,集團規模越大,分享收益的人越多,為實現集體利益而自我努力的人就會越少,以至于最終無法形成穩定的合作策略。只有將所有人置于“無知之幕”(6)“無知之幕”由約翰·羅爾斯提出,指只有當每一個人都忘記自己的社會角色,才能保證每個人都受到無社會差異的對待,正義才會出現。,不對合作方案預設立場,才能使集體利益成為利益標準的自然選擇[11]。
2. 零約束下的系統仿真分析
為了直觀觀察零約束下的演化博弈過程,本文利用Matlab軟件,對群體A的復制動態方程式(4)和群體B的復制動態方程式(8)進行數值仿真,觀察系統的演化路徑。在滿足數值取值范圍的前提下,本文設定演化系統中群體A和B初始選擇合作概率均為0.5,其他參數值設為r=10、λ=0.2、c1=8、δ=0.8、c2=5、m=0.6,故“搭便車”收益設定為λr=2(7)因參數λ和r均通過正向影響“搭便車”收益,進而影響兩個群體的博弈概率,其作用路徑一致,故在后續分析中不單獨考慮λ或r的變動,而是選擇其乘積“搭便車”收益展開研究。,不合作抗疫下的社會總成本為c1+δc2=12。分別討論以下情形:
情形一:x(0)=0.5,y(0)=0.5,m=0.6,其余變量不變,如圖2所示。

圖2 情形一的ESS分析
情形二:x(0)=0.5,y(0)=0.5,m=0.75,其余變量不變,如圖3所示。

圖3 情形二的ESS分析
情形三:x(0)=0.5,y(0)=0.5,λr=5,其余變量不變,如圖4所示。

圖4 情形三的ESS分析
情形四:x(0)=0.5,y(0)=0.5,c1+δc2=15,其余變量不變,如圖5所示。

圖5 情形四的ESS分析
情形五:x(0)=0.3,y(0)=0.7,m=0.6,其余變量不變,如圖6所示。

圖6 情形五的ESS分析
情形六:x(0)=0.7,y(0)=0.3,m=0.6,其余變量不變,如圖7所示。

圖7 情形六的ESS分析
仿真圖中橫軸表示時間,縱軸是群體選擇合作的概率。取值為1,代表該群體的民眾都選擇合作,即合作概率為100%;取值為0表示該群體選擇合作可能性為0,即拒絕合作。兩條線分別描繪群體A和群體B選擇合作概率的變化路徑。曲線的陡峭程度表示系統向演化穩定策略演化的速度,曲線越陡峭,速度越快。
將圖2表示的情形一視為對照組,采用控制變量法,依次改變某一參數值,觀察情形二~情形五的仿真結果,如圖3~6所示。將圖3~6與圖2對照,可以得出如下結論:第一,不同情形下的系統發展方向都是一方傾向合作策略,最終合作概率為100%,另一方選擇非合作策略,最終合作概率為0,與上述模型分析結果一致。第二,模型中參數值r、λ、c1、δ、c2、m的變化并不會影響最優演化博弈策略的最終結果,仍為(0,1)或(1,0),即總有一方合作,而另一方不合作,但會影響系統達到穩定的速度。
首先,由圖2和圖3可知,短時間內兩條線距離迅速拉大,博弈的利益結構決定博弈方行為取向。異質性更高,即m更大的情況下,實力較強的一方會更快地推動對自身有益的博弈進程。其次,“搭便車”收益rλ越小,社會成本c1+δc2越大,參與者會權衡合作利弊(如戴口罩的成本收益)更快做出決策,系統也就更快地實現穩定。再次,圖2和圖4的差別在于“搭便車”收益由2增加至5,兩圖對比結果表明,“搭便車”收益的增加不僅延緩演化穩定策略的實現,還會短暫地降低群體A的合作意愿,使群體A合作抗疫的概率下降。同樣地,圖2和圖5體現了雙方拒絕合作時社會成本的增加,由12增加至15,會在短期推升群體B合作的概率。但雙方長期決策并沒有改變,系統演化穩定策略仍然是一方合作,而另一方不合作。最后,對照圖6和圖7的仿真結果發現,在零約束下,群體最初的選擇意愿會不斷增強,初始意愿就是最終選擇,演化博弈中群體A和B的選擇都具有路徑依賴的特點。
1. 演化穩定策略的求解
由上述分析可知,在沒有第三方干預的情況下,異質性群體之間不會形成穩定的雙方合作策略,現引入來自第三方的懲罰機制,如政府、社區等部門對拒絕戴口罩、拒絕自我隔離等不合作行為的“懲罰”,這種懲罰包括罰金、道德譴責等,這一場景下的模型稱為模型二。任何個人都會對其面臨的激勵做出反應,這種社會激勵加上個人偏好影響個人選擇和行為。結果可能或者不可能與公共利益沖突[11]。該部分將研究激勵下的個人選擇是否與公共利益有沖突,模型二的支付矩陣見表4。

表4 模型二的支付矩陣
其中,“懲罰”的對象僅針對拒絕合作的參與者,若將懲罰的力度用“罰金”K表示,則拒絕合作的一方獲得的凈收益將減少K。
模型二中群體A的復制動態方程為
x(1-x)[(1-y)m(c1+δc2)-λr+K]
(12)
群體B的復制動態方程式為
y(1-y)[(1-x)(1-m)(c1+δc2)-λr+K]
(13)
均衡時,雙方的選擇概率不再隨時間而變化,即G(x)和G(y)的值都等于0。當G(x)=dx/dt=0時,方程解為x=0,x=1,y*=1-(λr-K)/[m(c1+δc2)]。
當G(y)=dy/dt=0時,方程解為y=0,y=1,x*=1-(λr-K)/[(1-m)(c1+δc2)]。
其中,λr-K表示權衡“搭便車”與懲罰成本的凈收益。當存在懲罰機制時,上述均衡解共有5個,即(0,0)、(1,0)、(0,1)、(1,1)、(x*,y*)。下文將再次使用雅可比矩陣判斷穩態,尋找ESS點,模型二5個均衡點的演化穩定結果見表5。

表5 模型二中均衡點的演化穩定結果
最終結果顯示,只有均衡點(1,1)能夠成為演化均衡策略解,且只有滿足懲罰成本大于“搭便車”收益,即K>λr的條件時,演化穩定策略點才會出現,雙方合作才得以實現。這意味著,只有當對拒絕自我防護的公眾處以的罰金大于“搭便車”獲得的收益時,演化系統的穩定均衡解為(合作,合作),最終公眾全體合作抗疫。
滿足條件K>λr時模型二對應的相圖如圖8所示,橫軸為群體A選擇合作策略的概率,縱軸為群體B選擇合作策略的概率。O(0,0)、A(1,0)、B(1,1)、C(0,1)、D(x*,y*)是該模型的5個局部均衡點,B(1,1)是雙方合作的均衡點,在存在嚴厲懲罰機制的情況下,無論初始狀態點落在OABC區域內的任意位置,選擇組合策略會逐漸向B點移動,最終演化至B(1,1)的穩定狀態,且該穩定狀態唯一,這正是公眾合作的理想結果。

圖8 模型二的相圖(K>λr):合作策略
奧爾森[4]70-77設計出一種動力機制,為“有選擇性的激勵”,即“賞罰分明”,可以解決集體及個人之間的利益相關問題。懲罰機制便是這樣一種反向激勵,正是這種強制引導大集團的成員為實現公共利益而行事,否則自我防護作為一種公共物品,面臨供給困難。模型二的最終穩定策略證明在懲罰機制下公眾才可能合力提供公共物品,實現公共利益,類似于“污染者付費”的原則[11]。
2. 懲罰機制下的系統仿真分析
本文把上述引入懲罰機制下的模型進行系統仿真分析,只討論懲罰成本大于“搭便車”收益,即K>λr時,穩定策略存在的情況。各參數與模型一中情形一的設定值一致,在滿足K>λr的前提下,本文僅討論以下兩種情形(8)其他參數值變化對模型二的影響與對模型一的影響是相同的,只是兩個模型本身達到的穩定狀態不同,故在此不再贅述,只討論新引入參數K的變化。:
情形七:K=3,其余變量為設定值,如圖9所示。

圖9 情形七的ESS分析
情形八:K=7,其余變量為設定值,如圖10所示。

圖10 情形八的ESS分析
從圖9和圖10可知,懲罰機制下,群體A和B均朝著合作概率為100%的方向演化。合作意愿不斷增強的結果是兩個群體均選擇合作,演化穩定策略實現時的均衡點是(1,1),與表5中的理論結果一致。同時,K的大小,即懲罰力度的大小會影響該系統趨向穩定策略的速度。懲罰力度越大,群體A和B達到演化穩定策略的速度越快,自我防護越快,越能盡早形成全民抗疫的場景。
新冠肺炎疫情是典型的公共衛生危機,本文以此為場景,在群體異質性、“搭便車”和沖突成本等假設前提下,建立新冠肺炎疫情期間公眾合作行為的二維演化博弈模型。演化博弈模型是一場在有限理性假設下的重復博弈,比傳統博弈下的完全理性經濟人更貼近現實,更能反映動態演變過程并克服靜態博弈的局限。此外,該模型適用于研究群體行為,可以容納個別參與者的行為突變及選擇時形成的路徑依賴。因此,演化博弈模型更適用于研究公共危機事件下的公眾合作問題。
在5個基本假設的前提下,本文建立了國內社會環境零約束下和存在第三方懲罰機制的演化博弈模型。結果顯示,零約束時,博弈系統向一方選擇合作策略,另一方選擇非合作策略的方向發展。非合作方通過“搭便車”獲得額外收益。群體異質性程度、社會成本和“搭便車”收益等參數不會影響最終穩定策略結果,但會影響該博弈系統實現穩定的速度。異質性越強,系統就會越快實現穩定;成本越高,“搭便車”收益越高,初期的選擇概率越會發生輕微反向波動。
引入第三方懲罰機制(如城市治理和社區治理中的懲罰機制)后,有可能使博弈系統朝著雙方共同選擇合作的方向發展,但必要條件是政府的懲罰應大于公眾通過“搭便車”獲得的額外收益,并且懲罰力度的加大會促使系統更快達到穩態。雖然“搭便車”沒有根除,但它降低了群體選擇非合作策略的可能性。在嚴厲的處罰機制下,合作策略是博弈雙方的最佳選擇,穩定的舉國合作防疫模式由此形成,這是政府引導公眾合作抗疫的一種有效途徑??挂叩牧己眯Чl送的積極信號強化了公眾自覺采取防護措施,社會各界的倡導增強了公眾對合作策略的偏好,中國的抗疫過程和成果足以說明合作抗疫的有效性。
作為一場公共衛生危機,新冠肺炎疫情不僅增加了人們對病毒的認知,更推動了相關制度的建構和演化,提高了政府和民眾應對危機的能力,進而對社會產生深遠影響[5]118-123。公眾行為選擇是一個動態變化的過程,是否合作共同抗疫涉及公共秩序的恢復和重建。從個別選擇的權衡到集體行動的過程與面臨的場景直接相關,作為管理者需要關注個體行為變化的過程。在集體選擇理論中,任何經濟人的行動,只要實現了任一公共目標或滿足了任一公共利益,就已經代表他向該系統提供了一件公共物品[4]15。事實再次證明,“自愿行動尚未在任何領域成功地解決過公共產品供給不足的問題”[11]。本文據此得出以下政策啟示:
第一,公眾合作是構建人類衛生健康共同體的微觀基礎,可以通過設計合作機制促進全民抗疫。社區、小區治理的成功經驗再次證明了“集體行動的邏輯”。社區作為“小集團”,具有較強的組織集體行動的能力。特別在疫情防控的關鍵時期,中國充分調動社區力量,守住了疫情聯防聯控的第一線。此外,集團越大,越不可能增進其共同利益。因此,對于一個國家,意識形態引領、共同文化維系和法律法規制度是維護共同利益之必需。獲得公眾的持續支持和配合體現了中國的國家治理能力,最終克服了復雜外部經濟和政治環境帶來的沖擊,促進各種正式和非正式的制度安排的結合,恢復正常生產和生活秩序。2020年,中國是世界上唯一有效控制疫情并實現經濟正增長的國家,國內生產總值比上年增長2.3%(9)突破100萬億!11個數看懂2020年中國經濟[EB/OL]. (2021-01-28)[2021-04-26]. http://www.gov.cn/xinwen/2021-01/18/content_5580880.htm.。
第二,中國抗疫的舉國體制模式和效果具有國際示范效應。截至2022年3月17日,全球累計新冠肺炎確診人數已高達4.59億人,突破了公眾心理防線,多國開始反思抗疫過程。中國抗疫的結果給世界人民帶來了信心。事實證明,社區治理下的聯防聯控機制值得推廣,其可以超越國情限制,適應不同國家、民族的文化特征、價值理念和人際交往關系,形成同質但不同形式的“小集團”。中國公眾每個人的防疫行為就是一種公共物品,利我利他,利國利民。中國國內如此,國際亦是如此。每一個國家為疫情防控做出努力和成效便是為國際社會提供了一份公共物品,最終產生公共收益。當人們能在疫情防控成功的國家之間流動時,經濟交往就會被激活,有益于促進雙邊或多邊合作。這種事后收益會成為各國合作抗擊疫情的正向激勵,從而為抗疫不力的國家提供示范效應。
第三,在國際公共衛生合作中需要引入第三方機制。新冠肺炎疫情再次給人類社會敲響“警鐘”,人類已形成“一榮俱榮,一損俱損”的局面,公共利益是人類生存的基礎。中國國內第三方機制的有效介入說明,在全球性公共物品的提供上,為實現公共利益,國際社會的合作同樣需要第三方機制的參與。雖然世界上并不存在一個超越主權國家的權威機構,但是可以設想以下兩種方案減少“搭便車”行為。方案一:簽訂國際協定。受到疫情困擾的國家和地區可通過協商簽訂有約束力的國際衛生協議。為避免空洞的承諾,協議應尊重各國實情,明確各國義務和制定獎懲機制等。方案二:加強現有國際組織對國際事務的管理,間接促進抗疫合作。國際衛生組織是對國際公共衛生事件最直接的管理和執行部門,中國始終堅定地支持聯合國及世界衛生組織在完善全球公共衛生治理中發揮核心作用?!秶H衛生條例》是當發現疾病事件和應對公共衛生事件時,為國際社會更好管理集體防護措施而制定的法律框架[12]。受疫情影響的國家和地區應及時通報和共享疾病信息,聽取世界衛生組織的建議和應對指南[13]。世界衛生組織應對國家的公共衛生績效進行評估,向世界衛生大會提交關于《國際衛生條例》實施情況的年度報告并相應地報告其調查結果[12],公開為人類衛生健康共同體做出重大貢獻的國家名單。在當前世界經濟體系下,各國都重視對外貿易和援助,對因控制疫情而較快恢復經濟的國家,世界貿易組織可倡導其成員適當降低對該國產品的進口關稅,國際貨幣基金組織可考慮減輕其債務負擔或者放松貸款條件。這一機制的設立可以給控制疫情得力的國家帶來連帶收益,以此形成正向激勵。在整個過程中,國際組織應保持其客觀和公正。
第四,倡導大國責任、擔當和主動作為,補充全球公共物品。在國際合作中,大國作為集團內的“大成員”[4],更需負擔集體物品,向醫療人員、物資缺乏的國家和地區提供人道主義救助,配合世界衛生組織的行動。大國的責任、擔當和主動作為,就是公共物品。在新冠肺炎疫情蔓延最嚴峻的時刻,中國提供醫療物資和經驗,派遣專家團隊,向世界衛生組織捐款,援助對象遍布亞非國家和歐美國家。據統計,2021年中國已向154個國家和國際組織提供抗疫物資,向120多個國家和國際組織提供超過21億劑新冠病毒疫苗,并將繼續向非洲國家無償援助6億劑疫苗,向東盟國家提供1.5億劑疫苗(10)中國有力開展國際抗疫合作[EB/OL]. (2022-02-22)[2022-03-17]. http://m.ce.cn/yw/gd/202202/22/t20220222_37347019.shtml.。此外,中歐班列在2021年累計開行15 183列,其中累計運送防疫物資1 362萬件,共計10.5萬噸(11)2021年中歐班列開行再創佳績成為暢通亞歐供應鏈的一條大通道[EB/OL]. (2022-02-21)[2022-03-17]. https://www.ndrc.gov.cn/fzggw/jgsj/zys/sjdt/202202/t20220221_1316067.html?code=& state=123.。中國一直務實有力地開展國際抗疫合作,克服“免疫鴻溝”,積極兌現將新冠病毒疫苗作為全球公共產品的承諾,肩負起“大成員”的擔當,中國倡議、中國方案和中國實踐都在表明中國對人類命運共同體的深刻理解和執行。
同應對氣候風險一樣,應對全球公共衛生危機事件也是為人類共同利益服務,需要公眾之間、國家之間團結合作,使集體利益成為參與者行為的標準?!叭祟愋l生健康共同體”是所有人的健康利益訴求,是構建人類命運共同體的基礎。促進合作,傳播中國經驗,盡快幫助其他國家恢復生活秩序和生產秩序,將是中國為人類衛生健康共同體建設做出的重要貢獻。