李云燕,代 建,盛 清
(北京工業大學經濟與管理學院,北京 100124)
隨著我國自然資源消耗量的增加,環境污染問題頻發,且呈現出區域性發展的態勢,因大氣污染的空間溢出性[1],相鄰區域以合作的方式共同治理污染取得顯著成效。聯防聯控作為一種長效機制,在統籌區域各地政府治理能力方面至關重要。目前對環境問題聯防聯控的研究不僅從地區總體的環境問題出發,更是在大氣污染、水流域污染以及海洋污染等各個方面細致分析,探討政府合作方式與政策改進,以取得更好的治污效果。例如,胡志高等[2]、薛儉等[3]、Wang 等[4]、Song 等[5]針對大氣污染角度的區域聯合治理,分別從環境規制、影響因素、博弈關系、污染特征數據分析以及聯合治理區域的擴大等角度進行了研究;陳健鵬[6]則探討了我國水流域污染的聯防聯控與相關監管體制的必要性;凌欣[7]針對局部海洋污染的問題提出了聯防聯控制度的相關建議。首先,大氣污染空間外溢性與區域擴散性較強,嚴重危害生態環境、工農業發展以及人類健康,聯防聯控在為各地政府節約治理成本的同時,可縮小區域內部治理效率差距,提升大氣污染排放效率[8],更是有效解決各自為政的屬地治理效率低下的關鍵;其次,大氣污染聯防聯控方式的有效設立,需要高層面的法律政策制定[9],以及國外區域或州際合作經驗的借鑒[10],更需要平衡各個區域政府間達成聯防聯控策略的利益獲得與成本付出。因此,設立有效的生態補償機制是地方政府積極實行大氣污染聯防聯控策略的保障[11]。經濟補償作為利益協調的驅動力,可有效彌補管理無效率以及部分主體經濟受損的局面,破除大氣污染聯防聯控的阻礙。落實中央政府的生態補償機制是順利解決京津冀區域污染治理與經濟發展雙贏難題的有利途徑,進而保障區域大氣污染聯防聯控的有效施行。
演化博弈作為一種分析主體策略演化趨勢的有效方法,被廣泛應用于多個方面,涉及主體的穩定狀態。如宋妍等[12]分析了地方政府異質性與區域環境合作治理之間的主體演化博弈關系;初釗鵬等[13]、Sheng 等[14]運用演化博弈模型對環境監管與規制政策的建立進行了研究;張化楠等[15]對流域生態補償的生態功能區與經濟發展區間關系進行了博弈均衡分析。因此,利用演化博弈的理論方法分析區域大氣污染聯防聯控生態補償機制,將對大氣污染生態補償政策與聯防聯控的實行提供更有力的決策支撐。系統動力學(system dynamics,SD)作為一種復雜系統信息因果反饋的動態仿真方法[16],通過模擬不同主體行為的策略選擇趨勢,有效進行不完全信息下系統未來發展的多種情況預測,在相關領域也被用來與演化博弈模型相結合進行現實問題的深入探討與仿真分析,如Tian 等[17]建立了一個SD 模型指導補貼政策以促進綠色供應鏈管理(GSCM)在我國的傳播,并運用演化博弈理論分析了政府、企業和消費者等利益相關者之間的關系;Yuan 等[18]針對跨界流域內的水資源分配共享問題,構建演化博弈和SD 模型來預測不同戰略情景的結果,確定了3 種不同的進化均衡策略;You 等[19]、Ma 等[20]和Liu 等[21]分別從煤礦企業安全監管的不同利益主體出發,結合系統動力學和演化博弈模型模擬了企業內部、外部煤礦檢查措施以及實施不同處罰策略的效果;Zhang 等[22]建立了政府與制造商之間的演化博弈模型,研究了靜態和動態碳交易價格兩種情景下政府政策對碳交易市場的影響,通過SD 仿真發現動態碳交易定價政策可有效加速碳減排;Zhu 等[23]研究了我國可再生能源組合標準(RPS)對零售電力市場的影響,運用三方演化博弈的SD 模型來分析能源監管機構和不同售電公司的策略交互并模擬了相應的演化過程。
基于此,為了討論中央政府的補償對區域地方政府大氣污染聯防聯控策略的影響,本研究采用演化博弈的方法構建中央政府與京津冀地方政府兩大主體的博弈矩陣,在不同的參數條件下探討兩方的策略選擇與演化方向,進而以京津冀地區為例,采用中央政府財政對該地區大氣污染治理補償金額進行SD 仿真分析,驗證博弈結果的準確性,為區域大氣污染聯防聯控的推進提供策略建議。
根據我國區域大氣污染聯防聯控與中央政府的生態補償現狀,博弈的主體為中央政府與省區市地方政府,中央政府在生態補償機制方面主要分為補償和不補償兩個策略,地方政府有不執行聯防聯控策略與執行聯防聯控策略。在此,兩方主體都是有限理性決策者。
假設1:在地方政府選擇執行大氣污染聯防聯控策略時,中央政府所獲得的效益為E1;在區域地方政府選擇不執行大氣污染聯防聯控策略時,設中央政府所獲得的綜合經濟效益為E2。地方政府達成大氣污染聯防聯控的模式,在這種情況下,空氣質量明顯改善,由不同區域共同治理取得更好的環境質量,中央政府獲得的總體環境效益就會加大,因此E1>E2。
假設2:地方政府選擇執行大氣污染聯防聯控策略時,所獲得的環境效益為W1;地方政府選擇不執行大氣污染聯防聯控策略時,所獲得的環境效益為W2。因大氣污染具有外溢性、擴散性等特點,不同區域政府對大氣污染聯防聯控,則取得的效果更好,有效預防部分地方的企業和政府“搭便車”的行為,可以使地方政府獲得更多的環境效益,環境治理進展有效得到推進,因此W1>W2。
假設3:中央政府在區域地方政府選擇執行與不執行大氣污染聯防聯控策略時的補償存在差異,分別為P1與P2。區域地方政府對于大氣污染的治理,在選擇聯合與不聯合的情況下帶來的環境效益不同,因此,中央政府根據不同的檢查標準,針對機會成本、治理效果,在兩種不同策略下選擇不同的補償效益,并滿足條件P1>P2。當地方政府選擇執行大氣污染聯防聯控策略時,區域大氣污染執行聯防聯控策略的機會成本為K1。
假設4:中央政府選擇對地方政府的大氣污染治理進行生態補償時,所花費的執行成本為C1,包括人工成本、檢測大氣質量效果成本等。在這項成本中,中央政府除了花費人力、物力達到公平的補償效果外,還可以達到監管區域地方政府是否執行聯防聯控政策的作用,因為在生態補償過程中,中央政府對地方政府執行與不執行大氣污染聯防聯控政策時的補償效益不同,所以通過花費C1的執行成本進行監測,同時也達到監管的效果。但是當中央政府綜合各種因素選擇對大氣污染治理采取不補償政策時,監管地方政府對大氣污染聯防聯控政策的執行情況就要花費專門的監管成本C2,以達到對政策執行情況監管的目的。
假設5:中央政府對地方政府選擇不執行大氣污染聯防聯控策略時進行的處罰為K2,處罰是建立在監管成功的基礎上,所以存在一個成功的概率問題。中央政府采取生態補償機制時,對區域地方政府不執行聯防聯控策略監管成功的概率為α,且0<α<1;中央政府選擇不補償策略時,對地方政府單獨監管成功的概率為θ,且滿足0<θ<1。
根據區域大氣污染聯防聯控補償機制主體利益的綜合分析及以上參數設置,得到中央政府與地方政府即參與者的博弈支付矩陣,如表1 所示。

表1 區域大氣污染聯防聯控政府生態補償博弈支付矩陣
因中央政府和地方政府可能會選擇不同策略,設地方政府選擇大氣污染聯防聯控的概率為x且0<x<1,選擇不聯防聯控的概率為1-x;中央政府選擇生態補償機制的概率為y 且0<y<1,選擇不補償的概率為1-y,則地方政府采取與不采取聯防聯控策略時的期望收益的計算公式分別如式(1)和(2)所示:

則,地方政府平均收益的計算公式如式(3)所示:

中央政府選擇生態補償和選擇不補償時,期望收益的計算公式分別如式(4)和(5)所示:

則,中央政府平均收益的計算公式如式(6)所示:

分別對兩類群體博弈進行復制動態分析,得到地方政府的復制動態方程如式(7)所示:

中央政府的復制動態方程如式(8)所示:

通過雅可比矩陣計算行列式值的符號與跡的符號,來判斷各個平衡點是否為穩定點。令,則雅可比矩陣可表示為:

采用Vensim PLE 軟件建立區域大氣污染聯防聯控機制下的中央政府財政補償機構與地方政府間博弈的SD 模型,如圖1 所示。該模型包含多個存變量要素,存在4 個水平變量、2 個速率變量、4個輔助變量以及12 個常量,并對Vensim PLE 軟件仿真的初始參數進行相關設置:INITIAL TIME=0;FINAL TIME=5;TIME STEP=0.015 625;Units for Time=Year。

圖1 區域大氣污染聯防聯控政府生態補償博弈因果關系
若演化博弈的均衡點滿足Det(J)>0 且Tr(J)<0,則該均衡點是演化穩定策略,對應的平衡點為穩定點。本研究模型中,假定所涉及的參數均大于0,根據系統ESS 的判定條件,中央政府和地方政府大氣污染聯防聯控的演化博弈需討論以下4 種情況:具體計算結果及分析如下,可知相關的成本參數、處罰參數和地方政府的環境收益都影響著最終系統的演化結果。

表2 區域大氣污染聯防聯控政府生態補償博弈系統局部穩定性分析(情形1)

圖2 區域大氣污染聯防聯控政府生態補償博弈系統演化相位(情形1)

圖3 區域大氣污染聯防聯控政府生態補償博弈系統演化相位(情形2)

表3 區域大氣污染聯防聯控政府生態補償博弈系統局部穩定性分析(情形2)

表4 區域大氣污染聯防聯控政府生態補償博弈系統局部穩定性分析(情形3)

表5 區域大氣污染聯防聯控政府生態補償博弈系統局部穩定性分析(情形4)

圖4 區域大氣污染聯防聯控政府生態補償博弈系統演化相位(情形4)
自2013 年以來,中央政府對京津冀地區大氣污染治理的生態補償一直在進行中。為響應《國務院關于印發大氣污染防治行動計劃的通知》,財政部建立了大氣污染防控治理專項資金,以“以獎代補”的形式發放生態補償資金,實現有限污染治理資金的合理配置。2013 年年末,財政部對京津冀及周邊地區按PM2.5 濃度下降比例、污染治理投入與預期污染物減排量等標準,分配了50 億元用于大氣污染治理[24],在當年度結束后,將對治理工作實施績效考查,根據區域治理成效進行補償資金核算。專項資金的設立為京津冀大氣污染治理起到了很好的帶頭作用,2014 年中央對京津冀地區投入大氣污染防治專項資金較2013 年的數額增加近一倍[25]。到2019 年,以京津冀為重點,為支持京津冀及周邊、珠三角、長三角等地區的大氣污染治理防控工作,財政部分配的大氣污染防治資金達250 億元,比2018 年增加25%[26]。中央政府對京津冀大氣污染治理的補償工作與績效考核逐漸條理化,平衡京津冀地區利益的差異,打破聯防聯控工作的障礙,對該項工作的開展提供了便利。
2013 年,京津冀大氣污染聯防聯控工作處于前期階段,尚未成熟,基本屬于一種屬地治理階段,所以本研究選取2013 年中央政府用于京津冀大氣污染治理專項資金為演化博弈模型中參數的值。經過4 年的有效規劃,京津冀聯防聯控工作逐漸完善,以此為過渡期,因此將2017 年中央政府用于京津冀的大氣污染治理專項資金為演化博弈模型中參數的值進行仿真。在2013 年年末,中央政府分配于京津冀大氣污染治理的專項資金約為26.80 億元[27],2017 年中央政府分配于京津冀大氣污染治理的專項資金約為91.42 億元[28],因此仿真博弈模型中的參數設為P1=91.42,P2=26.80。
將京津冀地區獲得的大氣污染專項資金獎勵作為中央政府對該地區大氣污染治理的生態補償資金,以此對不同初始策略條件下演化博弈模型結果用MATLAB 軟件進行仿真分析,如圖5 所示。

圖5 中央與京津冀地方政府大氣污染聯防聯控生態補償博弈動態仿真趨勢
考慮大氣污染聯防聯控與補償政策實施的現狀,在x、y兩個參數不同初始條件下的變化趨勢綜合仿真的基礎上,進一步運用系統動力學模型模擬各獨立參數對演化主體決策的影響,進而梳理各參數的變化,以促進系統向點(1,1)演化。在此選取主要參數P1、P2、K1、K2、C1、C2進行反饋回路的DYNAMO 仿真,以滿足W2-W1+K1-αK2<P1-P2且P1+C1-C2<0 條件的初始值設置初始參數大小。參考多次仿真演化趨勢的收斂性,為了直觀地模擬實驗效果,在確保試驗數據走勢穩定的情況下,默認選取INITIAL TIME=0,FINAL TIME=1,TIME STEP=0.015 625。
(1)如圖6(a)所示,當P1的數值增加時,地方政府在靜態支付矩陣下達到博弈穩定狀態時進行聯防聯控策略的概率就會加大。由圖6(b)可知,隨著P1的增大,中央政府采取補償策略的概率會減小,在達到一定的數值時,中央政府由于采取補償策略成本過大,會考慮放棄補償政策的實施。

圖6 生態補償金額P1 變化下中央和京津冀地方政府策略選擇演化
(2)為了直觀地觀察P2變化對地方政府和中央政府選擇不執行大氣污染聯防聯控策略的影響趨勢,把系統動力學仿真的FINAL TIME 的數值增加到5。如圖7(a)所示,隨著P2增大,地方政府采取聯防聯控政策的概率逐漸減少,向1 演化的趨勢逐漸緩慢;當P2過大時,即地方政府不采取聯防聯控政策得到的補償金額更多,則地方政府就會放棄進行協同聯防聯控的策略,同時在其他因素約束下出現波動變化的趨勢,系統難以達到穩定狀態。

圖7 生態補償金額P2 變化下中央和京津冀地方政府策略選擇演化
(3)由于受K1的影響,地方政府實施聯防聯控的比率會相應下降,趨向于穩定狀態演化趨勢減緩,在成本過高的情況下,為獲得最佳的綜合社會效益,地方政府則會放棄聯防聯控的政策實施,如圖8(a)所示;而對于中央政府來說,為促進地方政府進行聯合控制環境污染,則會進一步加大補償,因此,如圖8(b)所示,在聯合治理成本過高的情況下,加速了中央政府選擇作出補償,K1值增加,中央政府更快地到達補償選擇的穩定均衡狀態。

圖8 大氣污染聯防聯控成本K1 變化下中央和京津冀地方政府策略選擇演化
(4)處罰政策為各主體有效把握整體系統運行起到關鍵作用。如圖9 所示,當中央政府加大處罰的力度,京津冀地方政府會積極實行聯防聯控政策,中央政府趨向于實施補償政策的趨勢會適當減緩。

圖9 處罰力度K2 變化下中央和京津冀地方政府策略選擇演化
(5)如圖10 所示,隨著執行補償成本的加大,中央政府會選擇放棄采取補償政策;當執行補償成本增加過大,中央政府不作補償趨勢的演化更快,進而影響地方政府實行聯防聯控的積極性,減緩地方政府聯防聯控穩定狀態的實現。

圖10 生態補償執行成本C1 變化下中央和京津冀地方政府策略選擇演化
(6)如果中央政府不采取補償政策,則不會在補償實施的過程中達到監管地方政府的效果,當單獨監管要花費的成本增加、費用過高時,中央政府則會選擇采取補償政策、放棄單獨監管,在補償過程中達到監管效果,如圖11(b)所示。同時,加快補償政策的實施,有效促進京津冀地方政府大氣污染聯防聯控的執行,如圖11(a)所示。

圖11 監管成本C2 變化下中央和京津冀地方政府策略選擇演化
(1)對于中央政府而言,(聯防聯控,不補償)是最優的策略,但為加強地方政府對大氣污染治理的重視以及實施聯防聯控政策解決大氣污染問題,在爭取利益最大化的同時,實行有效的生態補償機制尤為必要。
(2)中央政府要加大地方政府在實行與不實行大氣污染聯防聯控政策兩種選擇下補償金額的差異,增加地方政府實行聯防聯控的生態補償利益,減少地方政府不必要的執行成本,協調中央財政補償專項資金的支出。
(3)區域大氣污染生態補償的參與主體較多,中央政府往往面臨補償專項資金短缺的問題,為了促進生態補償政策的順利實施,中央政府在生態補償過程中的監管尤為重要,不僅有助于提高監管成功的概率,而且比不提供生態補償時單獨施行監管措施更有意義,使得中央政府在節約生態補償成本的同時提高了大氣污染聯防聯控整體的工作效率;同時,對不執行聯防聯控政策及污染治理行動延緩的地方政府作出相應的處罰,使中央財政專項補償金的使用更加公平有效,達到環境治理效益最大化與節約治理大氣污染總成本的效果。
(4)從京津冀地區實例可知,現今中國大氣污染生態補償機制尚未達到成熟階段,要進一步完善生態補償機制應從不同區域的大氣污染物來源出發,建立政府與市場化相結合的生態補償方式。對于中央政府的大氣污染生態補償專項資金缺乏、不能及時響應聯防聯控政策的執行進程等問題,可拓寬資金的籌集渠道,并與綠色金融相關方式相結合,發揮個人與非政府組織的作用,同時注重排污權交易在大氣污染生態補償機制上的運用,分擔中央政府補償壓力,調動區域主體市場交易的積極性,緩解污染專項資金短缺的問題。