最大化“無廢城市”次第推進的績效：基于“地方—中央”演化博弈模型的推進策略研究

2022-08-30 07:14:18李玉爽劉麗麗李金惠

中國環境管理 2022年4期

李玉爽，劉麗麗，李金惠

（清華大學環境學院，北京 100083）

引言

“無廢城市”建設作為系統解決固體廢物污染問題的綜合途徑，是推動城市綠色低碳發展的有效載體，是打好污染防治攻堅戰和實現碳達峰、碳中和的內在要求，也是深入貫徹落實習近平生態文明思想的重要舉措[1]。自2018 年年底開展“無廢城市”建設試點以來，我國在農業、工業、生活領域的固體廢物源頭減量、循環利用、風險控制等方面都取得了積極進展，并在增強全民綠色生活和綠色消費理念，推進固體廢物治理體系和治理能力現代化，統籌區域管理促進各項措施協同增效等方面積累了豐富的經驗[2]。根據中共中央、國務院《關于深入打好污染防治攻堅戰的意見》，“十四五”時期，我國將繼續推進100 個左右地級及以上城市開展“無廢城市”建設，鼓勵有條件的省份全域推進“無廢城市”建設[3]。因此，在今后很長一段時間內，持續推進“無廢城市”建設將是我國環境保護領域的一項重要工作。研究如何充分發揮城市自主建設的積極性，以及最大化中央在次第推進過程中的績效產出，對于高質量推進“無廢城市”建設和快速形成“無廢社會”，具有重要意義。

現階段，國內對“無廢城市”的研究主要是基于我國當前“無廢城市”的建設現狀，集中于經驗借鑒[4,5]、技術應用[6]、模式探討[7]、協同推進[8]、成效評價[9]、政策建議[10,11]等方面，而國際上對“無廢城市”的研究主要是從“零廢棄”的角度，探索城市生活垃圾減量化、資源化、無害化的技術和方法[12,13]，以及相關管理經驗介紹和成效量化研究[14-18]。鮮少從成本—效益的角度，研究中央和地方的階段性次第推進策略。

演化博弈論（Evolutionary Game Theory）是博弈理論與動態演化過程的完美結合。不同于經典博弈論需要假設博弈雙方具有完全理性，該理論承認博弈過程中雙方的有限理性和不完全信息狀態[19,20]。區別于經典博弈論中的靜態納什均衡，演化博弈論追求的是演化穩定策略（Evolutionary Stable Strategy，ESS），即博弈雙方基于對方行為不斷進行策略調整，最終實現動態平衡[21,22]。20 世紀70 年代以后，演化博弈論已廣泛應用于社會、經濟、人類行為等問題的理論研究和應用分析[23]。

近年來，演化博弈論在環境管理與環境政策領域也得到了廣泛的應用。潘峰等[24]從演化博弈論的研究視角，探討了政府與企業的決策演化過程，從而為促進地方政府環境規制的嚴格執行提出了政策建議。徐莉婷和葉春明[25]基于演化博弈論，研究了企業、政府、公眾在霧霾協同治理方面的作用，得出政府的行為在影響三方決策中起到決定性作用的結論。Liu等[26]通過構建電子垃圾回收系統的隨機演化博弈模型，研究政府與回收者之間博弈互動過程中的演化穩定策略，并據此提出促進電子垃圾回收的有效管理建議。Shen 等[27]建立了太湖流域地方政府與污染企業之間的演化博弈模型，研究了流域生態補償的決策行為和影響因素，為地方政府建立包括污染企業在內的可持續流域生態補償機制提供建議。Xu 等[28]通過研究政府共同監管下內河航運污染治理演化博弈，提出了上下游政府和航運公司的最優演化穩定策略，并指出了相關影響因素。

在我國次第推進“無廢城市”建設過程中，首先由中央提出建設“無廢城市”的號召，地方基于其建設“無廢城市”的成本收益作出是否建設的決定；然后中央根據地方的建設效果和響應情況，采取下一階段的鼓勵措施；地方根據中央的鼓勵措施調整決策，中央再根據地方的決策做出鼓勵措施調整；如此往復，中央與地方之間形成演化博弈。本研究應用演化博弈理論，在充分考慮中央長期發展策略的基礎上，通過成本收益量化分析，研究中央和地方的動態均衡，以期為中央制定“無廢城市”次第推進策略提供理論依據。

1 基本假設和模型建立

通常情況下，中央的鼓勵措施與地方的響應積極性是相互影響的。因此，假設在“無廢城市”次第推進過程中，中央對地方的鼓勵措施會隨著全國“無廢城市”整體建設情況的變化而發生改變，地方是否建設“無廢城市”也會受到全國整體建設氛圍和中央鼓勵措施的影響。可理解為，在現實中中央和地方都是有限理性，很難在一次決策中做出最優策略選擇。因此，演化博弈論適用于分析在“無廢城市”次第推進過程中中央和地方的演化穩定策略。

與國外“無廢”實踐注重城市生活垃圾不同[29]，我國“無廢城市”建設涵蓋了各領域、多體系、全方位，是固體廢物環境管理在城市整體層面的綜合與深化。因此，相比于國外，我國城市（地方）在建設“無廢城市”過程中，需要投入更多成本。但是，得益于中央層面的幫扶，地方建設“無廢城市”的探索成本支出將會減少，此外，還可能會獲得中央財政補貼或其他政策優惠增加收益。從總體上看，我國在次第推進“無廢城市”過程中，中央和地方都有成本支出和收益產出。如何充分發揮中央引導性，調動地方積極性，盡快高質量地普及“無廢城市”，推動形成“無廢社會”，需要綜合考慮中央績效產出和地方成本收益，進而制定次第推進策略。

基本假設：①地方對于是否在本轄區內建設“無廢城市”有完全自主權，建設概率為x（0≤x≤1），則不建設概率為1-x；②中央通過采取鼓勵措施和不采取鼓勵措施兩種方式，對地方建設“無廢城市”產生影響，采取鼓勵措施概率為y（0≤y≤1），則不采取鼓勵措施概率為1-y；③中央和地方都是有限理性，通過強化認知，不斷改變自身策略，直至達到均衡為止。

地方成本收益包括：建設“無廢城市”的成本c1、治理固體廢物環境污染的成本（以下簡稱“地方治污成本”）c2、中央對地方建設“無廢城市”的補貼s。其中，c1指在建設“無廢城市”過程中，因構建“無廢”體系采取改革性措施而付出的成本，包括實施方案的編制、“無廢”政策的制定與施行、治污技術的研究與推廣、市場活力的激發、新產業模式的培育與應用、監管方式的創新與改進、工程項目的建設與啟動等。c2指現階段大部分城市通過“收集—運輸—處置”模式，為降低固體廢物環境污染而支出的傳統治污成本，該成本隨著廢物數量增多而升高。中央的成本收益包括：支持地方建設“無廢城市”的財政支出a、中央治理固體廢物環境污染和打擊環境犯罪等方面的投入（簡稱“中央治污成本”）b、因地方建設“無廢城市”而給中央節省的治污成本r。

地方是否建設“無廢城市”和中央是否采取鼓勵措施之間的博弈成本收益情況分析如下（收益矩陣見表1）：

表1 中央與地方的收益矩陣

（1）當中央采取鼓勵措施，地方決定建設“無廢城市”：地方的支出成本是建設“無廢城市”的成本c1，收益是來自中央的補貼s；中央的支出成本是支持地方建設“無廢城市”的財政支出a，收益是因地方建設“無廢城市”而節省的治污成本r。

（2）當中央采取鼓勵措施，地方決定不建設“無廢城市”：地方的支出成本是治污成本c2，無收益；中央的支出成本是支持地方建設“無廢城市”的財政支出a，以及中央治污成本b。由于地方不建設“無廢城市”，因此中央未能從地方建設“無廢城市”中獲益。

（3）當中央不采取鼓勵措施，地方決定建設“無廢城市”：地方的支出成本是建設“無廢城市”的成本c1，無收益；中央的支出成本是治污成本b，收益是因地方建設“無廢城市”而節省的治污成本r。

（4）當中央不采取鼓勵措施，地方決定不建設“無廢城市”：地方的支出成本為治污成本c2，無收益；中央的支出成本為治污成本b，無收益。

2 演化博弈分析

2.1 建立復制動態方程和模型求解

分別計算地方是否建設“無廢城市”和中央是否采取鼓勵措施的期望收益，得出地方和中央的平均期望收益，然后通過建立復制動態方程，求解特定時間內的收益函數，從而分別獲取地方和中央的演化穩定策略。

2.1.1 地方的復制動態方程和模型求解

地方建設“無廢城市”的期望收益為：

地方不建設“無廢城市”的期望收益為：

平均期望收益為：

地方建設“無廢城市”的收益是時間的函數，其收益增長率等于特定時間內的期望收益減去平均收益，整理得到復制動態方程：

根據式（4）得出，當x=0 或x=1 或時，F(x)=0，即復制動態穩定。其中y*是指地方建設“無廢城市”的概率。

2.1.2 中央的復制動態方程和模型求解

采取鼓勵措施的期望收益為：

不采取鼓勵措施的期望收益為：

平均期望收益為：

中央采取鼓勵措施的收益是時間的函數，其收益增長率等于特定時間內的期望收益減去平均收益，整理得到復制動態方程：

根據式（8）得出，當y=0 或y=1 或時，G(y)=0，即復制動態穩定。其中x*是指中央采取鼓勵措施的概率。

2.2 演化穩定策略分析

2.2.1 地方的演化穩定策略分析

根據微分方程的穩定性定理及演化穩定策略的性質[30,31]，當F(x)=0 且F′(x)＜0 時，對應的x為演化穩定策略。

此時，若y=則F(x)始終為0，意味著所有的x都是穩定狀態。若y≠y*，則x=0和x=1 是兩個穩定態。當y＞y*時，F′(0)＞0，F′(1)＜0，則x=1 是演化穩定策略，即地方傾向于建設“無廢城市”；當y＜y*時，F′(0)＜0，F′(1)＞0，則x=0是演化穩定策略，即地方傾向于不建設“無廢城市”。

當C C1≥2時，地方的群體復制動態相位如圖1 所示，其中，t是時間，是“無廢城市”數量的動態變化速度，ESS 是指演化穩定策略。

圖1 地方建設“無廢城市”的復制動態相位

但是，當y*＜0 時，即C1＜C2，則y＞y*始終成立，意味著當“無廢城市”建設成本小于治污成本時，在長期演化中，地方將傾向于建設“無廢城市”；當y*＞1 時，即C1-S＞C2，則y＜y*始終成立，意味著在扣去中央補貼后建設“無廢城市”的成本仍大于治污成本時，在長期演化中，地方將傾向于不建設“無廢城市”。地方演化穩定策略見表2。

表2 地方的演化穩定策略

2.2.2 中央的演化穩定策略分析

根據微分方程的穩定性定理及演化穩定策略的性質，當G(y)=0 且G′(y)＜0 時，對應的y為演化穩定策略。

此時，若x=x*=（a≤b），則G(y)始終為0，意味著所有的y都是穩定狀態。若x≠x*，則x=0 和x=1 是兩個穩定態。當x＞x*時，G′(0)＞0，G′(1)＜0，則y=1 是演化穩定策略，即在長期演化中，中央傾向于采取鼓勵措施；當x＜x*時，G′(0)＜0，G′(1)＞0，則y=0 是演化穩定策略，即在長期演化中，中央傾向于不采取鼓勵措施。

當a≤b時，中央采取政策措施的復制動態相位如圖2 所示，其中，t是時間，是中央采取政策措施強度的變化速度，ESS 是指演化穩定策略。

圖2 中央采取鼓勵措施的復制動態相位

若a＞b，即恒成立，也就意味著y=0 是演化穩定策略。中央演化穩定策略見表3。

表3 中央的演化穩定策略

2.3 演化結果分析

在情形1 中，地方建設“無廢城市”成本高，中央治污成本高，則中央和地方不存在演化穩定策略，博弈雙方的選擇具有相互依賴性，見圖3（a）。在情形2 中，地方建設“無廢城市”成本高，中央治污成本低，則中央存在唯一的演化穩定策略，即不采取鼓勵措施，而地方沒有唯一的演化穩定策略，見圖3（b）。在情形3 中，地方建設“無廢城市”成本低，中央治污成本高，則中央沒有唯一的演化穩定策略，而地方存在唯一的演化穩定策略，即建設“無廢城市”，見圖3（c）。在情形4 中，地方建設“無廢城市”成本低，中央治污成本低，則地方和中央在進行博弈過程中，存在唯一的演化穩定策略，即地方建設“無廢城市”，中央不采取鼓勵措施，見圖3（d）。

由于建設“無廢城市”對于可持續發展具有重要意義，且“無廢城市”的遠期經濟、社會、環境效益突出，中央并不會因為初期成本高而放棄推進“無廢城市”建設。因此，采取鼓勵措施將是其唯一演化穩定策略，與此同時，中央也希望地方將建設“無廢城市”作為其演化穩定策略。從圖3 可以看出（綠色箭頭代表演化趨勢），兩種情況下，地方傾向于建設“無廢城市”：一是，根據情形1 和情形2，當y＞y*時，即中央采取較為有力的鼓勵措施；二是，根據情形3 和情形4，當C1＜C2時，即地方治污成本大于建設“無廢城市”的成本。

圖3 不同情形下的演化相位

3 結果討論

3.1 地方策略的演化結果討論

從上述演化結果中可以看出，地方是否建設“無廢城市”主要取決于治污成本與建設成本的相對大小。當治污成本較高時，地方趨向于建設“無廢城市”；當治污成本較低時，地方趨向于維持現狀。若中央欲打破這種現狀，則需要采取措施，以抵消治污成本與建設成本之間的差額，或者直接予以經濟補貼，或采取其他行政鼓勵措施。因此，在兩種情況下地方能充分發揮自主建設的積極性，一是地方的固體廢物對該城市的發展造成了嚴重的影響，或地方的環境標準要求高，致使其治污成本高；二是中央出臺積極有效的鼓勵措施，引導地方開展建設。

表4 不同情形下的演化穩定結果

地方建設“無廢城市”的成本包含了“無廢”體系構建過程中的很多探索性成本，而治污成本主要與當地的固體廢物數量和種類有關。從時間上講，探索性成本可以通過借鑒其他城市的建設經驗而降低，但治污成本通常會隨著經濟社會發展而升高。這主要是由于在經濟社會發展過程中，固體廢物的產生量、產生強度、種類復雜程度都會有所增加，但是環境容量、處理處置標準、風險防控要求卻越來越嚴格，污染治理慢慢從末端處置發展為全面風險防控。因此，地方的“無廢城市”建設成本與治污成本在某一時間T0會出現相等的情況（圖4）。從成本效益角度，T0是地方是否建設“無廢城市”的意愿分界點。

圖4 地方的治污成本與“無廢城市”建設成本變化示意

在T＜T0階段，地方的“無廢城市”建設成本大于治污成本，中央需要采取有力的鼓勵措施，幫助地方抵消兩種成本之間的差額，才能調動地方的積極性；在T＞T0階段，地方的“無廢城市”建設成本小于治污成本，地方將會積極建設“無廢城市”。

3.2 中央策略的演化結果討論

根據演化結果，有兩個階段，即“無廢城市”建設初期和“無廢城市”次第推進后期，中央傾向于不采取鼓勵措施。這兩個時期，中央的建設成本高于治污成本。這主要是由于初期需要根據各地的具體情況，投入大量的資金進行實地調研、專家幫扶、方案可行性論證、項目建設、成效評估，“無廢城市”的建設成本過高；而后期固體廢物治理體系和治理能力已大幅提升，固體廢物環境污染已經不再是影響我國經濟社會可持續發展的重要問題，中央在污染治理和打擊非法處置方面的成本較低。從成本效益角度，這兩個時期建設“無廢城市”的績效產出較小，甚至為負。因此，在初期，中央需要以試點的形式，小范圍開展探索性工作；在后期，中央不再采取高強度的鼓勵措施，而是以提標、督促、打擊為主。

從當前中央在“無廢城市”方面的政策可以看出，中央暫不考慮成本收益的平衡，而是將鼓勵地方建設“無廢城市”作為中長期的一項穩定策略。為了實現此策略的績效最大化，中央希望最大化地方因建設“無廢城市”而節省的中央治污成本r，從而平衡“無廢城市”建設的財政支出與往年的污染治理成本。因此，中央會加強宣傳引導，強化可復制可推廣經驗的總結和運用。此外，還可能轉變開展模式，由現階段的“地方自主申報、中央機構幫扶”轉變為“各省（區、市）自主開展，幫扶模式多層級且多元化”，在降低成本支出的同時提升總體收益。

4 政策建議

4.1 平衡地方成本收益，調動城市自主建設積極性

“11+5”個試點在全國300 多個地級市中，所占的比例很小，而且這些試點得到了國家各部委和專家組的大力幫扶，探索性成本支出相對較小。其他地方對于其自主建設“無廢城市”的治污效果、成本支出、收益大小、可持續性等方面尚存疑慮，若無適當的鼓勵措施，部分地方的建設可能會流于形式。因此，建議中央或通過財政補貼、稅收優惠、資金專項等經濟措施，平衡地方“無廢城市”建設成本與治污成本，或采取評比表彰的行政措施，提升“無廢城市”的榮譽感，促使地方積極投入建設中。

4.2 選取恰當城市優先開展，確保整體績效最大化

從成本收益的角度，“無廢城市”建設成本低于治污成本的城市，即經濟社會發展水平達到一定程度之后的城市，更容易發揮其自主建設的積極性。“十四五”時期優先選取該類城市開展“無廢城市”建設，不僅能夠為中央節省大量的財政支出，而且不會對當地造成較大的財政負擔，同時還可以契合當地的需求，切實解決經濟社會發展過程中面臨的環境問題，從而在績效最大化的基礎上，提升建設效果。此外，該類城市的發展先于其他城市，其建設程序和路徑，以及形成的制度、技術、市場、監管、工程經驗，對其他地區具有示范和參考作用。

4.3 分階段采取推進措施，提升全過程績效產出

在次第推進初期，探索性成本較高，建議中央以總結經驗、宣傳交流、示范引導為主，將各地“無廢城市”建設成效與治污成本節約、碳減排效益、生態文明建設、治理體系和治理能力的現代化水平提升等相關聯，充分體現“無廢城市”建設帶來的各項收益。在次第推進中期，建設“無廢城市”的氛圍基本形成，地方建設的積極性較高，建議中央采取正向激勵與反向督促相結合的措施，一方面給予“無廢城市”建設適當的表彰或獎勵，另一方面提升處理處置標準和強化全過程風險防控。在次第推進后期，“無廢”體系基本形成，政策、市場、技術、監管、工程等形成合力，建議中央采取嚴厲的督促措施，例如將“無廢城市”建設的相關情況納入績效考核或作為中央環保督查要點、以年度檢查的方式進行規范化考核、強化排污稅費改革和排污權交易等，倒逼城市轉變治污模式。

4.4 推行多樣化的開展模式，優化中央財政支出

當前，多個省份已自主開展省域“無廢城市”建設，不僅降低了中央的成本支出，而且擴大了資源整合范圍，對于“無廢城市”建設的高質量快速推進具有積極意義。建議中央下一階段將組織模式由“地方自主申報，中央機構幫扶”轉變為“各省（區、市）自主開展，中央多層次多元化幫扶”，即各省（區、市）自主組織轄區內的地市推進“無廢城市”建設，中央組織專家直接從省級層面進行幫扶，或從省級層面組織經驗交流，從而針對各省份的實際難題和共性問題，進行重點突破和系統研究。同時，強化建設過程中的區域協同增效，不斷擴大統籌推進范圍，最終實現全國一盤棋，形成“無廢社會”。