姜珂 游達明



摘要 近年來,以水域和大氣等為代表的跨界污染問題層出不窮,在地區之間呈現出單向或交叉的外溢性。傳統的行政手段已不是解決跨界污染問題的最為有效管理工具,急需建立一個由地方補償為主,中央財政給予支持的橫向生態補償機制來彌補跨界治理合作中部分地區的治污損失,實現區域間發展權力的平衡。本文將跨界污染視為典型的區間外溢性公共物品,構建一個由生態補償方和受償方在有限時間內存在污染越界傳輸問題的微分對策模型。考慮補償方依據受償方治污投資力度的大小決定其補償比例;探討不同決策情形下雙方反饋均衡策略、狀態變量最優軌跡及其福利水平的動態變化情況;采用討價還價模型設計出合理的福利分配機制;結合我國新安江流域生態補償試點建設的應用和數值仿真方法,驗證相關策略結果的合理性。研究發現:非合作博弈狀態下受償方的最優均衡策略對補償方的策略選擇具有重要影響;兩種決策情形下治污投資累積量的動態變化趨勢均呈現單調遞減特性,而污染物存量的最優軌跡則呈現多樣化的變動趨勢;博弈參與主體的聯合決策有助于促使雙方分得的最優福利“帕累托”最優,且該福利凈現值的大小與具體的分配協議有關。雖然科斯式的地區自愿協商策略被認為是解決跨界污染傳輸問題的有效途徑之一,但實踐中考慮到政策、信息及技術等因素的影響和制約,地區間相互獨立的策略選擇比聯合決策在實踐中更具普適性。因此,當區域間存在污染外溢時,如何有效發揮生態補償機制作為協調補償方與受償方利益平衡的手段具有重要的現實意義。
關鍵詞 區域生態補償;跨界污染;治污投資;微分對策;福利分配
中圖分類號 F276
文獻標識碼A
文章編號1002 - 2104(2019) 01 - 0135 - 09
D01:10.12062/cpre. 20180903
伴隨工業化和城市化進程的快速推進,我國在經濟社會發展等各方面取得長足進步的同時,也面臨日趨嚴重的環境污染問題,尤其以跨界(省(直轄市、自治區)、市、縣、鄉邊界)流動性為特征的污染問題愈發凸顯,在區域間呈現出單向或交叉的外溢性。由于污染流動性造成的各轄區污染排放間的相互傳輸關系,使得由環境合作引起的區域環境質量改善一般應為整個區域共享,此時一旦跨轄區污染發生外溢并存在“搭便車”行為,將會遏制地方政府治理污染的動機。從實踐來看,解決跨界污染的基本手段可以分為兩類:其一是由上級(中央)政府建立約束機制或適當干預;其二是由地區政府直接參與合作協商。但是在我國傳統的區域分權環境管理體制下,作為“經濟人”的地區政府,在權衡污染排放帶來的經濟收益和環境損失時,極易采取機會主義方式逃避本應由自身承擔的治污成本,因此傳統的行政手段也被視為導致跨界污染問題長期得不到有效解決的主要因素之一。在此背景下,2016年5月國務院辦公廳發布《關于健全生態保護補償機制的意見》,明確“誰受益、誰補償,誰保護、誰受償”的原則,加快形成受益者付費、保護者得到合理補償的運行機制。這種選擇性激勵一懲罰機制既是應對當前我國嚴峻的生態問題的一種新型解決思路,也是新常態背景下環境規制策略創新的必然要求。
1 文獻綜述
有關跨界污染治理機制和優化路徑的研究起源于公共經濟學領域的外溢性公共物品供給理論。較早地研究發現央地兩級政府政治事權分配的不同是造成環境治理結果具有顯著差異性的深層原因。Banzhaf和Chupp驗證了當公共物品供給的邊際成本越凸,中央政府對大氣治理的效果越有利于提高社會總體福利;相反,當公共物品供給的邊際成本越凹,此時地方政府治理效果越顯著。考慮到單一轄區治理成效的局限性、污染物的持續流動程度及區域間污染外溢性產生的無效率問題,跨界污染的治理權有必要從地方執行層面轉移至更高層級的政府規制,即建立一個由地方補償為主,中央財政給予支持的橫向生態激勵(補償)機制,對轄區外產生受益的支出(如治污支出等)予以相應的補償,且補償的強度取決于外部性受益的大小,涉及的環境服務具有顯著的公共物品特征。因此,生態補償機制也被認為是公共物品在空間上外溢性內部化的合適工具之一,即鼓勵受益地區與保護生態地區、補償地區與受償地區、污染下游與上游地區通過資金補給、產業轉移、水權及碳匯交易等方式建立縱向補償關系,來彌補跨區合作中部分地區的治污損失。
研究方法上,由于跨界污染的流動性、長期性及連續性,有限理性的參與主體之間僅通過一次決策很難實現博弈的特定均衡,而需通過互相作用的動態博弈才能達到最終的平衡。微分博弈將傳統博弈理論擴展到連續的時間系統內,各參與主體通過持續的博弈,力求最優化各自獨立、沖突的目標,最終獲得各自隨時間演變的策略并達到納什均衡。因此,微分博弈已成為廣泛應用于研究跨界污染控制問題的有效工具,且多數研究基于以下兩個方面進行開展:一方面,政府被認為是決策者,即直接決定轄區的產出和減排資本以獲得更低的排放,如Dockner和Long模擬了兩個相鄰國家用于跨境污染控制的簡單動態博弈,發現當兩國政府僅限于使用線性戰略時,其非合作行為可能導致兩國整體利益的共同損失。Li、Benchekrou和Martin-Herran均基于非零和動態博弈理論,發現政府間聯盟合作的治污行為比獨立行動更為緊要。前者側重探究排污權交易制度與減排投資系統之間的關系;后者則重點關注清潔技術的開發和采納問題。另一方面,作為自然資源的直接消費者和環境污染的主要生產者,也有許多研究將工業制造商納入博弈分析的框架,這些研究大多通過構建一個跨界污染的合作微分博弈模型,獲得政府和工業兩個層面同時均衡的時間一致性結果。
通過對現有文獻的回顧和梳理,可以看出有關跨界污染的優化問題已引起國內外學者的普遍關注。而基于生態補償機制的視角,將跨區污染最優控制問題納入博弈分析框架的文獻則相對匱乏。鑒于此,本文從公共經濟學的研究視角出發,構建一個由受償地區和生態補償地區在有限時間內存在污染跨界傳輸問題的博弈模型。假設補償地區依據受償地區治污投資水平決定對其進行生態補償的大小,且治污投資累積量及污染物存量均隨時間動態變化。運用微分博弈理論,研究不同決策情形下兩地區相關均衡解、狀態變量及福利水平變化情況,以期為完善現階段我國跨界污染治理中的補償機制提供相關理論基礎。2模型構建與基本假設
本文考慮在一個中央政府管轄下,存在一個作為受償方的地區i和一個作為生態補償方的地區j在有限時間內產生跨界污染傳輸問題,且雙方不存在行政隸屬關系。受償地區i通過水土保持投入、生態修護建設和投資減排項目等方式率先展開治污活動,以期降低本轄區內工業生產過程中的能源消耗和污染排放量,且其治污效果具有顯著的正效益。為方便計算,本文僅考慮地區j為地區i治污效益的受益方,而忽略其是否付出與地區同樣的治污投資,那么基于“誰受益、誰補償”的準則,此時要求地區,須提供一定的生態補償,進而激發受償地區i綠色發展的內生動力。
假設1,由于污染是生產的副產品,在給定邊際生產力和技術水平不變的條件下,假設兩相鄰地區轄區內工業企業在有限時間內的生產量Qh(t)和污染排放量qh(t)呈線性關系,即Qh=QH(qh(t))(h=i,j),兩地區可通過工業生產產生一定收益Rh(Qh)。具體地,收益函數可以通過瞬時排放量qh(t)進行表征,且其是關于qh(t)的二次遞增凸函數。借鑒Jrgensen和Zaccour,Breton等的經典模型可刻畫出污染物的瞬時排放量:
其中,收益因子ah滿足0
假設2,考慮兩地區政府均基于完全信息進行理性決策,在非合作決策情形下,地區i根據轄區質量決定其自身治污投資力度Ii(t),且這一投資力度對鄰區j具有明顯的環境正效益。類似眾多學者有關污染治理投資成本的設定,用k/2(t)/2表征t時間地區i實際治污投資成本,k>0為治污投資成本系數。那么,治污投資累積量的變化服從以下標準動態過程:
其中,ζ>0表示不變的資本折舊率;Eo≥0為初始投資存量。
假設3,不失一般性,假設補償地區j工業化程度、經濟水平及人口總量等均高于受償地區i,對環境質量的要求也較高。根據生態補償機制的要求,本文僅考慮作為補償方的地區j需要據受償方地區i治污投資力度的大小決定對其進行生態補償的比例ε(t),且滿足0≤ε(t)≤1。進一步,假設伴隨治污投資項目的推行,兩地區環境質量均獲得顯著改善,也即減排成效系數,用σh(t)表示。
假設4,本研究考慮污染物排放量具有跨地區外溢性的特征,即某一地區生產排污量會通過自然介質如水及空氣等擴散轉移至另一個行政轄區并對其環境造成一定的損害。假設非合作狀態下兩地區只能決定自身排放量的大小,而對周邊地區排放量則無法干預。那么,分別用ωjqj(t)表示qj(t)擴散至地區i造成的環境損害,ωiqi(t)為qi(t)擴散至地區j造成的環境損害,ωi和wi分別為污染排放損害擴散系數,滿足ωi>ωj>0。
假設5,記τ(t)為污染物存量,其變化過程主要依賴于兩地區污染排放的水平、治污投資累積量及自然環境對污染物的吸收能力等因素的影響,具體過程可表示為:
其中,v>0表示地區i治污投資水平對污染物存量變化的邊際貢獻率;η>0表示地區污染物自凈能力系數,即環境本身具有的污染物消解能力;計劃期初排放累積量則設為τo。
假設6,兩地區均基于完全信息進行理性決策,且在任意時刻均具有相同且為正值的貼現因子p。此外,考慮當前污染治理水平下,地區生產過程中所排放的污染物對環境功能造成各類損害,假設該損害成本是當前污染物存量的線性函數,又稱環境退化成本,用δh(t)表示。
3 模型求解與分析
3.1 Stackelberg非合作博弈
在該情形下,考慮受償地區i和補償地區j組成一個兩階段的Stackelberg非合作博弈模型,在給定競爭對手的策略下努力選擇自身最優策略,用上標D表示。
設兩地區在時間t∈[0,T]內的累積福利函數分別為vi和vi,那么各自最優決策問題分別為:
根據最優控制理論,博弈雙方福利最優值函數滿足以下Hamilton-Jacobi-Bellman-Fleming(HJB)方程:
推論1:
(1)收益因子、貼現因子及污染物自凈能力系數均正向影響博弈雙方最優瞬時排放量()0)。相反,污染排放量對各參與主體造成的單位損害越大,排污控制水平則越低()。
(2)兩地區減排成效系數()均正向影響地區i的最優治污投資努力。即如何協調上述兩個因素的共同作用,是激勵地區i主動通過加大治污投資成本來控制污染物的排放的關鍵。相反,資本折舊率、貼現因子及治污投資累積量對污染物存量的邊際貢獻率()則負向影響地區i的最優治污投資努力。
(3)生態補償比例受減排成效系數、環境退化成本、資本折舊率、治污投資累積量的邊際貢獻率及貼現因子等因素的共同影響。由0≤ε≤1,可知其隱含條件為σi(p+
將上述最優均衡策略式(10)分別代入狀態變量方程式(2)和(3),整理可得非合作博弈情形下治污投資累積量和污染物存量分別為:
推論2:
(1)治污投資累積量的穩定值均與減排成效系數正相關(),而與治污投資成本系數、治污投資累積量的邊際貢獻率、資本折舊率及貼現因子負相關(a)。而雙方污染物存量的穩定值則均與治污投資成本系數、污染物消解能力及治污投資水平邊際貢獻率正相關(),與環境退化成本負相關()。
(2)治污投資存量最優軌跡具有單調特性。由式(12)可以看出,當φD >0,治污投資累積量在有限時間內單調遞減并趨近于EDss;當φD <0,治污投資累積量隨時間單調遞增并趨近于;當中=0時,治污投資物累積量保持在EDss的水平不變。而由于同時受治污投資累積量及瞬時排放量的雙重影響,污染物存量的變化軌跡呈現多樣化趨勢。
3.2 協同合作博弈
在該情形下,假設受償地區i和補償地區j事先已“達成”有約束力的合作協議,且以長期福利凈現值總和最大化為目標,對雙方減排策略進行統一協調和優化,用上標C表示。設兩地區在時間t∈[0,T]內的累積福利函數為v,那么其最優決策問題為:
推論3:協同合作博弈情形下,作為環保受益方的地區j不需要向地區i提供污染治理補償,地區i的治污投資水平由統一決策部門根據總體收益決定。其他因素對均衡策略的影響與非合作博弈情形下類似,不再贅述。
將最優均衡策略式(19)分別代入狀態變量方程式(2)和(3),整理可得協同合作博弈情形下,治污投資累積量和污染物存量分別為:
根據標準的微分方程求解方法,解得協同合作博弈情形下采取均衡策略時的污染物存量最優軌跡為:
推論4:協同合作博弈情形下,博弈雙方的最優瞬時排放量均受到污染擴散損害擴散系數的影響。其他因素的影響與非合作博弈情形類似,不再贅述。3.3福利分配設計
為保證動態合作的貫徹始終,需要合作參與雙方均同意通過一個動態的分配方案來協調聯盟情形下的總福利水平,即在合作計劃周期內能同時實現整體理性并滿足個體理性的制度安排。因此,在協同合作決策情形下,如果受償地區i與補償地區j在事先已“達成”的協議中合理分配福利,將有機會促使博弈雙方分得的福利均高于獨立決策下各自的最優福利水平,實現雙重“帕累托”改善。已知博弈雙方所獲福利多少由其討價還價能力決定,假設協同合作博弈情形下,受償地區i所獲福利占總體福利值的比例為Ω,地區j可分得的福利比則為1一Ω,且0≤Ω≤1。因此,個體理性需滿足不等式:但均可滿足總福利實現最優目標。而只有滿足個體理性的分配機制才能確保合作的持續進行,可以說,分配機制本身并不能使合作聯盟實現帕累托改進,只是維持合作能夠持續進行的必要條件。
4 數值仿真
為驗證前文模型假設的有效性和普適性,本文結合全國首個跨省流域試點即新安江流域生態補償機制試點的現實背景,通過對外生變量進行差異化賦值,對流域上下游生態補償問題展開數值仿真分析。
新安江發源于安徽省黃山市休寧縣,地跨皖浙兩省,經黃山市街口鎮流入浙江省杭州市淳安縣境內千島湖,是浙江省最大的入境河流。進入21世紀以來,由于受新安江上游即安徽省境內來水影響,下游的千島湖水質富營養化趨勢日漸明顯。千島湖是浙江省重要的飲用水源地,也是長江三角洲地區的戰略備用水源,上游政府流域水環境污染防治工作的開展對保障千島湖的水質具有重要意義。而下游地區由于經濟及社會發展水平程度相對較高,對于水質的要求也相對高于上游,且以犧牲環境換取經濟效益的動力較小。因此,為了獲得更好的生活及生產環境,一定程度上下游政府愿意支付一定的補償費用來換取更優質的環境。2012年起,在國家財政部、環保部指導下,皖浙兩省開展了新安江流域上下游橫向生態補償兩輪試點,每輪試點為期3a,涉及上游的黃山市、宣城市績溪縣和下游的杭州市淳安縣。為便于分析,本文將受償地區i和補償地區j統稱為新安江流域上游和下游地區。
假設上游治污投資成本系數k=0.5,每單位治污投資對流域上下游環境質量帶來的改善σi和σi分別為0.4和0.7,且治污投資水平對污染物存量變化的邊際貢獻率v為0.2;鑒于下游地區經濟發展水平相對較高,其轄區企業通過生產獲得一定收益也較上游地區更高,此時ai=10和ai=15,且下游污染擴散對水域周邊地區環境造成的損害也高于上游,滿足ωi=0.6和ωj=0.3;而流域水污染對上下游環境功能造成的損失δi和δj分別為0.7和0.9;令初始治污投資和排放累積量分別為Eo= 25和τo=35;水體自凈能力η記為0.5,上下游福利分配的貼現因子ψ和ψi分別設為0.6和0.4;此外,資本折舊率毋、折舊因子p、及考察周期T各自賦值為0.2、0.2和5。將上述基準參數值代入式(10),可計算出非合作博弈情形下,最優補償比例ε達到0.62,滿足。進一步取t∈[0,T],可模擬出兩種博弈情形下上下游最優污染排放量、治污投資力度、狀態變量以及福利水平在有限時間內的變化趨勢,分別如圖1、圖2和圖3所示。
從圖1可以看出,在算例基準參數情形下,協同合作博弈下的流域上下游最優瞬時排放量均低于非合作時的排放水平。其原因在于獨立決策狀態下,若不考慮嚴苛的外部懲罰機制,每個個體理性的地區政府均選擇各自為政,并基于自身福利最大化的視角進行決策,不會因為受到另一方策略變動的影響而改變自身選擇。相反,由于污染物跨區域的擴散加大了排污量對各自福利水平的損害,促使上下游政府均開始加強重視周邊污染外溢程度對自身水域質量的影響。此外,不同決策情形下上游最優治污投資力度在經過初期較為劇烈的調整之后,均在有限時間內呈現邊際遞減的趨勢。且相較于地區聯合決策,最優治污投資力度在獨立決策時明顯較低且下降速度更快。可以說,下游地區在享有上游帶來的環境正效益的同時提供一定比例的生態補償,明顯提高了上游加大污染治理投入力度的積極性。實踐中,單項的正外部性輸出在一定時期內可以維持水域環境的穩定狀態,但隨著時間變化及流域上下游經濟發展失衡、民眾或企業參與生態維護意愿的下降等,都無法使流域環境質量總體達到最優目標。長遠來看,針對跨地區水污染的治理問題,更需要包括流域范圍內各個層級政府、企業和居民等社會各界的共同努力。
從圖2可以看出,算例基準參數情形下,治污投資累積量的變化趨勢具有時間穩定趨向,即在有限時間內,最優軌跡隨時間£的遞增而呈現單調遞減趨勢并最終趨于穩定狀態。且相較于非合作博弈,聯合決策情形下的治污投資累積量有所增加,下降速度較慢。相反,由于同時受治污投資累積量及瞬時排放量的雙重影響,不同決策情形下流域上下游污染物存量變化的最優軌跡均呈現隨時間先遞減,在考察末期出現波動的多樣化趨勢,且同一時刻協同合作決策下的污染物存量較低。說明當水資源產權被清晰界定并得到全面保護的前提下,流域環境的外部性問題可通過博弈參與主體之間的自愿協商(如討價還價等)達到內部化。但需要注意的是,在正交易成本的現實實踐中,要對水域環境的產權進行完全明確的界定,并給予有效保護的可能性較小,此時建立下游經濟發達地區反哺中上游欠發達地區的生態補償機制顯得尤為重要。在考慮加入生態補償系數的非合作博弈中,上游污染治理的成本投入由下游予以一定分擔,此時流域污染物存量受治污投資存量的正向影響也明顯有所下降。據安徽省環保廳數據顯示,自2012年新安江生態補償機制試點實施以來,上游總體水質為優,連年達到補償標準,下游千島湖富營養化狀態逐步得到改善。2018年4月,《新安江流域上下游橫向生態補償試點績效評估報告(2012-2017)》通過專家評審,這也標志著我國首個跨省流域生態補償試點通過驗收。
由圖3可以看出,與非合作決策情形下的福利水平相比(Vi和Vj),協同合作情形下流域上下游的福利水平(Vi和Vj)均有所提高。表明依據討價還價理論設計的福利分配方案,確保了上下游地區在整個博弈期內不會單方面的偏離最優策略集合,且分得的福利值均高于獨立決策情形時所得福利,即實現跨界合作的個體理性。因此,無論從經濟利益還是生態環保的角度出發,上下游地區的協同合作始終優于非合作的決策情形。在達成合作一致的基礎上,政府如果能加強對污染越界傳輸的重視,并進一步強化對排污行為的控制,將有助于促使博弈雙方分得的最優福利“帕累托”最優,推進地區環境走向以低能耗、低排放、低污染為特征的可持續發展道路。
5 結論與對策
本文考慮在區域生態補償機制的背景下,構建由一個受償方和一個生態補償方的兩地區在有限時間內存在污染越界問題的微分博弈模型。首先,考慮補償方依據受償方治污投資大小決定對其進行生態補償的比例,進而探討不同決策情形下博弈雙方長期動態均衡策略。其次,為保證區域聯盟合作的順利開展,依據討價還價模型設計出科學合理的福利分配機制。最后,以我國新安江流域生態補償試點為例,通過差異化賦值的方法,對前文模型假設的合理性進行數值檢驗。研究發現:受償地區的最優均衡策略及其狀態變量穩定值與收益因子、環境退化成本、污染物消解能力及治污投資累積量的邊際貢獻率等多種因素的變動息息有關,且非合作博弈狀態下其策略選擇對補償地區的均衡策略有著重要的影響;兩種博弈情形下,治污投資累積量最優軌跡的動態變化趨勢呈現單調遞減特性,而由于受治污投資累積量及排放水平的雙重影響,污染物存量的最優軌跡則呈現多樣化的變動趨勢;相較于非合作博弈,聯合決策情形下兩地區總福利均獲得整體提升,且各主體福利凈現值的大小與具體的分配協議有關。雖然科斯式的地區自愿協商策略被認為是解決跨界污染傳輸問題的有效途徑之一,但現實中受實踐中政策、信息及技術等因素的制約,要實現跨區域間的完全合作是并不現實,而非合作的策略選擇則更具普適性。因此,當區域間存在污染外溢時,如何有效發揮生態補償機制作為協調補償方與受償方利益平衡的手段具有重要的現實意義。
為更好地緩解我國現階段跨界污染問題,政府可依據不同的合作模式及福利分配協議,結合相關參數制定差異化的補償方案;此外,通過征收排放稅、設立排放標準、建立排放許可交易市場等手段提高企業污染排放門檻,實現跨區污染“外部負效應成本”的“內部正效應化”。而作為污染主體的企業,要從根本上消除污染還需依靠企業綠色技術創新投入的提高,如加強其自主研發清潔生產技術、改造升級傳統工藝、回收利用廢棄物資和廢產品等,從生產源頭上節約資源,降低企業排放對地區環境的破壞。本文的不足之處在于僅考慮對治污投資方進行單一的生態補償,而實際上生態補償的種類眾多,如通過調整跨區對口支援工作、綠色技術支持、共建生態產業園區等“造血式”手段對跨區污染問題進行協調。此類問題也將在后續的研究工作中進行更深層次的探討。