□于富昌 葛顏祥 李偉長
近年來,國家出臺相關政策限制水源地產業發展,不僅使水源地現有的經濟發展模式和產業規劃受到嚴重影響,而且還使水源地的經濟發展承受了巨大機會成本。從全國各流域來看,水源地的發展一般都落后于流域的下游地區,形成了所謂的“源頭現象”。作為流域的最上游水源地具有特殊生態地位,只有采取適當的方式對水源地生態保護直接投入以及機會損失進行合理的補償,才能有效激勵水源地的生態保護行為。水源地生態補償機制是促進水源保護的利益驅動機制、激勵機制和協調機制的綜合體,其方式是利用經濟手段、政策手段和法律手段,通過水源地生態保護外部性的內部化,來調動水源地生態建設與保護者的積極性。[1]本文運用博弈分析的方法,對水源地生態補償中各利益相關體進行分析,并對其行為及其相互影響進行研究,模擬其最優選擇和均衡結果,以驗證生態補償制度的效用并為生態補償政策制定提供借鑒。
博弈論是在多決策主體之間行為具有相互作用時,各主體根據所掌握信息及對自身能力的認知,做出有利于自己的決策的一種行為。[2]在市場經濟條件下,各參與主體根據市場需求做出對自身有利的選擇。市場經濟強調依靠“看不見的手”來實現資源的最優配置,傳統經濟學認為通過市場機制總會把個人利己行為的最大化變成集體、社會利益的最大化,而博弈論中的囚徒困境卻揭示了這種論斷的矛盾,即個人理性并不總能帶來集體理性。同樣的,從個體利益出發的行為也并不總是能實現個人利益的最大化,而有可能出現相反的結果。
作為公共資源的流域生態環境,由于其自身的外部性,其經濟價值并沒有在市場交換中體現出來。各參與主體為了獲得利潤,會傾向無限制地開發利用資源,而在這一過程中,生態環境無法通過價格、競爭機制來實現其最優配置,因此需要政府動用行政權力來影響各補償主體的行為,使其能在補償合作中作出理性的利益選擇,從而實現帕累托最優。
在水源地生態補償中,博弈參與主體包括補償者、被補償者和政府。
1.補償者
在水源地生態補償中,補償者是指一切從水源地生態資源中受益的群體。按照對水資源的利用形式的不同,補償者可以分為下游的工業、農業及第三產業生產活動的用水戶,養殖、發電、旅游等經營活動的用水戶以及以下游政府為代表的生態用水戶。[3]在生態補償博弈過程中,補償者總是希望盡可能少補償,但同時希望獲得最大收益。
2.被補償者
被補償者是在水源地生態保護工作中為保障水資源可持續利用做出貢獻的地區或群體,是補償資金的接受方。包括上游的生態環境建設者和減少生態破壞者。他們希望以最小的投入或代價來獲得最大化的利益補償,是生態補償博弈中的重要一方。
3.政府
在水源地生態補償中地方政府是地區利益的代表者,盡可能的爭取本地區補償的最大化或者保護投入的最小化,以維護當地群眾的利益。而上一級政府則是生態補償的維護者和監督者,一方面希望下級政府之間達成補償合作來實現自身的利益訴求(稅收增加、生態環境改善等),另一方面要實施監督職能,對下游的不補償行為及水源地的不保護行為進行懲罰。
在水源地生態補償中,博弈雙方為水源地生態資源的保護者和流域下游生態環境的受益者,按照“經濟人”假設,參與博弈的雙方都會朝著最大化自身利益的方向努力,實現個體理性的納什均衡。
1.模型假設
假設模型中的補償者和被補償者都是完全理性的個體,以自身利益最大化為目標,而且兩者之間都彼此了解雙方的戰略空間和收益,即掌握對方完全擁有的信息。在沒有政府干預的情況下,博弈策略有四種:(1)補償者不補償,被補償者不保護;(2)補償者不補償,被補償者保護;(3)補償者補償,被補償者不保護;(4)補償者補償,被補償者保護。
假定在被補償者保護的情況下,補償者能從流域中獲得的收益為U1;在被補償者不保護的情況下,補償者獲得的收益為U2(U2<U1),被補償者自身所獲得的收益為S;被補償者的保護投入為C1;補償者的補償數額為C2。
2.無政府干預下的博弈支付矩陣及模型分析
根據上述假設,在被補償者保護、補償者補償的條件下,被補償者與補償者的收益分別為S-C1+C2、U1-C2;在被補償者保護、補償者不補償的條件下,被補償者與補償者的收益分別為S -C1、U1;在被補償者不保護、補償者補償的條件下,被補償者與補償者的收益分別為S+C2、U2-C2;在被補償者不保護、補償者不補償的條件下,被補償者與補償者的收益分別為S、U2(具體支付矩陣見表1)。

表1 無政府干預下補償者與被補償者的博弈支付矩陣
依據表1 支付矩陣,對于被補償者而言:S-C1+C2<S +C2,S -C1<S,即不保護是其最優策略;對于補償者而言:U1-C2<U1,U2-C2<U2,即不補償是其最優策略。可見,(不補償,不保護)是這個博弈的納什均衡點,在這種均衡條件下,被補償者與補償者都沒有積極性去打破平衡,兩方陷入“囚徒困境”。這反映了個人理性與集體理性之間的矛盾。
顯然,如果補償者選擇補償、被補償者選擇保護,在他們各自福利得到增加的同時社會的總福利也得到了增加,這雖然是一種帕累托改進,但并不滿足個人理性的要求,不是納什均衡。即使博弈雙方事先達成一個協議,規定受益者采取補償的策略,保護者采取保護的策略,在沒有外在強制力約束的情況下,這個協議也難以實施。因為只要這個協議不構成納什均衡,那么參與人是沒有積極性自覺遵守協議規定的規則,不滿足納什均衡的協議或制度安排是沒有制度效力的。[4]
為了改變這種不合理的均衡,需要政府通過行政干預使個人理性與社會理性都達到平衡,即形成新的納什均衡。
1.模型假設
在無政府干預下,補償者、被補償者都不會自覺地去進行補償或保護,生態補償合作無法自發進行。政府為了促進這種合作的開展,就需要制定一種獎懲制度,設立流域生態補償合作基金,當一方合作時,政府會以正常收益額為基礎,進行獎勵,獎勵系數為θ1,當一方不合作時,政府會以其正常收益額為基礎,進行懲罰,懲罰系數為θ2,為方便計算,將獎懲系數簡化為θ1=θ2=θ(0 <θ <1),當雙方都合作時,政府需要為生態補償合作基金進行補貼,用以獎勵雙方合作。懲罰一方的資金也將納入流域生態補償合作基金,用以支付對合作方的獎勵。
根據政府獎懲力度θ 的不同,補償者會根據自身利益進行選擇補償或者不補償,被補償者同樣會選擇保護或者不保護。假設補償者的補償概率為x,則不補償概率為1 -x;被補償者保護的概率為y,則不保護的概率為1 -y。根據這些假設,形成政府干預下的博弈支付矩陣(見表2)。
2.混合策略納什均衡點的確定
設補償者、被補償者雙方行為選擇為(x,y),那么雙方混合策略納什均衡點的確定就是尋找被補償者的最佳保護概率以及補償者的最佳補償概率的過程。

表2 政府干預下補償者與被補償者的博弈支付矩陣
(1)被補償者的最佳保護概率y*的確定
被補償者的最佳保護概率y*的確定需要滿足如下條件:即此時無論補償者的補償(補償概率x=1)還是不補償(補償概率x=0),補償者的期望收益值都相等。給定被補償者的保護概率y:
補償者選擇補償(x=1)時期望收益為:

補償者選擇不補償(x=0)時期望收益為:

令π1(1,y)=π1(0,y)得:

如果被補償者的保護概率小于y*,補償者的最優策略是不補償;如果被補償者的保護概率大于y*,補償者的最優策略是補償。
(2)補償者的最佳補償概率x*的確定
補償者的最佳補償概率x*的確定需要滿足如下條件,此時無論被補償者保護(保護概率y=1)還是不保護(保護概率y=0),補償的期望收益值都相等。給定補償者的保護概率x:
被補償者選擇保護(y=1)時的期望收益為:

被補償者選擇不保護(y=0)時的期望收益為:

如果補償者的補償概率小于x*,被補償者的最優策略是不保護;如果補償者的補償概率大于x*,被補償者的最優策略是保護。
根據上述分析,可以看出(x*,y*)是補償者和被補償者行為選擇的混合策略納什均衡點,對應著雙方的最佳行為選擇。在這一點上僅靠單方改變策略不會增加自身的收益,即在一方行動不變的情況下,理性的另一方沒有積極性打破這種均衡。
1.被補償者的保護積極性分析
在(1)式中,對被補償者保護概率的影響主要通過可變動量C2和θ,而U1、U2作為確定量不予討論。被補償者的保護積極性通過最佳保護概率y*的增大而提高,隨y*的減小而降低。通過對:

求偏導可知,C2越大,y*越大,θ 越大,y*越小。被補償者保護積極性與各影響因素之間存在較為復雜的關系,通過表3 分析如下:

表3 被補償者的保護積極性與主要影響因素間的關系
被補償者的保護合作意愿較為復雜,較高的補償金額C2,以及合理的獎懲系數θ 會促進補償合作的進行。
2.補償者的補償積極性分析
在(2)式中,可變動量C1、C2和θ 的變化對補償者補償概率存在一定的影響,而S 作為確定量不予討論。補償者的補償積極性通過補償概率x*的增大而提高,隨x*的減小而降低。通過對:

求偏導可知,θ 越大,x*越大;C2、C1越大,x* 越小。補償者的補償積極性與相關因素的主要影響關系如表4 所示。

表4 補償者的補償積極性與主要影響因素間的關系
補償者的補償合作意愿受到上述因素的影響,較高的獎懲系數θ 以及較低的保護投入C1,較低的補償金額C2會提高補償者的補償積極性。
3.政府獎懲系數與補償金額的確定
在上述模型中,政府獎懲系數θ 可由上級政府確定。在水源地生態補償博弈過程中,政府可以通過控制獎懲系數θ 的值來提高雙方合作的積極性。通過對最佳補償概率(2)式以及最佳保護概率(1)式對獎懲系數θ 求偏導數,可得:

由此可見,補償者的最佳補償概率隨獎懲系數θ 的增大而增大,但被補償者的最佳保護概率卻隨θ 的增大而降低。因此存在確定的θ值,使補償者的補償概率與被補償者的保護概率相等,且使雙方都處于均衡狀態。
令 x*=Y*

當政府制定獎懲系數為θ*時,雙方具有相等的補償與保護意愿,且滿足補償者和被補償者行為選擇的混合策略納什均衡點。
1.生態補償額的確定要充分考慮下游的承受能力
通過前面的分析,隨著下游補償者的補償金額C2的增大,補償者的補償積極性會下降,因此當上下游進行生態補償時,補償額的確定要充分考慮到下游的承受能力。下游補償者通過大力發展區域經濟,提高自身的經濟實力,來提高對補償金額的承受能力。同時注重經濟發展方式的轉變,發展資源集約型經濟,減少對水資源的依賴,提高用水效率,以便在同水源地被補償者就補償合作進行談判時會有更大的主動權,來降低補償金額C2。
2.提高政府的獎懲力度
政府利用獎懲系數θ,一方面對于上游的生態保護行為進行獎勵,另一方面對于下游的補償行為進行獎勵,對其違約行為進行處罰。政府通過控制獎懲系數θ 值,調整獎懲力度,調動下游生態補償的積極性。
1.優化水源地經濟結構
對于被補償者來說,當經濟發展對水源地生態的影響超過生態系統自身的修復能力時,對生態環境的破壞將不可逆轉,作為上游其治理成本將會大大增加,在博弈模型中較高的保護投入C1會阻礙補償合作的進行。通過優化水源地產業結構,大力發展環境友好型經濟來降低保護投入C1,能有效促進補償合作的進行。
2.建立水源地生態保護激勵機制
水源地生態補償機制更多的是在政府層面、宏觀層面的開展,如何落實則更多的依賴個體、微觀層面的行動。被補償者在保護水源地生態環境時引入激勵機制,從政策上和財政上支持鼓勵資源節約、環境保護的行為,能夠極大地調動區域內部門、企業、個人保護生態環境的積極性,從而使生態補償效益最大化。[5]
1.制定合理的獎懲制度
上級政府作為補償合作的協調者和監督者,有責任推進水源地生態補償的順利進行,其中對于獎懲系數θ 的制定尤為重要。上級政府要在科學合理調研的基礎上,充分聽取下游補償者與水源地被補償者的意見,使上游水源地被補償者有較高的保護積極性,下游補償者也有較高的補償積極性。
2.加大監督檢查力度
由于水源地生態補償的補償者、被補償者涵蓋流域上下游眾多補償個體,因此對于生態補償的順利實施存在著較大困難,上級政府要對補償合作加大監督檢查力度,對于補償者要督促其按時足額繳納協議規定的補償金額,對于被補償者水源地的保護工作則要進行定期考核檢查,對合作方增大獎勵力度,對不合作方加大處罰力度。以促使雙方都能遵守相關補償協議,促進補償合作的良性互動。
3.增加水源地生態保護的資金支持,建立補償合作基金
資金支持是生態補償保障機制建設的重要方面,充分利用經濟因素達到生態保護的目標,這包括明晰中央財政、地方財政、微觀個體的職能范圍,增強補償的可持續性。通過財政支持,建立本流域內的補償合作基金,對于上游水源地的保護投入C1進行一定數額的資金支持,促進其保護工作的開展。上級政府的這種轉移支付直接降低了被補償者自身的保護投入C1,可以有效提高水源地被補償者地保護積極性。對于下游補償者的積極補償行為,補償合作基金也可以進行一定的資金支持,這種資金補貼直接降低了補償者的補償金額C2,也會提高補償者的補償積極性。
4.建立統一的流域環境管理機構
我國在流域環境管理體制上存在制度性的缺陷。雖然我國對水資源有管理權限的部門10多個,但缺少一個統一的、有權威的流域環境管理機構,并且流域一般涵蓋多個行政區域,導致流域管理混亂、無序,無法實現對流域綜合有效管理。[6]因此政府通過科學合理的規劃,整合相關機構,建立一個對流域環境有權威管理權的機構,對水源地生態補償合作進行監管,對流域在各行政區域間出境水質和入境水質的標準進行界定及統一,明確各方權責,并處理補償者、被補償者之間因補償合作產生的糾紛,保障水源地生態補償的順利進行。
[1][4]王燕.水源地生態補償理論與管理政策研究[D].山東農業大學,2011:29 -37.
[2]劉建林,張浩明.基于混合策略Nash 均衡的商洛水源地補償研究[J].人民黃河,2011,(9):38 -40.
[3]葛顏祥,梁麗娟,接玉梅.水源地生態補償機制的構建與運作研究[J].農業經濟問題,2006,(9):22 -27.
[5]張俊.飲用水源保護區生態補償機制研究—以寧波市皎口-周公宅水庫為例[D].寧波大學,2010:53 -55.
[6]董正舉,嚴巖.國內外流域生態補償機制比較研究[J].人民長江,2010,(4):37 -39.