政府和企業環境行為：博弈及博弈均衡的改善

2009-01-01 00:00:00鄒偉進胡畔

理論月刊 2009年6期

摘要：隨著我國經濟不斷快速發展，生態環境承受的壓力越來越大，生態文明建設研究在我國也越來越得到重視。然而在生態文明建設過程中，政府和企業的目標函數不同，決定了二者行為方式的不同。本文從博弈論的角度，建立政府環境監管與企業污染治理的博弈模型，深入分析政府與企業的決策過程及博弈結果，以期為加強政府環境監管、提高企業污染治理水平，促進我國生態文明建設提供可借鑒的政策建議。

關鍵詞：政府和企業；環境行為；博弈分析

中圖分類號：D625；X171.1 文獻標識碼：Ａ文章編號：1004-0544（2009）06-0161-04

一、博弈論的引入

建設生態文明，加快轉變經濟發展方式是關系國民經濟全局緊迫而重大的戰略任務，生態文明建設對國家的發展至關重要。生態文明發展戰略的一個重要內容就是要讓企業成為環境保護的主體，讓政府合理有效的行使環境監管的職能，使企業和政府雙方的環境行為在博弈中達到最優，使環境保護成為企業和政府的共同利益和自覺行為，從而實現提高資源效率、環境優化和可持續發展，進而達到社會進步和福利最大化的目標。

博弈論是研究理性的決策主體之間發生沖突時的決策及均衡問題，也是研究理性的決策者之間沖突及合作的理論。它改變了傳統微觀經濟學的某些基本假設，即決策主體的效用函數不僅依賴于自己的選擇，并且依賴于他人的選擇，也就是在相互存在外部經濟條件下的個人選擇問題。

環境資源由于其產權關系的殘缺以及公共物品特點，在使用中存在著大量的外部不經濟性，從而導致了環境問題。而在環境保護過程中，企業和政府相關部門等決策主體利益行為相互影響和相互制約，因此各方不僅要考慮自己對環境保護的支付，同時也要考慮其他方的支付。博弈論在生態文明建設和環境保護中的應用，就是把環境保護中涉及的企業和政府二者之間的決策行為數量化，更科學地表達和分析二者之間的相互影響關系。博弈雙方的支付函數、所獲得的環境收益及支付成本指標的量化，使得博弈論成為分析生態文明建設中企業和政府環境行為的有效工具。本文從博弈論的角度，建立政府環境監管與企業污染治理的博弈模型，分析政府與企業的決策過程及博弈結果和博弈均衡的改善，以期為加強政府環境監管、提高企業污染治理水平，促進我國生態文明建設提供可借鑒的政策建議。

二、政府與企業在生態文明建設中的博弈均衡

在生態文明建設和環境保護過程中，政府更多追求的是社會效益和環境效益。對于企業而言，環境保護意味著減少污染，提高資源利用效率，這往往會使企業增加即時生產成本，在短期內降低利潤。由于資源環境影響的外部性，如果沒有外在約束，市場機制是不能直接引領追求自身利潤最大化的企業自發地保護環境的，即企業推行環境保護，實現生態轉變，并不是企業的自覺行動，而是企業在外部環境和社會制度約束下的一種理性選擇。企業追求利潤最大化的個體理性往往與政府追求生態文明和經濟可持續發展的集體理性存在一定的沖突，必然會在政策制定和執行過程中產生博弈。

1. 政府與企業博弈模型的建立和博弈過程

在這場污染排放與規制的博弈中，一方面政府為實現一定的環保目標會根據污染總量控制需要，制定排放標準，并監控企業是否按此規定合法排污。另一方面，企業為追求利潤最大化，在其生產函數的約束下，企業會決定超標排污與否及其程度大小。進而不同主體根據各自的目標和約束條件，進行博弈并表現出相應的行為策略。在此，企業不僅要考慮進行治污的額外收益（主要是獲得減稅或政府補貼和良好的社會聲譽等），還要考慮自己減少污染的成本、不減少排污被發現后要交納的罰金以及社會形象受損等成本；同時政府既要考慮對企業規制帶來的收益（主要是社會效益和環境效益，以及政府形象的提升），也要考慮監測成本、對企業超標排污罰款的征收成本，以及環境規制可能對經濟增長造成的不利影響等。當企業治污成本較高或政府監測放松時，企業往往會減少治污的數量甚至根本不治理。與此同時，針對企業的策略行為，政府也會及時調整并做出反應，如增加監控力度或增大超標排污罰款數額。此時企業又會增加治污投資以減少排污數量，或通過某些其它方式降低受懲罰的程度，如向某些政府官員進行游說甚至行賄。如此循環往復，重復博弈，直至達到均衡。

根據政府與企業的角色定位，結合現階段我國經濟發展的實際，本文對該模型作出以下假定：

（1）整個博弈過程只有政府和企業兩個博弈方，他們的效用函數分別表示為U和V。

（2）企業和政府都是理性人，都關心自己的目標利益，政府的目標是實現社會福利最大化，企業的目標是實現利潤最大化，并且由此決定了雙方的決策行為。

（3）政府與企業的戰略選擇假定:作為局中人的企業的純策略選擇是污染或不污染（治理），而作為局中人的政府的純策略選擇是規制或縱容。

假設C₁為企業治理污染的成本，R₁為企業治理污染的收益（獲得減稅或政府補貼和良好的社會聲譽等）；C₂為政府規制的成本，R₂為企業治理污染給政府帶來的收益（主要有因污染減少而增加的環境價值的增值以及政府形象的提升等）；F為政府對污染企業的罰款額。顯然R₂＞C₂，否則，政府就會放棄規制；F＞C₁，否則企業會寧可支付政府罰款，也不愿治污。

如果企業治理而政府規制，則企業的效用為R₁-C₁，而政府的效用為R₂-C₂；如果企業治理而政府不規制，則企業的效用為R₁-C₁，政府的效用為R₂；如果企業污染而政府規制，則企業的效用為C₁-F ，政府的效用為F-C₂；如果企業污染政府不規制，則企業的效用為C₁，政府的效用為C₂-R₂。企業與政府的支付矩陣如表2-1。

表2-1企業與政府的支付矩陣

當R₁-C₁＞0時，企業治理污染能夠獲得收益，此時納什均衡為（治理，不檢查），這也是該博弈中最完美的結果，對企業和政府都有利。

當R₁-C₁＜-F時，存在兩種情況：若F＜C₂，納什均衡為（不治理，不檢查）；若F≥C₂，納什均衡是（不治理，檢查）。

當-F＜R₁-C₁＜0時，情況相對復雜。若政府決心檢查，則企業的最優戰略為治理；若政府不檢查，則企業最優戰略為不治理。政府是否檢查與R₂、F和C₂的大小相關。若F＜C₂，政府的最優戰略為不檢查，此時企業一定選擇不治理；若F≥C₂，則不存在純策略納什均衡，只存在混合策略均衡。

圖2-1表示政府與企業間動態博弈的一個子博弈。用p表示企業污染的概率，q表示政府規制的概率，對方很難準確把握博弈方的得益。在此子博弈中，如果p=0，那么博弈提前結束。政府的規制對于廠商來說是一種威脅。如果q＞1-q，則它是可信的威脅，那么企業在上階段很可能選擇“治理”，即1-p＞p；反之，1-p＜p，博弈繼續向下進行，形勢將越演越烈，環境向著惡性方向發展。該子博弈說明，政府在生態文明建設和環境保護中要充分發揮其權威性和強制性等特點。

圖2-1政府與企業環境行為博弈樹

下面求該博弈的混合策略納什均衡概率分布。

設企業的混合策略S₁=（p，1-p），政府的混合策略為S₂=（q，1-q）。計算企業的期望盈利函數為：

U（S₁，S₂）=p［-Fq+0］+（1–p）［（R₁- C₁）q+（R₁-C₁）（1–q）］= -Fpq+R₁-C₁-PR₁+PC₁。（1）

按照納什均衡定義，在給定政府的混合策略S₂=（q， 1-q）條件下，求p值以使U （S₁，S₂）達到極大，因此對（1）式關于p求導數，并令導數為0，得–Fq=R₁-C₁。（2）

（2）式左端是企業污染時的期望贏利，右端為企業治理時的期望盈利，說明在納什均衡中政府所取的策略S₂必須使企業在治理或排污之間的選擇由于平均收益相等而沒有偏向，因此q=（C₁-R₁）/F。

同樣，求政府的期望贏利函數為：

V（S₁，S₂）=q［p（F-C₂）+（1-p）（R₂-C₂）］+（1-q）［0+（1-p）R₂］=Fqp-C₂q+R₂-R₂pq-PR₂。（3）

在給定企業的混合策略S₁=（p，1-p）條件下，尋求q值以使V（S₁，S₂）達到極大，因此對（3）式關于q求導數，并令導數為0，得Fp-C₂+R₂p=0。（4）

同上，在納什均衡中企業所取的策略S₁必須使政府在選擇規制和縱容時由于平均效用相等而沒有偏向，因此p=C₂/（F+R₂）。

綜上所述，得到這個博弈的混合策略解：

［S₁=C₂/（F+R₂），1-C₂/（F+R₂）；S₂=（C₁-R₁）/F，1-（C₁-R₁）/F］。

進一步，由（3）式和混合策略解計算得到在達到納什均衡時政府的期望效用為：

Fqp-C₂q+R₂-R₂pq-PR₂=R₂-C₂/（F+R₂）。

2. 政府與企業博弈結果分析

顯然，企業污染與政府規制博弈的納什混合策略均衡與規制成本C₂、規制收益F+ R₂有關。C₂和R₂可視為固定，即增加F值，可以使政府的期望利益增加。F作為政府針對企業超標排污時的罰款額，由于其便于控制，成為政府對企業污染規制的主要手段之一。

下面對上述結果進一步分析。如圖2-2所示，橫軸表示政府選擇規制策略的概率q（0＜q＜1），縱容的概率為1-q；縱軸則表示當政府規制的概率不同時企業選擇污染的期望效用。其中線段C₁A縱坐標就是在相應的規制概率企業選擇污染的期望效用，其與橫軸的交點q，就是博弈雙方達到均衡時政府規制的概率值，此時對應的企業污染效用為0。

圖2-2 混合策略

同時在上面分析中得到了博弈的混合策略解，并且計算了在達到納什均衡時政府的期望效用為R₂-C₂/（F+R₂）。從這個結果可以看到: F越大，政府效用就越大，因此政府有增大F的趨向；當政府對企業的罰款額由F增大到F＇時，會使C₁F下移到C₁F＇。如果政府規制的混合策略不變，此時企業污染的期望效用由原來的0變為u（u＜ 0），因此企業會停止污染進行治理。但在長期中，由于企業停止污染會使政府規制放松，即政府規制的概率由q減到q＇，而此時企業污染的期望效用曲線由原來的C₁F下移到C₁F＇，企業也就會重新選擇混合策略，使它污染的效用由負數又恢復到最初的效用0，于是該博弈模型又達到一種新的均衡。因此從長期來看，政府加重對企業污染的罰款力度并不能抑制其污染行為，只能短期內降低企業的污染概率。

通過這種簡化和抽象的博弈模型可以看到，政府和企業的環境行為是一種交互作用的關系，博弈的均衡取決于博弈均衡的激勵相容條件。提供適當的激勵相容條件，如加大對企業排污的處罰力度，可以改善短期博弈均衡，但是不能改善長期均衡。

3. 企業和政府行為的進一步分析

上述分析是建立在博弈論基礎上的抽象分析，它假定企業和政府都對彼此的特征、策略空間和支付函數有準確的認識，即完全信息博弈；企業是只考慮自身利益和短期利益的行為主體，政府是只考慮社會利益和長期利益的行為主體。但現實中情況要復雜得多。

從企業層面上看，在現實博弈過程中，企業博弈方對其生產過程、生產技術、排污狀況、污染物的危害等方面了解較多，但出于自身利益考慮，可能向政府隱瞞真實信息，甚至不嚴格按照環保要求生產，不披露廢棄物信息，假報產品性能等，造成動態博弈的政府博弈方無法全面了解企業博弈方的相關行為，是信息不完美的博弈方。因此博弈的基本特征之一就是博弈雙方在信息方面的不對稱。這種信息的不對稱會使企業有更多的行為選擇，將使雙方的博弈均衡朝有利于企業方傾斜。如果企業只從自身利益和短期利益采取行動，將不可避免的造成環境污染的加劇。

從政府層面看，生態文明建設和發展中的政府行為也會出現“政府失靈”。從地方政府層面上講，這種“失靈”可能表現在兩個方面。一是作為理性的“經濟人”地方政府考慮更多的是地方經濟問題，它的經濟利益與企業利益密切相關。因為企業能增加就業從而緩解社會就業壓力、通過企業繳稅可以增加政府收入、企業的蓬勃發展帶動經濟增長可提升地方政府的政績。因此，在很多地方政府眼里經濟增長是硬指標，環境保護是軟指標，經濟增長是企業和政府的共同利益所在。于是就產生了政府與企業“合謀”的可能性，即政府為了地方經濟的增長而對企業污染環境的行為采取聽之任之甚至保護的態度。二是政府為了取得排污費等環保收費，而在一段時期內對企業污染環境的行為采取不作為的態度，特別是當企業治理污染不能給政策執行部門帶來效益時，執行部門有可能為追求處罰金收入而縱容企業的排污行為。

三、企業和政府博弈均衡的改善

從現實情況看，無論是企業還是政府在博弈策略上都更具有復雜性。要實現政府與企業在生態文明建設中的環境行為博弈中的最優或次優均衡，就必須設計出一種制度，既對企業行為的外部性產生約束，又能及時對企業自覺的環保行為給予激勵，讓生態文明建設和環境保護由外部壓力轉化為企業的自覺行動；既能最大程度地降低政府和企業“合謀”的概率，促進政府和企業良性互動，又能提高政府規制的效率，實現經濟發展和環境優化的雙贏。

1. 尊重人民群眾的環境主人地位，提高全社會的參與意識

為了研究的方便，我們在分析博弈過程中假定只有政府和企業兩個博弈方。但是，我們必須認識到，環境保護涉及多個利益主體，公眾是最大的利益相關人，擁有保護環境最大的利益動機，任何對于環境的損害都是對人的損害，是對全體公民根本利益的損害。缺乏公眾的參與，雖然也能實現博弈均衡，但無論是企業還是政府都有可能因自身利益和短期利益而放棄最優均衡。實際上，當前我國很多環境問題長期得不到解決，就是社會主義民主制度不健全，公眾缺乏參與權、監督權和話語權的結果。因此，在現實中政府和企業環境行為博弈均衡的完善離不開公眾的參與和監督。而要保證公眾的有效參與和監督，首先必須從法律上明確環境權是公民的基本權利，尊重公民的環境主人地位。同時，要實施國民環境教育，提高全社會的參與意識。要明確公眾參與和監督的主體既包括人大、政協，也包括基層社區、民間團體和每個公民；參與的方式既包括立法、信訪，也包括聽證制度、公益訴訟、專家論證、媒體監督和志愿者服務等；監督的對象既包括企業，也包括政府。

2. 轉變政府職能，建立高效廉潔的政府

政府和企業的環境行為雖然是一種交互作用的關系，但是，由于雙方的地位不同和目標不同，在博弈中政府的行為往往起決定性的作用。在現有的GDP評價指標體系下政府缺少生態文明建設和環境保護的驅動力，甚至可能產生政府和企業在排污等環境問題上的“合謀”。因此，必須調整評價指標體系，建立以生態建設為導向的綜合評價體系，力求將環境保護效果、資源利用率、人居環境指數等因素納入政府績效評價體系中，對政府績效、地區發展和官員政績進行全方位的評估，激發其進行生態文明建設和環境保護的積極性和主動性，促進生態文明建設和經濟社會的可持續發展。同時，要求政府在嚴格排污標準，加大處罰力度時，使行政部門對排污企業的治理、督導情況與工作業績相掛鉤，作為考核的主要依據，必要時應建立對政策執行部門的再監督制度和問責制度，嚴格規范政策執行部門的工作。要完善管理體制，特別是排污費等環保收費的管理，堅持收支分開的原則。

3. 增強企業社會責任感，建立綠色企業文化

如同任何一種博弈一樣，企業與政府在環境保護和環境污染上的博弈有多重均衡，在這眾多的博弈均衡中哪些會最終實現呢？博弈論本身不能給出答案。但是博弈論告訴我們，在無限次的“重復博弈”中，由于各博弈參與人要考慮到以后的長遠利益，若以后的長遠利益對現在來說影響足夠大的話，參與人就會為了長遠利益而作出“合作”的選擇，從而達到一種更有效率的均衡。而當一個社會領域的博弈有眾多均衡時，哪個均衡會最終實現，文化傳統和社會氛圍將起決定性的作用。如果我們把企業利益和社會利益、環境保護和經濟增長的“雙贏”作為最優均衡，這個最優均衡的實現取決于各方存在長遠利益和自覺保護環境的文化傳統和社會氛圍。

樹立長遠利益的觀念和培育自覺保護環境的文化傳統和社會風氣，對于企業來說就是要增強企業的社會責任意識，建立綠色企業文化。要使企業認識到只有將自身利益和短期利益與社會利益和長遠利益結合起來，才能實現企業的持續發展；只有實現生產方式的轉變，從高消耗、高污染的粗放生產轉變為減量型、清潔型的綠色生產，才符合企業自身利益，才能提高企業核心競爭力。因此，節能減排應成為更多企業的自覺行動，而不完全是一種被動的與政府的博弈。

4. 大力發展環保科技，完善環保市場，降低污染治理成本

現實中任何企業與政府的環境博弈都是在一定的經濟技術條件下進行的。企業逃避污染治理主要是為了降低生產成本，防止因成本增加而削弱其市場競爭力。因此，治理污染成本的大小直接影響企業環境行為和博弈的均衡。如果企業污染治理成本有較大的下降空間，污染治理所獲取的經濟效益和企業聲譽等大于治理投入，企業就會愿意主動采取污染治理行動。反之，若企業參與環境保護的成本下降空間很小，企業因污染治理投入所增加的生產成本削弱了企業的市場競爭力，那么企業在污染治理方面就缺乏積極性。

降低污染治理成本既是企業自身的責任，也是政府的職責。政府督促企業治理污染，可以使用加大罰款力度的辦法，也可以使用幫助企業降低污染治理成本的辦法。上述博弈模型的分析證明，加大罰款力度不能改善長期博弈均衡，而降低企業環境治理成本，則可以從根本上影響企業的環境行為，改善長期博弈均衡。因此，政府應轉變以懲罰為主的思路為服務為主的思路，即大力發展環保科技，完善環保市場，幫助企業降低污染治理成本，實現企業利益和社會利益、環境保護和經濟增長的“雙贏”。

四、結語

現階段我國將生態文明建設和可持續發展作為重要的發展戰略，但在企業發展生態文明建設和實施環境保護的過程中，存在大量不確定因素，如生產成本的加大、政府制度的變動、科技的不斷升級等，這些不確定因素的存在給企業進行環境保護帶來較大的風險，從而阻礙了企業的生態化和我國生態文明發展進程。同時，受自身利益和地方利益的制約，政府行為也可能短期化和具有自利性，使得政府和企業進入更復雜的博弈過程。這種博弈必將伴隨著生態文明建設的發展歷程而長期存在。基于博弈論的分析，我們可以得到雙方博弈均衡及均衡的條件。但是，要推動這一博弈向最優均衡發展，必須有公眾的參與和監督，形成一個良好的全社會生態文明氛圍；政府要明確和改善職能定位，變懲罰為主的思路為服務為主的思路；企業要增強社會責任感，培育有社會責任意識的企業文化；促進環保科技的發展，降低企業環境治理的成本。這樣，我國的生態文明建設發展最終會形成政府、企業和社會共贏的良好格局，實現經濟、環境、資源的可持續發展。

參考文獻：

［1］張維迎.博弈論與信息經濟學［M］.上海:上海三聯書店，2004.

［2］王玉慶.環境經濟學［M］.北京:中國環境科學出版社，2002.

［3］王冬梅，李萬慶.博弈論在環境保護中的應用［J］.城市環境與城市生態，2004，（10）.

［4］王斌，張英杰.環境污染治理的博弈分析［J］.青島建筑工程學院學報，2004，（2）.

［5］張偉麗，葉民強.政府、環保部門、企業環保行為的動態博弈分析［J］.生態經濟，2005，（2）.

［6］王齊.政府管制與企業排污的博弈分析［J］.中國人口·資源與環境，2004，（3）.

［7］韓貴鋒.環境保護低效率的博弈分析［J］.地理學與國土研究2001.

責任編輯劉鳳剛

理論月刊2009年6期

理論月刊的其它文章: 獨立學院可持續發展思考; 禮儀教育與大學生人文素質的提高; 論中國特色學生事務管理模式的構建; 中西方道德建設的比較與啟示; 中部欠發達地區新農村建設中“生產發展”的成效、問題與對策; 構建覆蓋城鄉社會保障體系的現實條件分析