李 鑫,馬國順,孫 冰
(1.西安航空學院 理學院,陜西 西安710077;2.西北師范大學 數學與統計學院,甘肅 蘭州730070;3.西安市長安區第一中學初中部,陜西 西安710100)
2010年國家環保總局對外公布了130家曾經存在環境違法行為的跨國企業名單,其中3家由于整改不力再次違反環保法規,被國家環保總局重點曝光[2]。而此次公布的130家曾被列入黑名單的跨國公司僅僅是局部統計數據,只是跨國企業環保問題的“冰山一角”。這些跨國公司不僅在執行標準上低于母公司的標準,甚至違反了中國最基本的環保法規。此次事件引發了民眾對環保機構監管效率等相關問題的擔心和焦慮。生態環境是建設我國現代文明社會的主要支柱之一,環保部門如何運用多維博弈的思想對大型跨國公司進行有效地監督,將成為實現經濟持續增長、社會和諧穩定發展的重要基礎[3]。
在現實情況中,當一個博弈模型存在純策略Nash均衡時,可以運用諸如劃線法、優勢策略法以及反復剔除劣勢策略等方法求出該博弈的Nash均衡。然而,很多博弈模型本身是不存在純策略Nash均衡的,此時可以利用多維博弈理論求解博弈模型的混合策略Nash均衡,其中一種常用的方法就是支付等值法。
在博弈G={S1,…,Sn;u1,…,un}中,博弈方i的策略空間為Si={Si1,Si1,…,Sik,},則博弈方i以概率分布Pi=(Pi1,Pi2,…,Pik)隨機在其k個可選策略中選擇的“策略”,稱為一個“混合策略”,其中0≤Pij≤1對j=1,2,…,k都成立,且Pi1+Pi2+…+Pik=1[6]。
針對無純策略Nash均衡的狀態下,參與人A與參與人B進行策略交往,由于各博弈方必須保證自身策略選擇的隨機性,以及各博弈方重視選擇各個策略的概率分布,以防止其他博弈方猜到自己的策略,或利用策略選擇的偏好獲利,參與人A其任意一個策略的選擇對參與人B的期望支付應當是等值或無差異的。同樣參與人B的任意一個策略選擇對參與人A的期望支付亦為等值或無差異的,由此求出參與人A與參與人B的概率分布Pi、qi(i=1,2,…,n)的方法,稱為支付等值法。
自我國加入了WTO以及隨著社會主義市場經濟的進一步完善,有相當數量的跨國公司進入我國,從而進一步加劇了企業之間的市場競爭。為了增加市場競爭能力和抵御市場風險的能力,將有更多的企業組成企業集團或聯盟。由于企業集團一般由多個企業所組成,并且集團中的每個企業在行政上既有獨立性同時又被集團總部所控制。這樣一來,環保機構在監督企業履行環保責任問題上將面臨更加復雜的情況和困難。在目前情況下,我國由于環保機構人力和財力等方面的原因,以至于在對企業集團進行監督的過程中,有時不可能對企業集團下屬的所有企業進行環保檢查,而企業集團如果也知道環保機構不可能對其下屬所有企業都進行環保檢查時,環保機構如何對企業集團進行環保監督以及企業集團以何種形式逃避環保機構的檢查就形成了一個較為復雜的博弈過程。下面,在完全信息條件下,以環保機構和企業集團下屬的兩個企業為例來分析他們之間的靜態博弈。
假設集團有兩個企業,一個是企業A,另一個是企業B,企業A是一個大型企業,企業B是一個小型企業;企業A進行規范排污時所耗費的成本TA是企業B進行規范排污成本TB的r倍,即TA=r·TB=r·T,TB=T。再假設環保機構對每個企業進行檢查的成本為常數C,對企業違規排污的罰款F是其規范排污所耗費成本的α倍,并假設如果環保機構對違規企業進行檢查就一定能夠查出(令C<T+F),同時假設如果集團全部企業都違規,將增加一定數額的罰款記為β。
從企業角度看,企業A選擇是否違規排污與企業B選擇是否違規排污沒有直接關系,但由于兩個企業既然是屬于同一個集團,從集團的整體利益來看,一旦都違規,集團將可能另外附加一定的“成本”β。因此,集團就要從總體利益出發來選擇策略。從總體博弈角度分析,集團選擇企業A違規還是企業B違規的博弈策略是相互影響和聯系的。對于環保機構,由于可能知道集團會將兩個企業是否違規聯合考慮這個“信息”,因此在選擇對哪個企業進行檢查時,也會考慮這種聯系和影響,實際上這樣就導致了環保機構在選擇對哪個企業進行檢查時必須考慮這種聯系和影響,所以,這個博弈可以從二維博弈角度進行分析。
在C<T+F的條件下,純策略二維Nash均衡不存在。令pi表示集團選擇第i策略的概率(i=1,2,3,4);qi表示環保機構選擇第j個策略的概率(j=1,2,3,4)。根據支付等值法,環保機構關于企業集團的任意一個策略的期望支付都是等值無差異的,以及企業集團關于環保機構的任意一個策略的期望支付亦為等值無差異的,按照這種思想可以求得該博弈的混合策略二維均衡[1]。
企業集團決策者的混合策略為:p1=0,p2=C[rT(1+α)]-1,p3=C[rT(1+α)]-1,p4=1-C(1+r-1)[T(1+α)]-1。
這其中要求:0≤C(1+r-1)[T(1+α)]-1≤1。環保機構的混合策略為:q1=0,q2=q3=(α+1)-1,q4=(α-1)(α+1)-1,其中:α≥1。
從以上結果可以看出:q1=0表示在混合均衡條件下,由于企業集團知道環保機構內部人力、財力和物力的制約,環保機構一定不采取檢查所有企業而只是抽檢部分企業的策略,則企業集團的最優策略也應當是部分企業違規,而不是全部企業均違規的策略。p1=0表示環保機構一定不采取對集團全部企業都進行檢查的策略。這也許表明環保機構知道,由于增加了對全部違規的集團罰款力度而使集團不敢采取全面違規的策略。當C(1+r-1)[T(1+α)]-1=1時,集團所有企業都違規的概率為零,此時所采取的策略是以1-(1+r-1)-1的概率進行企業A違規和企業B不違規的策略,以(1+r-1)-1的概率進行企業A不違規和企業B違規的策略。當α=1時,即環保機構對檢查到的違規企業采取按其違規所得利潤進行100%的罰款時,環保機構將采取各以1/2的概率對A和B企業進行檢查。此時,企業采取的混合策略是以C(2T)-1的概率進行企業A違規和企業B不違規的策略,以 的概率進行企業A不違規和企業B違規的策略,以1-(2T)-1C(1+r-1)的概率采取A和B企業都不違規的策略。當p1與q1同時等于0,表明增加一定數額(β)的罰款能夠遏制全面違規的作用。當C增加時,p4減小,這表明當環保機構的檢查成本上升時,集團選擇兩個企業均不違規的概率在降低。或許集團知道環保機構不敢放手檢查而無所顧忌的違規。當T增加時,p2、p3減小。表示當企業規范排污的成本上升時,集團由于考慮到附加數額的罰款(β),更傾向于選擇下屬的某一個企業違規而不是全部企業違規。當α增加時,p2減小,p3減小,p4增大。這表示環保機構對單個企業罰款趨于嚴厲,集團會跟著調整對策,降低企業違規的概率。
通過對上述混合策略二維均衡結果的分析,可以得到以下結論:增加環保機構監管收益;降低機構監管成本;加大違法企業懲處力度;提高誠信合格企業聲譽收益;以及減少企業排污成本等,能夠有效地規范跨國企業的排污行為,且只要政府能夠制定出合理的規章制度,企業違規排污事件發生的概率將可以大大降低。
[1]譚德慶 .多維博弈論[M].成都:西南交通大學出版社,2006:24~30.
[2]段密密,葛 夢,呂 婧 .淺談在華跨國公司的環保責任問題[J].華商,2008(15).
[3]周忠偉,周煜川 .企業污染與社會生態安全問題研究[J].企業經濟,2012(10).
[4]Weibull.演化博弈論[M].上海:上海人民出版社,2006.
[5]張維迎 .博弈論與信息經濟學[M].上海:上海人民出版社,1996:34~39.
[6]謝識予 .經濟博弈論[M].上海:復旦大學出版社,2002:70~75.
[7]王 怡,羅 杰,陳天鵬,尹志紅 .企業污染治理戰略聯盟的動態演化博弈分析[J].決策參考,2011(17).
[8]任國佼,馬 軍 .淺析公共環境保護博弈[J].北方經濟,2008(6).