馬 媛,潘亞君
(山東科技大學經濟管理學院,山東 青島 266590)
煤炭是我國的重要能源,但煤炭開采存在較為嚴重的環境問題,具體表現為:傳統開采方式容易造成地下水位下降和地表水流失,礦區廢水排放對土質、植被造成損害[1-2];過度開采造成巖層移動,大面積地表塌陷[3]。因此,如何減少煤炭開采的環境污染是實現行業可持續發展的關鍵。綠色開采將綠色理念引入到煤炭開采過程中,通過技術創新解決煤炭開采中的水資源破壞、巖層移動、地表塌陷等問題,能夠最大限度地實現環境、經濟和社會效益[4-6]。
長期傳統開采形成的技術路徑和市場環境,造成綠色開采技術推廣受阻[3]。企業層面,受到管理層環保意識[2]、管理方式[5]等因素的制約,綠色開采機制難以建立。由于對傳統開采技術的路徑依賴,推廣新技術需要大量的資金、人力等,企業承擔較大風險[3,6];配套設備和充填材料價格昂貴,也制約了企業綠色開采的積極性[7];此外,綠色開采技術的環境外部性特征導致成本不能完全與企業收益掛鉤,也限制了技術的推廣[8]。政府作為監督者,主要承擔制定懲罰機制和獎勵措施的責任,獎懲措施不完備[2]、監管懈怠也影響了企業綠色開采的積極性[7]。
針對綠色開采技術推廣中存在的諸多問題,申洛霖[8]運用博弈論的理論方法研究了煤炭企業與地方政府之間策略選擇的交互影響;龍如銀等[9]從靜態博弈的角度分析了綠色開采動力不足的原因,進一步分析了雙方的博弈策略。上述成果為研究企業綠色開采提供了理論基礎,但上述研究成果多采用案例研究或者靜態博弈的方法。企業和政府的策略選擇是一個動態的變化過程,博弈方會根據對方的策略以及內外部環境變化,實時更改策略選擇。因此,本文使用演化博弈研究方法,在有限理性假設下,建立政府部門和企業的收益矩陣,分析監管部門和企業之間策略選擇的動態趨勢,為推廣綠色開采技術提供理論支持。
假設1:博弈參與者為政府部門(包括煤炭工業管理局和環保局等)和煤炭企業。政府部門的策略為監管(比例為x)與不監管(比例為1-x)。煤炭企業的策略為綠色開采(比例為y)和非綠色開采(比例為1-y)。政府監管的成本為Cg,不監管的成本為0;煤炭企業綠色開采策略下的收益為R1,非綠色開采策略下的收益為R2。政府和企業隨機決策進行博弈。
假設2:煤炭企業選擇綠色開采策略,在政府監管的情況下,企業的收益為R1-C1+T。其中,C1表示企業的綠色開采成本;T表示綠色開采企業獲得的政府補貼、稅收優惠等相關獎勵。政府的收益為T0-Cg,其中,T0表示環境改善帶來的整個社會福利的提高。在政府不監管的情況下,煤炭企業的收益為R1-C1,政府的收益為T0。
假設3:煤炭企業選擇非綠色開采策略,在政府監管的條件下,企業收益為R2-C2-F。其中,F表示煤炭企業非綠色開采受到的懲罰或者損失的收益;C2表示企業非綠色開采的成本。政府收益為G-Cg,其中,G表示政府對企業采取懲罰而獲得的收益。政府不監管條件下,煤炭企業的收益R2-C2,政府的收益為0。
建立博弈雙方收益矩陣,見表1。由于政府和煤炭企業不能準確判斷對方的策略選擇,博弈雙方以一定的概率進行策略選擇,進而形成一種混合策略。無論哪一方獨自改變自己的策略都不會增加額外收益。因此,本文通過演化博弈分析此混合策略。

表1 博弈雙方收益矩陣Table 1 Return matrix for both game players
通過表1的政府監管部門和煤炭企業的收益矩陣,可得下面幾種收益。
1) 政府監管與不監管的期望收益和平均收益分別見式(1)~(3)。
E11=y(To-Cg)+(1-y)(G-Cg)=
G-Cg+yTo-yG
(1)
E12=yTo+(1-y)×0=yTo
(2)

(3)
政府采取監管策略的復制動態方程見式(4)。
x(1-x)(-yG+G-Cg)
(4)
2) 企業綠色開采和非綠色開采策略的期望收益和平均收益分別見式(5)~(7)。
E21=x(R1-C1+T)+(1-x)(R1-C1)=
R1-C1+xT
(5)
E22=x(R2-C2-F)+(1-x)(R2-C2)=
R2-C2-xF
(6)

(7)
因此,企業采取綠色開采策略的復制動態方程見式(8)。
y(1-y)[x(T+F)+R1-C1-R2+C2]
(8)

由式(4)和式(8)組成的微分方程系統的雅可比矩陣來判斷其平衡點的穩定性,見式(9)。

(9)
系統局部均衡點處的具體取值見表2。
其中:

(10)

(11)
2.3.1 情形1:G 此種情況下,政府監管成本高于政府對非綠色開采企業的罰款,在扣除成本和政府罰款之后,企業非綠色開采所獲收益依然高于綠色開采的利潤和政府獎勵。系統演化穩定結果見表3。只有A(0,0)是演化穩定策略,對應的策略組合為(不監管,非綠色開采)。圖1為對應的系統動態演化圖。在該種情況下,政府方面G 表2 局部均衡點處取值情況Table 2 Values at the local partial equilibrium point 表3 情形1的局部穩定性分析Table 3 Partial stability of case 1 圖1 情形1演化結果Fig.1 Evolution results of case 1 2.3.2 情形2:G 政府監管成本高于政府對非綠色開采企業的罰款,企業綠色開采與非綠色開采收益增加大于兩者的成本增加。系統演化穩定結果見表4。只有B(0,1)是演化穩定策略,對應的策略組合為(不監管,綠色開采)。此時的系統動態演化結果如圖2所示。在該種情況下,政府方面G 2.3.3 情形3:G>Cg,R-C1+T 政府對非綠色開采企業的罰款高于監管成本,企業非綠色開采收益在扣除成本與罰款后仍然大于綠色開采利潤與獎勵。系統演化穩定結果見表5。只有C(1,0)是演化穩定策略,對應的策略組合為(監管,非綠色開采)。圖3為系統動態演化結果。政府對非綠色開采企業的罰款所得高于監管成本,政府監管積極性提高。而企業由于非綠色開采獲得的收益在扣除開采成本和政府罰款后仍然高于有政府獎勵政策下的綠色開采所得,從“經濟人”角度考慮,企業會選擇綠色開采。 表4 情形2的局部穩定性分析Table 4 Partial stability of case 2 圖2 情形2演化結果Fig.2 Evolution results of case 2 表5 情形3的局部穩定性分析Table 5 Partial stability of case 3 平衡點TrJ(跡)DetJ(行列式)結果A(0,0) 不確定-鞍點B(0,1) 不確定-鞍點C(1,0) -+ESSD(1,1) ++不穩定點 2.3.4 情形4:G>Cg,-F-T 政府對非綠色開采企業的罰款高于監管成本,企業非綠色開采利潤大于綠色開采利潤,但企業非綠色開采在扣除政府對其罰款之后小于政府對綠色開采補貼與利潤之和。演化穩定結果見表6。系統不存在演化穩定策略,系統動態演化結果如圖4所示。監管之初,政府獲得收益達到了期望值,會選擇監管;考慮到政府監管,企業會選擇綠色開采;然而,政府繼續監管除了增加監管成本,還要給予企業相應的補貼和優惠,于是,政府選擇不監管;企業因為政府的不監管繼而選擇非綠色開采。如此反復,兩博弈主體之間沒有穩定演化策略。 圖3 情形3演化結果Fig.3 Evolution results of case 3 表6 情形4的局部穩定性分析Table 6 Partial stability of case 4 平衡點TrJ(跡)DetJ(行列式)結果A(0,0)不確定-鞍點B(0,1)不確定-鞍點C(1,0)不確定-鞍點D(1,1)不確定-鞍點O(x?,y?)00中心點 圖4 情形4演化結果Fig.4 Evolution results of case 4 為更直觀地描述博弈中各參數對演化穩定策略的影響,下面使用Matlab對演化博弈四種情形進行仿真檢驗,以探究其對演化穩定狀態的影響機制。 根據情形1的條件設置各參數并進行調整,得到仿真結果如圖5所示。此時,政府監管收益低于預期收益,而監管成本較高,調整這兩個參數不會影響最終的演化穩定策略。但政府監管成本和預期收益會對博弈系統達到均衡狀態的速率有所影響。在該情況下,調整企業的綠色開采收益、非綠色開采收益、綠色開采成本、非綠色開采成本、政府補貼及非綠色開采情況下政府罰款和企業損失參數會對演化穩定策略有影響。綠色開采利潤與非綠色開采利潤之差較小時,部分小企業會選擇綠色開采,這部分企業沒有政府罰款,其政府補貼正好能彌補與非綠色開采利潤差值。而大部分企業會選擇非綠色開采以獲取更多收益,說明政府對其懲罰力度較小,且政府的補貼等獎勵政策對其吸引力較小。對于推廣綠色開采技術,此情況應當引起重視,以便及時采取適當的措施改進企業僥幸心理,否則綠色開采技術難以推廣,甚至環境和資源等會進一步破壞。 圖5 情形1仿真結果Fig.5 Simulation results of case 1 根據情形2的條件設置各參數并進行調整,得到仿真結果如圖6所示。政府監管收益低于預期收益,而監管成本較高,調整這兩個參數并不能影響最終的演化穩定策略。但政府監管成本和預期收益會對達到均衡狀態的速率有所影響。在該情況下,調整企業的綠色開采收益、非綠色開采收益、綠色開采成本、非綠色開采成本、政府補貼及非綠色開采情況下政府罰款和企業損失等參數不會改變演化穩定策略,只會影響博弈系統達到均衡狀態的速率。企業綠色開采收益和成本等參數的改變加速了演化博弈達到穩定狀態。情形2在現實生活中并不常見,一般會出現在管理層思想先進,資源雄厚的企業。絕大數傳統企業思想固化不會主動對開采技術進行改革。 根據情形3的條件設置各參數并進行調整,得到仿真結果如圖7所示。政府實施監管之初經驗不足,對企業的懲罰力度較小,所獲收益低于預期,政府監管意愿會較小;后期隨著監管制度的完善,政府最終會選擇監管。調整這兩個參數不會影響最終的演化穩定策略。但政府監管成本和預期收益會對博弈系統達到均衡狀態的速率有所影響。在該情況下,調整企業的綠色開采收益、非綠色開采收益、綠色開采成本、非綠色開采成本、政府補貼及非綠色開采罰款和企業損失等參數也不會改變演化穩定策略,只會影響博弈系統達到均衡狀態的速率。情形3在現實生活中比較常見,煤炭企業屬于傳統企業,管理層思想固化, 不愿意引進創新人才對開采技術進行改革,而政府作為綠色開采技術的推動者,必然要采取措施對企業進行整頓。 圖6 情形2仿真結果Fig.6 Simulation results of case 2 圖7 情形3仿真結果Fig.7 Simulation results of case 3 根據情形4的條件設置各參數并進行調整,得到仿真結果如圖8所示。此情形中沒有穩定均衡策略,得到中心點(0.5,0.5)。在此情況下政府和企業都選擇了混合戰略,博弈雙方會根據彼此策略的變化改變策略,雙方有一定的相互依賴性,這種策略選擇有一定的周期性。 圖8 情形4仿真圖Fig.8 Simulation results of case 4 1) 完善綠色開采制度體系。將礦區周圍的地表塌陷面積、水污染程度等納入績效考核,通過給予企業相應補貼和稅收優惠政策,激發企業綠色開采的積極性。遵循“誰綠色、誰受益”的原則,支持企業使用綠色開采技術,給予企業綠色開采設備和材料購買的補貼。 2) 降低綠色開采風險。完善綠色開采法律法規,明確煤炭資源屬于國有,使綠色開采有法可依。通過立法解決煤炭開采過程中對地表及水資源等污染的問題,推動綠色開采技術的推廣,降低綠色開采的風險,保護企業權益。 3) 強化綠色開采的內在激勵。營造“誰綠色、誰光榮”的氛圍,對于更換綠色開采設備的企業,政府不但給予企業一定的補貼和稅收優惠政策,并授予供應商和開采企業榮譽稱號,調動企業使用先進開采技術的積極性,從而實現企業和供應商的雙贏。 4) 推動綠色開采技術的市場化。大力建設市場化的技術中介服務體系,結合企業對開采過程中對設備、材料等的需求,有效解決企業技術創新成本高的難題。加大對技術服務部門的溝通,形成市場化、網絡化和專業化的技術交流平臺。








3 仿真設計
3.1 情形1博弈仿真

3.2 情形2博弈仿真
3.3 情形3博弈仿真


3.4 情形4博弈仿真

4 建 議