周澤輝, 張桂濤, 尹曉娜
(青島大學 商學院,山東 青島 266100)
隨著全球氣候變暖、環境污染等問題的日益嚴重,政府對環境問題愈加重視。自20世紀90年代以來,中國成為碳排放增長最快的新興大國,二氧化碳排放量占世界總排放量的比重迅速上升[1]。當前,全球正面臨著新一輪經濟發展方式的變革,其中低碳經濟正以不可逆轉的趨勢改變著人們的生活方式和生產方式。低碳經濟的主要特征是污染小、能耗低、排放少,是未來世界經濟發展的新方向,這種經濟發展方式與當下中國經濟發展方向相適應,也正是當下中國經濟發展的必由之路。
在政府實行碳減排政策的過程中,企業作為實施碳減排的主體,在一定程度上決定政府碳減排問題能否順利解決,當然政府碳減排政策又會在一定程度上決定企業是否選擇碳減排策略,兩者相互影響,相互聯系[2]。一方面,在國家倡導發展低碳經濟的新形勢下,企業為了避免受到政府巨額的罰金,紛紛響應國家號召積極選擇碳減排策略,進行低碳生產;另一方面,由于越來越多的消費者具有低碳偏好,這促使他們在購買低碳產品時自愿支付更高的價格[3],這也進一步提高了企業選擇低碳生產的積極性。但我國大多數企業由于自身資金不足或碳減排技術不夠成熟等限制,很難獨立實施低碳生產[4]。而低碳服務提供商[5,6]正是為由于自身原因無法進行低碳生產但本身又有強烈減排意愿的制造業企業提供碳減排技術服務。因此,本文基于此背景,引入低碳服務提供商,以三方主體之間的博弈過程和演化路徑為研究重點,最終實現政府、企業以及低碳服務提供商三贏的結果。
關于碳減排問題,有學者通過構建生產者制造/再制造最優生產決策模型,尋求碳減排投資對社會福利最大化的策略[7,8]。另外國內外學者主要以兩方主體構建演化博弈模型,尋找最佳演化穩定策略[9]。其中大多數國內外學者對政府和企業之間低碳決策行為做了大量的研究,如WU等[10]基于復雜網絡的環境下,分析了政府與企業的低碳策略,促進了低碳戰略在企業的應用和發展。ZHAO等[11]發現政府直接補貼和優惠稅率都能夠促進企業低碳生產,特別是當兩者結合時,能夠最有效的提高企業碳減排的積極性。肖林功[12]通過對地方政府監管成本、地方政府罰金與創新補貼、企業低碳技術創新成本等因素進行分析,得出了地方政府與物流企業演化博弈策略。與肖林功不同的是,劉枚蓮等[13]結合前景理論構建了低碳策略下政府與企業的演化博弈模型,分析了環境惡化風險成本、懲罰成本及補貼力度等因素對政府與企業低碳策略選擇的影響,為政企低碳發展提供了理論依據。這部分學者主要考慮政府補貼力度、政府懲罰力度、政府監管成本環境惡化風險成本等主要因素對企業碳排放行為的影響。以上學者均以兩方利益主體進行有關演化博弈的研究,現如今部分學者已經開始對有關低碳問題的三方演化博弈展開研究,如孫夙鵬等[14]基于我國當下嚴峻的環境形勢,構建了政府、企業和環境NGO的三方演化博弈模型,運用Matlab軟件進行數值仿真,分析各參數變量對演化博弈過程的影響,探析低碳經濟背景下各主體決策的穩定策略和演化路徑。徐建中[15]考慮低碳經濟的背景下,構建了政府、企業和消費者的三方演化博弈模型,研究得出影響系統演化至穩定狀態的重要因素。不難發現,學者們在研究有關低碳問題的三方演化博弈時,通常都是在以政府與企業為兩方主體的基礎上,再引入第三方主體從而構成三方演化博弈。
綜上所述,國內外學者已經在碳排放領域取得較為豐碩的成果,同時也為本文的研究提供了相關的理論基礎,但仍存在一定的局限性:第一,雖然以往學者對碳排放問題進行了相關的三方演化博弈研究,但是他們考慮的三方沒有涉及低碳服務提供商;第二,目前雖有很多文獻考慮到政府補貼力度與政府懲罰力度對企業碳減排的影響,但尚未有學者將政府補貼力度與政府懲罰力度對企業敏感性影響進行對比研究。基于以上情況,本文將政府、企業以及低碳服務提供商為主體構建演化博弈模型,運用演化博弈理論研究低碳經濟背景下如何有效的推動三方演化博弈模型向穩定策略發展,以期為我國低碳經濟提供理論借鑒。
在碳減排三方演化博弈中,政府、企業、低碳服務提供商(以下簡稱提供商)為三方核心利益主體,三方主體都以自身利益為最終目標,在博弈過程中信息是不完全對稱的,且三方主體均為有限理性主體,會通過預測其它兩方的策略來改變自己的策略,最終取得三方都能夠接受的策略集。
假設1政府會因其社會效益、監管成本、環境治理成本及環境效益等因素自愿性選擇“監管”策略或“不監管”策略,其中采取“監管”策略的概率為x,采取“不監管”策略的概率為1-x(0≤x≤1)。
假設2企業會因其基礎收益、額外收益、政府帶來的補貼或罰金及企業單獨選擇不合作的罰金等因素自愿性選擇與提供商進行“合作”的策略或“不合作”的策略,其中采取“合作”策略的概率為y,采取“不合作”策略的概率為1-y(0≤y≤1)。
假設3提供商會因其基礎收益、企業購買碳減排服務的成本、低碳服務提供商提供服務時所花費的成本及政府帶來的補貼或罰金等因素自愿性選擇與企業進行“合作”的策略或“不合作”的策略,其中采取“合作”策略的概率為z,采取“不合作”策略的概率為1-z(0≤z≤1)。
假設4設企業生產的產品會對環境帶來一定的影響,當企業購買提供商的低碳服務時,所生產的產品為低碳產品,對環境所帶來的效益為W。環境效益W將計算在政府的主體收益函數中。
假設5在企業與提供商合作時,如果企業與提供商有一方選擇了“合作”,另一方選擇“不合作”的時候,不合作的一方需要支付一定的罰金給合作的一方。假設企業單獨選擇不合作的罰金為Z1,提供商單獨選擇不合作的罰金為Z2,如果企業選擇合作而提供商選擇不合作,則提供商需要向企業支付的罰金為Z3,反之企業需要向提供商支付的罰金為Z1。如果存在雙方都選擇不合作的情況則雙方都不需要支付罰金。
假設6政府只有在監管狀態下對實行低碳生產的企業進行補貼,對無法實行低碳生產的企業進行處罰;無論政府在監管或者不監管的狀態下,都會對提供商的進行補貼,但分為愿意提供碳減排服務和愿意并且成功提供碳減排服務兩種補貼,政府對提供商的處罰只有一種情況,便是在政府監管狀態下,企業選擇合作但提供商選擇不合作時,此時政府要對提供商進行處罰。
博弈模型中,三方均是有限理性的參與主體,三方主體均根據自己的意愿進行策略的選擇,其中(1)政府收益包括社會效益、監管成本、支出的“補貼”或收入的“處罰”、環境治理成本及環境效益六部分;(2)設企業的基礎收益為Π1,主要為銷售高碳產品所帶來的收益,假設市場中存在消費者綠色低碳偏好,所以當企業花費c4向提供商購買低碳服務時,企業的收益將會提高Π3;(3)設提供商的基礎收益為Π2,當提供商提供服務的成本為c3,企業花費c4向提供商購買低碳服務時,提供商的收益將會增加c4-c3。基于上文的假設和三方主體策略選擇,可以構建出不同情景狀態下博弈收益支付矩陣[16]。
2.1.1 政府復制動態微分方程
根據Malthusian動態方程原理[17],刻畫政府的監管概率的復制動態微分方程可表示為:

=x(1-x)(U-U′-c+k2+y(k5-z(k1-k2-k5)))
(1)
2.1.2 企業復制動態微分方程
根據Malthusian動態方程原理,刻畫企業的合作概率的復制動態微分方程可表示為:

=y(1-y)(Z2-z(Z2-Z1+c2-Π3-x(k1+k2)))
(2)
2.1.3 提供商復制動態微分方程
根據Malthusian動態方程原理,刻畫提供商的合作概率的復制動態微分方程可表示為:

=z(1-z)(Z1+k3-y(Z1-Z2+c3-c4+k3-k4-xk5))
(3)
對于政府、企業和提供商三方的演化博弈,可以用上文中求解出來的政府、企業和提供商三方主體決策行為策略選擇的復制動態微分方程來描述,三式聯立可得政府、企業和提供商的三維動態系統,根據三個復制動態微分方程先構造出雅克比矩陣J:

=x(1-x)(U-U′-c+k2+y(k5-z(k1-k2-k5)))

=y(1-y)(Z2-z(Z2-Z1+c2-Π3-x(k1+k2)))

=z(1-z)(Z1+k3-y(Z1-Z2+c3-c4+k3-k4-xk5))
根據WEINSTEIN[18]提出的微分方程穩定性原理,令F(x)=0、G(y)=0、H(z)=0,可得到三維復制動態系統的所有均衡解,其中有8組純策略解,其余為非純策略解。依據演化博弈理論,滿足雅可比矩陣的所有特征值都為非正時的均衡點為系統的演化穩定點ESS。非對稱演化博弈的策略組合(均衡點)為演化穩定均衡點說明其肯定是嚴格納什均衡,而嚴格納什均衡又是純策略均衡,表明穩定均衡點只有在純策略均衡點中產生,所以只需討論8個純策略均衡點的漸進穩定性。
由李雅普諾夫判別規則可知,在構造雅可比矩陣后,求出在各個純策略均衡點條件下雅可比矩陣的特征值,然后根據所有特征值的正負情況來判定各個純策略均衡點是否為演化穩定點。當均衡解的Jacobian矩陣的所有特征值λ都小于0時此均衡解具有漸進穩定性,即ESS點;當均衡解的Jacobian矩陣的所有特征值λ都大于0時此均衡解不具有漸進穩定性,即不穩定點;當均衡解的Jacobian矩陣的特征值λ有正有負時,此均衡解為鞍點。
在政府、企業以及提供商三方演化博弈中,由于政府監管機構監管時所得到的社會效益大于政府監管機構不監管時所得到的社會效益,即U>U′;企業銷售低碳產品所帶來的額外收益大于企業生產低碳產品時所花費的額外成本,即Π3>c2;企業購買碳減排服務的成本大于碳減排服務提供商提供服務的成本,即c4>c3;政府對無法實行低碳生產的企業給予的處罰大于政府對無法實行低碳生產的企業給予的處罰,即k2>c;則Q2(1,1,0)、Q3(1,0,1)、Q4(1,0,0)、Q6(0,1,0)、Q7(0,0,1)為鞍點,Q8(0,0,0)為不穩定點。
把8組純策略解代入雅克比矩陣J,可得系統均衡解局部穩定性分析表。
當U>U′+c+k1時,即政府監管機構監管時所得到的社會效益大于政府監管機構不監管時所得到的社會效益與政府監管機構監管的成本與政府對實行低碳生產的企業給予的補貼之和時,則Q1(1,1,1)為穩定點,反之當U3 演化穩定策略數值分析
本研究最終目標是達到政府不監管、企業與提供商選擇共同合作的狀態,尋找趨近于漸進穩定點Q5(0,1,1)的博弈策略,根據上文的演化博弈的模型研究,進一步通過數值仿真進行分析。具體參數設置為:k1=2.5,k2=4,Π1=3,Π2=4,Π3=8,U=5,U≤1.5,W=2,c=2,c1=2,c2=4.7,c3=2.7,c4=3.2,c5=3,k3=1,k4=1.5,k5=3,Z1=0.9,Z2=0.8;且政府、企業和提供商的初始參與意愿值都設置為0.5。運用MATLAB2019a軟件對其策略選擇的演化路徑進行數值分析。
通過對上述的具體參數進行數值仿真,可以驗證在政府、企業及提供商在滿足設定的約束條件的情況下,三方演化博弈主體能夠隨t演化到穩定策略。初始值為x0=0.5,y0=0.5,z0=0.5,通過數值仿真可以發現,在滿足上述條件下,三方演化博弈主體最終演化至x=0,y=1,z=1的理想穩定狀態,也就是上文所提到的漸近穩定點Q5(0,1,1),此時三方的策略是政府不監管、企業與提供商選擇共同合作的理想狀態。
3.2.1 改變c對政府策略影響的數值仿真
在保證其他參數不變的前提下,將政府監管機構監管成本c的取值分別取0.5、0.75、1、1.5、2、2.5共仿真6次,可得政府策略選擇的演化路徑的仿真結果。
由仿真結果可以發現,當c=1時,政府選擇“監管”策略的概率不會趨向0或1,即無法收斂到穩定狀態;當c<1時,政府選擇“監管”策略的概率會趨向于1;當c>1時,政府選擇“監管”策略的概率會趨向于0。當政府監管機構監管的成本c的取值為1時,政府無法達到穩定狀態,也就是說,其他參數保持不變時,如果政府監管機構監管的成本c的取值小于1時,政府選擇“監管”策略的概率會收斂于1,且政府監管機構監管的成本c越小,收斂速度越快,反之如果政府監管機構監管的成本c的取值大于1時,政府選擇監管策略的概率會收斂于0,且政府監管機構監管的成本c越大,收斂速度越快。
這說明對于政府來說,監管目的是為了讓企業與提供商更加積極地去選擇“合作”策略,這樣一方面可以使政府節省環境治理成本,另一方面也可以使政府獲得企業銷售低碳產品所帶來的環境效益,但是政府監管成本需要被控制在一定合理范圍之內,只有這樣,政府才會選擇“監管”策略。
3.2.2 改變k1和k2對企業策略影響的數值仿真
在保證其他參數不變的前提下,將政府對實行低碳生產的企業給予補貼的成本k1的取值分別取1、2.5、4、5.5、7共仿真5次,可得企業策略選擇的演化路徑的仿真結果。政府對無法實行低碳生產的企業給予的處罰k2的取值分別取1、2.5、4、5.5、7共仿真5次,可得企業策略選擇的演化路徑的仿真結果。
由仿真結果可以發現,當k1=1時,企業選擇“合作”策略的概率趨向于1的速度最慢,這說明當政府給予企業補貼力度較小時,企業對于與提供商選擇合作的積極性較低;隨著k1的增大,企業選擇“合作”策略的概率趨向于1的速度會加快,這說明當政府提高了補貼力度時,企業會因為政府補貼的增加,從而更加積極地與提供商去尋求合作。
由仿真結果可以發現,當k2=1時,企業選擇“合作”策略的概率趨向于1的速度最慢,這說明當政府對企業的罰金較小時,企業對于與提供商選擇合作的積極性較低;隨著k2的增大,企業選擇“合作”策略的概率趨向于1的速度會加快,這說明政府提高了罰金金額時,企業會因為政府罰金的增加,從而只能選擇積極地與提供商去尋求合作。
將仿真結果對比來看,政府對企業給予的補貼以及政府對企業給予的處罰都會促使企業與提供商選擇合作,并且隨著補貼力度以及罰金金額的增加,企業與提供商合作的積極性也慢慢提高,但是不同的是,企業在改變k2情況下的收斂速度要比企業在改變k1情況下的收斂速度要快,這說明相比于政府對實行低碳生產的企業給予的補貼來說,政府對無法實行低碳生產的企業給予的處罰對企業選擇與提供商選擇“合作”策略的影響更大。
3.2.3 改變c3對提供商策略影響的數值仿真
在保證其他參數不變的前提下,將提供商提供服務的成本c3的取值分別取1.2、2.2、3.2、4.2、5.2、6.2、7.2、8.2、8.5、9.2共仿真10次,可得政府策略選擇的演化路徑的仿真結果。
由仿真結果可以發現,當c3=5.2時,提供商選擇“合作”策略的概率趨向于1的速度最慢,這說明當低碳服務提供商提供服務的成本較高時,提供商對于與企業選擇合作的積極性較低;隨著c3的減小,提供商選擇“合作”策略的概率趨向于1的速度會加快,這說明當低碳服務提供商提供服務的成本減少時,提供商會因為自身凈利潤增加,從而更加積極地與企業去尋求合作。
由仿真結果可以發現,當c3=8.5時,提供商選擇“合作”策略的概率不會趨向0或1,即無法收斂到穩定狀態;當c3<8.5時,提供商選擇“合作”策略的概率會趨向于1;當c3>8.5時,提供商選擇“合作”策略的概率會趨向于0。當低碳服務提供商提供服務的成本c3的取值為8.5時,提供商無法達到穩定狀態,也就是說,其他參數保持不變時,如果低碳服務提供商提供服務的成本c3的取值小于8.5時,提供商選擇“合作”策略的概率會收斂于1,且低碳服務提供商提供服務的成本c3越小,收斂速度越快,反之如果低碳服務提供商提供服務的成本c3的取值大于8.5時,提供商選擇合作策略的概率會收斂于0,且低碳服務提供商提供服務的成本c3越大,收斂速度越快。
這說明對于提供商來說,如若使提供商選擇“合作”策略地積極性提高,可以適當控制低碳服務提供商提供服務的成本,以達到政府、企業和提供商三贏的結果。
本文研究結果表明:(1)當U