宋作玲 史欣




[摘要]在制造商、零售商、回收商等企業聯合回收模式下,聯合回收聯盟根據政府的激勵獎懲機制權衡自己的成本與績效。探討了政府進行補貼和懲罰策略對于聯合回收行為的影響,運用演化博弈的方法進行數學建模和數值仿真。仿真結果表明:兩種情況下達到穩定狀態,一種是綠色回收收益多于傳統回收收益時,另一種是懲罰監管成本與補貼激勵成本之差小于被懲罰的損失時。其余情況下,聯合回收主體是否選擇綠色回收由政府采取何種激勵機制的概率決定。通過博弈分析可以為政府監管機制選取以及聯合回收行為決策提供依據。
[關鍵詞]政府獎懲機制;電子廢棄物;聯合回收;演化博弈
[中圖分類號]F252.19???? [文獻標識碼]A???? [文章編號]1005-152X(2022)03-0058-05
Evolutionary Game Analysis of Government Reward and Punishment Mechanism in E-waste Joint Recycling
SONG Zuoling1,2, SHI Xin3
(1. College of Transportation, Shandong University of Science & Technology, Qingdao 266590;2. College of Economics & Management, Shandong University of Science & Technology, Qingdao 266590;3. College of Transportation Engineering, Dalian Maritime University, Dalian 116026, China)
Abstract: The paper pointed out that under the joint recycling setup involving the alliance made up of the manufacturer, retailer, and recycler, etc., the joint recycling alliance would weigh its own costs and performance according to the reward and punishment mechanism of the government. Then, it discussed how government subsidy or punishment would impact the joint recycling behavior, and used the evolutionary game method for mathematical modeling and numerical simulation. The simulation result indicated that equilibrium could be reached in two scenarios: one being when the green recovery return was more than the traditional recovery return; the other being when the difference between the punishment regulatory cost and the subsidy incentive cost was less than the loss from punishment. In other cases, whether thejoint recycling subjects chose green recovery was determined by the probability of the incentive or punitive measures taken by the government. The game analysis in this paper could provide reference for the selection of government supervision mechanism and the decision making onjoint recycling behaviors.
Keywords: government reward and punishment; e-waste;joint recycling; evolutionary game
0 引言
2020年,習近平主席在聯合國大會上宣布了中國的低碳目標,在2030年前實現碳達峰,2060年實現碳中和,充分顯示了中國政府參與環境治理的決心。作為工業門類最多的制造大國,在制造業開展碳中和目標對于整體目標達成尤為重要。
政府環境戰略目標、社會環境意識提高、環境和社會事故頻發等促使生產企業責任延伸的實踐,制造商作為焦點企業與供應鏈上下游參與者以及利益相關方協同,以實現經濟、環境、社會綜合績效提升。據《中國廢棄電子產品循環經濟潛力報告》顯示,2030年我國電子廢棄量將超過2700萬t,對環境破壞嚴重,因此,通過回收利用產生價值增值、節能降耗勢在必行。
使用關鍵詞或摘要“回收”“政府”“博弈”檢索核心期刊、EI、CSSCI共查詢出269篇,主要集中于閉環供應鏈、逆向物流等領域,側重研究政府補貼、激勵機制對于電子廢棄物、廢舊家電、電池、共享單車的回收渠道、機制、定價策略等的影響。
已有研究從制造商和零售商、回收商視角或者政府監管和制造商回收廢棄電子視角的博弈分析較多[1-3],少有文獻從政府獎懲和聯合回收視角進行博弈行為分析。聯合回收作為回收主體和渠道的一種有效方式,應該作為博弈主體進行分析,是對制造商和零售商、回收商聯盟模式的拓展分析,并且將政府環境規制引入供應鏈可持續治理。同時,考慮綠色回收產生的社會效益,進而找到促進回收逆向供應鏈的驅動機制。
回收聯盟采用技術創新、基礎設施布局、綠色研發、分類拆解等方式實現電子廢棄物的有效循環利用[4]。為了解決回收聯盟回收意愿低、綠色回收開發成本大、回收率低、回收利潤低等問題,政府可以對采取綠色回收的回收供應鏈聯盟給予一定的補貼,同時政府對于沒有有效履行延伸責任的供應鏈聯盟收取一定的環境污染處罰[5-6]。然而,政府監管也存在一定難度和監管成本。因此,權衡環境治理成本、監管成本、環境治理效益也是政府參與供應鏈治理的問題之一。
綜上,本文構建了包括回收聯盟和政府兩方的博弈模型,進行模型仿真并得出結論和建議。
1 模型假設與參數設置
假設博弈雙方僅具有有限理性,則:
(1)策略集合。政府對于回收聯盟治理的策略集記為 S1=(補貼,罰款);回收聯盟是否實施綠色回收的策略集記為S2=(綠色回收,傳統回收)。
(2)局中人行為策略采取的比例。假設政府實施激勵機制的概率為X,則政府采取懲罰機制的概率為 1-X;聯合回收主體選擇綠色回收的概率為Y,則其選擇不分類回收的概率為1-Y。
(3)參數假設及含義。聯合回收商選擇“綠色回收”時的收益為Pg;聯合回收商采用“傳統回收”方式得到的收益為Pt;回收聯盟選擇“綠色回收”時的可持續收益為 Sg;聯合回收商實施“綠色回收”的成本為 Cg;聯合回收商采用傳統回收方式的成本為 Ct;若聯合回收商主動選擇綠色回收,政府將給予一定的補貼,補貼系數為α,補貼程度為R;聯合回收商采用傳統回收方式受到政府懲罰的風險系數為β;聯合回收商采用傳統回收方式受到政府懲罰的損失為F。從政府層面,回收商選擇“綠色回收”時帶來的環境與社會效益為Eg;政府采取激勵或懲罰措施需要一定的人力物力,選擇激勵治理方式時監管成本為Cr,不包括給予企業聯盟的補貼部分,選擇懲罰治理方式時監管成本為Cf;回收商選擇沿用“傳統回收”進行廢棄電子產品的回收處理工作時,必將造成環境的破壞,由此政府進行環境污染及社會治理費用為Ce。政府和回收聯盟采取不同策略的收益見表1。
2 處理企業與回收中心之間的演化博弈模型構建
假設政府選擇“補貼”策略的期望收益為 G1,選擇“罰款”策略的期望收益為G2,平均收益記為E(G);回收商選擇“綠色回收”的期望收益為R1,選擇“傳統回收”的期望收益為R2,平均收益記為E(R)。根據上述假設和收益矩陣表1,可知政府對回收商實施補貼激勵機制的期望收益為:
政府采取懲罰機制的期望收益為:
則政府采取混合策略,即采取補貼激勵策略與懲罰策略的平均期望收益為:
根據演化博弈原理,可得政府策略的復制動態方程:
同理,聯合回收主體選擇綠色回收的期望收益為:
聯合回收主體選擇傳統回收的期望收益為:
則聯合回收主體采取混合策略的平均期望收益為:
求得聯合回收主體的復制動態方程,進而構建出政府—聯合回收主體演化博弈的復制動態方程組為:
在實際情況中,政府與聯合回收主體的最優策略選擇不可能一次性完成,需要不斷進行演化博弈來優化方案。在雙方博弈過程中,若聯合回收主體自覺選擇綠色回收廢棄電子產品,則政府為了社會經濟均衡發展會減弱對其的激勵與約束機制。反過來,當聯合回收主體沿用傳統回收方式時,政府就會加大激勵與約束機制的實施力度。因此,為了使研究結果更適用于現實生活,要對局中人策略進行穩定性分析。利用 Friedman 提出的局部穩定性分析法,通過構建Jacobian矩陣來分析各均衡狀態的穩定性。
令 FX=? ,FY=? ,根據演化穩定策略的性質與微分方程穩定性定理可知,當時,該點所對應的策略集為穩定策略。
對方程組求導得:
解得:
情形一:聯合回收主體采取策略的演化穩定性分析。
(1)當X=X0時,等式F(Y)=0恒成立,則區間內任意 Y 點均處于穩定狀態。
(2)當X>X0時,有Y=0 >0 ,Y=1 <0 ,
因此Y=1是穩定演化策略,聯合回收主體在此情況下選擇“綠色回收”。
(3)當X<X0時,有Y=0 <0 ,Y=1 >0 ,
因此Y=0是穩定演化策略,聯合回收主體選擇“傳統回收”。
綜上,當聯合回收主體選擇綠色回收廢棄電子產品付出的成本小于該方式下獲得的收益時,無論政府是否實施激勵與約束機制,有限理性聯合回收主體都會選擇綠色回收;當聯合回收主體選擇綠色回收廢棄電子產品付出的成本大于該方式下獲得的收益時,則聯合回收主體對于回收方式的選擇依賴于政府實施激勵與約束機制給其帶來利益還是損失。
情形二:政府采取策略的演化穩定性分析。
(1)當Y=Y0時,等式F(X)=0恒成立,則區間內任意X點均處于穩定狀態。
(2)當 Y>Y0時,有X =0 <0 ,X =1 >0 ,
因此X=0是穩定演化策略,政府在此情況下選擇“懲罰”。
(3)當 Y<Y0時,有X =0 >0 ,X =1 <0 ,
因此X=1是穩定演化策略,政府在此情況下選擇“補貼”。
綜上,當政府實施懲罰機制的成本與采取補貼激勵措施的成本之和低于聯合回收主體被懲罰的損失時,無論聯合回收主體是否選擇綠色回收廢棄電子產品,有限理性的政府都會選擇實施懲罰機制;當政府實施懲罰機制的成本與采取補貼激勵措施的成本之和高于聯合回收主體被懲罰的損失時,有限理性的政府策略的選擇取決于回收商對于回收手段的選擇。
情形三:雙方混合策略的演化穩定性分析。
依據動態系統復制方程式,可以得出當0≤X0≤1,0≤Y0≤1時,總共有五個復制動態均衡點,分別為(0,0)、(1,0)、(1,1)、(0,1)、(X0,Y0)。對于由微分方程描述的動態演化,其均衡點的穩定性一般通過雅克比矩陣分析,該系統的雅克比矩陣為:
將五個復制動態均衡點帶入,同時滿足det(J)>0和 tr(J)<0的點是漸進穩定的,對應著一個演化博弈。五個點的特征根見表2。
根據表2可知該復制動態方程組有四個鞍點和一個中心點,因此當政府與聯合回收主體的策略集為(X0,Y0)時,系統才能達到穩定。
3 模型仿真
根據博弈情境進行參數賦值,運用Matlab軟件進行模型仿真。
3.1 回收收益對于策略行為的影響
當綠色回收收益大于傳統回收收益,即 Pg>Pt 時,設置仿真1 數值為 Pg=5,Pt=4,Sg=1,Cg=2.5,Ct=1,α=0.5,β=0.5,F=1,R=4,Cf=2,Cr=1,Ce=1,則政府與聯合回收主體混合策略動態演化如圖1所示。