摘要:
為探討廢舊電器電子產品(WEEE)回收過程中各參與主體的策略選擇問題,構建了一個包含政府、回收處理商、制造商和消費者的四方演化博弈模型,分析了系統演化穩定策略及條件,利用數值仿真探究了關鍵參數對各主體行為策略的影響。研究結果表明,政府獎懲機制能夠激勵回收處理商、制造商和消費者實施綠色策略,但激勵作用呈現邊際效應遞減趨勢,政府應充分發揮引導作用,完善WEEE回收的獎懲機制,科學地確定合理的獎懲力度;學習效應與政府實施獎懲策略的概率呈負相關,學習效應是回收處理商實施正規回收的內在動力,回收處理商應重視學習效應的影響,關注綠色回收成本的投入過程中經驗的積累和總結,最大化學習效應所產生的效果,積極開展正規回收處理。
關鍵詞:
廢電器回收;獎懲機制;學習效應;演化博弈
中圖分類號:F224.32;F426
文獻標志碼:A
隨著工業化和城市化的快速發展,廢棄電器電子產品(Waste Electrical and Electronic Equipment,WEEE)的產生量急劇增加,既包含有毒有害物質,又包含可再生利用物質,兼具環境危害性和資源性。中國已成為電器電子產品的生產、消費與廢棄大國。據家用電器研究院估算,2023年中國家用電器理論報廢量為26億臺,而行業總體拆解處理量約為9 700萬臺,正規回收處理率不到40%[1],WEEE回收處理仍面臨嚴峻形勢。政府為促進WEEE正規回收行業發展,出臺了一系列政策法規,其中,具有顯著成效的是生產者責任延伸制度(Extended Producer Responsibility,EPR)。2016年,國務院辦公廳發布《關于印發生產者責任延伸制度推行方案的通知》,EPR制度將生產者對其產品承擔的資源環境責任從生產環節延伸到產品設計、流通消費、回收利用、廢物處置等全生命周期,并明確了生產者的責任范圍,包括開展生態設計、使用再生原料等[2]。在此基礎上,國務院于2020年再次修訂了《固體廢物污染環境防治法》,明確新形勢下“國家鼓勵產品的生產者開展生態設計,促進資源回收利用”[3]。即EPR制度要求生產者不僅要考慮產品報廢后的環境影響,還要通過生態設計減少產品生命周期的環境影響[4],為回收產業和環保工作提供了明確的方向指引和規范依據。研究表明,EPR制度能夠激勵生產商參與正規回收和實施生態設計[5],對WEEE回收再利用和環境保護有意義重大。然而,現實中回收處理商往往優先考慮直接經濟效益而選擇非正規回收處理,環保意識淡薄的消費者受回收價格、便利性等因素影響,將WEEE出售給非正規回收商[6],致使正規回收處理率較低。已有研究[710]探討了WEEE回收行業中政府獎懲機制的有效性,但忽視了能激勵回收處理商正規回收的消費者綠色行為以及學習效應。學習效應指員工、組織或整個行業因重復勞動與經驗積累,而提升生產效率、降低成本的現象。1936年Wright[11]對學習效應展開研究后,眾多行業紛紛探索將其應用于自身生產運營的方法[1213],如研究了閉環供應鏈中的成本學習效應[1415]。回收處理商通過回收處理量的積累而降低綠色回收成本的過程體現了學習效應的“邊做邊學”機制,但其學習效果目前尚不明確,對WEEE回收處理階段的學習效應缺乏關注。本文將學習效應納入WEEE回收研究范疇,拓展了傳統的“政府—企業”二元框架,通過引入學習效應模型和消費者行為參數,構建四方演化博弈模型并進行策略分析和數值仿真,探討學習效應和獎懲機制對各主體策略選擇的影響。
1 演化博弈模型
1.1 基本假設及參數
假設1 政府、回收處理商、制造商和消費者四個博弈方均為有限理性主體,能學習和適應動態的環境變化,在演化博弈中不斷調整和優化自己的策略,博弈關系如圖1所示。
假設2 博弈四方各有兩種策略選擇:政府{實施獎懲、不實施獎懲};回收處理商{實施正規回收處理,實施非正規回收處理};制造商{實施生態設計、實施非生態設計};消費者{參與正規回收,參與非正規回收}。政府實施獎懲的概率為x0≤x≤1,不實施獎懲的概率為1-x;回收處理商實施正規回收的概率為y0≤y≤1,實施非正規回收的概率為1-y;制造商實施生態設計的概率為z0≤z≤1,實施非生態設計的概率為1-z;消費者參與正規回收的概率為w0≤w≤1,參與非正規回收的概率為1-w。
假設3 無論政府是否實施獎懲,都需要治理非正規回收處理商造成的環境損害,成本為eE,e表示政府單位環境治理成本,E代表非正規回收處理商對環境造成的損害,假設正規回收處理商不會對環境造成破壞[16]。政府實施獎懲時,依據制造商是否實施生態設計對其應繳納的環境稅額T采取不同的減免比例α0≤α≤1,當其實施非生態設計時α=0,制造商應繳納的環境稅稅額為1-αT;政府給予正規回收處理商綠色回收補貼βD′,β0lt;βlt;1為補貼系數,D′為實施正規回收處理需要投入的綠色回收成本;政府對非正規回收處理商的罰款金額為F,對參與正規回收的消費者發放補貼金額S。
假設4 制造商實施生態設計策略時獲得的收益為Rm1,生產成本為Cm1,可為政府增加社會和環境效益B1;制造商實施生態設計降低的正規回收處理商的成本用ΔC1表示;當制造商實施非生態設計時,收益為Rm2,生產成本為Cm2,由于制造商需額外投入資金來升級制造技術和設備以及使用新的可持續利用的原材料,因此有Cm1gt;Cm2。
假設5 消費者參與正規回收時出售WEEE的收益為Rc1,獲得政府補貼S,成本為Cc1,為政府產生社會和環境效益B2,降低正規回收處理商的回收成本[17],降低的成本為ΔC2;消費者參與非正規回收時,收益為Rc2,成本為Cc2,且Rc1-Cc1lt;Rc2-Cc2,這是由于回收價格和便利性等因素,消費者參與正規回收的成本高于非正規回收,且參與正規回收的收益低于非正規回收。
假設6 回收處理商選擇正規回收處理時的收益為Rr1,成本為Cr1,選擇非正規回收處理方式的收益為Rr2,成本為Cr2;回收處理商實施正規回收處理可為政府帶來社會和環境效益B3;基于經典學習曲線理論[1819],假設正規回收處理商的單位綠色回收成本D隨累積回收處理量Qt的增加而下降,t代表學習效應的某階段,表示為D′=DQt/Q0-k,D′為考慮學習效應后的單位綠色回收成本,Q0為初始階段的正規回收處理量,k為學習指數,與學習率LR相關,滿足LR=1-2-k;在無外部激勵約束的情況下,回收處理商不會主動進行正規回收,即Rr1-Cr1lt;Rr2-Cr2[20](下標g、r、m、c分別代表政府、回收處理商、制造商以及消費者)。
1.2 收益矩陣與復制動態方程
基于上述假設、參數設置及四方主體之間的關系,得到四方演化博弈主體的收益矩陣見表1。可得政府實施獎懲的期望收益fg1,不實施獎懲策略的期望收益fg2及平均期望收益fg分別為
fg1=yzwB1+B2+B3+1-αT-S-βD′+yz1-wB1+B3+1-αT-βD′+
y1-zwB2+B3+T-S-βD′+y1-z1-wB3+T-βD′+
1-yzwB1+B2+1-αT-S+F-eE+1-yz1-wB1+1-αT+F-eE+
1-y1-zwB2+T-S+F-eE+1-y1-z1-wT+F-eE(1)
fg2=yzwB1+B2+B3+yz1-wB1+B3+y1-zwB2+B3+y1-z1-wB3+
1-yzwB1+B2-eE+""""""" 1-yz1-wB1-eE+
1-y1-zwB2-eE-1-y1-z1-weE(2)
fg=xfg1+1-xfg2
由此求得政府的復制動態方程為
Fgx=xfg1-fg=x1-xfg1-fg2=x1-x-yβD′+1-yF+1-zαT-wS(3)
回收處理商選擇正規回收的期望收益fr1,選擇非正規回收的期望收益fr2及平均期望收益fr分別為
fr1=xzwRr1-Cr1-D′+βD′+ΔC1+ΔC2+xz1-wRr1-Cr1-D′+βD′+ΔC1+
x1-zwRr1-Cr1-D′+βD′+ΔC2+x1-z1-wRr1-Cr1-D′+βD′+
1-xzwRr1-Cr1-D′+ΔC1+ΔC2+1-xz1-wRr1-Cr1-D′+ΔC1+
1-x1-zwRr1-Cr1-D′+ΔC2+1-x1-z1-wRr1-Cr1-D′(4)
fr2=xzwRr2-Cr2-F+xz1-wRr2-Cr2-F+x1-zwRr2-Cr2-F+
x1-z1-wRr2-Cr2-F+1-xzwRr2-Cr2+1-xz1-wRr2-Cr2+
1-x1-zwRr2-Cr2+1-x1-z1-wRr2-Cr2(5)
fr=yfr1+1-yfr2
由此求得回收處理商的復制動態方程為
Fry=y1-yRr1-Cr1-Rr2-Cr2-D′+xβD′+xF+zΔC1+wΔC2(6)
制造商選擇生態設計的期望收益fm1,選擇非生態設計的期望收益fm2以及平均期望收益fm分別為
fm1=xywRm1-Cm1-1-αT+xy1-wRm1-Cm1-1-αT+
x1-ywRm1-Cm1-1-αT+""""""" x1-y1-wRm1-Cm1-1-αT+
1-xywRm1-Cm1+1-xy1-wRm1-Cm1+
1-x1-ywRm1-Cm1+1-x1-y1-wRm1-Cm1(7)
fm2=xywRm2-Cm2-T+xy1-wRm2-Cm2-T+x1-ywRm2-Cm2-T+
x1-y1-wRm2-Cm2-T+1-xywRm2-Cm2+1-xy1-wRm2-Cm2+
1-x1-ywRm2-Cm2+1-x1-y1-wRm2-Cm2(8)
fm=zfm1+1-zfm2
由此求得制造商的復制動態方程為
Fmz=zfm1-fm=z1-zfm1-fm2=z1-zRm1-Cm1-Rm2-Cm2+xαT(9)
消費者參與正規回收的期望收益fc1,參與非正規回收的期望收益fc2以及平均期望收益fc分別為
fc1=xyzRc1-Cc1+S+x1-yzRc1-Cc1+S+1-xyzRc1-Cc1+
1-x1-yzRc1-Cc1+xy1-zRc1-Cc1+S+x1-y1-zRc1-Cc1+S+
1-xy1-zRc1-Cc1+1-x1-y1-zRc1-Cc1(10)
fc2=xyzRc2-Cc2+x1-yzRc2-Cc2+1-xyzRc2-Cc2+
1-x1-yzRc2-Cc2+xy1-zRc2-Cc2+x1-y1-zRc2-Cc2+
1-xy1-zRc2-Cc2+1-x1-y1-zRc2-Cc2(11)
fc=wfc1+1-wfc2
由此求得消費者的復制動態方程為
Fcw=wfc1-fc=w1-wfc1-fc2=w1-wRc1-Cc1-Rc2-Cc2+xS(12)
2 四方演化博弈主體策略穩定性分析
2.1 政府策略穩定性分析
根據微分方程穩定性原理,政府策略選擇處于演化穩定狀態時必須滿足Fgx=0且Fg′xlt;0。對式(3)求x一階偏導數,得Fg′x=1-2x-yβD′+1-yF+1-zαT-wS。令Fgx=0,得y=y0=F+1-zαT-wS/βD′+F,x=0和x=1。當y=y0時,Fgx≡0,此時無論政府選擇何種策略,均處于演化穩定狀態,策略選擇不隨時間的變化而變化;當y≠y0時,x=0和x=1是兩個可能的演化穩定點。根據演化博弈論,若Fg′xlt;0,表示穩定點有效。若0lt;ylt;y0lt;1,則Fg′0lt;0,Fg′1gt;0,此時x=0為穩定點,即政府選擇不實施獎懲;若0lt;y0lt;ylt;1,則Fg′0gt;0,Fg′1lt;0,此時x=1為穩定點,即政府選擇實施獎懲。
2.2 回收處理商策略穩定性分析
對式(6)求y一階偏導數,得Fr′(y)=(1-2y)[(Rr1-Cr1)-(Rr2-Cr2)-D′+xβD′+xF+zΔC1+wΔC2]。令Fr′(y)=0,得x=x0=[(Rr2-Cr2)-(Rr1-Cr1)+D′-zΔC1-wΔC2]/(βD′+F),y=0和y=1。x=x0時,Fr(y)≡0,即此時無論回收處理商是否實施正規回收處理,都處于穩定狀態;x≠x0時,兩個可能的穩定點為y=0和y=1;若0lt;xlt;x0lt;1,則Fr′0lt;0,Fr′1gt;0,此時y=0為穩定點,即回收處理商選擇非正規回收;若0lt;x0lt;xlt;1,則Fr′0gt;0,Fr′1lt;0,此時y=1為穩定點,即回收處理商選擇正規回收。
2.3 制造商策略穩定性分析
對式(9)求z一階偏導數,得Fm′z=1-2zRm1-Cm1-Rm2-Cm2+xαT。令Fmz=0,得x=x0=Rm2-Cm2-Rm1-Cm1/αT,z=0和z=1。當x=x0時,Fmz≡0,即無論此時制造商作何選擇,都處于穩定狀態;當x≠x0時,兩個可能的穩定點為z=0和z=1。若0lt;xlt;x0lt;1,則Fm′0lt;0,Fm′1gt;0,此時z=0為穩定點,即制造商選擇非生態設計;若0lt;x0lt;xlt;1,則Fm′0gt;0,Fm′1lt;0,此時z=1為穩定點,即制造商選擇生態設計。
2.4 消費者策略穩定性分析
對式(12)求w一階偏導數,得Fc′w=1-2wRc1-Cc1-Rc2-Cc2+xS。令Fcw=0,得x=x0=Rc2-Cc2-Rc1-Cc1/S,w=0和w=1。當x=x0時,Fcw≡0,此時無論消費者采取何種策略,均處于穩定狀態;當x≠x0時,兩個可能的穩定點為w=0和w=1。若0lt;xlt;x0lt;1,則Fc′0lt;0,Fc′1gt;0,此時w=0為穩定點,即消費者選擇參與正規回收;若0lt;x0lt;xlt;1,則Fc′0gt;0,Fc′1lt;0,此時w=1為穩定點,即消費者選擇參與非正規回收。
3 系統演化穩定性分析
聯立式(3)、(6)、(9)和(12),求得演化博弈四維動力系統為
Fgx=x1-x-yβD′+1-yF+1-zαT-wSFry=y1-yRr1-Cr1-Rr2-Cr2-D′+xβD′+xF+zΔC1+wΔC2Fmz=z1-zRm1-Cm1-Rm2-Cm2+xαTFcw=w1-wRc1-Cc1-Rc2-Cc2+xS(13)
令Fgx=Fry=Fmz=Fcw=0,得到16個純策略平衡解:E10,0,0,0,E21,0,0,0,E30,1,0,0,E40,0,1,0,E50,0,0,1,E61,1,0,0,E71,0,1,0,E81,0,0,1,E9(0,1,1,0),E10(0,1,0,1),E110,0,1,1,E121,1,1,0,E131,1,0,1,E141,0,1,1,E150,1,1,1,E161,1,1,1。根據Friedman的演化博弈理論[21],通過復制動態方程所得到的穩定點必須嚴格屬于純策略納什均衡,因此,只判斷16個純策略平衡點的穩定性。對應的Jacobi矩陣為
J=FxxFxyFxzFxwFyxFyyFyzFywFzxFzyFzzFzwFwxFwyFwzFww=J11J12J13J14J21J22J23J24J31J32J33J34J41J42J43J44(14)
其中,J11=1-2x-yβD′+1-yF+1-zαT-wS,J12=-x1-xβD′+F,J13=-x(1-x)αT,J14=-x1-xS,J21=y1-yβD′+F,J22=[(Rr1-Cr1)-(Rr2-Cr2)-D′+xβD′+xF+zΔC1+wΔC2]1-2y,J23=y1-yΔC1,J24=y1-yΔC2,J31=z1-zαT,J32=0,J33=1-2zRm1-Cm1-Rm2-Cm2+xαT,J34=0,J41=w1-wS,J42=0,J43=0,J44=1-2wRc1-Cc1-Rc2-Cc2+xS。
根據李雅普諾夫判定法則,當平衡點所有特征值都小于零時,該平衡點為演化穩定策略(ESS)。經過分析,16個平衡點中有9個演化穩定點(表2)。分析E161,1,1,1,確定為最理想的演化穩定狀態。
表2 四方演化博弈中純策略平衡點的穩定性分析
平衡點特征值穩定性平衡點特征值穩定性
E1(0,0,0,0)
F+T
(Rr1-Cr1)-(Rr2-Cr2)-D′
(Rm1-Cm1)-(Rm2-Cm2)
(Rc1-Cc1)-(Rc2-Cc2)
不穩定
E9(0,1,1,0)
-βD′+(1-α)T
(Rr2-Cr2)-(Rr1-Cr1)+D′-ΔC1
(Rm2-Cm2)-(Rm1-Cm1)
(Rc1-Cc1)-(Rc2-Cc2)
穩定:條件⑤
E2(1,0,0,0)
-F-T
(Rr1-Cr1)-(Rr2-Cr2)-(1-β)D′+F
(Rm1-Cm1)-(Rm2-Cm2)+αT
(Rc1-Cc1)-(Rc2-Cc2)+S
穩定:條件①
E10(0,1,0,1)
-βD′+T-S
(Rr2-Cr2)-(Rr1-Cr1)+D′-ΔC2
(Rm1-Cm1)-(Rm2-Cm2)
(Rc2-Cc2)-(Rc1-Cc1)
不穩定
E3(0,1,0,0)
-βD′+T
(Rr2-Cr2)-(Rr1-Cr1)+D′
(Rm1-Cm1)-(Rm2-Cm2)
(Rc1-Cc1)-(Rc2-Cc2)
不穩定
E11(0,0,1,1)
F+(1-α)T-S
(Rr1-Cr1)-(Rr2-Cr2)-D′+ΔC1+ΔC2
(Rm2-Cm2)-(Rm1-Cm1)
(Rc2-Cc2)-(Rc1-Cc1)
不穩定
續表2
平衡點特征值穩定性平衡點特征值穩定性
E4(0,0,1,0)
F+(1-α)T
(Rr1-Cr1)-(Rr2-Cr2)-D′+ΔC1
(Rm2-Cm2)-(Rm1-Cm1)
(Rc1-Cc1)-(Rc2-Cc2)
不穩定
E12(1,1,1,0)
βD′-(1-α)T
(Rr2-Cr2)-(Rr1-Cr1)+(1-β)D′-F-ΔC1(Rm2-Cm2)-(Rm1-Cm1)-αT
(Rc1-Cc1)-(Rc2-Cc2)+S
穩定:
條件⑥
E5(0,0,0,1)
F+T-S
(Rr1-Cr1)-(Rr2-Cr2)-D′+ΔC2
(Rm1-Cm1)-(Rm2-Cm2)
(Rc2-Cc2)-(Rc1-Cc1)
不穩定
E13(1,1,0,1)
βD′-T+S
(Rr2-Cr2)-(Rr1-Cr1)+(1-β)D′-F-ΔC2(Rm1-Cm1)-(Rm2-Cm2)+αT
(Rc2-Cc2)-(Rc1-Cc1)-S
穩定:
條件⑦
E6(1,1,0,0)
βD′-T
(Rr2-Cr2)-(Rr1-Cr1)+(1-β)D′-F
(Rm1-Cm1)-(Rm2-Cm2)+αT
(Rc1-Cc1)-(Rc2-Cc2)+S
穩定:
條件②
E14(1,0,1,1)]
-F-(1-α)T+S
(Rr1-Cr1)-(Rr2-Cr2)-(1-β)D′+F+ΔC1+ΔC2(Rm2-Cm2)-(Rm1-Cm1)-αT
(Rc2-Cc2)-(Rc1-Cc1)-S
穩定:
條件⑧
E7(1,0,1,0)
-F-(1-α)T
(Rr1-Cr1)-(Rr2-Cr2)-(1-β)D′+F+ΔC1(Rm2-Cm2)-(Rm1-Cm1)-αT
(Rc1-Cc1)-(Rc2-Cc2)+S
穩定:
條件③
E15(0,1,1,1)
-βD′+(1-α)T-S
(Rr2-Cr2)-(Rr1-Cr1)+D′-ΔC1-ΔC2
(Rm2-Cm2)-(Rm1-Cm1)
(Rc2-Cc2)-(Rc1-Cc1)
不穩定
E8(1,0,0,1)
-F-T+S
(Rr1-Cr1)-(Rr2-Cr2)-(1-β)D′+F+ΔC2(Rm1-Cm1)-(Rm2-Cm2)+αT
(Rc2-Cc2)-(Rc1-Cc1)-S
穩定:
條件④
E16(1,1,1,1)
βD′-(1-α)T+S,
(Rr2-Cr2)-(Rr1-Cr1)+(1-β)D′-F-ΔC1-ΔC2(Rm2-Cm2)-(Rm1-Cm1)-αT,
(Rc2-Cc2)-(Rc1-Cc1)-S
穩定:
條件⑨
E16(1,1,1,1)成為演化穩定點需滿足:(1-α)T-βD′-Sgt;0,(Rr2-Cr2)-Flt;(Rr1-Cr1)-(1-β)D′+ΔC1+ΔC2,(Rm2-Cm2)-αTlt;Rm1-Cm1,Rc2-Cc2lt;(Rc1-Cc1)+S。此演化穩定點被認為是最理想的,因為政府的獎懲機制有效激發了回收處理商、制造商和消費者實施綠色策略的積極性,對提高WEEE的正規回收處理率產生積極影響,有利于資源節約和環境保護。平衡點成為演化穩定點需滿足的條件見表3。
4 "數值仿真
為考察四方演化路徑和關鍵參數對主體策略選擇的影響,使用Matlab軟件進行數值模擬和仿真。參數取值主要基于2023年小米空調在京東的銷售價格[22],并借鑒現有文獻[15,23]:x=y=z=w=05,T=15,α=02,β=015,F=13,S=1,Rm1=21,Cm1=16,ΔC1=08,Rm2=18,Cm2=13,Rc1=26,Cc1=02,ΔC2=1,Rc2=34,Cc2=01,Rr1=8,Cr1=65,Rr2=9,Cr2=57,D′=11。
4.1 系統演化路徑分析
由圖2可以看出,隨時間推移,政府率先較快向實施獎懲方向演化并迅速達到穩定狀態。隨著政府實施獎懲概率p的增大,制造商和消費者先后朝綠色策略方向逐步演化。在初始階段,回收處理商傾向于實施非正規回收處理,但隨著政府獎懲機制的落實以及消費者和制造商綠色策略實施意愿的增強,其演化方向有所轉變,最終權衡收益和成本后選擇實施正規回收處理。
4.2 參數敏感度分析
為分析主要參數的變化對四方策略演化的影響,模擬分析獎懲機制和學習效應。獎懲機制的參數包括β,F,S,以及α。考慮到正規回收處理商回收過程中存在學習效應,本文還對學習效應相關參數,即LR和Qt進行了數值模擬分析。
4.2.1 政府獎懲機制對相關主體策略選擇的影響 為保證系統的演化穩定性,β∈(0,01·8·),F∈(0935,+∞),S∈(09,1035),α∈(0,0223·),其他參數不變:β=010,014,018;F=13,15,17;S=098,100,102;α=010,015,020。
由圖3可知,政府的獎懲力度與各主體綠色策略選擇概率之間存在正相關關系,然而這一激勵效果呈現邊際效應遞減趨勢。在初期,獎懲力度的增加帶來較為明顯的綠色策略演化速度提升,但隨著獎懲力度的進一步加大,速度提升幅度卻越來越小,充分體現了邊際效應遞減的規律。盡管如此,在合理范圍內適度加大獎懲力度,仍然不失為一種有效的政策手段。
4.2.2 學習效應的影響 參考相關文獻[18,24],LR=003,019,034。研究學習效應對系統演化路徑的影響時,取LR=003。結合第3節中的演化博弈四維動力系統,比較圖4與圖2發現,LR對回收處理商的行為策略影響最為明顯,對政府影響較小,對另外兩個主體沒有影響。
在圖5(a)中,LR增加了回收處理商選擇正規回收的概率。LR=0時表示不考慮學習效應,與之相比,LR=003以及LR=019時回收處理商實施綠色策略的概率顯著增加。隨著LR的增大,回收處理商由非正規回收策略向正規回收策略轉變的時間點會逐漸提前。當LR=034時,對回收處理商策略選擇的影響較其他取值時變化量較小,由此可見,LR的變化對回收處理商策略選擇的影響呈現邊際遞減的趨勢。圖5(b)中,學習效應與政府實施獎懲策略的概率呈負相關關系,即學習效應在一定程度上能降低政府實施獎懲的概率,然而二者之間的關系強度相對較為微弱,結合實際分析,政府主導下的決策過程受到多種利益權衡等因素的影響,這會削弱學習效應與獎懲機制實施概率之間的關聯強度。
由圖6可知,隨著累積回收處理量Qt的增加,回收處理商實施正規回收的意愿明顯增加。然而,LR的提高,累積回收處理量的增加產生的影響呈現逐漸衰弱的趨勢。由此可見,當LR達到某一特定水平后,隨著經驗的持續積累以及回收量的不斷增加,原本由這些因素所帶來的諸如綠色回收成本節約等效益將逐漸變得不再顯著,即學習效應不再明顯。
5 結論
本文通過引入消費者行為與學習效應,探討了獎懲機制下各個主體參與意愿的動態演變。政府實施包括環境稅、綠色回收補貼、罰款以及消費者補貼的獎懲機制能夠激勵相關主體實施綠色策略,而學習效應能在無外部獎懲約束時增強回收處理商的正規回收意愿,當學習率達一定水平后,經驗積累所產生的學習效應對于成本節約的作用將漸趨式微。因此,政府應在合理范圍內設置獎懲力度,建立回收行為數字溯源平臺(如通過螞蟻鏈實現“行為—記錄—獎勵”閉環),及時感知各主體行為并實施獎懲,確保獎懲機制充分發揮作用。回收處理商在學習效應較強的階段,應充分利用成本節約優勢擴大業務規模或升級技術;節約效果減弱時,積極探索新的綠色回收工藝或流程以減輕成本壓力。在未來的研究中,可在此基礎上深入探究消費者綠色購買行為對制造商和回收處理商綠色行為的作用機制,這與現實情境更為契合。
參考文獻
[1]中國廢棄電器電子產品回收處理及綜合利用行業白皮書2023[J].家用電器,2024(7):5271.
[2]國務院辦公廳.國務院辦公廳關于印發生產者責任延伸制度推行方案的通知[EB/OL]. [20241125]. http://www.gov.cn/zhengce/content/201701/03/content_5156043.htm
[3]中華人民共和國生態環境部.固體廢物污染環境防治法[EB/OL]. [20241125]. https://www.mee.gov.cn/ywgz/fgbz/fl/202004/t20200430_777580.shtml
[4]常香云,潘婷,鐘永光,等.EPR制度約束下生產—再制造競爭系統的雙環境責任行為分析[J].系統工程理論與實踐, 2021, 41(4): 905918.
[5]儲濤,鐘永光,孫浩,等.考慮消費者碳責任的家電產業“碳中和”路徑研究[J].系統工程理論與實踐, 2024, 44(3): 10181037.
[6]王慧敏,馬敬愛,郭振起,等.WEEE逆向物流回收模式評價與優化[J].青島大學學報(自然科學版),2020,33(3):129135.
[7]CHU T, ZHONG Y G, JIA W Q. Incorporating selfemployed maintainers into WEEE formal recycling system: A system dynamic approach[J]. Journal of Environmental Management, 2023, 345: 118777.
[8]HU Z X, MA J G, ZHONG Y G, et al. Multiagent behavior strategies of WEEE recycling considering public participation under environmental regulation: A perspective of dual governance[J]. Journal of Cleaner Production, 2024, 484: 144327.
[9]馬敬愛,鐘永光.生產者責任延伸制下WEEE回收多主體參與策略選擇研究[J]. 軟科學,2021, 35(7):122129.
[10] WANG Z, DUAN Y R, HUO J Z. The impact of government intervention measures on recycling of waste electrical and electronic equipment in China considering consumer decision[J]. Energy Policy, 2022,160: 112697.
[11] WRIGHT T P. Factors affecting the cost of airplanes[J]. Journal of the Aeronautical Sciences, 1936, 3(2): 122 128.
[12] YELLE L E. The learning curve: Historical review and comprehensive survey[J]. Decision Sciences, 1979, 10(2): 302328.
[13] RAMAN K, CHATTERJEE R. Optimalmonopolist pricing under demand uncertainty in dynamic markets[J]. Management Science, 1995, 41(1): 144162.
[14] JIAO J L, CHEN Y Q, LI J J, et al. Carbon reduction behavior of waste power battery recycling enterprises considering learning effects[J]. Journal of Environmental Management, 2023, 341: 118084.
[15] 陸芬,徐和,周品.成本學習效應對供應鏈渠道決策的影響[J].中國管理科學,2019,27(6):5363.
[16] LI B Y, WANG Q X, CHEN B X, et al. Tripartite evolutionary game analysis of governance mechanism in Chinese WEEE recycling industry[J]. Computers amp; Industrial Engineering, 2022, 167: 108045.
[17] WAN Y, YANG L. Differential recycling strategies and government intervention in a closedloop supply chain[J]. Computers amp; Industrial Engineering, 2024, 187: 109816.
[18] FERIOLI F, SCHOOTS K, VAN DER ZWAAN B C C. Use and limitations of learning curves for energy technology policy: A componentlearning hypothesis[J]. Energy Policy, 2009, 37(7): 25252535.
[19] CASTREJONCAMPOS O, AYE L, HUI F K P. Effects of learning curve models on onshore wind and solar PV cost developments in the USA[J]. Renewable and Sustainable Energy Reviews, 2022, 160: 112278.
[20] WANG Z, WANG Q X, CHEN B X, et al. Evolutionary game analysis on behavioral strategies of multiple stakeholders in Ewaste recycling industry[J]. Resources, Conservation and Recycling, 2020, 155: 104618.
[21] FRIEDMAN D. Evolutionarygames in economics[J]. Econometrica: Journal of the Econometric Society, 1991, 3: 637666.
[22] 京東. 小米空調一級能效1.5匹商品詳情頁[EB/OL]. [20241125]. https://item.jd.com/100039042553.html.
[23] 吳勇毅.小米空調成功逆襲給家電行業的啟示[J].家用電器, 2024(9): 8283.
[24] MCDONALD A, SCHRATTENHOLZER L. Learning rates for energy technologies[J]. Energy Policy, 2001, 29(4): 255261.