摘" 要:新能源汽車的使用量急劇增長,對于到達使用壽命的電池若不及時回收拆解處理,便會造成環境的污染與公共資源的占用。基于此,文章構建動力電池回收商與地方政府之間的演化博弈模型,結合系統動力學理論,構建SD-演化博弈模型,借助Vensim仿真分析,驗證均衡點的穩定性,探討如何實現廢舊動力電池高效回收。研究表明,動力電池回收商與地方政府之間存在長期博弈,只有在地方政府采取具有懲罰措施的動態監管策略時,系統才能達到均衡穩定狀態,反之在靜態監管策略下系統不穩定。
" 關鍵詞:動力電池回收;獎懲策略;演化博弈論;系統動力學仿真
" 中圖分類號:F713.2" " 文獻標志碼:A" " DOI:10.13714/j.cnki.1002-3100.2025.01.019
Abstract: The use of new energy vehicles has increased rapidly, and if the batteries that have reached the service life are not recycled and disassembled in time, it will cause environmental pollution and the occupation of public resources. Based on this, an evolutionary game model between power battery recyclers and local governments is constructed, and an SD-evolutionary game model is constructed in combination with the system dynamics theory. The stability of equilibrium points is verified by Vensim simulation analysis, and how to achieve efficient recycling of used power batteries is discussed. The research shows that there is a long-term game between power battery recyclers and local governments, and only when local governments adopt a dynamic regulatory strategy with punitive measures, the system can reach an equilibrium and stable state. Conversely, the system is unstable under a static regulatory strategy.
Key words: power battery recycling; reward and punishment strategy; evolutionary game theory; system dynamics simulation
0" 引" 言
" 新能源汽車已經成為未來汽車產業的發展大勢,動力電池回收正處于新型發展的綠色產業的初步階段,產業回收體系初步建立。國內回收技術欠缺,動力電池回收市場混亂等問題都是在回收過程中存在的重大隱患。基于上述問題,國家高度重視新能源汽車動力電池的回收循環使用,并發布《生產者責任延伸制度推行方案》,要求生產者承擔相應的環境責任,且不僅局限于生產者。因此,完善動力電池回收體系,提高動力電池回收效率是亟待解決的問題。
" 眾多學者在電池回收模式、回收效率、回收制度等方面進行研究,為動力電池的回收貢獻了新的思想和策略。危浪等[1]通過建立“車企-消費者-地方政府”三方演化博弈模型,發現動力電池回收初期,地方政府對退役電池供需兩側的監管懲罰更為關鍵;回收技術成熟期,地方政府演變為寬松監管者,更有利于雙方盈利。在提高新能源汽車動力電池回收率的有效性方面,樓高翔等[2]運用博弈論建立3個回收決策模型,研究在不同補貼政策下電池的回收效率及社會福利的高低與補貼系數大小的關系。Wang Enci et al.[3]建立了在無地方政府情況下回收企業與消費者之間的演化博弈模型,分析了回收企業和消費者之間的決策行為,以及正向回收的趨勢是否受到地方政府的影響。結果表明,由于缺乏地方政府補貼,回收商和消費者很難在回收報廢動力電池方面取得共贏。張建同等[4]建立了廢舊動力電池循環再制造二級逆向供應鏈模型,綜合考慮消費者偏好與循環再制造風險后發現,再制造商負擔再制造模式更加有利于廢舊動力電池循環再制造以及再制造電池的應用。在通過信息與大數據改善動力電池回收體系方面,Gao Yanhong et al.[5]分析三方在動力電池回收過程中的戰略選擇,模擬了參與者意愿和信息壁壘對各方戰略選擇的影響,研究發現動力電池生產企業和回收企業相互合作的意愿隨著信息壁壘的增加而降低。Haijun Yu et al.[6]結合大數據信息的特點,分析了基于大數據的動力電池回收平臺的運行機制,建立了動力電池危險品運輸優化系統,利用改進的蟻群算法求得最短路徑模型,降低運輸成本和風險,最大限度地提高信息資源的價值,推動動力電池回收產業轉型升級。
" 演化博弈是一種區別于傳統博弈的研究方法,側重于靜態與動態兩種情況下系統能否達到均衡,因而在回收過程中被學者廣泛運用。在新能源汽車動力電池回收方面,王成功等[7]建立了地方政府、消費者與回收企業之間的演化博弈模型,研究各主體在博弈過程中的決策和穩定策略,并分析主要決策影響因素,結果表明參與者初始選擇策略的概率會影響系統最終穩定結果。劉艷龍[8]提出了政府、回收處理商、消費者之間的演化博弈模型,并在模型中納入了技術投資,從而擴展了演化博弈模型中各參與者的決策范疇,并從政府、回收處理商和消費者收益角度出發,分析不同情景下的三方策略演化路徑。
" Faridah Zulkipli et al.[9]在研究馬來西亞固體廢物管理中運用系統動力學的方法進行仿真研究,并對回收過程進行評估。趙林等[10]運用系統動力學的方法,建立了一個廢棄塑料托盤回收的數學模型,并運用PLE與Vensim對模型進行仿真,分析環保稅額與返利金對廢棄塑料托盤回收利潤與回收率的影響,得出了不同政策組合下的動態仿真結果。張玉春等[11]采用系統動力學方法,研究信息不對稱所導致的回收過程中產品質量不穩定問題,構建了回收品質控制模型,分析將回收比例和回收品質量預防水平作為信號傳遞的動態行為。
" 本文旨在探究新能源汽車動力電池回收過程中,動力電池回收商和地方政府之間的博弈關系,利用復制動態方程,推導出地方政府在靜態監管和動態獎懲措施下的系統均衡解,并對其穩定性進行分析。構建回收過程的系統動力學模型,使用Vensim軟件仿真了地方政府與新能源汽車動力電池回收商采取不同策略的情形,驗證與博弈均衡點的一致性。
1" 演化博弈模型的構建與分析
" 新能源汽車動力電池的回收由多個環節構成,回收的相關主體主要包括:新能源汽車制造商、銷售商、第三方回收主體、廢舊電池處理站、地方政府、消費者等,各主體之間存在不同的博弈關系,由于新能源汽車用戶遍布全國,僅靠整車企業回收非常困難,且一般整車企業都與第三方回收商存在合作關系,合作下的回收模式如圖1所示。
1.1" 模型構建與求解
1.1.1" 基本假設與收益矩陣
H1:在回收過程中博弈雙方的主體是有限理性的。
H2:在動力電池回收的過程中,會出現許多回收主體,但由于實際情況過于復雜,文中只考慮與新能源汽車制造商合作的第三方回收商(后文簡稱動力電池回收商)和地方政府這兩個主體。
" H3:動力電池回收商的決策集合為S=積極回收,消極回收,設選擇積極回收的概率為x,則選擇消極回收的概率為1
-x。假設地方政府的策略集為S=強監管,弱監管,地方政府選擇強監管策略是為了促進動力電池的有效回收,監管措施包括建立相應的獎懲制度,減免積極承擔回收責任的企業的稅負、提供財政補貼以及對消極承擔回收責任的企業進行罰款等。弱監管的行為往往表現為不采取政策上的補貼、減稅或其他形式的獎勵。假設地方政府采取強監管的概率為y,則采取弱監管的概率為1-y。
" H4:地方政府采取強監管措施促進動力電池的回收或新能源汽車制造商積極承擔回收責任所帶來的社會收益為B。地方政府在動力電池的回收過程中實施強監管措施時,資源占用會產生時間、行政、人力成本和其他隱性成本,將此記為地方政府的監管成本C。地方政府在實施弱監管政策時或者新能源汽車制造商回收處于消極狀態時,社會公共資源的占用和對環境污染的治理所引起的成本記為C。地方政府監管時,企業積極配合,地方政府對于積極配合的企業給予獎勵或補貼記為A,對于不積極配合的企業地方政府應當進行處罰,處罰金額記為F。
" H5:動力電池回收商積極回收動力電池直接收益設為B,間接節約成本設為B,積極回收時整個物流供應鏈運轉所需的費用成本設為C。
" 根據上述假設,構建動力電池回收商和地方政府之間收益矩陣如表1所示。
1.1.2" 模型求解
動力電池回收商選擇積極回收,消極回收和平均的期望收益分別為
U,U,U;地方政府強監管,弱監管和平均的期望收益分別為U,U,
U,如表2所示。
根據表1和表2,可得地方政府與新能源汽車動力電池回收商間演化博弈的復制動態方程為:
" " " " " " " " " " " " " "(1)
1.2" 模型分析
1.2.1" 靜態獎懲策略下系統穩定性分析
根據演化博弈的進化穩定策略的定義,令Fx=0,Fy=0,則系統演化得到如下五個Nash均衡點:0,0,0,1,1,0,1,1,, (考慮到實際情況,對地方政府與動力電池回收商雙方采取混合策略時演化博弈分析的穩定性進行分析,只著重討論B
+F-Cgt;0,0lt;C-B-Blt;A+F,因此0≤≤1, 0≤≤1)。將求得的五個均衡解代入系統的雅可比矩陣J=,根據局部分析穩定法,若使得均衡逐漸接近穩定狀態,得到演化均衡狀態ESS,需detJgt;0且trJlt;0。對五個均衡點進行分析得到以下穩定分析結果,如表3所示。
本文假設所有的政策性變量均為正數,且保證各個主體無論采取何種策略的收益均為正值,在滿足前提條件下,參照文獻[12]對參數進行賦值:B=1,C=1,B=3, B=2,C=6,A=1,F=1.5,C=1。對均衡解進行穩定性分析,發現即使是在中心點處, ,也達不到穩定狀態,因此動力電池回收商和地方政府構成的二維非線性動力系統在靜態獎懲策略下無法達到穩定狀態。
1.2.2" 動態獎懲策略下系統穩定性分析
在地方政府采取靜態的獎懲措施時,演化博弈模型無法達到穩定狀態,已有研究發現當地方政府采取動態的獎懲措施時可以提高均衡點的穩定性,結合實際情況構建地方政府采取動態獎懲措施下的復制動態方程,已知動力電池回收商選擇積極回收的概率為x,消極回收的概率為1-x,假設動力電池回收商選擇消極回收的概率與對環境的污染呈正相關,則地方政府選擇強監管時對選擇消極回收的企業的罰款由常數F變為Fx=α1-x,α為比例系數,地方政府強監管時對動力電池回收商的補貼和獎勵由常數A變為Ax=βx,β為比例系數,參照文獻取α=1.5,β=0.9,則式(1)的復制動態方程組變為:
(2)
表3中前四個均衡點也是式(2)的均衡點,分別是X=0,0, X=0,1, X=1,0, X=1,1。
" 本文將地方政府的獎懲分為三種情形討論:
(1)當地方政府策略只有獎勵且為動態時,即A=βx=0.9x,此時復制動態方程組為:
" " " " " " " " " " " " " " " " (3)
將1.2.1的參數值代入,令方程組等于0,解得X=, 。
(2)當地方政府策略只有懲罰且為動態時,即Fx=α1-x=1.51-x,此時復制動態方程為:
" " " " " " " " " " " " " (4)
同上將參數值代入,解得X=,。
(3)當地方政府策略獎懲并施且為動態時,即Fx=α1-x=1.51-x,A=βx=0.9x,此時復制動態方程為:
(5)
將參數值代入,解得X=, ,雅可比矩陣為:
J=" " " " " " " " (6)
首先分析均衡點0,0,將其帶入雅可比矩陣J中,即J==,顯然detJlt;0,trJ
gt;0,所以0,0點為不穩定點。同理可得余下均衡點的穩定性。
表4中只存在兩個均衡點,即只有地方政府所采取的動態策略中存在懲罰策略時,系統才會達到穩定狀態。
2" 系統動力學仿真分析
2.1" 系統動力學模型
利用Vensim軟件繪制流圖,可以很好的反映地方政府與動力電池回收商在動力電池回收過程中的反饋機制,詳細的表達出系統的結構,并可以直觀反映不同策略下的演化過程。根據表1動力電池回收商和地方政府的博弈支付矩陣及表2中的期望收益,構建SD模型如圖2所示。
2.2" 靜態獎懲策略下系統仿真分析
" 為了更加直觀的探究主體行為策略的演化過程,現對模型中的變量進行賦值,根據參考文獻[12],令B=1,C=1,B=3,B=2,C=6,A
=1,F=1.5,C=1。仿真初始時間設置為0,結束時間設置為100,步長設置為0.25。當動力電池回收商與地方政府初始策略分別為0.5,0.5,0.4,0.6,0.2,0.8時,博弈雙方行為策略的演化過程如圖3(a)、圖3(b)、圖3(c)所示:
" 根據圖3仿真分析可知,靜態獎懲下系統的演化過程是波動的周期性曲線,且隨著地方政府強監管概率的增大,波動的幅度也會增大,因此地方政府與動力電池回收商在靜態獎懲策略下不存在演化穩定均衡狀態,與靜態獎懲策略下演化博弈穩定性分析所得的結論一致。博弈行為不穩定會增大動力電池回收的難度,不利于動力電池回收行業的發展。
2.3" 動態獎懲策略下系統仿真分析
" 在Vensim軟件中將地方政府強監管時對積極回收的動力電池回收商給予的補貼或獎勵A,與地方政府強監管時對消極回收的動力電池回收商進行的處罰F,設為輔助變量,A=0.9x,F=1.51-x,并對SD模型做出重新改動,本文只列出地方政府獎懲均為動態時的SD模型,如圖4所示。設定仿真時間為200個月,開始時間為0,結束時間為200,單位月,時間步長設置為0.125。
考慮動力電池回收商與地方政府初始策略分別為0.5,0.5、0.4,0.6、0.2,0.8,地方政府的獎勵為動態時博弈雙方行為策略的演化過程如圖5所示,地方政府的懲罰為動態時博弈雙方行為策略的演化過程如圖6所示。
" 根據圖5分析得到,當地方政府所采取的獎懲策略只有獎勵為動態時,無論初始策略如何,地方政府和動力電池回收商之間演化博弈的結果都趨向于純策略1,1,并不是一種穩定的狀態,且在SD模型中通過增大獎勵力度A時發現,演化博弈策略趨于1,0,也未達到穩定,與動態獎懲策略下演化博弈穩定性分析所得的結論一致。
根據圖6分析得到,當地方政府所采取的策略只有懲罰為動態時,無論動力電池回收商與地方政府的初始策略如何,雙方演化博弈最終都會趨于穩定狀態,且雙方演化博弈策略穩定于均衡點X=,附近,與動態獎懲策略下演化博弈穩定性分析所得的結論一致。
" 地方政府獎懲均為動態時,為了便于更直觀的分析,取雙方初始策略組合為0.2,0.8時,將動力電池回收商積極回收x,地方政府強監管y分別在獎勵為動態,懲罰為動態,獎懲為動態,獎懲為靜態四種情況下進行比較,如圖7和圖8所示。
根據圖7和圖8可以直觀得到:(1)當地方政府對動力電池回收商的獎懲為靜態時,汽車企業選擇積極回收的概率與地方政府強監管的力度均呈現周期性波動,達不到穩定狀態;(2)當地方政府對動力電池回收商的獎勵為動態時,企業選擇積極回收的概率與地方政府強監管的力度均穩定于1,但并未達到Nash均衡;(3)當地方政府對動力電池回收商的懲罰為動態或獎懲均為動態時,企業選擇積極回收的概率與地方政府強監管的力度均穩定于某一值,且達到了Nash均衡。
3" 結束語
本文研究新能源汽車動力電池回收過程中回收商與地方政府之間的演化博弈問題,通過建立動力電池回收商與地方政府間的演化博弈模型,構建博弈雙方收益矩陣,并建立復制動態方程,通過雅可比矩陣分析演化博弈的均衡點,并利用Vensim軟件對回收系統進行仿真,以驗證系統均衡點的穩定性。本文還探究了地方政府強監管策略下獎懲策略的變動對動力電池回收的影響以及地方政府強監管概率閾值的問題。通過研究得到如下結論:(1)動力電池回收商與地方政府在靜態博弈下達不到演化穩定均衡狀態,當地方政府對動力電池回收商的懲罰為動態時,可以達到系統穩定狀態,且SD模型仿真結果與演化博弈模型分析一致;(2)動力電池回收商的策略選擇受到地方政府監管策略的影響,因此地方政府在動力電池回收系統中采取的監管措施至關重要;(3)影響動力電池回收商選擇積極回收還是消極回收的因素除了地方政府的強監管力度,獎懲措施外,還與動力電池回收商在回收過程中獲得的直接收益、間接收益,回收過程中整個供應鏈所耗費的物流成本有關。
" 因此,對于動力電池回收商,要加強其環保意識,增強社會責任感,地方政府要加強對動力電池回收市場的監管力度,完善動力電池回收法律法規,完善生產者責任延伸制。對于積極回收的動力電池回收商可以加大獎勵或者補貼額,促進動力電池回收商回收動力電池的積極性,同時對于消極回收的動力電池回收商,在懲罰上要嚴懲不貸。
" 基于現實動力電池回收因素的復雜性,回收主體的多樣性,本文簡化了回收主體之間錯綜復雜的回收關系,只選擇了新能源汽車生產企業與第三方回收商合作情況下的一個主體作為主要回收主體。本文在構建演化博弈模型與系統動力學模型時很多假設簡化了現實中主體間交互關系,且由于支付矩陣的限制一些次要影響因素并未設置在模型中。未來研究時可從以下幾方面進行深入研究:(1)建模需充分考慮新能源汽車動力電池的回收體系與市場的實際情況,回收體系不同主體之間的相互關系和國內外回收政策;(2)消費者這一大主體與第三方回收商在整個回收體系中如何交互、如何構建包含多個回收主體的理論模型是值得進一步研究的嶄新課題。
參考文獻:
[1] 危浪,王翠霞. 基于SD演化博弈的新能源車動力電池回收監管策略研究[J]. 系統科學與數學,2023,43(5):1314-1330.
[2] 樓高翔,雷鵬,馬海程,等. 不同回收補貼政策下新能源汽車動力電池閉環供應鏈運營決策研究[J]. 管理學報,2023,20(2):267-277.
[3]" WANG ENCI, NIE JIANYUN, WANG YUHAN. Government subsidy strategies for the new energy vehicle power battery recycling industry[J]. Sustainability, 2023,15(3):2090.
[4] 張建同,陳秀英. 考慮回收風險和消費者偏好的動力電池回收定價策略研究[J]. 上海管理科學,2022,44(3):83-90.
[5]" GAO YANHONG, LIU YOUDI, TAN ZHIXIONG, et al. Analysis of cooperation equilibrium of participants in power battery recycling chains considering information barrier[J]. Chinese Journal of Population, Resources and Environment, 2022,20(2):159-167.
[6]" HAIJUN YU, HONGLIANG DAI, GUANGDONG TIAN, et al. Big-data-based power battery recycling for new energy vehicles: Information sharing platform and intelligent transportation optimization[J]. IEEE Access, 2020,99(8):99605-99623.
[7] 王成功,劉娟娟. 考慮政府獎懲的動力電池回收利益相關者決策行為演化博弈分析[J]. 生態經濟,2023,39(4):205-213.
[8] 劉艷龍. 基于演化博弈的動力電池回收策略研究[D]. 重慶:重慶大學,2021.
[9]" FARIDAH ZULKIPLI, ZULKIFLI MOHD NOPIAH, NOOR EZLIN AHMAD BASRI, et al. Recycle evaluation using system dynamics for solid waste management in Malaysia[J]. International Journal of Recent Technology and Engineering (IJRTE), 2019(8):657-659.
[10] 趙林,顧巧論. 基于系統動力學的廢棄塑料托盤回收利用仿真分析[J]. 天津職業技術師范大學學報,2018,28(3):52-58.
[11] 張玉春,馮昱. 非對稱信息下閉環供應鏈回收品質量控制系統動力學分析[J]. 統計與決策,2019,35(1):67-72.
[12] 余福茂,王希鵑. 電子廢棄物非正規回收渠道監管策略的演化博弈研究[J]. 生產力研究,2016,48(9):74-77.