李艷梅,楊 沖,任恒君,牛丹丹(華北電力大學經濟管理系,河北 保定 071003)
全世界范圍內的能源需求持續擴大.當下,使用最多的是化石能源,化石能源的開發運用雖然方便,但大范圍的燃燒化石能源勢必使得二氧化碳過度排放,從而導致一系列環境問題.可再生能源是十分有效的節能減排途徑,但在實際推廣運用中卻遇到了一定的困難.由于可再生能源具有開發困難,采購應用成本較高的特點,企業對于可再生能源的投資使用意愿不夠強烈,可再生能源在實際生產中依然處于劣勢地位.可再生能源投資是實現能源轉型的重要途經,提高企業對于可再生能源投資的意愿,已經成為現階段中國應對能源安全和氣候變化雙重挑戰的重要抓手[1].
2021年7月16日,全國碳排放權交易市場(簡稱“碳市場”)開市,碳交易機制為可再生能源的發展和利用帶來了新的契機,同時也帶來了新的挑戰.碳排放權交易價格(簡稱“碳價”)是隨著時間和市場變化而不斷波動的,即碳價具有動態特征,碳價波動性導致可再生能源投資的收益具有不確定性,使可再生能源投資面臨一大挑戰,同時全國碳市場剛剛起步,同樣面臨諸多問題和挑戰[2].故本文擬探究碳交易機制下政府與發電企業的互動機理,研究促進發電企業投資可再生能源的邊界條件,為政企的決策提供指導.
對于可再生能源投資的問題,從研究內容來看,現有研究者主要集中在影響因素研究,可再生電力標準和可再生能源證書的政策[3],收入增長、外國直接投資、國內投資、城市化、物質基礎設施和制度質量[4],公眾吸引力[5],較高的經濟增長和不斷上升的失業率和政府債務水平[6],財政發展[7]等因素均對可再生能源投資有積極影響.從研究方法來看,ARDL 方法[8]、計量經濟學方法[9-12]、實物期權理論[13]以及實物期權理論和博弈理論[14-15]等是研究可再生能源投資的常用理論和方法.
演化博弈方法是研究碳交易驅動下政府與企業之間作用機制的有效工具,傳統博弈論如囚徒困境[16]等的基本假設均為完全理性,然而完全理性下個體理性與集體理性存在明顯沖突,嚴格來說無法解決現實世界中的問題.為解決這一情況,Smith等[17-18]首先提出了演化博弈以及演化穩定策略等概念,假定博弈主體是有限理性的,通過不斷試錯達到最優策略.
演化博弈中基于微分方程的復制動態模型是最為著名的,它最早是在1978年由Taylor 等[19]提出,是一種確定性的演化模型.Friedman[20]認為演化博弈在經濟領域有著極大的應用前景,這一演化動態已被廣泛地應用于社會科學的博弈模型的分析中.部分學者利用演化博弈模型研究動態獎懲機制對企業減排行為的影響[21-22],陸秋琴等[23]采用演化博弈方法探索發現動態碳規制策略會直接影響重污染企業碳減排策略選擇.有學者利用演化博弈方法研究發現環境政策(如碳配額、排放交易機制)有利于企業進行綠色技術創新和綠色產品的生產[24-28].
然而傳統的演化博弈理論僅能對確定狀態下各主體的策略演化進行研究,無法描述現實中的不確定性,因此有必要引入隨機干擾,對不確定環境下隨機演化的穩定性進行判斷[29],Foster 等[30]率先將隨機性引入復制動態方程中,提出了隨機微分方程模型,近年來隨機演化博弈在經濟管理領域快速發展,綠色、低碳技術創新[31-32],可持續發展[33],碳減排[34]均是研究的熱點問題.
現有文獻在運用傳統演化博弈方法進行碳市場下政企之間作用機制的相關研究時,往往把碳價當作一個穩定不變的因素進行考慮,沒有考慮到實際碳價具有波動性的特點,而這將使研究結果與現實存在一定的偏差.
綜上所述,現有的研究存在一定的不足,少有學者使用演化博弈模型研究碳市場背景下關于可再生能源投資的政企互動機制,同時現有的使用演化博弈方法研究碳市場的文獻多聚焦于傳統的確定性演化博弈,未能考慮到碳價的波動.因此本文應用幾何布朗運動(GBM)模型模擬碳價,考慮碳價的動態特征,在全國碳交易市場背景下構建政府與發電企業關于可再生能源投資的隨機演化博弈模型,研究政企雙方的策略選擇的演化規律以及各因素對演化的影響.本研究有利于發展可再生能源,推動電力行業能源清潔轉型,實現碳達峰、碳中和目標.
本文的貢獻如下:1.應用GBM 模型模擬碳價,構建考慮碳價波動性的隨機演化博弈模型,為碳交易機制下政企間演化博弈模型的構建提供新思路,同時考慮碳價的波動性使演化博弈模型更加貼合現實.2.通過仿真模擬,探究了靜態碳價和動態碳價情景下政企的演化過程.基于考慮碳價動態特征的隨機演化博弈模型,采用情景模擬法研究了政府、碳市場、火力發電和可再生能源的相關因素對政企雙方策略選擇的影響,為政企的決策提供指導.
演化博弈論是在有限理性的條件下,博弈群體基于獲得的信息和經驗不斷調整其策略的復雜動態博弈過程,其核心內涵是進化穩定策略和復制動力學[19].政府和發電企業作為演化系統的博弈方,雙方為有限理性,其中的發電企業屬于被納入全國碳市場第一個履約周期的發電行業中的重點排放單位[35].
全國碳市場的主體主要有三類:中央政府、地方政府和發電企業.中央政府負責碳市場的政策制定,包括制訂配額分配方案、核查技術規范及排放報告管理辦法以及碳市場穩定機制等,同時監督地方政府的行為;地方政府執行中央政府制訂的分配方案,對發電企業的進行監督,可采取作為或不作為兩種策略引導企業的低碳行為;發電企業根據減排成本和配額價格采取投資可再生能源的減排方式,或在碳市場購買配額.本文不考慮中央政府和地方政府之間存在的委托-代理問題,認為兩者具有完全信息、目標一致的特點,將其視為同一博弈主體.政府與發電企業的相互作用關系如圖1所示.

圖1 全國碳市場背景下政府與發電企業互動機制Fig.1 Interaction mechanism between government and power generation enterprises under the National Carbon Emission Trading Market
假設1:根據政府與發電企業的互動機制,發電企業有{EG1,EG2}={投資;不投資}兩種策略,其概率分別是x 和1-x.如果選擇不投資則繼續使用火力發電,如果選擇投資策略則投資并使用可再生能源發電.政府有{RG1,RG2}={作為;不作為}兩種策略,其概率分別是y 和1-y.
假設 2:獎懲政策是政企演化博弈模型的常用策略[21,36-39].政府選擇“作為”策略時,會積極實施獎懲政策,即政府對投資可再生能源的發電企業給予投資補貼,記為補貼S,而對繼續使用火力發電的企業征收環境保護稅,記為罰款F.政府為維持此策略,必然會消耗人力物力財力,故產生一定的成本,記為C.當政府選擇“不作為”策略時,不會對發電企業進行補貼和罰款,也無需付出成本.
假設3:火力發電存在負外部性,可再生能源存在正外部性[40],根據經濟學的外部性理論,外部性通常由整個社會承擔.無論政府是否選擇作為策略,當發電企業選擇投資策略時,社會都會因為環境改善而獲得環境方面的額外收益N,當發電企業選擇不投資策略時,社會因為環境污染而受到損失M.本研究中外部性全部由政府承擔,即發電企業選擇投資策略,則政府獲得收益N,發電企業選擇不投資策略,則政府受到損失M.
假設4:參考文獻[41-44]的碳排放量,發電收益以及配額分配的計算方法,設置發電企業選擇不投資策略時,火力發電收益為Rf,碳排放量為Q,選擇投資策略時收益為Rn,計算方法如下所示.
式中:pf代表火力發電的上網電價,元/(MW·h);cf代表火力發電的平均成本,元/(MW·h);w 代表發電企業發電機組總功率,MW;h 代表機組平均利用小時數,h;e 代表碳排放強度,t/(MW·h).pn代表可再生能源發電的上網電價,元/(MW·h);cn代表可再生能源發電的平均成本,元/(MW·h);ci是可再生能源機組投資建設的平均單位成本,元/MW;n 為可再生能源發電機組平均使用壽命,d.可再生能源發電幾乎不會產生碳排放,其碳排放量遠遠小于火力發電,所以認為可再生能源碳排放量為0.
假設5:碳市場可以對發電企業產生有效約束,當期分配給發電企業的初始碳配額為I=iQ,i 是碳配額分配基準值.設碳排放配額(CEA)交易價格為P.發電企業采取投資策略,可以出售多余的碳配額.發電企業采取不投資策略,碳排放量高于免費分配的碳排放額度(Q>I),其需要承擔碳排放成本,在碳交易市場購買碳配額.政府與發電企業雙方博弈的相關參數和解釋見表1.

表1 模型指標及定義Table 1 Model indicators and definitions
1.2.1 模型構建 政府與發電企業的博弈矩陣見表2,政府選擇作為策略(RG1)的概率為x,選擇不作為策略(RG2)的概率為1-x(0 發電企業選擇“投資”、“不投資”策略的期望收益,以及采取不同策略的平均期望收益可以分別表示為EP1、EP2和EP: 根據Malthusian 方程[20],政府和發電企業的復制動態方程如式(7)和式(8)所示. 令 F(x)=0 可得,x=0,1 或 y*=(F-C)/(S+F).令F(y)=0 可得,y=0,1 或 x*=-(Rn+QP-Rf)/(S+F).設π=Rn+QP-Rf,其代表的含義是發電企業選擇投資可再生能源的總收益與火力發電的總收益的差值. 當F(x)=0 且F(y)=0 時,系統不隨時間t 的變化而變化,達到穩定狀態,系統的局部均衡點(LEP)為E1(0,0),E2(0,1),E3(1,0),E4(1,1). 當F-C 1.2.2 穩定性分析 LEP 不一定是演化穩定策略(ESS),LEP 的穩定性可以由雅可比矩陣判斷,用J 表示確定性演化博弈系統的雅克比矩陣: 利用復制動態方程,可以分析政府和發電企業的演化博弈過程: 根據表2 中所示的矩陣,可得政府選擇策略{RG1,RG2}的收益分為{EG1,EG2}、發電企業選擇策略{RP1,RP2}的收益分為{EP1,EP2}.由博弈矩陣可得,政府選擇“作為”、“不作為”策略的期望收益,以及采取不同策略的平均期望收益可以分別表示為EA1、EA2和EA: 矩陣J 的行列式為: 矩陣J 的跡為: 其中: 若系統的LEP 滿足條件Det(J)>0 和Tr(J)<0,則是 ESS.特別的,當 E(x*,y*)滿足 Tr(J)=0 以及Det(J)>0 時,(x*,y*)是演化的中心點,政企選擇作為和投資策略的概率(x,y)圍繞(x*,y*)上下周期波動.LEP的Det(J)和Tr(J)結果如表3所示. 表3 LEP 的Det(J)和Tr(J)結果Table 3 Results of Det(J)and Tr(J)of the LEP 由于參數的取值不確定,局部均衡點是否為系統的演化穩定策略需要待進一步分析.當政府的監管成本C和發電企業投資可再生能源的額外收益π在區間內變動時,雙方在6 種情形下的演化穩定性分析結果見表4.其中‘+’代表大于0,‘-’代表小于0. 表4 6 種情況下的演化穩態Table 4 Evolutionary steady state under six scenarios (1)情形 1:當π=Rn+QP-Rf<-(S+F)且 0 (2)情形2:當-(S+F)<π=Rn+QP-Rf<0 且0 (3)情形3:當π=Rn+QP-Rf>0 且0<C<F 時,(0,1)是系統的ESS.此時發電企業投資可再生能源發電與出售碳配額的收益之和大于火力發電的收益,系統將趨向于(不作為,投資),是一種理想的狀態.政府不需要采取獎懲政策,碳交易機制發揮作用,促進發電企業投資可再生能源. (4)情形4:當π=Rn+QP-Rf<-(S+F)且C>F 時,(0,0)是系統的ESS. (5)情形5:當-(S+F)<π=Rn+QP-Rf<0 且 C>F時,(0,0)是系統的ESS.情形4 與情形5 一致,發電企業的火力發電收益較大,政府監管成本較高,雙方選擇(不作為,不投資)策略. (6)情形6:當π=Rn+QP-Rf>0且C>F時,(0,1)是系統的ESS.與情形3 一致是期望達到的最優情景,即政府不行動,發電企業自覺投資可再生能源. 1.3.1 動態碳價模型 假設碳價遵循非平穩隨機過程,由GBM 控制,本文按照文獻[45-48]的方法,建立碳價模型,如式(12)~(14)所示. 式中:p 表示碳價,μp代表碳價的年化增長率,σp代表碳價的年化波動率.zp是標準維納過程,其服從均值為0,方差為dt 的正態分布. 上式可以表示為: 1.3.2 考慮限價的碳價模型 全國碳市場剛剛建立,目前尚未出臺市場穩定調節機制的細則,建立碳價限制政策等市場調節機制和工具十分必要[49].參考文獻[50]中的碳價模型,建立考慮碳價下限的碳價模型. 式中:PFloor是碳價的下限. 1.3.3 改進的復制動態方程 生物學領域的鄭秀燈率先提出了在隨機環境中演化的隨機進化穩定性(SES)和隨機收斂穩定性(SCS)的概念,為建立隨機演化博弈理論的基本框架奠定了重要的基礎[51],本文將動態碳價引入演化博弈中,構建具有隨機支付矩陣的演化博弈模型(表5). 表5 政企雙方的隨機支付矩陣Table 5 Stochastic payment matrix of government and enterprises 改進后的具有隨機支付的復制動態方程如式(17)和(18)所示. 模型求解和模擬使用python 語言,運行在具有Intel(R)Core(TM)i5-8300H CPU @ 2.30GHz 2.30GHz 處理器、8GB RAM 和64 位的Windows操作系統上. 基于隨機演化博弈理論,設計政企雙方策略選擇的演化算法,對模型求解,具體的算法步驟如下: 步驟3:根據式(15)計算本期碳價格P(t). 步驟7:重復步驟2~6,達到設定的博弈迭代次數后終止仿真. 算法流程如圖2所示. 圖2 算法流程圖Fig.2 Flow chart of algorithm of stochastic evolution game model 為了驗證本文構建的模型,參考文獻[44,52-54]所用的典型算例,并結合政策文件,設置仿真的初始參數,仿真步長設置為1d. 以1年為365d 對參數進行折算處理,以1d 為單位進行仿真模擬.發電企業總裝機容量w=1600MW,機組年平均利用小時數為4000h,平均每天利用小時數為h=4000/365h.火力發電的平均發電成本cf=300元/MW·h,火力發電的碳排放強度e=0.9t/MW·h.可再生能源機組平均建設成本ci=3.5×106元/MW,平均使用壽命n=20年(即20×365d),可再生能源平均發電成本cn=360 元/MW·h.根據《國家發展改革委關于2021年新能源上網電價政策有關事項的通知》(發改價格〔2021〕833 號)規定,新能源平價上網,設上網電價pf=pn=450 元/MW·h.初始碳價取全國碳市場2022年1月至2023年7月的平均價格,即P0=57.6 元/t.設置政府每年的補貼金額S=1 億元,罰款金額F=1 億元,作為成本C=0.5 億元.將政企雙方策略選擇的初始概率設置為(0.5,0.5). 2.3.1 確定性演化博弈均衡仿真 將參數代入確定性演化博弈模型,調整x和y的初始值,進行多次模擬,演化結果見圖3 和圖4.x 代表政府選擇作為策略的概率,y 代表發電企業選擇投資策略的概率.t 代表時間(d),用于描述概率的收斂速度. 圖3 初始參數條件下政府的多次演化結果Fig.3 Government’s evolution results under initial parameter conditions 圖4 初始參數條件下發電企業的多次演化結果Fig.4 Power generation enterprises’ evolution results under initial parameter conditions 根據2.2.2 節的穩定性分析可知,設定的初始參數滿足情形1 的條件,故演化結果將收斂于(1,0),此時政企雙方的最優策略為(作為,不投資).圖3的模擬結果顯示演化結果均收斂于(1,0),與穩定性分析結果一致,驗證了確定性演化博弈模型和均衡分析的準確性和有效性,說明x 和y 的初始值不會影響演化的最終結果. 2.3.2 隨機演化博弈均衡仿真 根據2022年1月至2023年7月的碳價數據,設碳價的初始年化增長率和波動率分別為μP=0.0809 和σP=0.2754.將參數代入隨機演化博弈模型,進行100 次隨機模擬實驗,模擬的碳價見圖5,政企雙方策略選擇的演化過程見圖6 和圖7. 圖5 100 次隨機模擬實驗的碳價Fig.5 Carbon prices extracted from random simulation experiments repeated 100 times 圖6 政府的演化路徑Fig.6 The evolutionary pathways of government 圖7 發電企業的演化路徑Fig.7 The evolutionary pathways of power generation enterprises 觀察圖6 和圖7 可知,相比于確定性演化博弈模型,隨機演化博弈呈現出更加復雜的動態演化過程.0 在“雙碳”目標背景下,未來將逐步增加納入碳交易市場的企業和行業,并加強對國內碳配額的管控.當前全國碳市場的碳價呈現上升趨勢,預計未來將逐步上升.基于上述背景抽取隨機模擬實驗中上升的碳價路徑,進一步研究x 和y 的初始值對隨機演化博弈的影響.碳價路徑如圖8所示. 圖8 抽樣的碳價路徑Fig.8 The curve of carbon price derived from the sampling 在設定的初始參數和抽樣的碳價路徑下,調整x和y 的初始值,進行多次仿真模擬,演化結果見圖9至圖10. 圖9 政府的演化路徑Fig.9 The evolutionary pathway of government 圖10 發電企業的演化路徑Fig.10 The evolutionary pathway of power generation enterprises 結果顯示演化最終均收斂于(0,1),說明在同一碳價路徑下,x 和y 的初始值不會影響演化的最終收斂結果.觀察圖9 和圖10 政企的演化路徑發現,由于0 考慮到現實的復雜性和多變性,本節采用情景模擬法,首先分析不同因素對演化的影響,然后結合政策設置4 種組合情景,研究影響因素組合對政企雙方的影響. 在初始仿真參數的基礎上,設置政府的獎勵力度S、懲罰力度F、作為成本C、火力發電成本cf、火力發電收益pf、碳排放系數e、可再生能源發電成本cn、可再生能源發電收益pn、可再生能源建設成本c1、碳價增長率up和碳價波動率σp分別增加10%,政企雙方的演化結果見圖11 和圖12. 圖11 因素變動后政府演化路徑Fig.11 The evolution pathways of government after changes in parameter value 圖12 因素變動后發電企業演化路徑Fig.12 The evolutionary pathways power generation enterprises after changes in parameter value 根據圖11 的結果,政府的獎勵力度、懲罰力度、作為成本、火力發電成本、火力發電收益、碳排放系數、可再生能源發電收益、碳價增長率和碳價波動率對政府選擇作為策略產生負向影響.當這些參數增加10%后,政府更傾向于選擇不作為策略,表現為政府穩定于作為策略的時間縮短,并且政府更早地收斂于不作為策略.另一方面,可再生能源建設成本、可再生能源發電成本和火力發電收益對政府選擇作為策略產生正向影響.當可再生能源建設成本增加10%后,政府穩定于作為策略的時間延長,并且政府收斂于不作為策略的時間延后.當可再生能源發電成本或火力發電收益增加10%后,政府收斂于作為策略. 根據圖12 的結果,政府的獎勵力度、懲罰力度、火力發電成本、碳排放系數、可再生能源發電收益、碳價增長率和碳價波動率對發電企業選擇投資策略產生正向影響.當這些參數增加10%后,有利于增強發電企業的投資意愿,表現為發電企業初次選擇投資策略的時間提前.另一方面,作為成本、可再生能源建設成本、可再生能源發電成本和火力發電收益對發電企業選擇投資策略產生負向影響.當作為成本或可再生能源建設成本增加10%后,發電企業初次選擇投資策略的時間延后.當可再生能源發電成本或火力發電收益增加10%后,發電企業將收斂于不投資策略. 綜上所述,可再生能源發電成本和火力發電收益增大10%后,改變了政企的收斂結果,政企最終收斂于(作為,不投資)的策略組合,說明可再生能源發電成本和火力發電收益的變動對雙方策略選擇的影響程度較大.其他參數增大10%后,政企最終仍收斂于(不作為,投資),以10-2的精度判斷政府初次選擇不作為策略的時間,即x 首次達到<0.01 條件所對應的時間.同樣的以10-2的精度判斷發電企業初次選擇投資策略的時間,即y 首次>0.99 條件的時間,對各情景中政府初次選擇不作為策略和企業初次選擇投資策略的時間以及相對于初始情景的變動率的絕對值進行整理,可得不同因素對政企演化的影響程度,見圖13. 圖13 參數值變化前后不同因素對政企演化的影響Fig.13 The impact of different factors on the evolution of government and enterprises before and after the changes in parameter value 由圖11、圖13 可知,正向因素對政府選擇作為策略的影響程度的排序為:可再生能源發電成本和火力發電收益>可再生能源建設成本.負向因素對政府選擇作為策略的影響程度的排序為:可再生能源發電收益>火力發電成本>碳排放系數>獎勵力度>懲罰力度>碳價波動率>碳價增長率>政府作為成本. 正向因素對發電企業選擇投資策略的影響程度的排序為:可再生能源發電收益>火力發電成本>碳排放系數>懲罰力度>獎勵力度>碳價波動率>碳價增長率.負向因素對發電企業選擇投資策略的影響程度的排序為:可再生能源發電成本和火力發電收益>可再生能源建設成本>政府作為成本. 可以發現火力發電的成本、收益和碳排放系數以及可再生能源發電的成本、收益和建設成本對演化的影響較大,是決定政企決策的關鍵因素. 設置低、中、較高、高4 種碳價下限,對應的參數為PFloor=0、60、75 和110 元/t,研究碳價下限對政府和發電企業演化的影響,結果見圖14 和圖15. 圖14 四種碳價下限政策情景下政府的演化路徑Fig.14 The evolutionary pathways of government under four scenarios of carbon price floor 圖15 四種碳價下限政策情景下發電企業的演化路徑Fig.15 The evolutionary pathways of power generation enterprises under four scenarios of carbon price floor 由圖14 和圖15 可知,碳價下限為0 和60 元/t時,隨著時間推進,雙方的最優策略由(作為,不投資)轉變為(不作為,投資).下限是75 和110 元/t 時,雙方的策略迅速收斂于(不作為,投資). 隨著碳價下限的提高,發電企業更早考慮投資可再生能源發電,而政府更早偏離作為策略.碳價下限的提高使得發電企業需要承擔更高的碳排放成本,從而加快了其收斂于投資策略的速度.當碳排放成本上升到一定程度時,企業開始認識到投資可再生能源發電是減少碳排放成本、提高競爭力的有效途徑,因此更早地選擇投資. 碳價下限的提高使企業需要承擔更高的碳排放成本,從而增加了投資可再生能源發電的吸引力.同時政府認識到企業已經有足夠的動力和意愿進行投資,不再需要過多的政府干預. 《中共中央國務院關于完整準確全面貫徹新發展理念做好碳達峰碳中和工作的意見》指出,構建以新能源為主體的新型電力系統,提高電網對高比例可再生能源的消納和調控能力.隨著國家對可再生能源的支持,將推動可再生能源技術的進步和成熟,降低成本,提高效率,而政府可以靈活調節獎懲力度.結合上述政策,設置可再生能源的成本小幅度下降(-5%)和大幅度下降(-10%)兩種情景,設置政府高(+10%)和低(-10%)兩種獎懲力度,四種組合情景如表6所示,四種情景下政企的演化路徑見圖16 和圖17. 表6 四種組合情景(%)Table 6 Four combined scenarios(%) 圖16 四種情景下政府的演化路徑Fig.16 The evolutionary pathways of government under four scenarios 圖17 四種情景下發電企業的演化路徑Fig.17 The evolutionary pathways of power generation enterprises under four scenarios 由圖16 和圖17 可知,四種情景下政企的最終的最優策略均是(不作為,投資).具體而言,情景1 和2,政府存在選擇作為策略的傾向,發電企業存在選擇不投資策略的傾向.情景3和4,政府則迅速收斂于不作為策略,發電企業也快速收斂于投資策略. 對比情景1 和情景2 可以發現,情景1 的政府作為時長較短且選擇作為策略的最高概率相對較小,情景1 中發電企業由不投資轉向投資的拐點對應的時間較早,但最終收斂于投資策略的時間較晚.說明同一可再生能源成本下,政府較高的獎懲力度將在短期內提升發電企業由不投資轉向投資的速度,但在長期來看不利于發電企業穩定于投資策略.原因是較高的獎懲力度在短期內增強了對發電企業投資的激勵作用,但也降低了政府的作為意愿,縮短了其作為時長,最終推遲了發電企業的收斂時間. 政府以及發電企業在情景3 和情景4 中的演化路徑重合度較高,但可以發現同一時間節點,情景3中的政府的作為概率略低于情景4,情景3 中的發電企業的投資概率略高于情景4.說明當可再生能源成本大幅度下降時,政府較高的獎懲力度可以增強發電企業的投資意愿,但對雙方策略選擇的影響較小. 對比情景1 和情景3 以及情景2 和情景4 可以發現,情景3 和4 的發電企業收斂于投資策略時間早于情景1和2.說明同一獎懲力度下,發電企業的可再生能源成本的大幅度降低將加速發電企業收斂于投資策略的時間.原因是可再生能源成本大幅下降增強了可再生能源發電的競爭力,使發電企業有更強的動力進行投資. 本文構建了考慮碳價波動的政府與發電企業關于可再生能源投資的隨機演化博弈模型,以全國碳市場為例,對政企雙方的演化進程和策略選擇進行了研究,得到以下結論: (1)碳價是影響政府和發電企業決策的重要因素,在碳價較低時,發電企業投資可再生能源的收益低于火力發電,發電企業的最優策略是不投資,此時政府的最優策略是作為.當碳價足夠高時,發電企業選擇不投資策略需要承擔更高的超額排放所帶來的成本,政企雙方的最優策略發生轉變,政府不作為和發電企業投資是當前的最優策略組合.碳價下限政策是促進發電企業投資行為的有效政策,隨著下限的增大,發電企業穩定選擇投資策略的時間逐漸提前. (2)政府選擇作為策略和發電企業選擇投資策略受多種因素的影響.政府選擇作為策略與獎勵力度、懲罰力度、作為成本、火力發電成本、火力發電收益、碳排放系數、可再生能源發電收益、碳價增長率和碳價波動率負相關,與可再生能源建設成本、可再生能源發電成本和火力發電收益正相關.發電企業選擇投資策略與獎勵力度、懲罰力度、火力發電成本、碳排放系數、可再生能源發電收益、碳價增長率和碳價波動率正相關,與作為成本、可再生能源建設成本、可再生能源發電成本和火力發電收益負相關. (3)火力發電的成本、收益和碳排放系數以及可再生能源發電的成本、收益和建設成本對演化的影響較大.火力發電的電價、發電成本和碳排放系數決定了發電企業選擇不投資策略的收益.火電電價增高時,發電企業的投資意愿降低,而火電成本和碳排放系數越高,發電企業的投資意愿越強.可再生能源的電價、發電成本和建設成本是影響發電企業投資策略的直接因素.可再生能源電價越高,發電企業的投資意愿越強烈,而可再生能源發電成本和建設成本的升高將降低投資可再生能源的經濟效益,推遲發電企業的投資行為. (4)可再生能源成本小幅度降低時,政府較高的獎懲力度在短期內可以增強對發電企業投資的激勵作用,提升發電企業由不投資轉向投資的速度,但在長期來看將降低政府的作為意愿,不利于發電企業的穩定于投資策略.可再生能源成本大幅度降低時,發電企業更有動力進行投資,此時政府的獎懲力度對雙方的策略選擇影響較小. 根據上述結論,提出以下建議: (1)若未來的碳價呈上升趨勢,在初期碳價較低時,政府積極實行獎懲政策可以彌補碳市場激勵作用的不足,待碳價上升后,政府可采取不作為策略,減少成本降低政府支出.若未來碳價日益下降,碳價下限政策是穩定碳市場的有力工具,而碳價的穩定有利于推動發電企業投資可再生能源. (2)適當提高獎懲力度,可以激勵發電企業投資可再生能源.在可再生能源發展初期,實施電價補貼提高可再生能源收益或實施投資補貼降低可再生能源成本,使可再生能源具備足夠的競爭力,推動可再生能源迅速發展.未來隨著碳市場的推行和穩定發展,逐漸停止補貼,通過碳交易機制,替代補貼政策,同樣可保證可再生能源的競爭力. (3)政府在制定獎懲政策時需要考慮長期穩定性.可再生能源成本小幅度下降時,政府可先采取較高的獎懲力度,加速發電企業的能源轉型,然后采取較低的獎懲力度,降低作為策略支出,提高政府作為策略的積極性,進而維持政企策略選擇的穩定性.在可再生能源成本大幅度下降時,發電企業將自發選擇可再生能源,此時政府可以降低獎懲力度,減輕財政負擔. 本文重點討論了動態碳價下政府和發電企業關于可再生能源投資的隨機演化進程和決策問題,研究未涉及公眾意愿和第三方核查機構的影響,未來可以進一步探索上述問題. 致謝:本論文的英文內容由同濟大學經濟與管理學院張超教授幫助修改完成,在此表示感謝.

1.3 考慮碳價波動的隨機演化博弈模型

2 仿真分析
2.1 隨機演化博弈模型算法設計


2.2 初始參數設置
2.3 演化博弈均衡仿真








3 情景模擬
3.1 不同因素對演化的影響





3.2 因素組合對演化的影響



4 結論建議