格日勒圖,張立輝,柴劍雪
(1.華北電力大學 經濟與管理學院,北京 102206; 2.華北電力大學 新能源電力與低碳發展研究北京市重點實驗室,北京 102206; 3.內蒙古電力(集團)有限責任公司,內蒙古 呼和浩特 010080)
隨著儲能技術的發展,儲能電站已成為電力系統調峰填谷、提高系統穩定性、實現需求側管理的一種有效手段[1],[2]。光伏發電是一種重要的新能源發電形式,大規模光伏電站的并網運行是未來發展的趨勢[3],[4]。 隨著電力市場規則的不斷完善,儲能電站和光伏電站作為決策主體參與電力市場已成為一種重要趨勢。
針對多主體參與的電力市場,采用博弈論建立其運行模型是重要研究方向。 文獻[5]建立了考慮風電與儲能參與的電力市場聯動博弈模型。 文獻[6]針對負荷不確定性與隨機線路的故障停運,建立了考慮系統運行不確定性的電力市場線性供給函數均衡模型。 大部分文獻研究的博弈模型所針對的都是發電側競價[7],[8]。文獻[9]建立的多主體博弈模型針對用電側開放的情景。 除了傳統的電力市場主體,有的文獻研究了微電網作為市場主體參與下的博弈模型[10]。目前,大部分文獻研究的電力市場博弈模型都是非合作博弈,而且針對發電商的文獻較多。 盡管一些文獻針對分布式電源參與電力市場博弈,但還很少針對儲能電站和光伏電站組成聯盟進行合作博弈參與電力市場的建模[11]。
光伏電站出力具有隨機性和波動性,且受自然條件的影響,光伏電站出力預測精度仍然較低[12]。因此,光伏電站參與日前電力市場存在先天的劣勢,即容易與中標電量存在偏差。針對此偏差,電網公司一般通過收取懲罰費用來激勵光伏電站采用保守的競價策略[13]。 光伏電站一般通過招標電價制參與電力市場[14]。 在中長期招標電價制下,光伏電站在市場上失去了競價能力,也就失去了進一步提升收益的空間。 由于儲能電站具有靈活的運行模式,因此能夠以多樣的運行模式充分參與電力市場。然而,由于儲能容量和充放電功率限值的約束,儲能電站難以進一步提高收益。如果儲能電站和光伏電站組成聯盟將具備提高收益的潛力。在合作博弈中,儲能電站和光伏電站仍然作為獨立決策者參與電力市場,但是須要遵循聯盟制定的協議。 通過這樣的方式可以提高聯盟收益,并采取合理的模型對合作博弈剩余進行分配。
本文針對含發電商、售電公司、用戶、儲能電站和光伏電站等代理的電力市場,建立了博弈模型。其中,計及儲能電站和光伏電站組成聯盟進行合作博弈。 合作博弈聯盟以最大化聯盟收益為目標,制定聯盟內部交換功率和交易電價協議;儲能電站和光伏電站在遵循協議的前提下作為獨立決策者參與電力市場。 本文基于博弈理論得到模型的Nash 均衡,并采用Shapley 值對合作博弈剩余進行分配,并通過算例驗證了模型的合理性和適用性。
本文首先建立電力市場環境中各個博弈主體的基本模型,作為建立合作博弈模型的基礎。 博弈主體包括儲能電站代理、光伏電站代理、電網公司代理、發電商代理和用戶代理。
儲能作為一種特殊的電氣設備,既要通過充電獲得電量,也要通過放電獲得收益。 在獨立運營模式下,儲能電站可以在一天的各個時段選擇兩種運行模式:發電商模式和用戶模式。
如果儲能電站t 時段運行在發電商模式下,儲能參與發電側競價,與傳統的發電商的報價策略一樣,采取如式(1)所示的三段式報價策略[15]。

式中:PSB(t)為 t 時段儲能電站充放電功率;P1,P2,P3為階梯式報價中各個電量區段的報價; Qmin,Qmax為最小出力、 最大出力;Q2為第 1 段最大出力;Q3為第2 段最大出力;QSB為儲能中標電量。
如果儲能電站t 時段運行在用戶模式下,儲能作為一個用戶向電網公司購電,購電價格為電網公司制定的銷售電價p(t)。
儲能電站在運行過程中的運行成本主要來自于充放電轉化及充放電深度變化對使用壽命的折損[16]。計及儲能運行成本,則儲能電站運行一天的收益如式(2)所示。

式中:ESB為儲能電站一天的運行收益;BSB(t)為 t時段儲能電站發電收益或購電成本;CSB(t)為t 時段儲能電站運行成本。

式中:QSB(t)為 t 時段儲能電站在發電側(發電商模式)的中標電量或者在用戶側(用戶模式)的購電電量,QSB(t)≥0 為發電商運行模式,QSB(t)<0 為用戶運行模式;q(t)為 t 時段儲能電站發電側市場出清價;u1(t),u2(t)表征儲能電站在 t 時段的運行狀態,u1(t),u2(t)為[0,1]之間的整數,當u1(t)=1 時,為發電商運行模式,當 u2(t)=1 時,為用戶運行模式,且滿足 u1(t)+u2(t)=1 對任意時段t 成立。

式中:Δt 為時段長;PSB(t)為 t 時段儲能電站充放電功率,PSB(t)≥0 時,儲能電站運行在發電商模式進行放電,PSB(t)<0 時,儲能電站運行在用戶模式進行充電;kch為儲能電站充電時的損耗成本系數;kdis為儲能電站放電時的損耗成本系數。

式中:N(x)為儲能電池最大循環次數,由充放電深度x 決定[16];Cinit為儲能電站初始固定投資成本;SSB,start,SSB,end分別為儲能電池初始、最終荷電狀態;SSBmax為儲能電池最高允許電量,一般為儲能電池容量的0.9 倍;cch,cdis分別為充、放電影響因子。
儲能電站運行須滿足的約束條件包括充放電功率和剩余電量關系約束。 充放電功率約束和剩余電量約束如式(7)~(9)所示。

式中:ESB(t+1)為 t+1 時段末儲能電池剩余電量狀態;ηch,ηdis分別為儲能電池的充電效率、 放電效率;DSB為儲能電池自放電系數。
電網公司針對光伏電站采取招標電價制。 光伏電站在中長期內參與競標,并且就中標的電量和價格與電網公司簽訂中長期購電協議。 由于本文所建立的模型針對的是日前市場,因此可以將光伏上網價格視作既定的常數。 一方面根據招標電價制,電網公司有義務優先消納光伏出力;另一方面,電網公司也有權利對大于投標電量的光伏出力部分不予消納,并對小于投標電量的不足出力收取懲罰費用計于電費中。 光伏電站一天的運行收益如式(10)所示。

式中:EPV為光伏電站一天的運行收益:BPV(t)為光伏電站在t 時段的發電收益;CPV(t)為光伏電站在t 時段的運行收益。

式中:QPV(t)為 t 時段光伏電站中標電量;pPV為電網公司與光伏電站簽訂的上網電價;γPV為政府對光伏發電的補貼價格;kPV為光伏電站運行維護成本系數;ΔQPV(t)為不平衡功率,當 ΔQPV(t)>0 時,光伏電站實際出力小于中標出力,當ΔQPV(t)≤0 時,光伏電站實際出力大于中標出力;rPVmax[ΔQPV(t),0]為出力不足懲罰費用;rPV為懲罰系數。
電力市場中參與博弈的主體還有電網公司代理、用戶代理和其他發電商代理。目前,已有一些文獻針對以上代理進行了研究,本文不再贅述。 其中,對電網公司代理采取文獻[17]中的模型,對用戶代理采取文獻[18]中的模型,對其他發電商代理采取的模型參考了文獻[15]。 本文的電力市場競價機制采取統一市場出清價格(Market Clearing Price,MCP)機制,在發電側采取競價模式,電網公司對發電側中標的電量采用市場出清價結算[19]。
博弈模型的基本要素包括參與者、 策略和支付[20]。本文的合作博弈參與者包括聯盟代理(下文簡稱聯盟)中的儲能電站和光伏電站。博弈策略包括儲能電站參與電力市場運行和競價策略。 儲能電站與光伏電站的交易電量策略由光伏電站代理制定,交易價格由聯盟制定。如果一個博弈中由決策者達成了有約束力的協議,那么該博弈就是合作博弈。 本文合作博弈模型中儲能電站和光伏電站的交易電量以及交易價格即為協議。 與聯營模式不同的是,在合作博弈模型下,儲能電站和光伏電站還是獨立的運營主體,仍然追求自身利益,有著各自的策略,模型中還須要解決合作剩余的分配問題。
在合作博弈模式下,儲能電站和光伏電站作為新的主體參與電力市場競價,聯盟需要最大化收益,如式(13)所示。


當 ΔP(t)≥0 時,表示光伏電站向儲能電站輸送功率,實際上更準確地理解是光伏電站代替儲能電站在市場中出力;當 ΔP(t)<0 時,表示儲能電站代替光伏電站在電力市場出力,比如用于平抑不平衡功率。
在電力市場中,與儲能電站和光伏電站獨自參與電力市場相比,合作博弈會對出清價格和銷售價格產生影響。本文根據MCP 機制進行電力市場出清,并將出清價格和銷售價格看作是各博弈主體策略的函數,則有:

式中:PSB(t),PG(t)分別為合作博弈前 t 時段儲能電站和發電商的競價策略,其中,PSB(t)=[PSB,1(t),PSB,2(t),PSB,3(t)],PSB,1(t),PSB,2(t),PSB,3(t)分別為 t時段儲能電站三段式競價策略的功率分段;PG(t)=[PG,1(t),PG2(t),PG,3(t)],PG,1(t),PG2(t),PG,3(t)分別為 t時段發電商三段式競價策略的功率分段;QL(t)為用戶的購電電量策略為合作博弈后t 時段儲能電站的競價策略,其組成形式與PSB(t)相同。
合作博弈聯盟主要在如下3 種情況下產生收益。
①當光伏電站出力充裕時,ΔP≥0,儲能電站從光伏電站購買電量,擴大市場競價的規模,獲得更大的收益,并將一部分收益拿來作為對光伏電站的補償。
②當光伏電站出力不足時,須視情況而定競價策略。 如果此時發電側市場出清價高,則仍然可能ΔP≥0,儲能電站向光伏電站購電,擴大市場競價規模;光伏電站獲得儲能電站的補償,用于支付不平衡功率懲罰后,收益仍然較高。
③當光伏電站出力不足,且市場出清價較低時,ΔP<0,儲能減少競價規模,將節省的電量用于后續時段競價,或者售電給光伏電站,用于不平衡功率平抑。 光伏電站在降低懲罰費用的同時,儲能電站也獲得售電收益,達到雙贏的效果。
分布式電源和儲能組成聯營模式也能起到能量協調的效果[21]。 盡管聯營模式能夠更加充分地對儲能電站和光伏電站的市場行為進行協調,進而獲得更大效益,但聯營模式不利于體現光伏電站和儲能電站獨自的市場價值,難以指導社會資本對兩者的投資決策。
當儲能電站和光伏電站組成聯盟時,必須保證兩者收益不減,否則兩個主體就會失去參與聯盟的動力,該約束為

式中:xSB,xPV分別為合作博弈聯盟向儲能電站和光伏電站分配的合作剩余。
采用Shapley 值法進行計算,計算式如式(18)~(20)所示[22]。

式中:si為聯盟中包括參與主體i 的所有子聯盟組成的子集;│s│為子集 s 的元素數目;ω(│s│)為加權因子;ν(s)為子聯盟 s 的合作剩余;ν(s/i)為子聯盟除去參與主體i 后的合作剩余;i∈{SB,PV}。
假定合作博弈聯盟由N 個主體組成,則Shapley 值衡量了參與主體i 在進入聯盟前后對聯盟帶來的綜合邊際收益。 因此,用Shapley 值來分配聯盟的合作剩余是比較公平合理的。
另外,合作博弈聯盟的運行還須要滿足內部交易電量約束:

式中:PPVmax(t)為 t 時段光伏實際最大出力。
合作博弈模型中設定一個聯盟決策者的角色作為博弈領導者,儲能電站和光伏電站作為從屬者。 兩個從屬決策者在領導者的決策下達成的博弈均衡叫做Nash 均衡。領導者和從屬者達成的博弈均衡叫做Stackelberg 均衡。 根據所建立的模型,本文合作博弈聯盟中實際有3 個決策者,分別為聯盟代理制定的內部交易電價策略、 儲能電站制定的運行策略及市場競價策略、 光伏電站制定的交易電量策略。
事實上,將聯盟策略看作主體決策者,將儲能電站和光伏電站看作從屬決策者,則可以得到對于任意 p0下,合作博弈模型的 Nash 均衡[PSB*,ΔP*]。 其中:對于?PSB≠PSB*,式(22)成立; 對于?ΔP≠ΔP*,式(23)成立。

式中將儲能電站一天的運行收益看作PSB,p0和ΔP 的函數,將光伏電站一天運行收益看作p0和ΔP 的函數。
另外,可以得到模型的Stackelberg 均衡為ESB[PSB*,p0*,ΔP*]。 其中:對于?p0≠p0*,式(24)成立。

以下規劃都須要滿足必要的約束條件:

本文采用混沌粒子群算法設計合作博弈模型的求解流程。 混沌粒子群算法中種群的速度和位置更新分別為

在每一次迭代后采用如下的Logistic 映射進行混沌搜索。

式中: χu+1,χu分別為第 u+1 次、 第 u 次迭代時的混沌變量值;χ0為混沌變量初始值。
根據以上混沌粒子群算法的基本原理,可以設計基于混沌粒子群算法的合作博弈模型的求解流程。
①根據隨機初始化儲能電站的報價策略,調度運行方案以及聯盟內部的交易電量計劃和交易電價曲線。初始化混沌粒子群算法參數:最大迭代次數為300;混沌搜索代數為30 代;學習因子為2;慣性系數為0.8。
②計算所有粒子對應的聯盟競價和運行方案下的目標函數,即參與電力市場競價收益。
③根據各粒子對應的電力市場競價收益,將約束條件作為罰函數出力,計及到該目標函數中,計算各粒子的適應度函數值。
④記錄種群中的全局歷史最優粒子以及每個粒子的歷史最優情況。
⑤令每一個粒子根據全局最優粒子和歷史最優粒子改變位置來尋優,并將改變后的每個位置粒子引入混沌算法,在局部區域進行混沌搜索。
⑥根據混沌粒子群算法收斂條件判斷算法是否收斂。如果收斂,得出全局最優解及其對應的合作博弈聯盟報價策略、 調度運行方案以及聯盟內部的交易電量計劃和交易電價曲線; 否則返回步驟②。
本文構造的電力市場中接入了3 個發電商(G1,G2,G3),其中,G1 為保守型發電商,G2 為中庸型發電商,G3 為投機性發電商。 3 個發電商的競價參數參考文獻[15]。 此外,系統中還并網接入了一個儲能電站和一個光伏電站作為市場主體。光伏電站并網容量為0.3 MW,儲能電站最大出力為0.1 MW,儲能電站容量為1 MW·h。電網公司代理作為對整個輸配電網絡的擁有者,對整個系統進行管理,并作為市場的組織者有權對各個市場主體的行為進行約束。 電力市場運行時段長為0.5 h。 為了比較儲能電站與光伏電站合作博弈的效果,設置儲能電站為獨立運營模式與合作博弈模式兩種運營方式。 電力市場中,典型日一天的綜合負荷水平曲線、光伏電站實際出力曲線如圖1 所示。 從圖1 中可以看出,電力市場中負荷水平具有明顯的峰谷特性。

圖1 電力市場典型日中光伏發電和負荷水平曲線Fig.1 Photovoltaic power generation and load level curve in a typical day of electricity market
運行本文所建立的模型,可以得到典型運行日電力市場發電側一天的出清電價曲線、電網公司代理制定的銷售電價曲線和儲能電站及光伏電站組成合作博弈聯盟的內部交易電價曲線(圖2)。

圖2 電力市場博弈后市場出清電價曲線、銷售電價曲線及聯盟內部交換電價曲線Fig.2 Market clearing price curve,sales price curve and inter-alliance exchange price curve in power market game
從圖2 中可以看出,市場出清電價曲線基本上隨著綜合負荷水平的變化而變化,并隨著負荷水平的上升而增高。 在第1~10 時段,系統綜合負荷水平較低,無論是傳統發電商還是儲能電站,都能夠根據經驗存在一個對系統低負荷水平的預期。 因此,為了盡量獲得中標電量,趨向于申報較低的報價曲線。在這種情況下,系統中保守型的發電商有著更優的中標優勢,而保守型發電商的報價曲線降低了電網公司代理制定的出清電價。
在第12~26 時段,系統綜合負荷水平較高,無論是傳統發電商還是儲能電站,都能夠根據經驗存在一個對系統高負荷水平的預期,此時電力市場相對處于功率緊張時段,發電商和儲能電站都更容易獲得中標電力,因此都趨向于申報較高的報價曲線。在這種情況下,積極型發電商更具備中標優勢,拉高了電網公司代理制定的市場出清電價。
在后續的綜合負荷低谷時段和負荷高峰時段,對電力市場的分析也與上述時段相同。由于電網公司代理在制定市場出清電價時,不僅考慮經濟因素,也須考慮系統電氣運行約束(如支路傳輸容量限值、 發電商的出力受出力限值的約束和機組組合約束),因此圖中所示的市場出清電價曲線又不完全只與綜合負荷水平有關。
從圖2 中還可以看出,系統中線路輸送功率越緊張,電網公司代理制定的銷售電價水平與出清電價水平之差越大,以緩解緊張局面,并提高電網公司代理收益。 相比于出清電價曲線和銷售電價曲線,聯盟內部的交換電價水平在不同運行時段具有不同的特征。 當儲能電站向光伏電站銷售功率時,聯盟內部電價高于市場出清價格,同時小于不平衡功率懲罰價格,以保證儲能電站和光伏電站的雙贏。
在儲能電站與光伏電站組成合作博弈聯盟的情況下,可以得到電力市場中各個主體一天的收益情況和合作博弈聯盟內部的運行情況,包括聯盟內部交換功率曲線、 光伏電站不平衡功率曲線和儲能電站充放電功率曲線(圖3)。 在這種情況下,其他發電商總收益達到了1 312 869 美元/d,而儲能電站總收益達到了29 645 美元/d,光伏電站總收益達到了78 615 美元/d。

圖3 儲能電站、光伏電站和其他發電商一天收益曲線Fig.3 Benefit curves of energy storage power stations,photovoltaic power stations and other generation companies in a day

圖4 合作博弈聯盟內部交換功率、光伏電站不平衡功率以及儲能充放電曲線Fig.4 Internal exchange power,unbalanced power of photovoltaic power station and charge-discharge curve of energy storage in cooperative game alliance
從圖4 中可以看出,由于其他發電商承擔了電力市場中大部分的中標電量,因此其收益水平遠遠高于儲能電站和光伏電站。對于儲能電站來說,在一天的第1~10 時段,市場出清電價較低,儲能電站在用戶模式下運行,向市場購電進行充電,并向市場支付銷售電價。在第11~25 時段,市場出清電價高,儲能電站在發電商模式下運行,參與發電側的市場競價并獲取收益。 在第26~33時段,儲能電站再一次在用戶模式下運行,為后續的放電做好準備。 在該時段中,儲能電站收益為負,即存在購電成本。在第34~42 時段,市場再一次運行在負荷水平和電價水平的峰時段,儲能電站也再一次在發電商模式下運行。由此可以看出,儲能電站利用自身的削峰填谷效益獲得收益。 對于光伏電站以及合作博弈聯盟來說,光伏電站只在第17~35 時段存在出力的情況下才能獲取收益。 同時,光伏電站的不平衡功率基本上都通過儲能電站加以平抑,避免付出高昂的懲罰費用。
實際運行中,儲能電站還能和光伏電站作為一個電力市場主體在聯營模式下運行。 表1 給出了儲能電站在4 種運行方式下各電力市場運行的收益情況。 其中:方式1 為不參與電力市場;方式2 為獨立運營模式; 方式3 為與光伏電站聯營模式;方式4 為與光伏電站合作博弈。

表1 電力市場博弈綜合運行分析Table 1 Power market game comprehensive operation analysis 美元
當儲能電站未參與電力市場時,一天的綜合收益為零。 在該方式下,光伏電站、其他發電商以及電網公司代理均有一定的收益,分別為68 157 美元,1 296 348 美元和 52 369 美元。
儲能電站在獨立運營模式下,能夠獲得一定的收益,但這收益是以光伏電站以及其他發電商的收益降低為代價的。在負荷水平一定的情況下,針對同樣的市場出清電量,必然會出現這樣的情形。對于其他發電商來說,儲能電站的參與使發電商中保守型報價策略更加占優,以彌補電量不中標的風險,因此,其他發電商的收益比儲能電站未參與時降低。對于電網公司代理來說,由于儲能電站的加入,市場多樣性得到了加強,電網公司代理作為市場出清電價制定者和向發電側的購電者,其買方市場地位得到加強,因此電網公司代理收益得到了提升。
當儲能電站與光伏電站聯營時,由于兩者的能量互補協調,儲能電站和光伏電站的收益都得到了提高。這種方式下,聯營主體對市場出清電價的穩定作用更加明顯,其他發電商的收益也得到了顯著提升。 但是,對于電網公司代理來說,其收益提升不明顯,因為這時發電側的聯營體作為新的市場主體,產生了一定的壟斷效應。在聯營模式下,儲能電站和光伏電站不存在各自的運行收益。當儲能電站與光伏電站在合作博弈方式下運行時,由于儲能電站能夠充分運用與光伏電站之間的電量協調,其收益要高于獨立運營方式。 這時,光伏電站的收益比儲能電站獨立運營方式下得到了提高,從66 154 美元提高到了78 615 美元。 對于發電商來說,儲能電站與光伏電站合作博弈,盡管仍然會與發電商競爭,但儲能電站的參與對電力市場電價起到了穩定的作用,促進發電商制定更加激進的報價策略,從而提高收益。 然而,這種情況下儲能電站效益仍然明顯,而發電商的收益仍然低于儲能電站未參與電力市場時。 對于電網公司代理來說,儲能電站與光伏電站進行合作博弈,最重要作用是降低了電網公司代理對光伏電站收取的不平衡電量費用,因此電網公司代理的收益低于儲能電站獨立運營方式。
本文針對儲能電站與光伏電站組成合作博弈聯盟參與電力市場的情景建立模型。 在合作博弈中,儲能電站和光伏電站仍然是獨立的決策者,并且須要遵守合作協議。
①針對含多主體參與的電力市場和儲能電站及光伏電站合作博弈的情景進行建模并仿真,結果表明基于Shapley 值進行合作博弈剩余分配,有利于兩者參與聯盟的積極性。
②儲能電站作為市場主體參與市場活動,一方面能夠取得效益,另一方面能夠降低市場環境的不確定性,降低市場主體報價的保守性,從而激發市場活力。
③在合作博弈情景下,儲能電站和光伏電站能夠通過電量協調,進一步地提高收益;儲能電站和光伏電站作為獨立市場主體,有利于對兩者市場價值的評估,從而更好地引導社會資本投資。