張敏慧,李曉露,柳勁松,林順富
(1. 上海電力大學(xué) 電氣工程學(xué)院,上海 200090;2. 國(guó)網(wǎng)上海電力科學(xué)研究院,上海 200437)
隨著“雙碳”目標(biāo)的推進(jìn),風(fēng)、光等分布式電源在電網(wǎng)中的接入比例不斷上升。分布式電源的發(fā)電具有波動(dòng)性和隨機(jī)性,在并網(wǎng)過程中可能會(huì)對(duì)配電網(wǎng)產(chǎn)生巨大的擾動(dòng)。為解決這一問題,微電網(wǎng)應(yīng)運(yùn)而生。伴隨電力市場(chǎng)的雙邊開放,微電網(wǎng)作為新興主體參與配電側(cè)的市場(chǎng)交易,然而,微電網(wǎng)在解決能量互補(bǔ)以及處理大規(guī)模可再生能源帶來(lái)的不確定性問題的能力有限。多微電網(wǎng)技術(shù)的發(fā)展可以有效彌補(bǔ)單個(gè)微電網(wǎng)在處理不確定性問題上的不足。多微電網(wǎng)通過自治管理和微電網(wǎng)間能量互濟(jì)的方式,緩解了微電網(wǎng)由于不確定性產(chǎn)生的供需不平衡問題[1-2]。
由于微電網(wǎng)中可再生能源所占比例不斷提高,集中式電力交易局限了微電網(wǎng)之間的協(xié)同合作和資源共享。P2P(點(diǎn)對(duì)點(diǎn))電力交易可以解決這個(gè)問題,通過允許多個(gè)微電網(wǎng)直接相互交易,還能促進(jìn)清潔能源的推廣和應(yīng)用[3-4]。因此,未來(lái)的微電網(wǎng)應(yīng)朝向P2P 電力交易模式轉(zhuǎn)型,以實(shí)現(xiàn)微電網(wǎng)之間的精準(zhǔn)協(xié)同合作。在采用微電網(wǎng)P2P 交易模式的多微電網(wǎng)系統(tǒng)中,微電網(wǎng)之間、微電網(wǎng)與配電網(wǎng)之間能夠進(jìn)行能量的交互,通過各個(gè)微電網(wǎng)的自治管理以及微電網(wǎng)之間的協(xié)調(diào)互補(bǔ),降低微電網(wǎng)運(yùn)行成本[5-6]。
參與微電網(wǎng)交易的各個(gè)利益主體由于具有不同的效益目標(biāo)、不同的運(yùn)營(yíng)方式,在能量互動(dòng)過程中,彼此影響、彼此作用,因此利益主體之間形成了相對(duì)復(fù)雜的博弈關(guān)系[7-8]。博弈論可以有效解決不同利益主體之間復(fù)雜的博弈問題[9-10]。通常情況下,博弈參與者被認(rèn)為是絕對(duì)理性的[11],但在多微電網(wǎng)電能交易過程中,博弈參與者并不會(huì)展現(xiàn)出完全理性的狀態(tài)。
文獻(xiàn)[12]提出了一種考慮新能源發(fā)電不確定性的主從博弈模型,并將共享儲(chǔ)能容量租賃價(jià)格作為可變變量,通過優(yōu)化共享儲(chǔ)能的方式削減了新能源發(fā)電不確定性對(duì)微電網(wǎng)交易造成的影響。文獻(xiàn)[13]將電能生產(chǎn)者與電能消費(fèi)者之間的博弈轉(zhuǎn)換為隨機(jī)博弈,模擬了新能源發(fā)電不確定情況下的智能電網(wǎng)產(chǎn)消者的行為,證明隨機(jī)博弈對(duì)智能電網(wǎng)的管理具有參考價(jià)值。文獻(xiàn)[14]提出一種基于合作博弈的配電網(wǎng)-多微電網(wǎng)隨機(jī)博弈模型,為保證合作聯(lián)盟的穩(wěn)定,提出基于談判系數(shù)的納什談判合作價(jià)值分配機(jī)制,將博弈雙方作為理性人進(jìn)行博弈模擬。文獻(xiàn)[15]根據(jù)主動(dòng)消費(fèi)者和聚合商之間的交互作用,建立了主從博弈模型,研究了用戶在實(shí)時(shí)電價(jià)響應(yīng)中的行為以及對(duì)電網(wǎng)電壓的影響,并通過算例證明了主從博弈模型模擬主動(dòng)消費(fèi)者和聚合商之間交互作用的有效性。由于參與微電網(wǎng)交易的利益主體均為有限理性人,文獻(xiàn)[16]提出了有限理性的演化博弈方法,并與完全理性人的傳統(tǒng)博弈模型進(jìn)行比較,證明了有限理性的演化博弈方法在計(jì)算微電網(wǎng)源-儲(chǔ)規(guī)劃策略的有效性。在文獻(xiàn)[17]中,針對(duì)微電網(wǎng)的特點(diǎn)和屬性,研究人員設(shè)計(jì)了一套完整的綜合評(píng)價(jià)指標(biāo)體系,并采用前景價(jià)值函數(shù)、改進(jìn)層次分析法和熵權(quán)法相結(jié)合的主客觀綜合賦權(quán)方法,從而獲得更為客觀和準(zhǔn)確的微電網(wǎng)評(píng)價(jià)結(jié)果。文獻(xiàn)[18]基于區(qū)塊鏈技術(shù)建立微電網(wǎng)分布式電力市場(chǎng),采用前景理論將發(fā)電商的主觀偏好引入交易決策過程中,使優(yōu)化結(jié)果更加符合實(shí)際微電網(wǎng)市場(chǎng)的不確定場(chǎng)景,更好地管理市場(chǎng)運(yùn)行風(fēng)險(xiǎn)。文獻(xiàn)[19]提出了發(fā)電企業(yè)參與調(diào)整日前能源市場(chǎng)最優(yōu)競(jìng)價(jià)策略的博弈,將前景理論應(yīng)用于博弈中,并對(duì)博弈主體的主觀性以及其如何影響博弈主體的決策進(jìn)行了模擬。與現(xiàn)有假設(shè)產(chǎn)消者完全理性的投標(biāo)模型不同,文獻(xiàn)[20]提出了一種基于前景理論的電力市場(chǎng)產(chǎn)消者競(jìng)價(jià)模型;該模型考慮到電力市場(chǎng)投標(biāo)規(guī)則的影響,包含了非理性和個(gè)人偏好,以獲得產(chǎn)消者對(duì)投標(biāo)結(jié)果的主觀感知,并以此作為研究電能雙邊交易的基礎(chǔ)。文獻(xiàn)[21]提出了一個(gè)將微電網(wǎng)內(nèi)部市場(chǎng)和不同微電網(wǎng)間的交易市場(chǎng)相互嵌套的市場(chǎng)清算算法。運(yùn)用基于前景理論的分布式魯棒優(yōu)化方法來(lái)描述消費(fèi)者行為的復(fù)雜性。微電網(wǎng)的時(shí)間偏好,即對(duì)未來(lái)效用的偏好程度,也影響了微電網(wǎng)在電能交易中的行為選擇。然而,當(dāng)前的研究尚未對(duì)微電網(wǎng)作為有限理性個(gè)體在面對(duì)供需不平衡的不確定性問題時(shí)的時(shí)間偏好進(jìn)行考慮。
綜上,本文擬從多微電網(wǎng)之間交易過程中存在有限理性問題進(jìn)行研究,基于時(shí)間偏好理論和前景理論提出多微電網(wǎng)運(yùn)營(yíng)商-微電網(wǎng)主從博弈下微電網(wǎng)P2P 博弈交易策略,最終為多微電網(wǎng)運(yùn)營(yíng)商的定價(jià)提供參考依據(jù)。本文的主要研究工作如下:1)分析微電網(wǎng)交易模式,建立多微電網(wǎng)運(yùn)營(yíng)商為領(lǐng)導(dǎo)者、微電網(wǎng)為追隨者的主從博弈模型;2)對(duì)微電網(wǎng)的成本收益進(jìn)行定量分析,建立微電網(wǎng)的收益模型,并分析多微電網(wǎng)之間交易決策過程中表現(xiàn)出的有限理性,提出基于時(shí)間偏好理論和前景理論的主從博弈下微電網(wǎng)P2P博弈均衡求解方法。
傳統(tǒng)微電網(wǎng)在發(fā)電量不能滿足用戶的負(fù)荷需求時(shí),將會(huì)向配電網(wǎng)購(gòu)買電量以補(bǔ)足缺額。在多微電網(wǎng)主從博弈電能交易框架下,微電網(wǎng)之間可以進(jìn)行P2P 交易平衡供需關(guān)系。發(fā)電盈余的微電網(wǎng)可將盈余電量通過內(nèi)部交易售賣給供電不足的微電網(wǎng)。多微電網(wǎng)運(yùn)營(yíng)商負(fù)責(zé)協(xié)調(diào)電能交易,實(shí)現(xiàn)所有微電網(wǎng)收益最大化。
微電網(wǎng)之間的具體交易流程為:各個(gè)微電網(wǎng)將發(fā)電量與需求量等信息發(fā)布在交易平臺(tái),多微電網(wǎng)運(yùn)營(yíng)商根據(jù)發(fā)布的信息制定內(nèi)部交易價(jià)格并發(fā)布到平臺(tái)。各個(gè)微電網(wǎng)根據(jù)發(fā)布的信息計(jì)算存儲(chǔ)的電量、向配電網(wǎng)購(gòu)買的電量以及向其他微電網(wǎng)購(gòu)買或出售的電量,并將信息發(fā)布于平臺(tái)。隨后,多微電網(wǎng)運(yùn)營(yíng)商通過平臺(tái)上公布的信息調(diào)整內(nèi)部交易價(jià)格,各個(gè)微電網(wǎng)根據(jù)內(nèi)部交易價(jià)格以及平臺(tái)上的信息再次確定內(nèi)部交易策略,經(jīng)過多次調(diào)整直到達(dá)到供需平衡。
在上述交易步驟中,需要通過如下方式對(duì)交易中的變量進(jìn)行計(jì)算:首先,多微電網(wǎng)運(yùn)營(yíng)商通過制定內(nèi)部交易定價(jià)的方式協(xié)調(diào)多個(gè)微電網(wǎng)的交易;其次,微電網(wǎng)可根據(jù)多微電網(wǎng)運(yùn)營(yíng)商制定的電價(jià)自主選擇電能交易策略。最后,多微電網(wǎng)運(yùn)營(yíng)商與微電網(wǎng)的關(guān)系可以通過主從博弈進(jìn)行模擬,在主從博弈的納什均衡點(diǎn),微電網(wǎng)的整體收益可達(dá)到最大化。
因此,本文構(gòu)建如圖1所示多微電網(wǎng)運(yùn)營(yíng)商-微電網(wǎng)主從博弈框架[22],上層領(lǐng)導(dǎo)者是多微電網(wǎng)運(yùn)營(yíng)商,為保證微電網(wǎng)之間充分交易電量,以所有微電網(wǎng)整體收益最大為目標(biāo),制定實(shí)時(shí)電價(jià);下層追隨者為各個(gè)微電網(wǎng),以微電網(wǎng)時(shí)間偏好前景值最大為目標(biāo),根據(jù)多微電網(wǎng)運(yùn)營(yíng)商制定的電價(jià),確定微電網(wǎng)之間交易的電量。
在下層各個(gè)微電網(wǎng)之間的博弈過程中,微電網(wǎng)的主觀因素涉及兩方面的問題:對(duì)時(shí)間的效用偏好以及對(duì)風(fēng)險(xiǎn)和收益的偏好。時(shí)間偏好理論是指微電網(wǎng)在不同時(shí)間點(diǎn)上對(duì)于同樣數(shù)量級(jí)的收益/損失存在不同的偏好。前景理論可以有效模擬微電網(wǎng)在風(fēng)險(xiǎn)決策中的心理機(jī)制,促進(jìn)微電網(wǎng)平衡風(fēng)險(xiǎn)與收益,更好地做出決策[23]。同時(shí),前景理論可以幫助多微電網(wǎng)運(yùn)營(yíng)商對(duì)微電網(wǎng)的交易行為進(jìn)行評(píng)估和優(yōu)化。結(jié)合兩者的優(yōu)點(diǎn),本文提出基于時(shí)間偏好理論和前景理論的主從博弈下微電網(wǎng)P2P博弈均衡求解方法。
有限理性的概念最初是由赫伯特·A·西蒙提出的,是行為經(jīng)濟(jì)學(xué)重要的基本假設(shè)之一。有限理性集中考慮決策者受外界因素或自身有限的判斷能力的影響,在不同情境下采取不同的決策行為。相較于完全理性判斷,有限理性具有更強(qiáng)的實(shí)用性和動(dòng)態(tài)性,對(duì)實(shí)際經(jīng)濟(jì)活動(dòng)的指導(dǎo)具有重要意義。作為行為經(jīng)濟(jì)學(xué)的重要理論,有限理性為研究微電網(wǎng)的決策行為提供了重要的理論基礎(chǔ)[24]。
微電網(wǎng)在交易過程中的有限理性主要體現(xiàn)在:不同微電網(wǎng)對(duì)交易的期待收益不同,對(duì)交易的耐心、風(fēng)險(xiǎn)承受能力以及對(duì)風(fēng)險(xiǎn)不確定性的態(tài)度也不一樣。在交易過程中,這些因素共同組成了微電網(wǎng)的決策依據(jù)。本文基于時(shí)間偏好理論和前景理論,分別考慮了微電網(wǎng)對(duì)收益和損失的敏感程度、現(xiàn)期與遠(yuǎn)期時(shí)間段的持續(xù)性及附加折現(xiàn)影響因子等影響交易決策的心理因素,建立多微電網(wǎng)運(yùn)營(yíng)商-微電網(wǎng)主從博弈下微電網(wǎng)P2P博弈交易策略,模擬現(xiàn)實(shí)中微電網(wǎng)的交易決策。
時(shí)間偏好理論指出決策者在進(jìn)行效用判斷時(shí),效用值會(huì)隨著時(shí)間的推移而逐漸遞減[25],時(shí)間偏好理論可以有效模擬微電網(wǎng)在進(jìn)行效用判斷時(shí),收益帶來(lái)的效用會(huì)隨著時(shí)間的推移而逐漸遞減。遞減的比值計(jì)算方法如下:
式中:Di(t)為微電網(wǎng)i在t時(shí)段收益的時(shí)間偏好值;[s,s+τ)為現(xiàn)期時(shí)間段,[s+τ,∞)為遠(yuǎn)期時(shí)間段,τ是隨機(jī)的,刻畫現(xiàn)期時(shí)間段的持續(xù)性,且服從參數(shù)為1/η的指數(shù)分布,因此E(τ)=1/η,當(dāng)η較小時(shí),現(xiàn)期時(shí)間段的期望持續(xù)性較大;κ表示遠(yuǎn)期時(shí)間段的附加折現(xiàn)影響因子,當(dāng)κ越大時(shí),表明對(duì)現(xiàn)期偏好越小,0<κ≤1;ρi表示微電網(wǎng)i的貼現(xiàn)因子,是微電網(wǎng)對(duì)長(zhǎng)短期收益重視程度的量化指標(biāo),ρi越大,說明微電網(wǎng)對(duì)短期收益越重視,相反,ρi越小,說明微電網(wǎng)對(duì)長(zhǎng)期收益越重視,ρi>0。
綜上,時(shí)間偏好理論可以描述微電網(wǎng)在時(shí)間維度展現(xiàn)的有限理性,從而對(duì)微電網(wǎng)交易過程的納什均衡點(diǎn)進(jìn)行合理計(jì)算。
在博弈過程中,需要考慮微電網(wǎng)在面對(duì)獲利和損失時(shí)不同的主觀感受以及處理不確定風(fēng)險(xiǎn)時(shí)的有限理性問題。在大多數(shù)情況下,微電網(wǎng)在面臨獲利時(shí)采取風(fēng)險(xiǎn)規(guī)避的態(tài)度,在面臨損失時(shí)采用風(fēng)險(xiǎn)偏好的態(tài)度。
不同于期望效用理論中決策者對(duì)風(fēng)險(xiǎn)的態(tài)度呈線性變化,前景理論[26]通過引入心理學(xué)、社會(huì)學(xué)等方面的理論來(lái)描述決策者在面對(duì)不確定風(fēng)險(xiǎn)時(shí)的行為模式,進(jìn)而判斷決策者面臨不確定性風(fēng)險(xiǎn)時(shí)的態(tài)度。
微電網(wǎng)在處理收益和損失時(shí),通常呈現(xiàn)出有限理性,微電網(wǎng)對(duì)于損失的負(fù)向主觀感受要強(qiáng)于等量收益的正向主觀感受。根據(jù)前景理論,微電網(wǎng)關(guān)于收益和損失的價(jià)值函數(shù)可由下式所示:
式中:Vi,t表示微電網(wǎng)i在t時(shí)段的價(jià)值函數(shù);Vi,+(ΔUi,t)表示微電網(wǎng)i在t時(shí)段收益的價(jià)值函數(shù);Vi,-(ΔUi,t)表示微電網(wǎng)i在t時(shí)段損失的價(jià)值函數(shù);ΔUi,t表示t時(shí)段微電網(wǎng)i實(shí)際收益與理想收益的差值,即ΔUi,t=Ui,t-Ui,0,其中,Ui,t表示微電網(wǎng)i在t時(shí)段的實(shí)際收益;Ui,0表示微電網(wǎng)i的理想收益;α和β分別表示微電網(wǎng)對(duì)收益和損失的敏感程度,數(shù)值越大表示微電網(wǎng)對(duì)收益和損失越敏感,越容易影響微電網(wǎng)的交易行為;λ為損失規(guī)避系數(shù),是微電網(wǎng)對(duì)損失厭惡程度的量化指標(biāo)。通過上述設(shè)置,可以有效反映微電網(wǎng)的有限理性,即面對(duì)收益和損失采取不同的態(tài)度。
微電網(wǎng)面對(duì)不同概率的事件,也表現(xiàn)出有限理性,具體表現(xiàn)為:在決策時(shí)往往會(huì)高估低概率事件,而低估高概率事件。因此通過決策權(quán)重函數(shù)描述這個(gè)有限理性現(xiàn)象。決策權(quán)重函數(shù)可表示為:
式中:πi,+(pi,c)表示微電網(wǎng)i面對(duì)第c種收益事件的決策權(quán)重;πi,-(pi,d)表示微電網(wǎng)i面對(duì)第d種損失事件的決策權(quán)重;γ1表示微電網(wǎng)對(duì)收益的態(tài)度量化系數(shù);γ2表示微電網(wǎng)對(duì)損失的態(tài)度量化系數(shù);pi,c表示第c種收益事件發(fā)生的客觀概率;pi,d表示第d種損失事件發(fā)生的客觀概率。
將一個(gè)電力交易周期劃分為T個(gè)時(shí)隙,時(shí)隙t∈{1,2,…,T}。全體微電網(wǎng)的編號(hào)集合為:N={1,2,3,…,n}。
在t時(shí)段,微電網(wǎng)i收益值可由下式表示:
式中:Ci,t為t時(shí)段微電網(wǎng)i與用戶的交易電價(jià);Cint,t為多微電網(wǎng)運(yùn)營(yíng)商規(guī)定的t時(shí)段內(nèi)部交易的售電(購(gòu)電)價(jià)格;xi,t為t時(shí)段微電網(wǎng)i消耗的電量;Cnet,t為t時(shí)段微電網(wǎng)從配電網(wǎng)購(gòu)電的價(jià)格;Qnet,i,t為t時(shí)段微電網(wǎng)i從配電網(wǎng)購(gòu)買的電量;Qbuy,i,j,t為t時(shí)段微電網(wǎng)i從微電網(wǎng)j購(gòu)買的電量;Qsell,i,j,t為t時(shí)段微電網(wǎng)i向微電網(wǎng)j售賣的電量;n為微電網(wǎng)的總個(gè)數(shù);Fst,i,t為儲(chǔ)能成本[27]:
式中:Cst為微電網(wǎng)單位時(shí)間內(nèi)存儲(chǔ)單位電量的單價(jià);Wst,i,t為微電網(wǎng)i在t時(shí)段儲(chǔ)能電池儲(chǔ)存的電量。
式中:Wst,i,t-1表示微電網(wǎng)i在t-1時(shí)段儲(chǔ)能電池儲(chǔ)存的電量;Qst,i,t表示微電網(wǎng)i在t時(shí)段的儲(chǔ)存(釋放)電量,如果Qst,i,t>0,則說明在t時(shí)段,微電網(wǎng)i正在往儲(chǔ)能電池里充電,如果Qst,i,t<0,則說明在t時(shí)段,微電網(wǎng)i的儲(chǔ)能電池正在放電。
微電網(wǎng)在進(jìn)行電能交易時(shí),一般會(huì)考慮時(shí)間的效用偏好以及風(fēng)險(xiǎn)和收益的偏好。因此,在分析單個(gè)微電網(wǎng)的交易決策時(shí)需要在單個(gè)微電網(wǎng)收益值的基礎(chǔ)上考慮不同時(shí)間偏好影響下的微電網(wǎng)前景值,將單個(gè)微電網(wǎng)收益值與理想收益值的差值ΔUi,t代入前景理論價(jià)值函數(shù),并將時(shí)間偏好值、決策權(quán)重函數(shù)和價(jià)值函數(shù)相乘,單個(gè)微電網(wǎng)的時(shí)間偏好前景值如下式所示:
微電網(wǎng)i在t時(shí)段的決策集為:
式中:Qu,i,t表示t時(shí)段微電網(wǎng)i利用的電量。
式中:Qd,i,t表示t時(shí)段微電網(wǎng)i的發(fā)電量;當(dāng)微電網(wǎng)i在t時(shí)段的發(fā)電量小于用戶需求電量時(shí),說明微電網(wǎng)i的發(fā)電能力不足,t時(shí)段微電網(wǎng)i利用的電量等于微電網(wǎng)i供給用戶的電量與存儲(chǔ)的電量之和,減去向其他微電網(wǎng)和配電網(wǎng)購(gòu)買的電量;當(dāng)微電網(wǎng)i在t時(shí)段的發(fā)電量大于用戶需求電量時(shí),說明微電網(wǎng)i的發(fā)電能力盈余,t時(shí)段微電網(wǎng)i利用的電量等于微電網(wǎng)i供給用戶的電量、存儲(chǔ)的電量、出售給其他微電網(wǎng)的總電量之和。
所有微電網(wǎng)在t時(shí)段內(nèi)的決策集可表示為:
微電網(wǎng)i在交易博弈過程中,根據(jù)多微電網(wǎng)運(yùn)營(yíng)商的定價(jià)策略,在t時(shí)段通過選擇決策集si,t實(shí)現(xiàn)其自身時(shí)間偏好前景值最大的目標(biāo),即:
所有微電網(wǎng)在t時(shí)段內(nèi)的決策集St和時(shí)間偏好前景值函數(shù)的博弈是一組優(yōu)化問題。微電網(wǎng)i的目標(biāo)函數(shù)取決于微電網(wǎng)i和其他微電網(wǎng)的交易策略。此外,一個(gè)微電網(wǎng)采取的策略會(huì)被其他微電網(wǎng)的策略所約束,這種約束稱為耦合約束。因此,多個(gè)微電網(wǎng)之間的P2P電能交易博弈被稱作對(duì)偶策略博弈[28]。
式中:Qi*表示t時(shí)段微電網(wǎng)i交易電量的納什均衡解;Vi表示t時(shí)段微電網(wǎng)i的時(shí)間偏好前景值;N表示全體微電網(wǎng)的編號(hào)集合。
1)微電網(wǎng)發(fā)出的電量被負(fù)荷消耗后,還會(huì)被用來(lái)為儲(chǔ)能電池充能或者與其他微電網(wǎng)進(jìn)行交互,如果仍然留有剩余電量,則將被丟棄。因此微電網(wǎng)可利用的電量?jī)H占微電網(wǎng)發(fā)出電量的一部分,如下式所示:
2)微電網(wǎng)之間的交易是公開透明的,因此微電網(wǎng)內(nèi)部交易的出售電量總和等于購(gòu)入電量總和:
3)微電網(wǎng)出售電量不得高于微電網(wǎng)的供給盈余電量,供給盈余電量為微電網(wǎng)利用電量與用戶需求電量的差值:
4)在多微電網(wǎng)運(yùn)行中,所有微電網(wǎng)利用的電量,除去一部分被負(fù)載端所利用外,剩余電量將被儲(chǔ)能電池存儲(chǔ),但多微電網(wǎng)如果不滿足負(fù)載要求,即可被利用的電量總和低于用戶需求電量總和,則多微電網(wǎng)運(yùn)營(yíng)商需要向配電網(wǎng)購(gòu)買電量,以補(bǔ)足用戶需求電量缺額。
5)因?yàn)槲㈦娋W(wǎng)儲(chǔ)能電池的充放電功率和容量都是有限的,Qst,i,t和Wst,i,t的約束可表示為:
式中:Qst,max,i,t和Qst,min,i,t分別為充放電量Qst,i,t的上、下限;Wst,max,i,t為儲(chǔ)能電池容量的上限。
6)微電網(wǎng)之間的交易是單向的,不存在一個(gè)微電網(wǎng)在同一時(shí)間段向同一個(gè)微電網(wǎng)出售和購(gòu)買電量的情況,存在下面約束關(guān)系:
7)由于微電網(wǎng)相互之間、微電網(wǎng)與配電網(wǎng)之間受到傳輸線的容量限制,交易電量存在下面約束關(guān)系:
式中:Qbuy,max,i,j,t、Qsell,maxi,j,t、Qnet,max,i,t分別為Qbuy,i,j,t、Qsell,i,j,t、Qnet,i,t的上限。
如圖1所示,多微電網(wǎng)運(yùn)營(yíng)商以所有微電網(wǎng)整體收益最大為目標(biāo)制定微電網(wǎng)之間的電能交易價(jià)格,微電網(wǎng)根據(jù)多微電網(wǎng)運(yùn)營(yíng)商制定的內(nèi)部交易電價(jià)與其他微電網(wǎng)進(jìn)行交易[29]。同時(shí),微電網(wǎng)內(nèi)部交易電價(jià)應(yīng)低于微電網(wǎng)向配電網(wǎng)購(gòu)買電量的價(jià)格,如式(23)所示:
多微電網(wǎng)運(yùn)營(yíng)商確定內(nèi)部交易電價(jià)的過程為:微電網(wǎng)根據(jù)多微電網(wǎng)運(yùn)營(yíng)商制定的內(nèi)部交易電價(jià)選擇自身的內(nèi)部交易電量、儲(chǔ)能電量以及向配電網(wǎng)購(gòu)買的電量。多微電網(wǎng)運(yùn)營(yíng)商將根據(jù)微電網(wǎng)的決策,以所有微電網(wǎng)整體收益最大為目標(biāo),調(diào)整定價(jià)。微電網(wǎng)再根據(jù)調(diào)整后的定價(jià)重新選擇自身的內(nèi)部交易電量、儲(chǔ)能電量以及向配電網(wǎng)購(gòu)買的電量。如此重復(fù),直到博弈均衡時(shí)確認(rèn)最終交易電價(jià)。
微電網(wǎng)之間充分交易電量時(shí),由于減少了向配電網(wǎng)購(gòu)買高價(jià)的補(bǔ)足電量以及儲(chǔ)能成本,收益將得到提升。多微電網(wǎng)運(yùn)營(yíng)商以所有微電網(wǎng)收益最大化為目標(biāo),可以確保多微電網(wǎng)內(nèi)部充分交易,提高微電網(wǎng)的發(fā)電利用率,進(jìn)而滿足“雙碳”目標(biāo)的要求。
多微電網(wǎng)運(yùn)營(yíng)商以所有微電網(wǎng)整體收益最大為目標(biāo)的定價(jià)博弈優(yōu)化問題可表示為:
式中:Ui,t(Cint,t)表示在t時(shí)段,定價(jià)Cint,t下,第i個(gè)微電網(wǎng)的實(shí)際收益。
本文對(duì)多微電網(wǎng)運(yùn)營(yíng)商制定的電價(jià)、微電網(wǎng)之間交易的電量進(jìn)行迭代求解[30]。通過隨機(jī)生成策略集,并使微電網(wǎng)在每個(gè)策略集下進(jìn)行博弈,經(jīng)過多次迭代后得到最優(yōu)策略集,具體步驟如下:
1)載入微電網(wǎng)發(fā)電量、用戶需求量、微電網(wǎng)儲(chǔ)能電池容量、微電網(wǎng)與配電網(wǎng)之間傳輸線的容量限制等基本數(shù)據(jù),生成微電網(wǎng)之間初始定價(jià)。
2)在可行域中隨機(jī)生成微電網(wǎng)初始交易電量群組,pi,t表示第t代的第i組交易電量,依次計(jì)算每組交易電量的時(shí)間偏好前景值,作為當(dāng)前最優(yōu)時(shí)間偏好前景值,計(jì)作Vbest,i,對(duì)應(yīng)的交易電量為pbest,i;找到群組中的全局最優(yōu)時(shí)間偏好前景值,計(jì)作Vbest,對(duì)應(yīng)的交易電量為gbest。
3)更新交易電量,更新方法如下:
式中:a、b、c為設(shè)定的常數(shù);pi,t+1表示第t+1代的第i組交易電量。
4)根據(jù)更新后的交易電量,依次計(jì)算每組微電網(wǎng)的時(shí)間偏好前景值,計(jì)作Vi,t,將Vi,t與Vbest,i進(jìn)行比較,如果Vi,t>Vbest,i,則Vbest,i=Vi,t,pbest,i=pi,t,否則Vbest,i不變。
5)將Vi,t與Vbest進(jìn)行比較,如果Vi,t>Vbest,則Vbest=Vi,t,gbest=pi,t,否則Vbest不變。
6)判斷全局最優(yōu)時(shí)間偏好前景值Vbest是否連續(xù)固定代數(shù)保持不變,如果滿足條件,說明當(dāng)前微電網(wǎng)之間的博弈達(dá)到了納什均衡,執(zhí)行步驟7);否則執(zhí)行步驟3)。
7)多微電網(wǎng)運(yùn)營(yíng)商根據(jù)微電網(wǎng)的交易電量,求取使所有微電網(wǎng)整體收益值最高的內(nèi)部交易電價(jià),判斷所有微電網(wǎng)整體收益值是否連續(xù)固定代數(shù)保持不變,如果滿足條件,執(zhí)行步驟8),否則執(zhí)行步驟3)。
8)輸出最終結(jié)果。
9)結(jié)束。
本文選取3個(gè)微電網(wǎng)(MG1、MG2和MG3)進(jìn)行仿真分析。其中,MG1為風(fēng)力發(fā)電微電網(wǎng);MG2為光伏發(fā)電微電網(wǎng);MG3為常規(guī)能源發(fā)電微電網(wǎng),總共模擬了一天(24 h)的交易。微電網(wǎng)向配電網(wǎng)購(gòu)買電量的單價(jià)為0.8 元/kWh,微電網(wǎng)向用戶出售電量按固定電價(jià)0.4元/kWh進(jìn)行計(jì)算。
MG1、MG2和MG3的能源出力預(yù)測(cè)如圖3 所示。MG1的能源出力預(yù)測(cè)通過按照一定比例放大了文獻(xiàn)[31]中的風(fēng)力發(fā)電數(shù)據(jù),MG2的能源出力預(yù)測(cè)通過按照一定比例放大了文獻(xiàn)[32]中的光伏發(fā)電數(shù)據(jù),MG3的能源出力預(yù)測(cè)是在整體發(fā)電功率為1 600 kW的基礎(chǔ)上增加了范圍為±100 kW的隨機(jī)發(fā)電功率。根據(jù)文獻(xiàn)[33]中的數(shù)據(jù)得到各個(gè)微電網(wǎng)的用戶需求預(yù)測(cè)電量如圖4所示。

圖3 微電網(wǎng)能源出力預(yù)測(cè)Fig.3 Energy output power prediction of microgrids

圖4 用戶需求預(yù)測(cè)Fig.4 User demand prediction
采用如下方案進(jìn)行研究:
方案一:當(dāng)微電網(wǎng)可利用的電量低于用戶需求電量時(shí),微電網(wǎng)直接向配電網(wǎng)購(gòu)買補(bǔ)足電量,微電網(wǎng)之間不存在電能交易行為。
方案二:在方案一的基礎(chǔ)上,引入主從博弈的多微電網(wǎng)運(yùn)營(yíng)商P2P 電能交易策略,微電網(wǎng)之間可通過電能交易行為平衡供需關(guān)系,并通過期望效用理論計(jì)算納什均衡解。
方案三:在方案一的基礎(chǔ)上,引入主從博弈的多微電網(wǎng)運(yùn)營(yíng)商P2P 電能交易策略,微電網(wǎng)之間可通過電能交易行為平衡供需關(guān)系,并通過時(shí)間偏好理論和前景理論計(jì)算納什均衡解。
方案三中3 個(gè)微電網(wǎng)的前景理論參數(shù)取文獻(xiàn)[34]中的定值,α=0.88,β=0.88,λ=2.25,γ1=0.61,γ2=0.69。MG1的發(fā)電量基本可以滿足用戶的需要,因此MG1更關(guān)注遠(yuǎn)期收益,MG1的貼現(xiàn)因子較小,ρ1=0.7;MG2為光伏發(fā)電,有部分時(shí)間不能滿足用戶需要,因此MG2比MG1更關(guān)注短期收益,MG2的貼現(xiàn)因子略大于MG1的貼現(xiàn)因子,ρ2=0.8;MG3為常規(guī)能源發(fā)電,發(fā)電成本較高,對(duì)快速收回成本的傾向更強(qiáng),因此MG3更加關(guān)注短期收益,MG3的貼現(xiàn)因子在3個(gè)微電網(wǎng)中最大,ρ3=0.9。在3 個(gè)微電網(wǎng)的時(shí)間偏好參數(shù)中,遠(yuǎn)期時(shí)間段的附加折現(xiàn)影響因子κ=1,現(xiàn)期時(shí)間段的持續(xù)強(qiáng)度η=0.33。
通過對(duì)微電網(wǎng)供需平衡關(guān)系進(jìn)行計(jì)算,具體計(jì)算方法為:根據(jù)微電網(wǎng)發(fā)電量與需求量的歷史數(shù)據(jù),將發(fā)電量與需求量的差值作為供需值,統(tǒng)計(jì)每個(gè)時(shí)段的供需值,并將所有時(shí)段供需值的分布范圍劃分為9個(gè)大小相等的區(qū)間,將每個(gè)區(qū)間的時(shí)段數(shù)與總時(shí)段數(shù)的比例作為該區(qū)間的概率,得到概率分布如圖5 所示。微電網(wǎng)供需電量區(qū)間如表1所示。

表1 微電網(wǎng)供需電量的區(qū)間Table 1 The range of power supply and demand in a microgrids

圖5 微電網(wǎng)供需概率分布Fig.5 Probability distribution of supply and demand in microgrids
前景理論中Ui,0的選取方式分為兩種情況,當(dāng)微電網(wǎng)的發(fā)電量均超過用戶需求時(shí),收益參考點(diǎn)為3 個(gè)微電網(wǎng)的平均收益,分別為1 967 元/h、1 943元/h、1 832元/h。當(dāng)存在微電網(wǎng)的發(fā)電量不能滿足用戶需求時(shí),微電網(wǎng)處于供需不平衡狀態(tài),不能僅用微電網(wǎng)的平均收益作為收益參考點(diǎn),需要通過收益參考點(diǎn)的選取影響微電網(wǎng)的交易策略,從而降低供需不平衡程度。
當(dāng)供需不平衡程度較高時(shí),增加內(nèi)部交易電量可有效降低供需不平衡程度。適當(dāng)提高收益參考點(diǎn),會(huì)使得處于供電不足的微電網(wǎng)負(fù)向前景值增大,從而大量買入發(fā)電盈余微電網(wǎng)的盈余電量。因此適當(dāng)提高收益參考點(diǎn)可以平衡供需關(guān)系。根據(jù)三個(gè)微電網(wǎng)的平均收益,如圖6 所示,收益參考點(diǎn)分別取2 085元/h、2 036元/h、1 965 元/h。

圖6 供需不平衡程度較高時(shí)預(yù)計(jì)收益曲線Fig.6 The expected revenue curve under high degree of supply and demand imbalance
在供需不平衡程度較低時(shí),適當(dāng)降低收益參考點(diǎn),使得盈余狀態(tài)的微電網(wǎng)通過內(nèi)部交易獲得同等收益時(shí),前景值的增加較快。這樣可以促使盈余狀態(tài)的微電網(wǎng)將盈余電量賣給供電不足的微電網(wǎng),使得供需不平衡程度進(jìn)一步降低。根據(jù)三個(gè)微電網(wǎng)的平均收益,如圖7所示,參考點(diǎn)分別取1 842元/h、1 811元/h、1 731元/h。

圖7 供需不平衡程度較低時(shí)預(yù)計(jì)收益曲線Fig.7 The expected revenue curve under low degree of supply and demand imbalance
5.3.1 收益分析
通過模擬交易,得到多微電網(wǎng)運(yùn)營(yíng)商每小時(shí)收益值如圖8所示。由圖8可知,未引入多微電網(wǎng)運(yùn)營(yíng)商P2P 電能交易策略的方案一中所有微電網(wǎng)總體收益低于方案二和方案三。然而,從03:00—05:00時(shí)間段,由于用戶需求較低,多微電網(wǎng)運(yùn)營(yíng)商P2P 電能交易策略未能起到平衡供需的作用,方案一在該時(shí)段成為較佳方案。與未引入多微電網(wǎng)運(yùn)營(yíng)商P2P 電能交易策略的方案一相比,方案二和方案三的整體收益表現(xiàn)更佳。此外,方案三的整體收益高于方案二,這說明通過時(shí)間偏好理論和前景理論計(jì)算多微電網(wǎng)運(yùn)營(yíng)商P2P 電能交易的納什均衡解對(duì)于提高微電網(wǎng)的總體收益具有優(yōu)勢(shì)。具體而言,前景理論計(jì)算了微電網(wǎng)面對(duì)損失風(fēng)險(xiǎn)時(shí)的偏好,在微電網(wǎng)發(fā)電量無(wú)法滿足用戶需求時(shí),多微電網(wǎng)運(yùn)營(yíng)商更傾向于通過內(nèi)部交易來(lái)平衡供需關(guān)系和降低損失。因此,采用前景理論計(jì)算多微電網(wǎng)運(yùn)營(yíng)商P2P 電能交易的納什均衡解比采用期望效用理論更具優(yōu)勢(shì)。

圖8 多微電網(wǎng)運(yùn)營(yíng)商收益Fig.8 Revenues of multiple microgrid operators
5.3.2 DG利用率分析
如圖9所示,DG利用率為評(píng)價(jià)微電網(wǎng)可靠性的重要指標(biāo)[35],在00:00—03:00,18:00—24:00,因?yàn)镸G1、MG2和MG3中至少有一個(gè)微電網(wǎng)無(wú)法滿足用戶需求,而供給盈余的微電網(wǎng)無(wú)法通過P2P電能交易將盈余的電量補(bǔ)充給供給不足的微電網(wǎng)。供給盈余的單個(gè)微電網(wǎng)雖然DG利用率較高,但對(duì)于整體而言,方案一的DG利用率還是處于較低水平;當(dāng)所有微電網(wǎng)均能滿足用戶需求時(shí),無(wú)需通過P2P內(nèi)部交易平衡供需關(guān)系,DG利用率就可達(dá)到最大值;引入多微電網(wǎng)運(yùn)營(yíng)商P2P 電能交易策略后,可通過內(nèi)部交易將一些微電網(wǎng)的盈余電量平衡給了供給不足的微電網(wǎng),相比于方案一,方案二與方案三的DG利用率均有所提升。方案三的DG利用率略高于方案二,這說明:相比于期望效用理論,通過時(shí)間偏好理論和前景理論計(jì)算得出的納什均衡解可以使微電網(wǎng)之間交易更加充分。

圖9 DG利用率Fig.9 The DG utilization rates
5.3.3 碳排放分析
在傳統(tǒng)交易模型下,微電網(wǎng)需要與配電網(wǎng)進(jìn)行電能交易,而配電網(wǎng)的電能大多來(lái)自化石燃料發(fā)電,不符合低碳經(jīng)濟(jì)的發(fā)展政策[36]。引入多微電網(wǎng)運(yùn)營(yíng)商P2P 電能交易策略后,微電網(wǎng)之間的電能交易解決了一部分供需不平衡電量問題,因此減少了微電網(wǎng)向配電網(wǎng)購(gòu)電的電量,將這部分減少的電量按下式換算成二氧化碳排放量:
式中:MCO2,i,t表示微電網(wǎng)i在t時(shí)段的二氧化碳排放量;δ表示化石燃料發(fā)電量轉(zhuǎn)換為二氧化碳排放量的系數(shù),一般取。
換算后的二氧化碳排放量如圖10 所示。由圖10可知,在06:00—09:00、10:00—16:00時(shí)間段,由于微電網(wǎng)的發(fā)電量均能滿足用戶需求,無(wú)需從配電網(wǎng)進(jìn)行購(gòu)電,此時(shí)碳排放量為0。引入主從博弈的多微電網(wǎng)運(yùn)營(yíng)商P2P 電能交易策略后,微電網(wǎng)之間可以充分交易,使得新能源微電網(wǎng)能夠優(yōu)先滿足用戶需求,在一定程度上降低了碳排放量。由于方案一的24 h等價(jià)二氧化碳排放量為14 950 kg,方案二的24 h等價(jià)二氧化碳排放量為9 240 kg,方案三的24 h等價(jià)二氧化碳排放量為5 030 kg,所以方案二、方案三的碳排放總體上低于方案一的碳排放。方案三的碳排放低于方案二的碳排放,滿足“雙碳”目標(biāo)的整體要求。通過時(shí)間偏好理論和前景理論計(jì)算得出的納什均衡解使微電網(wǎng)之間更充分地交易,從而降低購(gòu)買配電網(wǎng)的電量。

圖10 不同方案下二氧化碳排放量Fig.10 Carbon dioxide emissions under different schemes
5.3.4 收斂性分析
在方案二與方案三計(jì)算出最終納什均衡解之后,記錄迭代過程中產(chǎn)生的解和最終納什均衡解,計(jì)算歷史解與最終納什均衡解的平均距離,并作為收斂性評(píng)價(jià)指標(biāo)g:
式中:M為歷史解的總個(gè)數(shù);Pi表示第i個(gè)歷史解;Pbest為最終納什均衡解。
各個(gè)迭代周期的g變化如圖11 所示。引入時(shí)間偏好理論和前景理論之后,微電網(wǎng)均衡解在第120代時(shí)已達(dá)到均衡狀態(tài);而期望效用理論則需要到270代才能達(dá)到均衡狀態(tài)。結(jié)果表明,時(shí)間偏好理論和前景理論的引入可使多微電網(wǎng)運(yùn)營(yíng)商-微電網(wǎng)主從博弈下層模型中微電網(wǎng)間的博弈快速達(dá)到納什均衡狀態(tài),從而使上層多微電網(wǎng)運(yùn)營(yíng)商可以較為快速地判斷定價(jià)是否合理。相較于期望效用理論,其更快的收斂速度能更迅速地滿足市場(chǎng)交易需求,提高市場(chǎng)交易效率。

圖11 不同迭代次數(shù)下的收斂性評(píng)價(jià)Fig.11 Convergence evaluation under different iteration times
本文研究了多微電網(wǎng)之間交易過程中存在的有限理性問題,基于時(shí)間偏好理論和前景理論提出了多微電網(wǎng)運(yùn)營(yíng)商-微電網(wǎng)主從博弈下微電網(wǎng)P2P博弈交易策略,得出結(jié)論如下:
1)采用主從博弈模型的多微電網(wǎng)運(yùn)營(yíng)商交易策略,微電網(wǎng)的整體收益值得到顯著增長(zhǎng),提升了DG利用率,減少碳排放量。
2)時(shí)間偏好理論和前景理論的引入使主從博弈下層模型中微電網(wǎng)間的博弈快速達(dá)到納什均衡狀態(tài)。相較于期望效用理論,時(shí)間偏好理論和前景理論能更快速計(jì)算出均衡解。
基于時(shí)間偏好理論和前景理論的多微電網(wǎng)P2P 交易策略為微電網(wǎng)資源調(diào)度與定價(jià)提供了優(yōu)化方案,提高了微電網(wǎng)自身的可靠性和穩(wěn)定性,加快了微電網(wǎng)在資源調(diào)度時(shí)的響應(yīng)速度,降低了電能損失,保障了電力市場(chǎng)的公平、透明,順應(yīng)了當(dāng)前電網(wǎng)的分散化發(fā)展趨勢(shì)。