基于三方演化博弈的微網接入公共配電網服務輸配電價調整監管機制

2021-06-26 04:05:40謝敬東卞澤遠呂志偉

科學技術與工程 2021年15期

關鍵詞：策略

謝敬東，卞澤遠，呂志偉，孫波

(1.上海電力大學能源電力科創中心，上海 200082； 2.上海電力大學經濟與管理學院，上海 200082)

國家能源局頒布的《推進并網型微電網建設試行辦法》規定，當并網型微網接入公用配電網時，由此引起的公用配電網建設與改造費用原則上由電網企業承擔，這是中國推動微網建設、實現電網轉型發展的重要舉措。

微網的接入能夠為公共配電網提供潛在的備用服務，提高電力系統的安全性和可靠性[1-2]。備用服務是在電力市場環境下保障供電可靠性和居民用電滿意度的重要手段，具有公共服務特性。由于并網型微網的建設數量存在較大不確定性，需要建立適當的激勵以及監管機制來解決電網企業為微網提供并網服務帶來的成本增加問題。

國家發改委，國家能源局于2020年2月出臺的《區域電網輸電價格定價辦法》中的第十六條規定：監管周期內遇有國家重大政策調整、發生重大自然災害、不可抗力等因素造成的成本重大變化，電網企業可以向國家發展改革委申請對準許收入和輸電價格作適當調整。電網公司進行微電網接入公共配電網服務屬于國家重大政策調整造成的電網企業成本重大變化，因此可通過輸配電費用調整對電網公司進行成本補償與激勵，下文以此為出發點進行研究。

由于電力市場規則、輸配電價等尚處于不斷完善中，對于電力市場環境下的微網接入服務的補償和激勵研究目前還處于空白。但是對于其他公共服務的補償與激勵的研究仍然值得我們參考。

文獻[3]通過對政府、電網企業與農村居民三方主體利益博弈進行分析，建立了政府與電網公司在居民電價補貼政策中的利益博弈模型，提出混合居民電價補貼政策應該成為政府的首選策略，為本文建立三方博弈的理論模型提供了借鑒；文獻[4]通過系統動力學仿真實驗，對不同主體進行博弈分析，對電力市場環境下通過適量的補貼維持普遍服務質量進行了有益的探討，認為通過一定的補貼和適當的監管，可以提高電力市場環境下的電力普遍服務，為本文建立博弈期望收益函數提供理論基礎；

由上述文獻綜述可知，要研究公共服務的補償與激勵這一涉及不同利益主體的復雜經濟行為，博弈論無疑是行之有效的工具。在學術研究中，博弈論被大量應用于不同利益主體的復雜經濟行為研究，針對復雜經濟行為分析中參與主體的博弈過程分析，主要可以分成如下兩大類。

(1)兩方博弈分析。文獻[5]利用演化博弈理論分析了可再生能源發電企業與電網企業之間的利益協調機制，認為這種利益均衡的形成是一個動態的、逐步演化的過程；文獻[6]結合中國南方電力市場的實際情況，運用多種群競爭的演化博弈理論，建立了發電廠商與電力公司共同競價的市場均衡模型，從利潤分配的角度得出了市場最終的穩定策略點；文獻[7]考慮配電網和多微電網交互運行情況，分別分析其經濟利益，建立了微電網和配電網隨機雙層調度模型，并提出協調控制策略。

(2)三方博弈分析。文獻[8] 應用三方演化博弈對新能源發電企業、傳統化石能源發電企業和電網企業組成“新體-舊體-電網”三方參與電力市場新能源消納為場景進行了實際應用分析，驗證了電力市場環境下的均衡穩定性分析的有效性和實用性，為本文應用三方演化博弈理論提供了參考；文獻[9]通過運用演化博弈理論構建了政府部門、企業與消費者之間的三方動態博弈模型，對新能源分時租賃汽車監管機制進行分析，提出企業如果能夠通過創新有效地降低經營成本，有利于新能源分時租賃汽車行業的健康發展，為本文建立求解三方演化博弈模型提供了思路；文獻[10]建立了監管機構、P2P 平臺和借款人之間的三方博弈復制動態模型，通過非線性系統穩定性理論，得到了有益的監管策略，為本文非線性系統穩定性理論的應用提供指導。

綜上所述，目前電力市場環境下的參與主體的博弈分析主要還是以兩兩博弈討論為主，而涉及三方參與主體的博弈分析較少。但是單純的兩兩靜態研究無法滿足現實中監管機構、電網公司和微網運營方存在的三方動態博弈關系，因此演化博弈論作為研究多群體長期博弈行為特性的一種重要而有力的工具，其采用自然選擇的機制，無需嚴格的理性假設，更為接近現實狀況，更能反映不同利益群體的策略的自發演化過程(動態過程)[8]。運用演化博弈理論，對三方成本收益進行量化，構建三方演化博弈模型，通過漸進穩定性判據，對各參數進行分析，以期尋找最理想狀況需要滿足的條件，從而提出相應的監管建議，為政府決策和電力監管提供參考。

1 三方博弈模型

1.1 電力市場環境下 “吸脂效應”

“吸脂”原指當牛奶加熱時，只把浮在表層營養較多、最美味的脂肪部分瓢起食用，其他部分則棄之不吃。應用到電力服務領域中，在電力市場化改革后，售電企業在利益驅動下，僅供給高獲利區域，而不愿供給低獲利區域，即電力市場用戶結構發生了變化，如圖1所示。因此，“吸脂效應”的結果是，一方面使低獲利的保底區域全由原在位者電網企業承擔，另一方面吸脂成功的新進入售電企業會壓迫電網企業已有業務的經營利潤，從而使其在競爭中處于劣勢地位。電力保底服務機制研究就是要解決電力市場化改革導致的“吸脂效應”引發的接入服務質量下降問題[11]。

圖1 電力市場用戶結構變化圖Fig.1 Diagram of changes in electricity market user structure

1.2 三方博弈模型假設

假定在微電網接入公共配電網服務監管博弈過程中參與的主體分別是監管機構、電網公司和微網，各主體策略選擇如下。

(1)監管機構:接入服務監管、補貼相關的部門，包括發改委、財政部、工信部等多個部門。作為政策的制定與博弈的主導方，該博弈方策略選擇分別為以社會整體效益優先的社會性監管與以經濟效益優先的經濟性監管，即增加人力物力應用到電網公司接入服務監管中，不定時進行監管與通過市場進行資源分配，放任電網公司進行接入服務，定時進行監管，以達到穩定狀態兩種策略選擇。

(2)電網企業:為微電網進行接入公共配電網的電網企業。為了減少成本或牟取超額利潤，企業在微電網的接入過程中會進行克扣、偷工減料或者虛報成本超額建設，造成浪費等情況，以及在微電網的并網運行過程當中存在對微網的供電質量差，風光電調度不及時導致的消納率過低等消極運營現象。在監管部門的監管和微網的參與下，電網企業擬采取保持和提高接入質量，從而可提高企業聲譽的服務質量優先型經營策略與壓縮運營成本，從而可提高企業經濟效益的經濟效益優先型經營策略兩個策略。

(3)微網:作為接入服務的直接受益者，接入質量越高，微網穩定性越大，經濟效益越高，在接受接入服務過程中由于電網企業的調度檢修不及時等行為會對接入服務產生負面評價。權衡參與監管成本與服務改進及補償收益的得失決定微網在博弈系統中的策略集合，分別是主動向監管機構舉報與反饋接入服務質量的主動參與監管策略或是等待監管機構介入的被動參與監管策略。

基于上述概念界定和模型假設，在三方均為有限理性且信息不對稱的條件下，建立微電網接入公共配電網和監管過程中監管機構-電網-微網三方博弈模型，如圖2 所示。

圖2 三方博弈樹Fig.2 Tripartite game tree

1.3 模型參數設定

設定微網接入服務三方參與的博弈模型中監管機構、電網公司和微網運營方的收益、成本、損失等相關參數表[12]，具體如下。

x,y,z:在監管機構-電網-微網三方博弈中,監管機構選擇社會性監管策略的概率為x,監管機構選擇經濟性監管策略的概率為1-x;電網公司選擇服務質量優先型經營策略的概率為y,電網公司選擇經濟效益優先型經營策略的概率為1-y;微網選擇主動參與監管策略的概率為z,微網選擇被動參與監管策略的概率為1-z,其中x,y,z∈[0,1],均為時間t的函數。Ci:監管機構設定的接入通道成本上限。it:輸配電準許收益率。F:監管部門選擇社會性監管的情況下,電網公司服務質量未達到監管基準時監管機構對其的罰款。p1:在微網主動、監管部門選擇社會性監管的情況下電網公司服務質量低于監管基準被發現的概率。p2:在微網被動、監管部門選擇社會性監管的情況下電網公司服務質量低于監管基準被發現的概率(p1>p2)。Cgov:監管部門選擇社會性監管策略相比經濟性策略需要增加的成本。Rgov1:電網采用服務質量優先型策略下監管機構獲得的社會效益。Rgov2:電網采用經濟效益優先型下監管機構獲得的社會效益(Rgov1>Rgov2)。Lgov:在微網采取主動參與監管策略下,接入服務被未達到監管基準,監管機構采用經濟性監管策略時,監管部門遭受的聲譽損失。Ccp:電網企業進行接入服務的固定成本。Rgrid1:電網采用服務質量優先型策略下獲得的綜合效益。Rgrid2:電網采用經濟效益優先型下獲得的綜合效益(Rgrid1>Rgrid2)。Cop:電網企業采用服務質量優先型策略時需額外增加的運營成本。Rmg1:電網采用服務質量優先型策略下微網獲得的經濟效益。Rmg2:電網采用經濟效益優先型下微網獲得的經濟效益(Rmg1>Rmg2)。Cmg:微網主動治理電能質量問題,主動參與監管的成本。k:接入服務被未達到監管基準,當監管部門采用社會性監管,被監管部門獲取到后,微網獲得補償的補償系數。Lgrid:當監管機構采用社會性監管策略時,接入服務被未達到監管基準被監管部門獲取到后,經監管部門通報之后,電網遭受的聲譽損失。

1.4 博弈支付矩陣

根據上述設定，列出支付矩陣，在監管機構分別選擇社會性監管和經濟性監管情況下，微網與電網公司之間的博弈支付矩陣如表1、表2所示。

表2 監管機構經濟性監管時電網與微網的支付矩陣Table 2 The payment matrix of the power grid and microgrid when the regulatory agency is economically supervised

2 三方博弈分析

2.1 監管機構監管策略博弈分析

監管機構選擇社會性監管策略的期望收益為

π11=yz[Rgov1-Cgov-Ci(1+it)] +

(1-y)z[Rgov2+Fp1-(1-p1)×

(Ciit+Lgov)-Cgov-Ci]+

(1-y)(1-z)[Rgov2+Fp2-

(1-p2)(Ciit+Lgov)-Cgov-Ci]+

y(1-z)[Rgov1-Cgov-Ci(1+it)]

(1)

監管機構選擇經濟性監管策略的期望收益為

π12=yz[Rgov1-Ci(1+it)] +(1-y)z{Rgov2-

[Ci(1+it)+Lgov]}+(1-y)×

(1-z){Rgov2-[Ci(1+it)+Lgov]}+

y(1-z)[Rgov1-Ci(1+it)]

(2)

監管機構的平均期望收益為

(3)

由此可得，監管機構選擇社會性監管時的復制動態方程為

(1-y)(1-z)[p2(F+Ciit+Lgov)]-Cgov

(4)

(1-y)(1-z)[p2(F+Ciit+Lgov)]-Cgov

(5)

令F(x)=0，得x=0，x=1，則

2.1.1 電網公司策略選擇對監管機構策略選擇的影響

若y=yx，則F(x) ≡0，此時博弈系統恒處于漸進穩定狀態，即無論監管機構選擇社會性和經濟性監管策略的比例如何，當電網公司采取服務質量優先型的概率y=yx時，監管機構行為策略都不會發生變動。

分析x=0，x=1兩點，若使得其鄰近區域內出發的軌跡漸近并趨向于該點，即對F(x) 求導，使?F(x)/?x<0，則稱該平衡點為局部漸近穩定的，則采用的行為策略也稱為演化穩定策略(evolutionarily stable strategy，EES)。

若y≠yx，當y>yx，則x=0 時，F′(x)<0，處于局部漸近穩定狀態，監管機構選擇社會性監管策略的概率x隨著電網公司選擇服務質量優先型的概率y提高而降低，即此時監管機構趨向于選擇經濟性監管策略; 當y

2.1.2 微網策略選擇對監管機構策略選擇的影響

若z=zx，則F(x) ≡0，此時博弈系統恒處于漸進穩定狀態，即無論監管機構選擇社會性和經濟性監管策略的比例如何，當微網選擇主動參與監管的概率z=zx時，監管機構行為策略都不會發生變動。

若z≠zx，當z>zx，則x=1 時，F′(x)<0，處于局部漸近穩定狀態，監管機構選擇社會性監管策略的概率x隨著微網選擇主動參與監管的概率z提高而提高，即此時監管機構趨向于選擇社會性監管策略; 當z

2.2 電網企業經營策略博弈分析

電網選擇服務質量優先型策略的期望收益為

π21=Rgrid1+Ci(1+it)-Ccp-Cop

(6)

電網選擇經濟效益優先型策略的期望收益為

π22=xz[Ci+(1-p1)Ciit-p1(F+Lgrid+kF)-Ccp] +(1-x)z[Ci(1+it) -Ccp]+(1-x)×

(1-z)[Ci(1+it) -Ccp]+x(1-z)×

[Ci+(1-p2)Ciit-p2(F+Lgrid)-Ccp]+Rgrid2

(7)

電網的平均期望收益為

(8)

電網選擇服務質量優先型策略的復制動態方程為

x(1-z)[p2(F+Lgrid+Ciit)]+Rgrid1-

Rgrid2-Cop

(9)

(10)

令F(y)=0，得y=0，y=1，則

2.2.1 監管機構策略選擇對電網公司策略選擇的影響

若x=xy，則F(y) ≡0，此時博弈系統恒處于漸進穩定狀態，即無論電網公司選擇服務質量優先型和經濟效益優先型策略的比例如何，當監管機構采取社會性監管策略的概率x=xy時，電網公司的行為策略不會發生變動。

若x≠xy，當x>xy，則y=1 時，F′(y)<0，處于局部漸近穩定狀態，電網選擇服務質量優先型的策略的概率y隨著監管機構選擇社會性監管的概率x的提高而提高，即此時電網公司趨向于選擇服務質量優先型策略; 當x

2.2.2 微網策略選擇對電網公司策略選擇的影響

若z=zy，則F(y) ≡0，此時恒處于漸近穩定狀態，即無論電網公司選擇服務質量優先型和經濟效益優先型策略的比例如何，當微網主動參與監管的概率z=zy時，電網公司的行為策略不會發生變動。

若z≠zy，當z>zy，則y=1 時，F′(y)<0，處于局部漸近穩定狀態，電網選擇社會效益優先型策略的概率y隨著微網主動參與監管的概率z提高而提高，即此時電網公司趨向于選擇服務質量優先型策略; 當z

2.3 微網參與監管策略博弈分析

微網選擇主動參與監管策略的期望收益為

π31=xy(Rmg1-Cmg)+(1-x)y(Rmg1-Cmg)+

(1-x)(1-y)(Rmg2-Cmg)+

x(1-y)(p1kF+Rmg2-Cmg)

(11)

微網選擇被動參與監管策略的期望收益為

π32=xyRmg1+(1-x)yRmg1+(1-x)(1-y)Rmg2+x(1-y)Rmg2

(12)

微網的平均期望收益為

(13)

微網主動參與監管策略的復制動態方程為

(14)

(15)

令F(z)=0，得z=0，z=1，則

2.3.1 監管機構策略選擇對微網策略選擇的影響

若x=xz，則F(z) ≡0，此時恒處于演化穩定狀態，即無論微網選擇主動和被動策略的比例如何，當監管機構選擇社會性監管的概率x=xz時，微網的行為策略不會發生變動。

若x≠xz，當x>xz，則z=1 時，F′(z)<0，處于局部漸近穩定狀態，微網選擇主動參與監管策略的概率z隨著監管機構選擇社會性監管x的概率提高而提高，即此時微網趨向于選擇主動參與監管策略; 當x

2.3.2 電網公司策略對微網策略選擇的影響

若y=yz，則F(z) ≡0，此時恒處于漸近穩定狀態，即無論微網選擇主動和被動策略的比例如何，當電網公司選擇努力的概率y=yz時，微網的行為策略不會發生變動。

若y≠yz，當y>yz，則z=0 時，F′(z)<0，處于局部漸近穩定狀態，微網選擇主動參與監管的策略的概率隨著電網公司選擇服務質量優先型策略的概率提高而減少，即此時微網趨向于選擇主動參與監管策略; 當y

2.4 三方演化博弈穩定策略

對于三方博弈，當雅可比矩陣J的特征值均小于0時，該平衡點為漸進穩定點[8]，反之即為鞍點。

表3 平衡點穩定性分析Table 3 Balance point stability analysis

3 算例仿真

根據上文的結論，系統各參數的初始值及其變動決定漸進穩定結論，故本節針對上述演化博弈模型，運用MATLAB軟件分別進行了數值仿真分析，從而直觀地體現各行為主體的策略演化路徑以及各參數變化對漸進穩定結果的影響。設各初始參數為Cgov=3，Ci=20，Rgrid1=10，Rgrid2=7，Ccp=18，Cop=5，Cmg=1，it=0.01，F=1，k=0.1，Lgov=8，Lgrid=4，p1=0.6，p2=0.3，x0=0.8，y0=0.6，z0=0.5。

3.1 監管部門策略選擇仿真分析

3.1.1 影響監管部門策略選擇的關鍵參數

對p2(F+Ciit+Lgov) -Cgov進行分析，微網被動參與監督的情況下，社會性監管成功的概率p2較低，監管部門聲譽損失Lgov無法人為干預，監管成本Cgov比較確定，因此準許收益Ciit與罰款金額F是影響監管策略選擇的重要參數，當準許收益率it與罰款金額F增大至p2(F+Ciit+Lgov) -Cgov>0時，監管機構的博弈策略趨向于社會性監管狀態。

3.1.2 監管部門策略選擇仿真

在其他參數為初始值的情況下，設準許收益Ciit與罰款金額F分別為 (0.2，1)、(2，2)，系統狀態演化仿真圖如圖3所示。

推論1準許收益Ciit與罰款F可以影響監管部門的演化穩定狀態，當滿足p2(F+Ciit+Lgov) -Cgov<0時，監管機構趨向于選擇社會性監管策略，但無法到達漸進穩定狀態，同時印證了上文，即電網選擇服務質量優先型的策略的概率隨著監管機構選擇社會性監管的概率提高而提高。準許收益與罰款作為電力市場環境下監管部門解決潛在的市場失靈的有效手段，較高的準許收益Ciit有助于補償電網公司在微網接入公共配電網后的運營成本，從而激勵電網提高接入服務[2]，如提高可再生能源消納率，推進微電網參與電力輔助服務市場，提升系統整體能源利用率；較為嚴厲的罰款F在一定程度上會降低監管機構與電網公司雙方之間信息不對稱帶來的不利影響，減少電網公司采取經濟效益優先型策略的概率。但是，準許收益與罰款的增大卻不能促使電網公司演化到漸進穩定時采取服務質量優先型策略，即沒有達到理想狀態。

3.2 微網策略選擇仿真分析

3.2.1 影響微網策略選擇的關鍵參數

3.2.2 微網策略選擇仿真

為減少無關變量的影響，在其他參數為初始值的情況下，設準許收益Ciit與罰款金額F為 (2，2)，微網主動參與監管成本Cmg分別為1、0.01，系統狀態演化仿真圖如圖4所示。

圖4 Cmg不同時的系統演化仿真圖Fig.4 System evolution simulation diagram with different Cmg

3.3 電網策略選擇仿真分析

3.3.1 影響電網策略選擇的關鍵參數

3.3.2 電網策略選擇仿真

圖5 Cmg、Cop不同時的系統演化仿真圖Fig.5 System evolution simulation diagram with different Cmg and Cop

推論3電網運營成本Cop可以影響電網公司的演化穩定狀態，當Cop

4 結論與建議

(1)針對推論1(準許收益與罰款可以影響監管部門的演化穩定狀態)和圖3，監管機構應當選擇運用經濟性監管策略，即不額外增加監管成本，設定一定的監管基準，同時適當提高準許收益Ciit與罰款金額F，在微網被動參與監管的情況下，在監管周期內定時對接入服務質量進行檢查，根據接入質量與監管基準對電網進行獎勵或者罰款，雙管齊下，激勵電網企業通過高效的運營在獲取成本補償的同時傾向于提高服務質量，獲取獎勵，減少監管部門的信息劣勢，實現強力監管，避免監管機構出現成為電網企業尋租工具的“規制俘虜”現象。此外，較高的準許收益Ciit能夠助力于電網公司進行運營技術研發，從而提高創新水平，有助于減少電網公司在下一監管周期的運營成本Cop，即實現推論3假定的情形。

(2)針對推論2(微網主動參與監管成本Cmg可以影響微網的演化穩定狀態，但無形中增加了監管成本Cgov，卻無法促使博弈達到理想狀態)和圖4、圖5(c)，在監管過程中，監管機構與其通過增加Cgov來提高行政行政效率從而減少Cmg，不如將相關成本通過補貼的形式運用到優化電力產業結構上，從而通過杠桿的形式傳導至電網企業運營采購部門的供給端，有效地減少電網公司運營成本Cop，此時微網趨向于選擇被動參與監管，而電網公司在市場的引導下和監管部門的監管壓力下，更加趨于選擇服務質量優先型策略。