魏振華,鄭亞鋒,高宇峰,張 妍
(1.國核電力規(guī)劃設計研究院有限公司,北京 100095;2.華北電力大學河北省發(fā)電過程仿真與優(yōu)化控制技術(shù)創(chuàng)新中心,河北 保定 071000)
隨著新能源的快速發(fā)展與能源控制技術(shù)的不斷提高,綜合能源系統(tǒng)中不同能源之間的互補協(xié)作大大提高了能源的利用效率。一般情況下綜合能源系統(tǒng)是由多個能源集線器組成的。然而,多能源集線器系統(tǒng)優(yōu)化調(diào)度中存在復雜多變、決策變量眾多、能流耦合嚴重以及各能源集線器之間相互影響制約等問題[1-4],使得優(yōu)化模型決策變量維數(shù)大幅度增加,造成維數(shù)災難,導致傳統(tǒng)優(yōu)化調(diào)度求解算法難以獲得令人滿意的優(yōu)化計算結(jié)果,因此需要對基于博弈論的多能源集線器系統(tǒng)優(yōu)化調(diào)度模型求解算法進行深入研究。隨著對多能源集線器系統(tǒng)優(yōu)化調(diào)度的不斷研究,發(fā)現(xiàn)系統(tǒng)優(yōu)化調(diào)度模型建立以及模型求解算法對系統(tǒng)優(yōu)化調(diào)度研究具有十分重要的作用,而對于模型的建立,學者已進行了深入研究并取得一定成果。文獻[5]提出了基于能量流的電熱綜合能源系統(tǒng)棄風消納優(yōu)化調(diào)度模型,仿真表明,所提模型較為準確和可信。文獻[6]提出了區(qū)域綜合能源系統(tǒng)的最優(yōu)混合潮流模型,全面地考慮系統(tǒng)中相關運行約束,進而保證綜合能源系統(tǒng)經(jīng)濟環(huán)保運行。文獻[7]建立了具有加熱網(wǎng)絡的多區(qū)域綜合能源系統(tǒng)調(diào)度的混合整數(shù)線性規(guī)劃模型,進一步提高了綜合能源系統(tǒng)的經(jīng)濟效益和環(huán)境效益。
目前已經(jīng)有很多針對多能源集線器系統(tǒng)優(yōu)化調(diào)度求解方法,主要包括混合整數(shù)隨機規(guī)劃、區(qū)間線性規(guī)劃和智能算法等方法[8-10]。但是由于多能源集線器系統(tǒng)優(yōu)化調(diào)度具有強耦合、約束復雜和求解維度高的特點,難以得到系統(tǒng)優(yōu)化調(diào)度最優(yōu)解。為了解決系統(tǒng)強耦合以及約束復雜的問題,文獻[11]提出了群體智能的粒子群優(yōu)化技術(shù),仿真結(jié)果表明了該技術(shù)可以有效研究解決強耦合約束復雜系統(tǒng)的優(yōu)化調(diào)度。針對系統(tǒng)優(yōu)化調(diào)度模型維數(shù)高的特點,文獻[12]提出了一種隨時間變化自適應學習的加速系數(shù)-重力搜索算法,結(jié)果表明該方法可有效求解高維數(shù)優(yōu)化調(diào)度模型。綜上所述,具有強耦合、約束復雜和高維度特點的多能源集線器系統(tǒng)優(yōu)化調(diào)度的研究仍較為有限,迫切需要加強對求解該系統(tǒng)優(yōu)化調(diào)度問題的有效算法的研究。
量子粒子群算法(Quantum-behaved Particle Swarm Optimization,QPSO)相對于粒子群算法有位置更新而無速度更新,在降低了算法復雜度的同時提高了計算效率和收斂速度。目前,QPSO已在電力調(diào)度[13]、混沌辨識[14]、核電控制[15]等諸多領域得到了研究與應用。然而,在用量子粒子群算法解決多能源集線器系統(tǒng)優(yōu)化調(diào)度求解問題上研究較少。本文提出了一種差分進化量子粒子群算法(Differential Evolution Quantum-behaved Particle Swarm Optimization,DEQPSO),用以解決多能源集線器系統(tǒng)優(yōu)化調(diào)度模型求解。通過對QPSO算法更新后的粒子進行差分進化算法中的相關操作,有效地解決了算法容易陷入局部最優(yōu)的問題。通過仿真測試與算法比較,驗證了DEQPSO算法對多能源集線器系統(tǒng)優(yōu)化調(diào)度求解的有效性。
多能源集線器系統(tǒng)優(yōu)化調(diào)度模型主要包括集線器內(nèi)部耦合關系模型和各集線器之間的功率流關系模型。
2.1.1 能源集線器內(nèi)部耦合關系模型
能源集線器輸入側(cè)以電力和天然氣為主,輸出側(cè)為電和熱負載等,且集線器中輸入和輸出功率流相互耦合,因此需要研究能源集線器內(nèi)部耦合關系。下面以一個簡單能源集線器為例分析能源集線器內(nèi)部耦合關系模型。
圖1為某簡單能源集線器內(nèi)部結(jié)構(gòu)圖,針對該圖,利用能量守恒定律,將轉(zhuǎn)換器輸出表達為輸入和效率的乘積,結(jié)果如下

圖1 簡單能源集線器內(nèi)部結(jié)構(gòu)圖
(1)

(2)
根據(jù)上述分析可知,調(diào)度因子v為CHP使用的天然氣占比,調(diào)度因子的邊界約束如下所示
0≤ν≤1
(3)
2.1.2 各集線器之間的功率流關系模型
多能源集線器之間的功率流關系模型如式(4)所示
Aα×Fα=Pα
(4)
式中,α為不同的能源種類(天然氣、電力等)。Aα是多能源集線器之間的連接矩陣,其元素取值為{-1,0,1}。Fα是能源α通過集線器的注入量矩陣。Pα為能源α流入集線器的輸入量矩陣。
線路損耗可近似為相應功率流的多項式函數(shù),但具體的能流損耗關系式取決于不同的能量形式,其中電損耗Λie和氣損耗Λig表達式為
(5)
式中,fie和fig是流入能源集線器i的電力和天然氣的能源損失系數(shù),F(xiàn)iα表示外部能源α通過集線器i注入到多能源集線器系統(tǒng)的大小。
因此,能源集線器i的總成本Ci表示為:
(6)
式中,aα,bαq,cαr是能流α的價格系數(shù),Piα為注入到能源集線器i中的能源α值,Qα、Rα分別為能流α需求和輸出成本多項式的階次。
通過上述分析可知,各能源集線器在追求自身支付最小的同時受其它集線器的影響和制約,難以保證在自身最優(yōu)決策的基礎上整體消耗成本最低。為此,采用博弈優(yōu)化調(diào)度方法對多能源集線器系統(tǒng)進行調(diào)度研究。
為了更好的研究多能源集線器系統(tǒng)博弈優(yōu)化調(diào)度,需研究系統(tǒng)博弈優(yōu)化調(diào)度模型以及博弈優(yōu)化調(diào)度模型求解方法。
2.2.1 多能源集線器系統(tǒng)博弈優(yōu)化調(diào)度模型
多能源集線器系統(tǒng)博弈優(yōu)化調(diào)度模型可根據(jù)博弈論三個基本要素進行建立。其中,參與者為N個能源集線器,可記參與者集合為
N={K1,K2,…,Ki,…,KN}
(7)
博弈參與者的策略變量為能源集線器中CHP使用的天然氣占比vi,由式(3)可知,各參與者的連續(xù)策略空間Ωi可表示為
vi∈Ωi=[0,1]
(8)
根據(jù)上述分析可知,博弈的支付集合為
C=(C1,C2,…,Ci,…,CN)
(9)
根據(jù)式(2)-(9),可得多能源集線器系統(tǒng)博弈優(yōu)化調(diào)度模型。
2.2.2 博弈優(yōu)化調(diào)度模型求解
不同于一般的目標優(yōu)化,納什均衡問題是在兼顧其它參與者利益的前提下做出自身最優(yōu)決策。系統(tǒng)博弈優(yōu)化調(diào)度求解的流程圖如圖2所示。圖中,i為迭代次數(shù),Cm(i)為在第i次迭代的總成本,Y1、Y2、Y3為各集線器的最小成本,v1(i)、v2(i)、v3(i)表示第i次迭代的各集線器調(diào)度因子。
從圖2中可知,能源集線器更新調(diào)度因子并與其它集線器共享這些值,當任何參與者都不能通過獨立改變策略而獲得更少支付時,可以認為該策略組合即為Nash均衡解。

圖2 多能源集線器系統(tǒng)博弈優(yōu)化調(diào)度算法流程圖
由于建立的多能源集線器系統(tǒng)博弈優(yōu)化調(diào)度模型具有約束復雜和求解維度高的特點,使采用常規(guī)的非線性模型求解算法難以得到最優(yōu)解,進而常規(guī)的優(yōu)化算法無法求解博弈優(yōu)化調(diào)度的最優(yōu)策略v1(i+1)、v2(i+1)和v3(i+1)。因此,本文提出了一種差分進化量子粒子群算法用于求解多能源集線器系統(tǒng)博弈優(yōu)化調(diào)度問題。
QPSO的粒子狀態(tài)是由量子空間中的波函數(shù)Ψ描述的,X表示粒子位置的向量[16]。
在QPSO中,粒子位置X(t+1)更新方程為
X(t+1)=P(t)±β×|mbest-X(t)|×ln(1/u)
(10)
式(10)中,u∈(0,1),且均勻隨機分布;P(t)={P1(t),P2(t),…,PM(t)}為粒子隨機點;mbest表示為最優(yōu)位置的平均值;β為取值在[0,1]之間縮放系數(shù)。
其中,P(t)的表達式為:
P(t)=φ(t)×pbest(t)+(1+φ(t))×gbest(t)
(11)
式(11)中,φ(t)∈[0,1]且隨機均勻分布;pbest(t)和gbest(t)分別表示個體粒子最優(yōu)值和種群所有粒子中的最優(yōu)值。
Mbest可表示為
(12)
式(12)中,M為種群中粒子的數(shù)目;D為粒子的維數(shù);pbesti為第i個粒子的最佳位置。
標準的量子粒子群算法流程如下:
步驟1:初始化。明確搜索空間、參數(shù)取值和理想適應值,初始化種群數(shù)目、迭代最大次數(shù)、粒子最優(yōu)位置、粒子位置與維數(shù)。
步驟2:根據(jù)目標函數(shù)以及初始粒子位置,計算出個體粒子最優(yōu)值pbest和種群所有粒子中的最優(yōu)值gbest。
步驟3:根據(jù)公式(11)和(12)更新粒子隨機點P和所有粒子個體最優(yōu)位置的平均值Mbest。
步驟4:根據(jù)公式(10)更新粒子的位置,并根據(jù)目標函數(shù)和粒子位置計算個體粒子最優(yōu)值pbest和種群所有粒子中的最優(yōu)值gbest。
步驟5:重新迭代以上步驟,直到達到最大迭代次數(shù)。
在QPSO算法中,隨著迭代次數(shù)的不斷增加,粒子逐漸趨向于當前最優(yōu)值位置,因而容易陷入局部最優(yōu),需要對QPSO算法進行改進。
差分進化算法(Differential Evolution,DE)主要操作包括:變異、交叉和選擇[17]。DE算法首先對粒子位置xi(t)進行變異操作,并產(chǎn)生變異個體ri(t)。可以用式(13)來表示
ri(t)=xbest(t)+F*[xr1(t)-xr2(t)]
(13)
式中,r1,r2為不同的正整數(shù),且與i不相等;xbest(t)是第t次迭代種群的最優(yōu)個體;F為0~1之間隨機取值的縮放比例因子。
式(14)表明了通過交叉操作生成實驗個體ui(t)的過程。
(14)
式中,a為0~1之間隨機數(shù);R為粒子的交叉概率,取值范圍為[0,1];xi(t)為變異粒子的原位置。
式(15)為選擇進入下次迭代的粒子個體xi(t+1)的過程。
(15)
差分進化算法增強了種群的多樣性,提升了種群搜索性能,有利于解決量子粒子群算法中后期粒子搜索能力變?nèi)醯膯栴}。
綜上,差分進化量子粒子群算法粒子更新方程如式(16)所示。
ri(t)=Pi(t)±β×|mbest-xi(t)|×ln(1/u)
(16)
在生成變異粒子ri(t)后,利用式(14)對變異粒子進行交叉操作,生成實驗粒子ui(t)。然后進行如式(15)所示的選擇操作。因此,DEQPSO算法的流程類似于圖3的QPSO流程,而其中步驟3之后的操作步驟采用如下的流程。
步驟4:利用公式(17)進行變異操作,產(chǎn)生一個變異個體ri(t);
步驟5:根據(jù)公式(15)~(16),對變異粒子ri(t)進行交叉和選擇操作,以實現(xiàn)更新粒子位置。根據(jù)目標函數(shù)和粒子位置計算個體粒子最優(yōu)值pbest和種群所有粒子中的最優(yōu)值gbest。
步驟6:重復迭代以上步驟,直到達到最大迭代次數(shù)。
為了證明DEQPSO算法的有效性,采用國際上常用的6個標準基準測試函數(shù)測試算法的性能[18],如表1 所示。其中,n代表函數(shù)的維數(shù),所有函數(shù)的最優(yōu)值均為0。

表1 標準測試函數(shù)
為了驗證DEQPSO算法的尋優(yōu)性能,對PSO算法、QPSO算法和DEQPSO算法進行算法比較。所有算法參數(shù)均設置為:種群規(guī)模為50;n=30;最大迭代次數(shù)等于1000。測試結(jié)果如表2所示,其中PSO算法的計算結(jié)果見文獻[19]。

表2 三種算法的實驗結(jié)果比較
從表2中可知,對所有函數(shù)尋優(yōu)上QPSO和DEQPSO算法的尋優(yōu)精度優(yōu)于PSO算法;在函數(shù)f2和f4尋優(yōu)上,DEQPSO算法的尋優(yōu)精度優(yōu)于QPSO算法;在其它函數(shù)上DEQPSO和QPSO算法的尋優(yōu)精度相持平。仿真結(jié)果表明了DEQPSO算法在求解高維數(shù)問題上具有一定的有效性,而多能源集線器系統(tǒng)優(yōu)化調(diào)度模型具有維數(shù)高的特點,因此本文采用 DEQPSO算法求解多能源集線器系統(tǒng)優(yōu)化調(diào)度問題。
本節(jié)以圖3所示的多能源集線器系統(tǒng)為例進行分析,以驗證DEQPSO算法的適用性和經(jīng)濟性。

圖3 三個能量集線器之間的能量流動示意圖
從圖3可知,多能源集線器系統(tǒng)是由三個結(jié)構(gòu)相同的集線器組成的,每個集線器配備有熱電聯(lián)產(chǎn)裝置和燃氣爐裝置等。集線器以自身能源成本最低為目標改變電力、天然氣的分配策略,同時又受到網(wǎng)絡位置及另外兩個能源調(diào)度需求的制約,從而形成三個集線器相互博弈的格局。
根據(jù)上述系統(tǒng)24小時的電熱負載需求情況[20],采用DEQPSO算法對系統(tǒng)博弈優(yōu)化調(diào)度模型進行求解。


表3 能源消耗價格

表4 線路的長度及能流損失系數(shù)

圖4 能源集線器電、熱負載功率和風力發(fā)電數(shù)據(jù)
由圖4可知,三個能源集線器的電熱負載相同且變化較平穩(wěn);三個能源集線器的注入風電功率不穩(wěn)定,單位功率0.1到0.25之間波動。為了驗證所提出的模型和算法對多能源集線器系統(tǒng)優(yōu)化調(diào)度的有效性,在已知電熱負荷等數(shù)據(jù)的條件下,利用DEQPSO算法對系統(tǒng)模型進行求解,進而得到該多能源集線器系統(tǒng)如圖7-10所示的優(yōu)化調(diào)度結(jié)果。

圖7 三個能源集線器的24小時天然氣注入量變化情況
圖5、6、7分別展示了系統(tǒng)中三個能源集線器調(diào)度因子、電力注入量和天然氣注入量在24小時的變化情況。從圖中可以看出三個能源集線器因位置和風力發(fā)電波動導致需要注入的電力和天然氣能源及能源調(diào)度因子變動,其中各能源集線器調(diào)度因子波動趨勢與天然氣變化趨勢一致,即天然氣輸入熱電聯(lián)產(chǎn)的比例隨著各能源集線器的天然氣輸入量變化。能源集線器1的調(diào)度因子v1在0.7附近波動,需要注入的電力較小甚至為負數(shù)(負數(shù)表示為該集線器向外提供電力),而天然氣注入量較多,這是因為能源集線器1距離能源注入點近,無需考慮能源傳輸損耗問題,又因為電力成本較高,則集線器1通過增多注入天然氣量和增大天然氣能源分配因子滿足用戶電熱需求。能源集線器2和能源集線器3的網(wǎng)絡調(diào)度因子v2、v3都較小,電力注入量較多和天然氣的注入量較少,這是因為能源集線器2和能源集線器3距離能源注入點的距離較大,天然氣管道遠距離傳輸天然氣產(chǎn)生較多的損失成本,因此這兩個集線器盡可能選擇輸入電力滿足用戶電力需求,輸入的天然氣主要通過燃氣爐產(chǎn)生熱量為用戶供熱,實現(xiàn)較高的能源時空分配。

圖5 三個能源集線器中調(diào)度因子24小時變化情況

圖6 三個能源集線器的24小時電力注入量變化情況
圖8描繪了系統(tǒng)總成本、總電負載、總熱負載和總風電的24小時變化情況。從圖中可知,系統(tǒng)總成本與總電負載的變化趨勢基本一致,這是由于系統(tǒng)電力輸入運行成本高,是總成本的直接影響因素。風機發(fā)電成本忽略不計促使系統(tǒng)最大程度上提高風力利用率,并且系統(tǒng)熱需求迫使天然氣被使用到最大水平,當熱負荷較大或風機出力不足時,系統(tǒng)才會增加電力注入量。

圖8 發(fā)電總成本、總電力負荷、總熱負荷和風機出力的24小時變化
為了解決多能源集線器系統(tǒng)變量眾多、耦合嚴重和約束復雜等博弈問題,提出了DEQPSO算法并應用到系統(tǒng)博弈優(yōu)化調(diào)度中。該算法將差分進化與量子粒子群相結(jié)合,將更新后的粒子進行變異、交叉和選擇操作,解決了QPSO后期陷入局部最優(yōu)的問題。測試結(jié)果表明DEQPSO算法具有良好的全局搜索能力。將該算法應用到多能源集線器系統(tǒng)優(yōu)化調(diào)度模型求解中,仿真結(jié)果表明,本文提出的算法具有較強適用性。