王小飛,胡志堅,仉夢林,胡美玉,汪祥,鄧奧攀
(武漢大學電氣工程學院,武漢市430072)
基于時段耦合特性的動態環境經濟調度求解方法
王小飛,胡志堅,仉夢林,胡美玉,汪祥,鄧奧攀
(武漢大學電氣工程學院,武漢市430072)
基于電力系統動態環境經濟調度(dynamic economic emission dispatch,DEED)在時段間的耦合特性,提出了一種改進的教與學優化算法,用于求解DEED問題,對燃料費用和污染氣體排放量同時進行優化。采用反向學習策略改善種群的多樣性,單時段教與學過程來提高算法的局部尋優能力,單時段貪婪選擇機制在全局范圍內找到新的搜索空間,平衡局部尋優與全局尋優能力。對10機39節點系統進行仿真分析,結果表明所提策略可以顯著提高算法的收斂速度和收斂效果,得到高質量的解。
動態環境經濟調度(DEED);教與學優化算法;貪婪選擇;時段耦合特性
電力系統動態經濟調度(dynamic economic dispatch,DED)是對傳統靜態經濟調度(economic dispatch,ED)的拓展,目的是在滿足各項約束的前提下,制定使發電總成本最小的調度方案。與ED相比,DED是多個時段的發電調度,考慮相鄰時段之間的機組出力爬坡約束。
火電廠在發電過程中排放大量的硫氧化物(SOx)、氮氧化物(NOx)等污染氣體,隨著環境惡化和人們環保意識的增強,有效減少污染氣體排放量成為社會各界努力的方向。與采用低污染排放燃料,安裝脫硫、脫硝裝置相比,環境經濟調度(economic emission dispatch,EED)[1-2]通過制定發電計劃達到兼顧經濟和減排的目的,具有投資少、見效快的優點。近年來,隨著智能電網的深入建設,越來越要求電網安全、經濟和環保[3-4],在此背景下,同時考慮發電成本和污染排放的動態環境經濟調度(dynamic economic emission dispatch,DEED)[5-8]得到國內外眾多學者的關注。然而DEED是一個非凸、非線性、高維度的多目標優化問題,求解較為困難,開發一個高效的算法,求得最優解對許多研究人員都是一個極大的挑戰。
電力系統經濟調度問題的傳統求解方法主要包括線性規劃、二次規劃、拉格朗日松弛法等,由于閥點效應導致的非凸等特點,這些方法常陷入局部最優。隨著啟發式算法的發展,如遺傳算法[5]、差分進化算法[7]、粒子群算法[9]及改進啟發式算法[10]都被應用于優化調度問題中。文獻[5]對整個調度時段內的2個目標同時進行優化,但缺乏針對復雜約束的有效處理方法和高效的全局尋優能力。文獻[6]按照調度時段將DEED問題分解為一系列EED問題求解,再組合為整個時段的解。文獻[7]提出一種改進的差分進化算法,引入動態約束處理策略,提高了約束處理的性能。文獻[11]采用logistic映射產生和聲搜索算法的變異因子,并使用自適應機制改變變異因子。這些方法都取得了一定的效果,但仍存在以下3個問題:(1)啟發式算法的控制參數對優化結果存在較大影響;(2)大多數算法的改進策略僅針對算法本身而忽略了DEED問題自身的物理特性,需要大量的迭代才能得到較優的結果;(3)懲罰函數法作為常用的約束處理方法存在懲罰因子設置困難的難題。
教與學優化算法(teaching-learning-based optimization,TLBO)[12]是Rao于2011年提出的群智能算法。教與學算法具有無須敏感參數設置、結構簡單、收斂迅速等優點。本文針對DEED在時間上的耦合特性,采用3種策略對原始TLBO算法進行改進,其中反向學習策略用來改善種群的多樣性,單時段教與學用來增強局部尋優能力,單時段貪婪選擇機制用來跳出局部最優,避免早熟收斂,同時利用動態隨機約束處理策略提高約束處理的效率。對10機39節點系統進行動態環境經濟調度的仿真計算,與其他算法的對比結果表明,所提算法具有較優的收斂性能,可以得到高質量的解。
電力系統的有功調度問題在時間尺度上可以分為日前機組組合和日內經濟調度。日前機組組合主要制定次日的發電機組啟停計劃,確定機組的最優投入。日內動態環境經濟調度問題是在確定機組組合基礎上,合理分配機組出力,實現調度周期燃料成本和污染氣體排放最小的目標[13]?;谶@些考慮,本文假設日前機組啟停計劃已經確定,重點研究日內動態環境經濟調度問題。
1.1 目標函數
DEED是一個多目標優化問題,采用權重法將其轉化為單目標是求解該類問題的常用方法之一[11],表達式如下:
F=wF1+Ω(1-w)F2
(1)
式中:F為加權目標函數;F1為總燃料費用;F2為總污染氣體排放量;w為權重因子;Ω為縮放因子。
(1)燃料費用??紤]閥點效應的系統總燃料費用可以表示為二次函數和正弦函數之和[7],如式(2)所示:
(2)
式中:f1為單時段燃料費用;T為調度時段數;N為機組臺數;Pi,t為機組i在時段t內的有功出力;ai、bi、ci、di和ei為機組i的燃料費用系數。
(2)污染氣體排放量。污染氣體包括SOx、NOx等,采用綜合污染氣體模型[5],如式(3)所示:
(3)
式中:f2為單時段污染氣體排放量;αi、βi、γi、ηi和δi為機組i的污染氣體排放量系數。
1.2 約束條件
(1)功率平衡約束:
(4)
式中:PD,t和PL,t分別為系統在時段t內的負荷和網損。
其中網損PL,t采用Kron’s公式進行計算,如式(5)所示:
(5)
式中Bij、Bi0、B00為網損系數。
(2)機組有功出力約束:
(6)
式中Pimax和Pimin分別為機組i的出力上下限。
(3)爬坡約束:
(7)
式中:PURi和PDRi分別為機組i在相鄰時段間的上調節功率和下調節功率最大值。
1.3 模糊選擇機制
對于多目標優化問題,可通過建立目標函數的隸屬度函數進行模糊化處理,采用模糊選擇機制[5]確定折中最優解,主要包括下述步驟。
(1)計算每個解每個目標函數的模糊滿意度:
(8)
式中:μi,j為第j個解第i個目標的模糊滿意度;fi,max和fi,min分別表示Pareto解集中第i個目標的最大最小目標值。
(2)計算每個解的整體模糊滿意度μj:
(9)
式中:J為Pareto解集中解的個數;n為目標函數的個數。
(3)選擇μj最大的解作為折中最優解。
教與學算法是由教學過程啟發得到的一種新型優化算法。該算法通過模擬教學過程中的“教階段”和“學階段”來提高學員的知識水平。TLBO算法中,班級用P表示,班級中的每個學員用Pk(k=1,…,NP)表示,其中NP表示學員的個數。
2.1 教階段
在每次迭代中,教師TR由班級中目標函數值最小的學生擔任,努力將班級平均成績提高到自己的水平。
(10)
(11)

2.2 學階段
在學階段,學員通過彼此之間的交流提高自身的知識水平。
(12)
原始的TLBO算法,學生從教師處獲取知識,學生之間的交流也基于教階段,這些特點使TLBO算法極易在教師附近找到新的解,然而種群的多樣性會有所降低且易陷入局部最優。為解決這一難題,本文首先采用反向學習機制提高種群多樣性。接著考慮到DEED是一個多時段優化問題,時段之間具有較強耦合性,基于這一特性,提出單時段教與學和單時段貪婪選擇策略。單時段教與學過程通過向每個時段的最優個體學習,以加強算法在已有解附近找到更優解的能力,旨在提高算法的局部尋優能力;單時段貪婪選擇過程結合新舊種群各自的優點,選擇每個時段的較優解組成新個體,促使學員向最優解方向努力,旨在提高全局尋優能力。
將這3種改進策略應用于原始TLBO算法,得到了一種改進的教與學優化算法(improved teaching learning based optimization,ITLBO),以期提高算法的全局尋優和局部尋優能力。
3.1 反向學習機制
反向學習機制[14]是Tizhoosh于2005年提出的一種策略,其主要目的是在缺少解的先驗知識的情況下,在當前解構造的空間和反向解構造的空間同時進行搜索,提高搜索到最優解所在空間的概率。文獻[15]中,理論推導和仿真結果證明反向學習機制在收斂速度和解的質量方面,均要優于單純隨機搜索。根據文獻[14]對反向數和反向點的定義,結合TLBO算法,將反向班級表示為OP,OP中第k個學生的知識水平由式(13)產生:
(13)
在本文中,反向學習機制在初始化階段用來改善初始解的質量;在教與學過程完成之后增加種群的多樣性。
3.2 單時段教與學優化
原始TLBO算法選擇目標函數值最小的學員作為教師,但是目標函數最優不能代表在每個學科上也是最優。在實際班級中,學生除了向教師學習外,還向每個學科成績最好的學生學習,原始教與學算法忽略了這一點??紤]動態環境經濟調度是靜態環境經濟調度的拓展這一特性,將DEED問題分解為T個時段的EED問題,每個時段表示1個學科。對每個EED問題執行優化算法,即單時段教與學優化,促使學生向各個時段的最優個體學習,以期增強算法的局部尋優能力。過程如下詳述。
(1)單時段教過程:
(14)

(2)單時段學過程:
f=wf1+ω(1-w)f2
(15)
(16)

3.3 單時段貪婪選擇

(17)
4.1 初始化
班級P由NP個學生組成,班級和每個學生Pk的表達式如下:
P=[P1,P2,…,PNP]
(18)
(19)
1個學員表示1種調度方案;1個變量表示1臺機組出力,在其可行范圍內隨機產生。
(20)
4.2 動態隨機約束處理策略
等式約束時段間的強耦合性是造成DEED問題難以求解的原因之一,直接影響著算法的求解效率和解的質量。懲罰函數法具有概念清晰、計算簡單的優點,已得到廣泛的應用,但該方法涉及大量的懲罰函數和懲罰因子,其選擇困難且復雜。本文采用動態隨機約束處理策略[16],將等式約束違背量隨機分配,步驟如下所述。
(1)對時段t(t=1,…,T),設置調整次數l=0。
(2)計算時段t等式約束違背量:
(21)

(4)對各臺機組的有功出力進行修正:
(22)
式中:ri為0至1之間的隨機數,若第i臺發電機出力達到功率限值,ri=0。
(5)若Pi,t違反約束條件(6)—(7),將其調整為功率限值,l=l+1,返回步驟(2)。
(6)等式約束處理完畢。
4.3 求解流程
ITLBO算法求解DEED問題的詳細流程如圖1所示。
5.1 參數設置
采用10機39節點系統驗證本文所提算法的有效性。系統考慮機組閥點效應、功率平衡約束及爬坡約束,系統參數和負荷參數見文獻[5]。調度期為24 h,分為24個時段,每個時段為1 h。改進教與學優化算法的參數設置如下:學生個數NP=25,最大迭代次數Nitermax=300,等式約束處理最大迭代次數Lmax=10,等式約束違背量閾值σ=10-6,權重因子w步長為0.02。
為分別驗證3種改進策略的效果,構造以下5種算法進行對比:(1)原始TLBO;(2)在原始TLBO的基礎上增加反向學習策略(TLBO1);(3)在原始TLBO的基礎上增加單時段教與學過程(TLBO2);(4)在原始TLBO的基礎上增加單時段貪婪選擇機制(TLBO3);(5)改進教與學優化算法(ITLBO)。
5.2 結果分析
在DEED問題求解過程中,權重因子w按照固定步長從0增加到1,每個權重因子對應1個解,得到一組Pareto解集。

圖1 ITLBO算法流程圖
當w=1時,DEED問題轉化為DED問題,5種算法求解DED問題的收斂特性曲線如圖2所示。由圖2可以看出:4種改進算法的收斂性能均要優于原始TLBO算法,證明所提策略有效可行。其中:TLBO1算法收斂效果較好,表明反向學習策略在一定程度上增強了算法的全局搜索能力,但改善效果有限,算法性能仍有較大的提升空間;TLBO2算法在迭代起始階段收斂速度明顯加快,隨后速度減慢,收斂曲線呈階梯狀,表明單時段教與學策略可以有效提高局部尋

圖2 燃料費用的收斂曲線對比
優能力,但也存在陷入局部最優的缺點;TLBO3算法收斂曲線平滑,收斂結果接近最優解,表明單時段貪婪選擇策略具有較好的全局尋優能力,可以有效避免陷入局部最優;ITLBO算法收斂迅速,收斂效果最好,表明基于DEED在時間上的耦合特性,所提的改進策略配合使用,可以有效平衡算法的局部搜索和全局搜索能力,改善解的質量。
ITLBO求解DED的調度方案如表1所示,對該結果進行約束條件檢查,所有機組在各個時段均滿足出力上下限約束,功率平衡約束違背量在10-6以內,在時段之間滿足爬坡約束。
ITLBO求解DEED問題的Pareto最優前沿和折中最優解如圖3所示,為方便對比,其他相關文獻的求解結果也在圖中進行了標注。從圖3可見,ITLBO算法可以得到平滑且分布均勻的Pareto最優前沿,且總可以找到其他算法的占優解。
表2給出了本文所提算法與RCGA[5]、NSGA-II[5]、MAMODE[7]、IBFA[10]、DE-SQP[17]、PSO-SQP[17]、PSO[18]、BPSO-DE[18]算法求解DEED的邊界解及折中最優解的詳細數值。由表2可以看出,相比于其他算法,ITLBO分別求解經濟最優(w=1)和環境最優(w=0)時,可以得到更低的燃料費用和更小的污染氣體排放量。經約束條件檢查,所得調度方
表1 ITLBO經濟最優的調度結果
Table 1 Optimal generation schedule obtained by ITLBO for DED
MW

注:燃料費用為2 464 737.13 $;污染排放為146 743.49 kg。
案均滿足各項約束。
通過表2與圖3折中最優解的情況可知,本文ITLBO算法根據模糊選擇機制得到的折中最優解相比其他算法,可以得到更小的燃料費用和污染氣體排放量,體現了在調度決策中的優越性。
(1)建立電力系統動態環境經濟調度模型,在模型中考慮閥點效應、網絡損耗和爬坡速率限制。
(2)基于DEED在時段間的耦合特性,采用反向學習、單時段教與學過程和單時段貪婪選擇策略,可以有效平衡教與學算法的局部尋優與全局尋優能力。
(3)改進教與學算法的收斂速度和收斂效果均優于原始教與學算法,可以得到光滑且分布均勻的Pareto最優前沿,與其他文獻的結果相比,所提算法可以給出更高質量的解。
表2 不同算法的結果對比
Table 2 Results comparison obtained by
different algorithms
[1]VENKATESH P,GNANADASS R,PADHY N P.Comparison and application of evolutionary programming techniques to combined economic emission dispatch with line flow constraints[J].IEEE Transactions on Power Systems,2003,18(2):688-697.
[2]劉靜,羅先覺.采用多目標隨機黑洞粒子群優化算法的環境經濟發電調度[J].中國電機工程學報,2010,30(34):105-111. LIU Jing,LUO Xianjue.Environmental economic dispatching adopting multiobjective random black-hole particle swarm optimization algorithm[J].Proceedings of the CSEE,2010,30(34):105-111.
[3]趙猛,丁曉群,劉遠龍,等.考慮負荷中斷的微網并網經濟調度[J].電力建設,2016,37(4):57-62. ZHAO Meng,DING Xiaoqun,LIU Yuanlong,et al.Economic dispatch of grid-connected microgrid considering load interruption[J].Electric Power Construction,2016,37(4):57-62.
[4]郭寧,滕歡,李基康.考慮綜合評估的孤立微網優化調度[J].電力建設,2016,37(4):63-69. GUO Ning,TENG Huan,LI Jikang.Isolated microgrid optimal scheduling considering comprehensive evaluation[J].Electric Power Construction,2016,37(4):63-69.
[5]BASU M.Dynamic economic emission dispatch using nondominated sorting genetic algorithm-II [J].International Journal of Electrical Power & Energy Systems,2008,30(2):140-149.
[6]GUO C X,ZHAN J P,WU Q H.Dynamic economic emission dispatch based on group search optimizer with multiple producers[J].Electric Power Systems Research,2012,86(4):8-16.
[7]江興穩,周建中,王浩,等.電力系統動態環境經濟調度建模與求解[J].電網技術,2013,37(2):385-391. JIANG Xingwen,ZHOU Jianzhong,WANG Hao,et al.Modeling and solving for dynamic economic emission dispatch of power system[J].Power System Technology,2013,37(2):385-391.
[8]于波,吳亮,盧欣,等.區域綜合能源系統優化調度方法[J].電力建設,2016,37(1):70-76. YU Bo,WU Liang,LU Xin,et al.Optimal dispatching method of integrated community energy system[J].Electric Power Construction,2016,37(1):70-76.
[9]GAING Z L.Particle swarm optimization to solving the economic dispatch considering the generator constraints [J].IEEE Transactions on Power Systems,2003,18(3):1187-1195.
[10]PANDIT N,TRIPATHI A,TAPASWI S,et al.An improved bacterial foraging algorithm for combined static/dynamic environmental economic dispatch [J].Applied Soft Computing,2012,12(11):3500-3513.
[11]ARUL R,VELUSAMI S,RAVI G.A new algorithm for combined dynamic economic emission dispatch with security constraints[J].Energy,2015(79):496-511.
[12]RAO R V,SAVSANI V J,VAKHARIA D P.Teaching-learning-based optimization:An optimization method for continuous non-linear large scale problems[J].Information Sciences,2012,183(1):1-15.
[13]劉小聰,王蓓蓓,李揚,等.基于實時電價的大規模風電消納機組組合和經濟調度模型[J].電網技術,2014,38(11):2955-2963. LIU Xiaocong,WANG Beibei,LI Yang,et al.Unit commitment model and economic dispatch model based on real time pricing for large-scale wind power accommodation[J].Power System Technology,2014,38(11):2955-2963.
[14]TIZHOOSH H R.Opposition-based learning: a new scheme for machine intelligence[C]//Proceedings of the 2005 International Conference on Computational Intelligence for Modelling,Control and Automation. Vienna,Austria:IEEE,2005:695-701.
[15]RAHNAMAYAN S,TIZHOOSH H R,SALAMA M M A.Opposition versus randomness in soft computing techniques[J].Applied Soft Computing,2008,8(2):906-918.
[16]李晨,胡志堅,董驥,等.計及風險系數的含風電場電力系統多目標動態優化調度[J].現代電力,2015,32(5):56-65. LI Chen,HU Zhijian,DONG Ji,et al.Multi-objective dynamic dispatching of power grid with wind farms by considering risk index[J].Modern Electric Power,2015,32(5):56-65.
[17]ELAIW A M,XIA X,SHEHATA A M.Hybrid DE-SQP and hybrid PSO-SQP methods for solving dynamic economic emission dispatch problem with valve-point effects[J].Electric Power Systems Research,2013,103(8):192-200.
[18]VAISAKH K,PRAVEENA P,NAGA SUJATHA K.Solution of dynamic economic emission dispatch problem by hybrid bacterial foraging algorithm[J].International Journal of Computer Science and Electronics Engineering,2014,2(1):58-64.
(編輯 張媛媛)
Solving Dynamic Economic Emission Dispatch Based on Period Coupling Characteristic
WANG Xiaofei, HU Zhijian, ZHANG Menglin, HU Meiyu, WANG Xiang, DENG Aopan
(School of Electrical Engineering, Wuhan University, Wuhan 430072, China)
This paper presents a new improved teaching-learning-based optimization algorithm (ITLBO) to solve the dynamic economic emission dispatch (DEED) problem based on the characteristics of period coupling. DEED is a bi-objective optimization problem, which minimizes the fuel cost and emission level simultaneously. In the proposed algorithm, the opposition-based learning (OBL) strategy is employed to improve the population diversity, the single interval teaching and learning process is used to enhance the local searching ability, and the single interval greedy selection strategy is adopted to explore a new domain in the whole searching space, aiming at balancing the local optimization and global optimization ability. Through the simulation analysis on the ten-unit 39-nodes system, the results show that the proposed strategy has a faster convergence rate and better convergence characteristic, and can obtain higher quality solutions.
dynamic economic emission dispatch(DEED); teaching-learning-based optimization algorithm; greedy selection; period coupling characteristic
高等學校博士學科點專項科研基金項目(20110141110032)
TM 731
A
1000-7229(2016)10-0144-07
10.3969/j.issn.1000-7229.2016.10.020
2016-05-12
王小飛(1991),男,碩士研究生,主要研究方向為電力系統優化與控制;
胡志堅(1969),男,博士,教授,博士生導師,研究方向為電力系統分析與控制、新能源與分布式發電;
仉夢林(1987),女,博士研究生,研究方向為電力系統優化調度;
胡美玉(1990),女,碩士研究生,主要研究方向為電力系統可靠性分析、含DG的配電網優化運行;
汪祥(1990),男,碩士研究生,主要研究方向為電力系統保護與控制、輸電線路帶電測量等;
鄧奧攀(1992),男,碩士研究生,主要研究方向為電力系統可靠性分析。
Project supported by Special Scientific and Research Funds for Doctoral Speciality of Institution of Higher Learning(20110141110032)