潘霄,張明理,韓震燾,胡旌偉,劉嘉恒,葛磊蛟
(1.國網遼寧省電力有限公司經濟技術研究院,沈陽市 110015;2.天津大學電氣自動化與信息工程學院,天津市 300072)
作為世界上最大的能源生產國和消費國,中國關于“雙碳”目標的“時間表”與“路線圖”一直備受海內外觀察人士關注[1]。在應對全球氣候變化挑戰的背景下,以低能耗、低污染、低排放為基礎的“低碳經濟”已成為全球熱點,也對電力能源安全運行提出了更高要求[2]。面向能源互聯網的零碳園區以新能源為主體,匯集了高比例風/光/生物質等可再生能源、氫發電、煤電、核電等,是未來電力能源的主要承載形式[3]。
面向能源互聯網的零碳園區對于園區的發展具有重要意義,相關的技術研究層出不窮[4]。文獻[5]提出了一種基于多能互補的園區綜合能源站-網協同優化規劃方法,從站-網整體規劃的角度出發,對能源站數量、位置和設備容量配置,供能網絡布局進行統一規劃研究;文獻[6]從資源評估、負荷預測、綜合能源系統建模、優化算法求解、區域供能站和管網規劃原則等方面對園區級的綜合能源系統進行詳細的案例分析。文獻[7]提出考慮能量梯級利用的園區綜合能源系統站網協同規劃方法,基于能量梯級利用原理,對能源站選址、設備選型定容和能源網絡布局進行協同規劃;文獻[8]為了充分考慮園區綜合能源系統的低碳性以及建設時序,提出了一種基于階梯碳交易機制的園區綜合能源系統多階段規劃方法。文獻[9]通過基于分時電價機制,采取低谷儲能峰平釋能的運行策略動態調整冷負荷側制冷機組功率和園區與電網聯絡線功率,由園區能量平衡原則得到儲能系統的實時充放電功率,實現對儲能功率和容量的配置;文獻[10]搭建了園區能源互聯網的典型架構,并對能源設備進行建模,構建了園區能源互聯網雙層優化配置模型,提出了計及多評價指標的園區能源互聯網雙層優化配置方法。
零碳園區的態勢感知技術是其智能化、多樣化發展的關鍵一環。態勢感知技術是在大規模系統環境中,對能夠引起系統態勢發生變化的要素進行獲取、理解、顯示,并預測未來發展趨勢等活動的一種技術[11],流程可劃分為態勢覺察、態勢理解、態勢預測等3個階段[12]。其中,態勢覺察階段主要是為了完成零碳園區數據或信息收集的任務,即獲取并檢測環境中的重要特征元素[13]。因此,如何合理規劃零碳園區中用于數據收集與分析的智能感知設備,是保證零碳園區能源系統可靠、安全、優質、低碳和經濟運行的焦點之一。
零碳園區中的智能感知設備是用于零碳園區數據采集和管理的新設備。然而,由于零碳園區的需要,收集信息的設備具有大規模、分散性和無序性的特點,且智能感知設備的昂貴價格,在每個零碳園區每一個需要監測信息的監測點都安裝智能感知設備對于大規模應用來說成本過高且數據采集效率低。文獻[14]為實現光伏智能邊緣終端的合理優化配置,提出了一種基于改進郊狼優化算法的光伏智能邊緣終端優化配置方法。文獻[15]針對郊狼優化算法優化性能弱、可操作性低的問題提出了一種變異反向學習郊狼優化算法,以解決光伏智能邊緣終端的優化配置。然而,在面向能源互聯網的零碳園區的規劃研究方面,目前的研究還沒有考慮其智能感知設備的優化規劃方面,因此,迫切需要建立面向零碳園區的智能感知設備優化規劃方法的數學模型。
智能感知設備的優化規劃模型具有高度的非線性與復雜性,智能算法是處理實際工程應用中復雜問題與非線性問題的有效解決方案,例如粒子群算法[16]、遺傳算法[17]、樽海鞘優化算法[18]等?;依莾灮?grey wolf optimizer,GWO)[19]是2014年提出的一種元啟發式算法,它模仿了自然界中灰狼的等級制度和狩獵行為,具有較快的收斂速度和全局優化能力。然而,其算法機制是由種群中三頭精英狼引導,盡管這使得算法快速收斂,但是其算法精度低,容易獲得局部最優解。教與學算法(teaching-learning-based optimization,TLBO)[20]是一種模擬課堂教學過程的基于群體的優化方法。分為“教師階段”(即向教師學習)與“學習者階段”(即通過學習者之間的互動進行學習),其兩個階段均為對候選解的評價行為,雖然使得算法求解精度高,但是求解速度與收斂速度均較慢。為此,本文結合兩種算法的優點,提出灰狼優化器-教與學混合優化(grey wolf and teaching-learning hybrid optimization,GWO-TLBO)算法,以克服兩種算法存在的各自缺點,保證準確、快速地獲得面向零碳園區的智能感知設備的最優規劃方案。
綜上所述,本文提出一種面向能源互聯網的零碳園區智能感知設備優化規劃方法。首先,分析智能感知設備的規劃要求,提出智能感知設備優化規劃的數學模型。對于一個給定的零碳園區/低碳城市,文中的模型旨在獲得智能感知設備的最佳數量和位置。然后,提出GWO-TLBO算法實現對智能感知設備優化規劃模型的高精度求解。最后,以零碳園區為背景,針對點多面廣、分散無序、數量龐大的零碳園區多類型設備的數據監測需要,實現智能感知設備的合理規劃。
1.1.1 投資成本
投資成本是所有規劃問題中首先要考慮的因素,主要是購買和安裝零碳園區智能感知設備的費用。零碳園區的智能感知設備的投資成本可以用以下公式描述:
(1)
A(r,ni)=r(1+r)ni/[(1+r)ni-1-1]
(2)
式中:CI是零碳園區的智能感知設備投資成本;N是智能感知設備的總數量;PT是一個智能感知設備在當前規劃階段的價格;A(r,ni)是資本回收系數;r是年利率;ni是區域內第i個智能感知設備的壽命。
1.1.2 故障損失成本
零碳園區的內部環境復雜多樣,其中的智能感知設備容易出現故障,這種故障的出現會對兩個方面造成影響。其一,智能感知設備的故障需要被修復從而產生維修成本;其二,由于智能感知設備產生故障,從而無法對零碳園區的態勢進行檢測,態勢覺察受到影響,這也導致了需要彌補其不能工作的成本出現。首先,本文對零碳園區智能感知設備的故障率進行討論:
智能感知設備的故障概率和使用壽命在理論上也是不同的,因此,本文提出一個結合的智能感知設備故障與使用壽命確定方法。單個零碳園區的智能感知設備的故障概率pi取決于它所監測設備的最大數量,可按以下方式計算:
(3)

同時,零碳園區中的智能感知設備的故障率將影響其智能感知設備的使用壽命,其數學模型為:
(4)
kj=Wj/WT
(5)
式中:nIN是一個智能感知設備的最大壽命;ω和σ是壽命系數;kj是第j個需要被監測設備智能感知設備的壽命系數;WT是參考值;Wj是零碳園區中第j個需要被監測設備的智能感知設備的壽命;S代表智能感知設備的集合。

(6)
(7)
式中:LK是固定的維修次數;v是與維修次數有關的系數;ceil(·)是向上取整函數;T是智能感知設備的年工作日數。
零碳園區中的智能感知設備的故障具有隨機性,為了分析故障損失的成本,有必要對智能感知設備的故障數量進行不確定性分析。在本文中,智能感知設備的故障率被認為是遵循指數分布的一個量,其概率密度函數可以描述如下:
f(xi)=piλie-λixi
(8)
式中:λi是該地區第i個智能感知設備故障的概率密度函數的參數;f(xi)是設備故障的概率密度函數。λi可以用下式計算:
(9)
如果智能感知設備發生故障,需要時間y來修復;根據已經存在的故障修復時間的研究,y也遵循指數分布,其分布函數為:
Fy=1-e-λyy
(10)
式中:Fy是設備維護的時間點的分布函數;λy是指數分布的參數。
描述智能感知設備故障導致其在時間t不可用的概率密度函數可以寫成:


(11)

(12)

(13)
(14)

1.1.3 運營和維護成本
由于園區內架構復雜且范圍較廣,因此運維人員到達運維的智能感知設備地點的交通費用不可忽略,智能感知設備的年度運營與維護成本涉及運維人員的交通成本和勞動成本,其中的交通成本CG計算如下:
(15)
式中:CG是一個智能感知設備的年度交通成本;CM是智能感知設備和零碳園區中被監測設備的固有交通成本;M為需要被監測的設備數量;Aij是一個二進制變量:如果一個智能感知設備與一個需要被監測的設備建立連接,Aij=1,否則Aij=0;Rij是第i個智能感知設備和第j個需要被監測設備之間的距離;θ是一個與交通成本有關的常數系數;V是一個與通信連接成本有關的系數。

(16)
式中:u代表維修一個智能感知設備的成本;CC為智能感知設備的運維成本。
因此,目標函數表述如下:
minC=CI+CF+CG+CC
(17)
零碳園區智能感知設備所能進行態勢覺察的設備數量是有限的,但所有智能感知設備必須對園區內至少一種設備進行監測,此約束條件表示如下:
(18)
(19)
式中:Jmax表示一個智能感知設備與被監測設備的最大連接數量。
由于零碳園區的空間限制,智能感知設備的數量約束如下:
N≤Nmax
(20)
式中:Nmax為零碳園區中所布置的智能感知設備的最大數量。
智能感知設備與需要被監測的園區和城市設備的距離需要滿足一定條件,以保證數據采集的準確性與運行維護的便利性,此約束條件被描述如下:
AijRij≤Rmax
(21)
式中:Rmax是智能感知設備和需要被監測設備之間的最大距離。
如果智能感知設備的壽命很短,那么智能感知設備將被頻繁替換,智能感知設備的更換成本也不能被忽視。因此,智能感知設備的使用壽命不能低于規定值,計算公式如下:
ni≥nlim
(22)
式中:nlim為在零碳園區中所配置的智能感知設備的最短設備壽命。
灰狼優化算法模仿了自然界中灰狼的等級制度和狩獵行為。在GWO中,灰狼個體被劃分為α、β、δ、ω四個級別。最優解被設定為α狼,次優解為β狼,第三個最優解是δ狼,其余的解是ω狼?;依堑牟东C過程包括接近和圍捕獵物,狼群的圍捕行為建模如下:
X(z+1)=XP(z)-A·D
(23)
D=|C·XP(z)-X(z)|
(24)
式中:D是個體狼與獵物之間的距離;C和A是系數向量;XP(z)是獵物的位置向量。X(z)是單只狼的位置向量。其中,A和C的計算公式如下:
A=2a·r1-a
(25)
C=2r2
(26)
式中:r1和r2是[0,1]之間的隨機值;a是收斂因子,描述如下:
a=2-2t/tmax
(27)
式中:t是當前的迭代數;tmax代表最大迭代次數。
在狩獵階段,灰狼在圍住獵物后會更新自己的位置,如下所述:
(28)
(29)
X(z+1)=(X1+X2+X3)/3
(30)
式中:Dα、Dβ、Dδ是α、β、δ與其他個體之間的距離;Xα、Xβ、Xδ分別是α、β、δ的當前位置;C1、C2、C3和A1、A2、A3分別為α、β、δ的系數向量。
教與學優化算法是一種模擬課堂教學過程的基于群體的優化方法。TLBO分為兩部分。第一部分是“教師階段”,即向教師學習;第二部分是“學習者階段”,即通過學習者之間的互動進行學習。
2.2.1 “教”階段
在TLBO算法的“教”階段,班級中每個學員根據教師的值Xteacher和學員平均值ME進行差異化學習:
(31)
(32)

(33)
式中:NP代表種群數量。
2.2.2 “學”階段
在“學”階段,對每一個學員在班級中隨機選取一個學習對象通過分析自己和學員的差異進行學習調整,TLBO算法中的學習步長對每個學員采用不同的學習因子:
(34)
式中:ri=U(0,1)表示第i個學員的學習因子(學習步長);Xi和Xj分別代表種群中第i個和第j個學員。
2.3.1 灰狼-教與學混合優化方法提出的動機
本文提出GWO-TLBO且應用于零碳園區智能感知設備的優化規劃問題的求解方法的動機如下:
智能感知設備的優化要求是需要在有限的迭代次數內獲得高精度的解,本文選取TLBO與GWO的結合作為零碳園區智能感知設備優化規劃模型的求解算法的理由在于,相比于其他元啟發式優化算法,TLBO與GWO具有其獨有的特性,描述如下:
TLBO包含“教”與“學”兩個階段的搜索與更新方法,在“教”與“學”兩個階段均存在適應度計算與迭代更新,候選解位置的更新取決于教師(當前最優解)、學生的平均位置、隨機的學生位置三種影響因素,其種群內個體不完全受當前最優解的引導,三種引導因素之間差異明顯。因此相比于已有的元啟發式算法,TLBO不容易陷入到局部最優中,可以獲得高質量的規劃方案,但TLBO的迭代過程具有迭代次數多且每一次迭代計算的時間較長的缺點。
GWO以三只種群中較好的灰狼為種群中其他灰狼的位置更新導向,其種群更新受到最優解(α狼)、次優解(β狼)與第三最優解(δ狼)的影響,盡管GWO與TLBO一樣均受到三個不同因素的影響,但這三個因素均為種群中當前較優的候選解。在算法迭代前期,前三個最優解一般差異明顯,但在算法迭代后期就會出現三個因素相同或者差異小的情況,非常容易導致算法陷入局部最優中。因此,相比于現有的粒子群算法、正余弦算法等元啟發式算法,盡管GWO具有模型簡單且具有快速收斂的優點,但其精度不能滿足智能感知終端優化規劃的要求。
綜上,相比于其他已有的元啟發式算法,TLBO具有非常高的求解精度,但迭代時間過長的特點,而GWO具有收斂速度較快,但非常容易陷入到局部最優解中的特點。因此,本文將TLBO與GWO相結合,提出一種GWO-TLBO的混合算法。GWO-TLBO克服了TLBO求解速度慢以及GWO求解精度低的缺點,具有精度高、收斂速度快的獨特優勢。
2.3.2 灰狼-教與學混合優化方法描述
下面對所提出的GWO-TLBO進一步解釋:零碳園區智能感知設備的優化規劃數學模型復雜,使用的優化算法需要有很強的全局搜索能力,且要求算法的迭代次數越少越好,迭代次數過多會造成時間和資源的浪費。根據以上對優化算法的要求,采用GWO和TLBO的組合可以很好地解決這一問題。GWO-TLBO算法的具體結合流程如下:利用GWO種群中排名前三的灰狼來更新其他灰狼的位置,使其他灰狼能夠迅速與種群中的高水平灰狼同步,在有限的迭代次數中獲得相對較好的優化結果。在這個過程中,GWO可以被認為是TLBO的初始化方法,進一步地,使用TLBO進行細化搜索,最終獲得零碳園區智能感知設備的高質量規劃方案。GWO-TLBO克服了GWO和TLBO的缺點的同時,繼承了二者的優點,所以它符合本文的優化要求。GWO-TLBO的算法流程如圖1所示。

圖1 GWO-TLBO的流程圖Fig.1 Flowchart of GWO-TLBO
為了驗證面向能源互聯網的零碳園區智能感知設備優化規劃方法的可行性,引入一個案例進行研究。面向能源互聯網的零碳園區以新能源為主體,匯集了高比例風/光/生物質等可再生能源、氫發電、煤電等能源形式。因此,零碳園區中需要監測的設備類型不僅數量多而且復雜多樣,具有分散、無序的特點。為了充分說明本文所提出的優化方法在不同尺度、邊界條件和參數下的優越性,進行了幾種不同的優化配置案例。數學模型中的參數如表1所示。

表1 零碳園區智能感知設備優化規劃的數學模型參數Table 1 Mathematical model parameters for optimal planning of intelligent sensing equipment in zero-carbon parks
對于面向能源互聯網的零碳園區智能感知設備優化規劃,比較了4個不同規模的智能感知設備優化配置實例。將智能感知設備的最大數量表示為N,將需要監測的零碳園區多類型用戶設備的數量表示為M。零碳園區多類型用戶設備的最大數量的選擇依據為N=M×0.3,更符合配置智能感知設備數量遠小于零碳園區多類型用戶設備數量的目標。之所以選擇這些案例,是因為M從 40 到 100 的跨度較大,可以驗證本文所提出規劃方法在不同規模下的有效性。這也符合現實中小規模和大規模分布在一定區域內的區別,所設置案例如下:
Case 1(案例1):M=100,N=30;
Case 2(案例2):M=80,N=24;
Case 3(案例3):M=60,N=18;
Case 4(案例4):M=40,N=12。
在本文的案例分析中,仿真環境采用Intel(R)Core(TM)i7-6700HQ CPU,主頻2.60 GHz和內存8 GB的PC機,操作系統采用64位的Windows 10,編程語言為MATLAB2017A。為進一步驗證本文所提出的GWO-TLBO在面向零碳園區智能感知設備優化規劃中應用效果,證明本文對算法作出改進與融合的合理性,將本文的GWO-TLBO與傳統TLBO、正余弦算法(sine cosine algorithm,SCA)、GWO、粒子群算法(particle swarm optimization,PSO)、旗魚優化器(sailfish optimizer,SFO)、海洋捕食者算法(marine predators algorithm,MPA)、象群算法(elephant herding optimization,EHO)進行比較,算法參數如表2所示。

表2 智能優化算法參數Table 2 Parameters of intelligent optimization algorithms
為公平起見,設定所有智能算法的預設最大迭代次數為50,種群數量為20。同時,為消除啟發式算法隨機性對其性能測試結果的影響,每個算法獨立運行30次,并統計優化結果的均值(mean)、均方差(std)與最小值(min),均值與最小值反映了算法的優化性能,均方差反映了算法穩定性。智能感知設備規劃方案的結果對比如表3所示。
從表3中可知,對于本文所提出的零碳園區智能感知設備優化規劃模型,相比于SCA、GWO、PSO、MPA、TLBO與EHO,本文所提出的GWO-TLBO方法獲得的規劃結果在4個案例中無論是在均值上還是在最小值上均展現出了最優的優化性能,獲得了具有最低生命周期成本的規劃方案。可見,GWO-TLBO顯著提高了原算法處理智能感知設備優化規劃的性能,并在效果上優于現有的多數元啟發式智能算法。然而,GWO-TLBO也具有一定的不足:在穩定性上,TLBO的穩定性是最優的,GWO-TLBO的穩定性差于MPA和TLBO。這是因為GWO種群進化的質量僅取決三條最優狼引導,沒有跳出局部最優的機制,導致算法本身并不穩定。在TLBO與GWO的結合時,GWO中的不穩定因素影響TLBO的穩定性,最終導致混合算法的穩定性較差。

表3 智能優化算法求解結果對比Table 3 Comparison of solution results of intelligent optimization algorithms
若不采用本文所提出的優化配置方法,而是對于零碳園區內所有多類型用戶設備都配置一臺智能感知設備,那么案例1到案例4的規劃成本分別為1 092 782元、874 226元、655 669 和437 113元,可見,無論采用何種算法進行智能感知設備的規劃,無論是在大型零碳園區還是中小型零碳園區,本文的規劃方法均可以顯著降低生命周期成本。
為進一步驗證本文所提出的GWO-TLBO在面向零碳園區智能感知設備優化規劃中的收斂性效果,將本文的GWO-TLBO與TLBO、SCA、GWO、PSO、SFO、MPA、EHO的收斂性方案進行對比,結果如圖2所示。值得注意的是,為了更好地表示智能算法的收斂性差異,在算法收斂性曲線中對所獲得結果作對數處理。
從圖2中各個算法的收斂性曲線可以看出,本文所提出的GWO-TLBO在處理零碳園區智能感知設備的規劃時具有最高的精度和收斂速度??梢?,GWO雖然很快收斂,但是很明顯算法陷入了局部最優,獲得的智能感知規劃結果不能支撐其實際應用;TLBO的收斂曲線下降較快,但在迭代結束后都沒有達到收斂狀態,可見該算法雖然具有較強的全局尋優能力,但是其收斂速度較慢。GWO-TLBO的結合,利用GWO快速收斂的能力獲得一個較好的解,再利用TLBO進行精細的搜索,可獲得最優的智能感知設備規劃方案。

圖2 智能優化算法的收斂性曲線對比Fig.2 Comparison of convergence curves of intelligent optimization algorithms
為保證零碳園區可靠、安全、優質、低碳和經濟運行,本文提出一種面向能源互聯網的零碳園區智能感知設備優化規劃方法。首先,分析零碳園區狀態感知設備的要求,制定了智能感知設備優化規劃的原則,考慮投資成本、維護成本、故障成本等方面,提出了零碳園區智能感知設備優化規劃的數學模型;其次,為實現所制定數學模型的準確求解,提出一種灰狼優化器-教與學混合(GWO-TLBO)算法;最后,以一個零碳園區的實際案例作為仿真案例,驗證了本文所提出的零碳園區智能感知設備優化規劃方法能夠顯著降低生命周期成本,與現有智能算法的對比實驗表明本文的GWO-TLBO算法具有最高的求解精度,本文的主要創新點如下:
1)目前零碳園區一次系統的規劃研究很多,但對于二次系統的規劃技術卻鮮有研究,為此,本文提出了零碳園區智能感知設備的優化配置模型,構建了優化配置的數學模型;
2)為實現所制定數學模型的準確求解,提出一種GWO-TLBO算法,與現有智能算法的對比實驗表明所提出的GWO-TLBO算法具有較高的求解精度。
本文的優化規劃問題為單目標優化問題,僅保證了感知設備規劃的經濟性目標最優,在實際工程應用中具有一定的局限性。在未來的工作中,將考慮低碳園區中智能感知設備規劃經濟性、安全可靠性、低碳性等方面,開展智能感知設備多目標優化規劃研究,使提出的規劃設計方案更加具有現實意義。此外,在智能感知設備的優化規劃中考慮零碳園區內的地理環境信息也是一個十分有意義的研究方向。