宋學偉,劉玉瑤
基于改進K-means聚類的風光發電場景劃分
宋學偉1,劉玉瑤2
(1.上海電機學院電氣學院,上海市 浦東新區 201306;2.國網東營市墾利區供電公司,山東省 東營市 257000)
針對可再生能源發電,尤其是風力、光伏發電的出力不確定性問題,結合改進后的K-means聚類方法對發電的狀態進行場景劃分。首先建立風力、光伏發電的不確定性模型,選用合適的概率密度函數進行擬合;之后結合密度聚類和提出的混合評價函數,對基本的K-means聚類算法進行改進,解決了算法的初始聚類中心和聚類個數難以選取的問題;然后運用改進后的K-means聚類對某地風力、光伏發電場景進行聚類劃分,從而將不確定性問題轉化成確定性問題。最后通過對場景劃分的算例進行分析,驗證了所提方法的工程實用性。
風力發電;光伏發電;密度聚類;K-means聚類;場景劃分
隨著環境問題日益突出,可再生能源發電技術得到廣泛關注[1-4]。風力發電、光伏發電等可再生能源得到大力發展,然而風電、光伏發電都存在出力不確定性問題[5]。文獻[6-7]分別研究了風力發電并網后的次同步振蕩現象、風力發電與光儲系統聯合發電的運行技術。文獻[8]結合馬爾科夫鏈對風力發電不確定性運行狀態進行劃分并進行可靠性評估研究。文獻[9]對光伏發電的出力預測方法和技術進行了歸納總結,包括點預測、區間預測、概率預測等。文獻[10]針對光伏出力特性,提出變頻率時控追蹤控制策略并進行驗證,該方法有效減少了系統的能耗和機械磨損。文獻[11]針對海島特殊情況提出了一種風、光、柴互補的發電系統控制策略,應用遺傳算法對多目標進行優化,驗證了控制策略的優越性,提升了資源利用率。文獻[12]對風電場不確定性的有功功率輸出進行研究。
如何處理好可再生能源發電的出力不穩定性問題是有效利用可再生能源的基礎,所以本文結合場景分析法對風力、光伏發電進行狀態劃分。多場景分析的主要工作是基于某一個確定的規則,把不確定性的變量提取出來組成一個場景,這樣的場景對應著一組確定的規則參數,多個確定的規則對應著多個確定的場景,從而實現了從不確定性到確定性問題的轉變。
本文結合密度聚類的思想,提出了一種混合評價函數,可以提升確定聚類中心數目的速度,從而有效改進了K-means聚類。針對風力發電、光伏發電出力的不確定性,運用改進的K-means聚類進行場景生成,得到了發電的典型場景,從而完成發電不確定性到確定性問題的轉變,為風力、光伏發電的推廣提供科學支撐。
風電出力由于受到風速的影響,呈現出比較大的隨機性與波動性,現階段較多采用Weibull分布[13]來描述風速的不確定性,其概率密度函數為

式中:為Weibull的尺度參數,表示在某時刻的平均風速;為Weibull的形狀參數,反應風速的分布情況。
風機出力W與風速之間的關系可以近似以分段函數表示為


光伏發電與風力發電類似,都受到自然氣候與天氣情況較大的影響。較多采用Beta分布來表示光伏發電的不確定性,光伏發電的輸出功率pv的概率密度函數[14]為

式中:pmax為光伏發電輸出的最大功率;G為伽馬函數;、為Beta分布參數,其表達式為

聚類是將同一數據集中的數據按照一定的原則分成不同的簇類,保證同一簇內數據具有較高的相似度,不同簇間具有較低的相似度。
K-means聚類誕生于1967年,是一種動態的聚類算法,算法的基本流程為:首先在數據集里面隨機選取個數據作為初始聚類中心;然后計算歐氏距離,將其他的數據劃分到與其最近的聚類中心所在的類中;之后計算已劃分完成的簇類的聚類中心點,與初始數據對比并更新;在之后的計算過程中迭代以上過程,直到數據不再更新為止。聚類流程如圖1所示。

圖1 基本K-means聚類流程
由基本K-means聚類可知其最大的缺陷就是在算法的前期隨機選擇個數據作為初始聚類中心。初始聚類中心的選擇決定聚類結果的好壞,如果選取不當,很可能陷入局部最優解,導致聚類的失敗,所以在運用K-means聚類之前需先對其進行改進。首先,結合密度聚類算法對聚類中心的選取方式進行改進,選擇密度最大的數據作為第1個聚類中心,之后依據一定原則可以選出其他的最佳聚類中心;然后提出一種混合評價函數,綜合考慮類內、類間的差異度來構建函數,進而更加有效地評價算法,因而聚類效果最好時對應的即為最佳的聚類數目。
2.2.1 結合密度聚類對聚類中心選取的改進
密度聚類的原理是聚類中心密度高,與其他密度高的聚類中心距離相對較遠,運用該原理特點,可以較為容易地確定出K-means聚類的初始中心。改進的基本思路是:首先在數據集中選擇密度最大的數據作為第1個初始聚類中心,然后選擇距離第1個初始聚類中心相對較遠且密度大的數據作為第2個中心點,依此類推,確定所有的初始聚類中心。之后根據相似度度量方法,一般選擇歐氏距離劃分數據,將數據劃分到距其最近的聚類中心所在的簇類中。
首先計算樣本中數據點之間的距離,即歐氏距離,表達式為

設置閥值距離t,并計算距離閥值內的局部密度,表達式為


2.2.2 混合評價函數確定最佳聚類數目值
綜合考慮簇類內、簇類間差異進而構建混合評價函數。在給定樣本集={1,2,…,x}中,按上文要求將個數據分成個簇類(1,2,…,C),結合密度聚類得到初始聚類中心(1,2,…,m)。
簇類內差異表示聚類的緊湊性,運用各個數據到其初始聚類中心的距離平均值表示:

簇類間差異表示不同類之間的遠離程度,運用初始聚類中心點之間的距離最小值表示:

定義混合評價函數為

由式(9)可知,函數的取值范圍是[-1,1]。()越接近1,簇類內差異度相對于類間可以忽略,聚類效果越好;()越接近-1,簇類間差異度相對于類內可以忽略,聚類效果越差。為了簇類內盡量相聚,類間應該盡量分離;()最大時,聚類結果最優,對應的即為最佳聚類數目。
改進后的K-means聚類算法流程如圖2所示。

圖2 改進后的K-means聚類算法流程
在運用改進的K-means聚類算法之前首先對其優越性進行檢驗,并以CH(+)和DB(-)作為檢驗的標準。文獻[15]給出CH(+)指標和DB(-)指標的定義,其中DB(-)是最常見的聚類有效性檢驗指標,用類內數據點到其聚類中心的距離估計類內的緊湊性,用聚類中心之間的距離表示簇類間的分離性。
同時運用基本聚類算法和改進后的算法對某地一年8 760 h的風力、光伏發電場景進行聚類。對基本聚類算法進行100次聚類后求平均值,來解決因其隨機生成聚類中心帶來的不穩定問題。K-means聚類算法改進前后指標對比見表1。

表1 K-means聚類改進前后指標對比
分析表1可知,可以通過2個指標得出,改進后的K-means更具有計算優越性,聚類效果更好。通過結合密度聚類以及混合函數確定值而得到的初始聚類中心更逼近最終的中心點,所以大大降低了聚類迭代的次數。綜上所述,改進后的K-means聚類算法更具有實用性。
1)首先根據風速、光照強度的概率密度函數進行出力擬合。相比于蒙特卡羅采樣方法,拉丁超立方抽樣通過分層抽樣的方式可以在更少的采樣數目下還原場景,所以運用拉丁超立方抽樣進行場景生成。
2)將生成的場景輸入待聚類樣本集中,計算樣本集中各個場景之間的歐氏距離。設定閾值距離,在閾值內計算數據的局部密度。
3)選擇密度最大的風、光發電場景作為第1個典型場景,根據密度聚類的思想,依次選出歐氏距離相對較遠、密度大的場景作為典型場景,初定個典型場景。
4)根據提出的混合評價函數(),()最大時對應的即為最佳初始典型場景數目。
5)進行基本K-means聚類算法,先計算每個場景到初始典型場景的距離,依次劃入到距離本身最近的典型場景所在的類中;再進行典型場景的平均值計算,決定是否更新典型場景。
針對某地裝設的風機和光伏板的有功出力進行場景生成并按照本文提出的步驟進行劃分,原始風速和光伏數據由某地電力公司提供。將一年365天的有功出力情況作為原始場景,首先綜合運用密度聚類和混合評價函數得到中心場景以及個數;然后運用K-means聚類算法進行聚類,得到典型場景。算例聚類計算得到8個典型場景,各場景出現的概率見表2,本文只列出其中出現概率最大的2個典型場景,分別見圖3、4。

表2 典型日場景概率

圖3 典型日場景5
圖3和圖4中,藍色為風力發電的典型場景預測有功功率邊界,黃色為光伏發電的典型場景預測有功功率邊界。分析圖中的風電、光伏發電的實際值和預測值可知,數值都在劃分的典型日場景的上下邊界中,有效約束了發電不確定性問題,且預測值與實際值十分貼近,體現了預測的準確性。

圖4 典型日場景6
1)光伏發電。可以分析出其發電規律性強,特征明顯,一般會隨著一天的日照以及氣溫情況的改變而改變。將光伏發電場景劃分為3個等級:光照I類時段,沒有光照,即沒有有功出力;光照II類時段,一般為06:00—10:00,16:00—18:00,光照逐漸加強(減弱),氣溫逐漸升高(降低),隨之而來的即光伏發電的有功功率變化明顯,但不是最大的有功輸出;光照III類時段,一般為10:00—16:00,此時段光照充足,光伏出力大,發出的有功功率可以為更多負荷供電。
2)風力發電。典型日場景5中體現的是高密度風區,總體風力發電輸出有功充足,04:00—11:00有功出力基本呈單調上升趨勢變化,11:00—17:00發出的有功功率基本呈單調下降趨勢變化,其余時間段出力平緩;典型日場景6中體現的是低密度風區,風力發電效果不明顯,且00:00—10:00有功出力呈單調下降趨勢變化,16:00—24:00發出的有功功率呈單調上升趨勢變化,其余時間段出力平緩。
在季風性氣候地區,典型場景5、6中風力發電符合實際情況,風力出力多和少的情況均分,且在早晚時間由于風速的提升而得到更多的有功出力;光伏發電出力具有顯著的特點,即13:00左右達到最大值,且規律性強,可以善加利用。
1)有效改進了基本K-means聚類算法,通過密度聚類和混合評價函數的有機結合,克服了算法隨機選取聚類中心的缺點,經實例驗證后可知,改進后的算法減少了迭代次數,提升了收斂性能。
2)針對風力發電和光伏發電的出力不確定性問題,運用改進后的聚類算法進行場景劃分,聚類得到典型出力場景,通過算例分析可知聚類結果符合實際情況,為風力、光伏發電電源的推廣運用提供了科學支撐。
[1]白建華,辛頌旭,劉俊,等.中國實現高比例可再生能源發展路徑研究[J].中國電機工程學報,2015,35(14):3699-3705.
BAI J H,XIN S X,LIU J,et al.Roadmap of realizing the high penetration renewable energy in China [J].Proceedings of the CSEE,2015,35(14):3699-3705.
[2]張興平,劉文峰.典型國家可再生能源政策演變研究[J].電網與清潔能源,2018,34(10):60-68.
ZHANG X P,LIU W F.The evolution of renewable energy policy in typical countries[J].Power System and Clean Energy,2018,34(10):60-68.
[3]姜曼,楊司玥,劉定宜,等.中國各省可再生能源電力消納量對碳排放的影響[J].電網與清潔能源,2020,36(7):87-95.
JIANG M,YANG S Y,LIU D Y,et al.Impacts of renewable electricity consumption on carbon dioxide emission in China’s provinces[J].Power System and Clean Energy,2020,36(7):87-95.
[4]馬藝瑋,楊蘋,郭紅霞,等.風–光–沼可再生能源分布式發電系統電源規劃[J].電網技術,2012,36(9):9-14.
MA Y W,YANG P,GUO H X,et al.Power source planning of wind-PV-biogas renewable energy distributed generation system[J].Power System Technology,2012,36(9):9-14.
[5]趙書強,李志偉.考慮可再生能源出力不確定性的多能源電力系統日前調度[J].華北電力大學學報(自然科學版),2018,45(5):1-10.
ZHAO S Q,LI Z W.Day-ahead scheduling of multi-energy power system considering renewable energy uncertain output[J].Journal of North China Electric Power University (Nature Science),2018,45(5):1-10.
[6]于笑,陳武暉.風力發電并網系統次同步振蕩研究[J].發電技術,2018,39(4):304-312.
YU X,CHEN W H.Review of subsynchronous oscillation induced by wind power generation integrated system[J].Power Generation Technology,2018,39(4):304-312.
[7]莊雅妮,楊秀媛,金鑫城.風光儲聯合發電運行技術研究[J].發電技術,2018,39(4):296-303.
ZHUANG Y N,YANG X Y,JIN X C.Study on operation technology of wind-PV-energy storage combined power generation[J].Power Generation Technology,2018,39(4):296-303.
[8]張文秀,韓肖清,宋述勇,等.計及源–網–荷不確定性因素的馬爾科夫鏈風電并網系統運行可靠性評估[J].電網技術,2018,42(3):762-771.
ZHANG W X,HAN X Q,SONG S Y,et al.Operational reliability evaluation of wind integrated power systems based on Markov chain considering uncertainty factors of source-grid-load[J].Power System Technology,2018,42(3):762-771.
[9]賴昌偉,黎靜華,陳博,等.光伏發電出力預測技術研究綜述[J].電工技術學報,2019,34(6):1201-1217.
LAI C W,LI J H,CHEN B,et al.Review of photovoltaic power output prediction technology [J].Transactions of China Electrotechnical Society,2019,34(6):1201-1217.
[10]謝富鵬,姜文剛,王茗倩.光伏逐日發電裝置變頻率時控追蹤控制策略研究[J].太陽能學報,2019,40(4):1011-1020.
XIE F P,JIANG W G,WANG M J.Study on control strategy for solar tracking system using variable tracking frequency[J].Acta Energiae Solaris Sinica,2019,40(4):1011-1020.
[11]繆仁豪,由世俊,張歡,等.海島生活艙風光柴互補發電系統優化設計[J].太陽能學報,2018,39(8):2147-2154.
MIU R H,YOU S J,ZHANG H,et al.Optimization design of island living quarters landscape and wood complementary power generation system[J].Acta Energiae Solaris Sinica,2018,39(8):2147-2154.
[12]樊新東,楊秀媛,金鑫城.風電場有功功率控制綜述[J].發電技術,2018,39(3):268-276.
FAN X D,YANG X Y,JIN X C.An overview of active power control in wind farms[J].Power Generation Technology,2018,39(3):268-276.
[13]韋仲康,徐建飛,于鵬.考慮風力發電波動性的分布式發電可靠性規劃[J].電力科學與工程,2014,30(11):31-36.
WEI Z K,XU J F,YU P.Reliability planning of distributed generation considering wind power fluctuations[J].Electric Power Science and Engineering,2014,30(11):31-36.
[14]王群,董文略,楊莉.基于Wasserstein距離和改進K-medoids聚類的風電/光伏經典場景集生成算法[J].中國電機工程學報,2015,35(11):2654-2661.
WANG Q,DONG W L,YANG L.A wind power/photovoltaic typical scenario set generation algorithm based on Wasserstein distance metric and revised K-medoids cluster[J].Proceedings of the CSEE,2015,35(11):2654-2661.
[15]周開樂,楊善林,丁帥,等.聚類有效性研究綜述[J].系統工程理論與實踐,2014,34(9):2417-2431.
ZHOU L L,YANG S L,DING S,et al.On cluster validation[J].Systems Engineering Theory & Practice,2014,34(9):2417-2431.
Wind and Photovoltaic Generation Scene Division Based on Improved K-means Clustering
SONG Xuewei1, LIU Yuyao2
(1. Department of Electrical Engineering, Shanghai Dian Ji University, Pudong New District, Shanghai 201306, China;2. State Grid Dongying Kenli Power Supply Company, Dongying 257000, Shandong Province, China)
In view of the uncertainty of power generation in renewable energy, especially wind power and photovoltaic power generation, the improved K-means clustering method was used to segment the state of power generation. Firstly, the uncertainty model of wind power and photovoltaic power generation was established, and the appropriate probability density function was used to fit. Then the basic K-means clustering algorithm was improved by combining density clustering and proposed hybrid evaluation function, to solve the problem that the initial clustering center and the number of clusters were difficult to select. The improved K-means clustering was used to cluster the wind and photovoltaic scenes in a certain place, thus transforming the uncertainty problem into a deterministic problem. Finally, the practicability of the proposed method was verified by analyzing an example of scenario division.
wind power generation; photovoltaic power generation; density clustering; K-means clustering; scenario division
10.12096/j.2096-4528.pgt.19090
TK 81; TM 615
國家自然科學基金項目(51477099);上海市自然科學基金項目(15ZR1417300, 14ZR1417200)。
Project supported by National Natural Science Foundation of China (51477099); Shanghai Natural Science Foundation (15ZR1417300, 14ZR1417200).
2020-05-25。
(責任編輯 辛培裕)