趙岳恒,劉民偉,王文飛,支剛,萬航羽,陳宇,趙爽,胡凱,劉娟
采用有效地手段從大量的風電出力場景中挑選出典型的風電出力場景,可以減少原始場景數量,以較小的工作量和較高的精度表征風電出力的全時空特性[1-3]。縱觀現有的相關研究,主要包含2 種思路,一是通過對歷史的實際風電出力數據進行概率統計分析,得到風電未來的出力場景;另一種是將風電典型出力場景選取轉化為一個聚類的問題,結合歷史的風電出力數據和無監督分類模型選取出最具有代表性的出力場景。
聚類分析是一種非常重要的數據挖掘工具,廣泛應用于圖像處理、入侵檢測和電力系統負荷預測等諸多領域[4-9],取得了較好的分析效果。如文獻[7] 提出了一種基于K 均值聚類的風電樣本場景生成方法,并將其應用到無功優化當中。文獻[8]利用類內、類間距離提出一種改進的聚類算法,并應用到圖像處理當中,效果較好。文獻[9]將分層聚類算法應用到風電場景選取應用當中,相關實驗證明了方法是有效的。譜聚類(SC)[10]是一種廣泛使用的聚類算法,相比于K 均值和分層聚類算法,SC 算法對數據分布具有更強的適應性,效果往往也更加出色,同時算法的計算復雜度也要低很多,本文嘗試采用SC 算法對云南某地區大規模的風電進行分析,選取出最能代表該地區風電出力特性的典型出力場景。
SC 算法是一種基于圖論的方法,將一個聚類的問題轉化成圖像分割的問題,由相似度把這些頂點連接在一起,然后進行分割,把分割后依然連接在一起的頂點判定為同一個類別,此即SC 算法的核心思路。SC 聚類示意見圖1。

圖1 SC算法聚類示意圖
基于SC 算法的風電日出力場景聚類算法的具體步驟如下:
1)假設第i(i=1,2,...,N) 天的風電出力樣本表示為Xi=[xi1,xi2,...xin],進一步可得到整個N 天的風電處理樣本集為:

根據以上樣本矩陣即可構建鄰接矩陣W,其矩陣元素為:

式中參數σ為高斯距離里面的方差,本文算法中取值為0.9。
2)計算拉普拉斯矩陣L=D-1/2WD,其中D表示對角陣,元素取值為:

然后計算Laplacian 矩陣L的前k個最大特征值和特征向量Vi,由特征向量構造子空間矩陣U,即

3)將矩陣U的每一行進行歸一化后即可得到矩陣Y,其元素為:

4)最后對矩陣Y中的每一行表示的數據樣本點采用K均值算法進行聚類分析,若Y中的第i行被分類到第k類,那么相應的原始數據樣本集X中的元素xi也就可以劃分到第k簇。
為驗證前述所提的風電日出力場景聚類方法的正確性及有效性,本文以云南某地區2017年風電場實際出力數據為案例進行分析。截至2017 年底,此地區風電場共計19 個,裝機總容量2089 MW。該地區風電場運行數據檢測設備所能采集的數據為每15 分鐘一個有功出力數據,全年有4×24×365=35 040 個采樣數據點。
參照現有的風電出力特性研究方法,本文采用月平均和月最大出力曲線定量地評估該地區風電的特性,分別如圖2、3 所示。

圖2 地區風電場月平均出力曲線

圖3 地區風電場月最大出力曲線
從上圖可以看出,地區風電場枯期最大出力基本能夠達到裝機的75%以上,豐期出力較小。地區風電場出力整體呈現枯期大、豐期小的特點。
從地區風電出力特性的分析可知,該地區風電場月平均出力特性呈現枯期出力大,豐期出力小的特點。考慮到篇幅限制,本文算例只選取了該地區冬季3 個月的實際風電出力數據進行場景聚類分析。
根據所提的場景聚類方法和實際出力數據,本文采用M atlab 軟件編程實現樣本數據的歸一化處理,并對該地區冬季風電出力場景進行聚類分析。為直觀的表示風電出力原始數據樣本集X90×96中樣本的分布情況,本文提出采用PCA降維算法將高維空間中的X90×96樣本矩陣映射到2 維空間進行可視化展示,如圖4 所示,圖上每個“*”點代表一個實際風電出力樣本。

圖4 風電出力樣本集2維可視化結果
為了確定算法最優聚類數k的取值,采用類內平均距離與類間平均距離的比值J來描述類間樣本的差異性[8],以此作為聚類數的判定依據。其中:

圖5 為J值隨聚類數k的變化關系。J越小,說明類內平均距離越小,類簇聚集程度更加緊密,類間平均距離越大,說明類簇間的差異程度更大,聚類效果越好。
從圖5 可知,當k增加到7 時,樣本集被緊湊的劃分到各自的聚類簇當中,聚類效果較好;當聚類數k大于7 時,聚類數的增加對J 值的影響逐漸減小,表明當k等于7 時,聚類數已經能夠有效地區分樣本間的差異性,而過多的聚類數會造成不同類間樣本差異性較小,使選取的典型場景不具有強代表性,同時也會增加實際工程計算量。

圖5 聚類數k與J的關系
因此,地區風電出力場景聚類中最優聚類數取7,聚類結果如圖6 所示。其中圖6 中(a)~(f)分別表示k-means 算法聚類結果、鄰接矩陣W、拉普拉斯矩陣L、子空間矩陣U、標準化后的子空間矩陣U 和譜聚類后的結果。

圖6 風電出力場景聚類結果
另外,根據以上風電出力場景聚類結果,圖7 給出了樣本集劃分到各簇的概率。

圖7 風電出力場景聚類概率分布
從上圖可看出,算例樣本集最大概率被劃分到Cluster 1 當中,說明該簇樣本具有很大地特性相關性,在場景選取的時候將重點考慮從簇1 中挑選出典型場景。
根據風電原始場景聚類結果,通過有效地方法確定該地區典型的風電日出力場景具有重要的意義。首先,風電的反調峰特性會加劇電網調峰的壓力,風電典型出力曲線應能很好地反映風電的調峰效益。其次,為保證各類場景典型風電出力曲線在系統電量平衡分析中的準確性,其必須能夠正確反映原發電曲線的電量特性,即與原發電曲線的期望發電量保持一致。
由上述風電出力場景聚類的結果可知,簇1聚類了樣本總數的大多數,比例最高,故可以在簇1 的風電日出力樣本中選取出地區風電出力典型場景。簇1 中的樣本出力特性曲線如圖8所示。

圖8 簇1中風電日出力典型場景
當風電出力峰谷差最大時,將會加大電網的調峰壓力,基于此本文選取簇1 中風電日出力峰谷差最大的樣本(深紅色曲線)作為調峰計算時采用的典型風電日出力場景。
綜上所述,提出了一種基于譜聚類算法的風電日出力典型場景生成方法,并以云南某地區冬季三個月的實際風電出力數據為算例進行出力場景聚類分析,實驗結果驗證了所提方法的有效性,總結本文得到如下結論:
1)算法主要研究了如何將大量的風電日出力場景行之有效地劃分到不同的類,有利于減少原始風電日出力場景數量,以較小的工作量和較高的精度表征風電出力的全時空特性。
2)實驗驗證了SC 算法對于風電出力的樣本聚類是有效且適用的,聚類效果較好。
3)采取何種評估方法定量地從聚類場景中挑選出最有效的典型出力場景是下一步可以開展的研究。