國網上海長興供電公司 張佳杰 王嵐青 張小芳 中國電建集團裝備研究院有限公司 李鵬輝 上海電力大學 李 崢
近年來,隨著國家開展整縣光伏政策的推進,農村地區光伏占比逐漸增大,導致其配電網臺區內負荷類型出現了新特點。隨著分布式光伏的不斷加入,開始出現低壓電網功率倒送問題,使電網的運行產生一些負面影響。因此,有必要研究含分布式光伏接入配電網臺區負荷的特性分類問題,從而對變壓器選型、錯峰調度管理、電網規劃提供有力支持。光伏發電系統的容量和接入配電網位置等因素均對配電網的電壓分布有影響,光伏滲透率較高的配電網可能出現電壓越限的情況,影響了供電電壓的穩定性。
目前,配電網臺區負荷分類方面展開已有一定的研究。負荷分類方法主要以用電負荷曲線作為研究數據,通過統計學習方法,如聚類分析,挖掘單一或不同用戶的典型用電特征[1]。聚類分析作為數據挖掘方法之一,有著廣泛的應用,相較于數據挖掘方法中有監督的分類,不需要提前劃分類別的無監督式聚類方法更加適用于對用電行為進行分析,其可以以較高的效率獲得數據在全局范圍內的分布特征,并且有較好的應用前景。因此,如何區分光伏臺的光伏特性和傳統單純用戶的負荷特性,已經成為業務和技術部門關注并急切需要處理的問題。
本文通過對農村配電網臺區負荷數據進行聚類分析,通過數據清洗、歸一化和K-Shape聚類分析方法[2],挖掘出配電網臺區分布式光伏發電規律,在農村居民用戶負荷的背景下,分析農村臺區的負荷規律以及用電的高峰低谷等情況,為進一步的負荷預測、改變發輸電計劃或是調整電價等措施提供。
農村配電網負荷分析是從負荷數據中挖掘負荷特性信息,數據的準確性直接影響所挖掘信息的有效性與可靠性。由于負荷數據的采集、傳輸和存儲過程中存在一定數據缺失,因此需要對數據進行預處理。
針對負荷數據存在的數據缺失和數據噪聲等問題,本文首先剔除整體缺失10%以上的負荷數據,其次對部分缺失數據的樣本進行滑動平均插值處理,最后通過高斯滑動平均剔除異常數據。
為了方便比較不同量綱特征數據,同時考慮到功率倒送,本文采用零均值歸一化。
目前,針對負荷分析問題,研究人員提出了多種聚類方法,其中聚類方法的選擇需要根據數據的性質和分析目的而選擇。臺區負荷數據是一種典型的時間序列數據,因此本文選擇一種針對時間序列數據聚類的K-Shape算法進行聚類分析[3]。該方法在許多聚類算法已被用于負載預測問題。確定最佳算法在一定程度上取決于數據集的性質、目的和挖掘目標。在本文中,使用K-Shape聚類算法,有效保存數據特征的時間序列形狀。該方法通過一個基于形狀的距離度量,實現高效地分析和比較時間序列,并根據形狀的距離度量屬性,計算聚類質心,從而實現挖掘數據體征,實現對時間序列的聚類。
K形聚類算法由三個主要組件組成:一是基于形狀的距離測量;二是時間序列形狀提取和;三是基于形狀的時間序列聚類。具體如下。
首先計算形狀距離,該算法針對時間序列使用高效計算方法導出比例、位移均不發生變化的距離度量。并且,序列和序列的相似性由公式(1)確定。
其產生的值介于0到2之間,0表示時間序列的完全相似性。
為了準確提取形狀,該算法將質心計算最優設為函數目標,函數最μ*k優定義為序列的平方相似性最大時對應的聚類中心。優化問題形式如下:
其中,Pk是第k個分區,是第k個分區的初始質心。為了將序列與參考序列對齊,該算法使用SBD度量,該度量為每個序列識別一個理想的移位。
該序列聚類操作需要通過SBD距離度量、形狀提取的方式。將序列集X、聚類數K作為K形聚類算法輸入,并將相關時間序列隨機分給聚類中心。然后,通過算法計算出質心并進一步細化簇的成員關系。重復上述操作直到算法收斂或達到最大迭代次數。
本文選擇以華東地區某縣農村配電網臺區為例進行分析。其中,某臺區已知含分布式光伏,且分布式光伏占負荷率大約20%以上,因此本文以此作為含分布式光伏系統的典型臺區。該臺區在晴空條件下工作日和節假日負荷曲線如圖1所示。
通過圖1可知,工作日從早上7點到下午4點之間,功率為負值,存在倒送現象,最大倒送電流出現在上午12點至下午1點之間,最大倒送負荷為9.926kW。節假日最大倒送負荷出現在上午11點至12點之間,最大倒送負荷為19.14kW。由于農村電網臺區負荷較輕,當處于輕負荷階段,由于光伏發電的并網接入,負荷低谷點從正常的凌晨轉移到了白天,甚至出現低壓電網倒送功率現象。總體來說,分布式光伏的接入使得農村配電網臺區出現了負荷低谷點轉移的現象,因此有必要通過聚類分析的方法找出類似的臺區,從而實現更有效的配電網管理。
由于分布式光伏接入后臺區負荷出現負荷低谷轉移現象,因此為了對含分布式光伏臺區負荷數據的聚類結果進行類別確定時,本文主要以負荷特征指標分類中的曲線類指標為主,對配電網臺區的單日負荷曲線進行分析與分類,對不同類型單日負荷曲線所表現的用電行為特征加以分析[4]。
本文針對收集到的華東地區某縣農村配電網824個臺區為例進行典型日分析,每天共96個采樣點(采樣頻率15min)進行試驗分析。本文首先采用了K-Shape聚類方法進行聚類,此時的相似性度量函數選用歐氏距離函數。通過聚類可以得到五種負荷模式,如圖2所示。本文參考文獻[5]的分類,對分布式光伏接入臺區負荷進一步劃分。
雙峰雙谷型負荷曲線,用電時間多集中于白天,但與單峰型曲線的不同在于出現兩個用電時段高峰。圖2所示雙峰型曲線的負荷主要集中在兩個時間段:第一個時間段是上午7點開始,另一個時間段是晚上5點到6點,如圖3所示,此類型的單峰型曲線多出現于第三產業的餐飲業和生活服務類。
雙峰日間單谷型負荷曲線,由于日間光伏發電功率較大,因此負荷出現了典型的低谷轉移,從原有的夜間,轉移到了白天。
如圖3所示,雙峰型曲線的負荷主要集中在兩個時間段:第一個時間段是上午5點到7點,另一個時間段是晚上6點到8點。此類單峰型曲線多出現于分布式光伏接入的生活居民負荷,且光伏接入量較大。
雙峰夜間單谷型負荷曲線,用電時間多集中于白天,但與單峰型曲線不同在于出現兩個用電時段高峰。
如圖4所示,雙峰型曲線的負荷主要集中在兩個時間段:第一個時間段是上午10點開始,另一個時間段是晚上5點到7點,此類型的單峰型曲線多出現于第三產業的餐飲業和生活服務類。
如圖5所示,單峰雙谷型負荷曲線用電時間主要集中在白天,晚上后半夜負荷非常小,同時由于分布式光伏的接入,在原有單峰型負荷曲線的基礎上在下午1點至3點出現了第二個負荷低谷,負荷日峰谷差大,負荷率較低。這類用戶一般是生活居民負荷,其用電特性體現在白天人們出去上班晚上回家,用電量主要集中在夜晚,晚高峰一般在晚上6點到8點時間段。
如圖6所示,避峰型曲線的負荷主要集中在晚上,白天負荷用電量很低,日最值差比較大,負荷率較高。這是農村灌溉類用電設備產生的避峰型曲線。
本文提出了一種基于K-Shape聚類的含分布式光伏接入的農村配電網臺區負荷分類方法。在對典型含分布式光伏接入的臺區負荷分析的基礎上,根據負荷低谷轉移特性,利用K-Shape方法對臺區負荷進行了分類。通過上述方法,可以得到居民用戶接入分布式光伏的臺區用電規律以及負荷高峰低谷信息,從而為農村配電網臺區負荷預測,分布式光伏管理等提供了數據支持。