基于粒子群優化分段聚合近似的負荷分類*

2021-03-30 09:08:46張宇獻

沈陽工業大學學報 2021年2期

關鍵詞：分類

張宇獻，董放

(沈陽工業大學電氣工程學院，沈陽 110870)

電力需求側管理是指通過有效的管理措施，提高客戶終端利用效率，減少不合理的電力消耗，同時減少客戶在電網高峰時段對電力的需求，提高電網運行的經濟性[1].但是，實際電力系統中負荷數據十分龐大，不利于負荷數據的管理與調度，所以需要對其進行降維分類處理[2].依據分類得到的典型日負荷曲線，可以合理地利用和分配電力資源，有效緩解電力供需的矛盾.

引起負荷數據產生異常的因素有很多，電力系統的負荷數據由于信道噪聲、沖擊負荷以及突發事故等因素會存在非平穩特性[3].負荷數據實際上是典型的非平穩時間序列，由時間分辨率決定著其特征維度[4].隨著我國智能電網的發展，設備精度的提高使得負荷數據的維度過大，影響分類效果[5]，因此，對負荷數據進行降維成為主要研究方向.常見的降維方法有：主成分分析(PCA)、自組織映射(SOM)、符號聚合近似(SAX)及分段聚合近似(PAA)等[6-8].鄭旭等[9]通過把小波熵值作為評估子序列復雜度的指標，進而來確定分段迭代次數，可以準確描述原始樣本數據.Song等[10]提出了基于分段聚合近似的符號化表示，這種算法的局限性在于特征表示過程中會丟失原始數據中一些比較關鍵的信息.何勰緋等[11]利用每個時間序列的子序列起點值與終點值作為趨勢距離，通過均值和趨勢來描述時間序列變化.

本文針對憑經驗或經過多次實驗確定分段聚合近似算法壓縮比這一缺陷，提出一種基于粒子群優化分段聚合近似的方法.利用粒子群算法對壓縮比取值進行優化，在降低數據維度的同時考慮對降維后樣本的質量與分段數的權衡，最后采用基于相似性的分類方法對負荷數據進行分類，使得分類后的同類負荷數據曲線相似性最大，實現電力負荷有效分類.

1 基于小波變換的平滑處理

連續小波變換(WT)將函數f(t)在該小波基下進行變換，其表達式為

WTf(a，τ)=[f(t)，ψa，τ(t)]=

(1)

式中：ψ(t)為小波基函數；a為伸縮量；τ為平移參數.

在小波分解過程中，分解層數的選擇對于結果至關重要.分解層數越大，則噪聲和信號自身特性越明顯，但分解層數越大導致重構信號失真也會越大，在一定程度上影響去噪效果.考慮本文負荷數據采樣頻率較低，選擇較少分解層數.

采用無偏風險估計閾值，并對每個閾值求出其所相對應的風險值，風險最小的設為所選閾值，即

(2)

式中，kmin為風險曲線最小風險點所對應的值.

考慮硬閾值函數在閾值點處并不連續，因此重構出來的信號可能會產生振蕩現象，本文選用連續性較好的軟閾值函數來進行數據的平滑處理.軟閾值函數為

(3)

式中：Wj，k為小波系數；Thr為由閾值確定準則得出的閾值估計值.

2 基于APSO分段聚合近似算法

2.1 分段聚合近似基本原理

對于一個長度為m的數據S=(s1，s2，…，sm)，用一個長度為w的數據S′=(s′1，s′2，…，s′w)對其表示，其中，w≤m且w能被m整除，則該方法是一個壓縮比為Nk=m/w的時間序列數據降維過程.

通過將長度為m的數據s轉變為長度為w的數據s′，并且用該段所包含數據元素的均值來近似表示該序列段，該過程稱為分段聚合近似.在實際研究過程中發現，利用PAA算法進行數據降維時，選取不同的壓縮比會導致數據的分段數目不同，最后得到的結果也不相同，因此對每個負荷數據選擇合適的壓縮比是利用PAA算法進行數據降維的關鍵.

2.2 基于APSO的壓縮比設定

當采用PAA方法進行負荷數據降維時，需要對PAA算法壓縮比的取值進行合理的權衡.本文采用加速粒子群算法(APSO)對PAA壓縮比進行優化，以提高全局搜索能力.

在APSO中，粒子的速度和位置更新表達式為

(4)

(5)

APSO-PAA算法描述如下：

1) 求出當前負荷數據S的壓縮比Nk；

2) 對負荷數據S進行分段表示，得到不同壓縮比下的PAA序列；

3) 初始化粒子群，將近似表示的負荷數據與原始負荷數據之間的歐式距離設置為粒子群算法的適應度函數；

4) 重復步驟1)～3)，直到近似表示的負荷數據與原始負荷數據間的歐式距離最小，并輸出當前位置的壓縮比；

5) 通過第4步計算的壓縮比得到該負荷數據最佳分段數，用PAA方法將長度為m的負荷數據表示為w個區間.

3 負荷分類

本文采用模糊聚類對負荷進行分類.模糊聚類通過優化目標函數得到每個樣本點對所有類中心的隸屬度，達到對樣本數據進行劃分的目的.對于給定的負荷時間序列樣本S={s1，s2，…，sm}，將其進行劃分為c個類，聚類中心分別為v1，v2，…，vc，則其目標函數為

(6)

式中：n為數據集中的樣本數：c為樣本聚類中心數；sj為第j個數據樣本；ei為第i個聚類中心；ui，j為第j個樣本屬于第i個類的隸屬度；M∈[1，∞)為權重因子，一般M的取值為1.5≤M≤2.5.

聚類有效性函數是用來衡量聚類結果與聚類數目的依據，本文采用改進劃分系數的聚類有效性函數，該指標函數結合了類群之間的差異性和類內各樣本之間的相似性，有效性函數越大，說明分類后類內樣本之間的相似性越大，不同類簇之間差異度越大，代表聚類效果越好.

4 算例驗證

為驗證本文方法有效性，選取國網遼寧省網公司在相同時間段內不同行業的58個典型日負荷數據集，時間間隔為15 min，每個典型日負荷曲線數據有96個數據點.為了消除數量級差異對聚類結果的影響，在進行聚類分析之前先對其進行歸一化處理，得到典型日負荷曲線數據集.

4.1 小波分解平滑處理

本文采取db3小波基、分解層數為5、軟閾值的方法對典型日負荷曲線集進行降噪處理，獲取去噪后的負荷數據.從數據集中選取負荷曲線26為其中一個負荷曲線，小波閾值去噪后結果如圖1所示.

圖1 小波閾值去噪結果

4.2 分段聚合近似

選取負荷數據樣本5、23說明壓縮比設定的重要性.數據樣本5在不同壓縮比下的分段聚合近似結果如圖2所示.從圖2可知，在壓縮比Nk=12時，5號樣本接近原負荷曲線，此時擬合誤差為1.322 3；Nk=6時曲線擬合誤差為1.972 8，該負荷曲線在壓縮比Nk=6時的擬合誤差大于Nk=12時的擬合誤差.

圖2 數據樣本5在不同壓縮比下的分段聚合近似結果

數據樣本23在不同壓縮比下的分段聚合近似結果如圖3所示.在Nk=12時，負荷曲線23剛開始出現波動，分段近似表示后曲線擬合效果較差，此時誤差為2.016 7；而曲線在Nk=6時誤差為1.158 0，近似表示效果更好.

將負荷數據進行APSO-PAA變換，根據誤差確定壓縮比，對58個負荷數據集進行APSO-PAA變換得到的壓縮比如表1所示.由表1可以看出，經過APSO-PAA變換后的負荷數據的選取壓縮比各不相同，對于形態特征相對復雜的負荷曲線可以分配更多的分段數，以確保近似表示后數據的精度.

本文實驗環境為Windows10操作系統，CPU為Intel Core i7-6498DU雙核四線程，其主頻為2.60 GHz，內存8 GB.考慮到算法的運行時間也是衡量該算法性能的重要指標，因此將本文提出的APSO-PAA方法和傳統PAA方法各運行10次，求取10次程序運行時間的平均值進行對比，表2為兩種方法的誤差對比情況.

圖3 數據樣本23在不同壓縮比下的分段聚合近似結果

表1 不同數據集對應的壓縮比

表2 兩種方法近似誤差比較

由表2可知，本文提出的APSO-PAA算法的近似誤差小于傳統PAA算法.在壓縮比Nk=16時效果最為明顯，相比傳統PAA算法的近似誤差降低了58.92%.其他情況下使用APSO-PAA算法的近似誤差分別降低了22.49%、43.13%、48.79%.通過兩種算法運行時間的比較可以看出，APSO-PAA算法由于計算步驟較多，雖然在運行速度上做出了犧牲，但是也得到了更高的數據精度.

4.3 負荷數據分類

負荷數據集分別進行PAA和APSO-PAA變換，得到兩組不同負荷數據集，再分別對兩組負荷數據集進行模糊C均值聚類.為了對比效果明顯，本次實驗PAA負荷數據集壓縮比選取為Nk=12，最優分類數采用本文提出的聚類有效性函數來確定，結果如表3所示.

表3 兩種方法的有效性指標

從表3中可以看出，對于APSO-PAA變換的負荷數據集，最優分類數為4簇，分類結果如圖4所示；對于PAA變換數據集，最優分類數也為4簇，分類結果如圖5所示.

圖4 APSO-PAA算法的聚類結果

由圖5可以看出，PAA算法在近似表示的過程中，可能會中和掉負荷曲線的平峰、雙峰和多峰等形態特征，因此造成在對負荷曲線進行分類的過程中，圖5中類別1的雙峰負荷混雜了類別3的多峰負荷；類別1中的部分雙峰負荷曲線結尾處的突變與波動被中和掉，被劃分到類別2中；類別3中的三峰負荷中存在部分前期波動程度較強的平峰負荷.比較圖4、5的分類結果可知，本文提出的APSO-PAA近似表示精度要優于PAA算法，聚類效果更明顯，有利于實現對不同用電特性負荷曲線的劃分.

圖5 PAA算法的聚類結果

5 結論

本文選取小波閾值去噪方法降低負荷數據噪聲，采用基于粒子群優化的分段聚合近似方法，將負荷數據用基于均值的分段聚合近似方法和適當的壓縮比來表示.算例驗證表明：

1) 基于粒子群優化的分段聚合近似方法與經典分段聚合近似相比，能夠更有效地進行負荷數據降維處理，具有較好的聚類性能和分類結果，算法復雜度低，算法效率高，并且能夠獲得理想的聚類效果.

2) 基于相似性聚類的負荷分類方法，通過類與類之間的差異性和類內各樣本數據之間的相似性來確定最佳聚類數目，實現了負荷曲線的有效分類.