劉毅,劉晉彪,韓文曉
(山西京能售電有限責任公司,山西太原 030000)
電力交易平臺是國家電力市場交易運營系統的關鍵構成部分之一,其包含的信息種類較多,涉及面較為廣泛,故得到了國家、監管部門以及社會各界的高度重視[1]。電力交易信息急劇攀升,對電力交易信息處理及其應用帶來了極大的挑戰。
根據市場成員不同,將電力交易信息劃分為用電側信息、發電側信息、電力交易機構信息、監管機構信息等。在電力市場交易運營系統實際運行過程中,主要以用電側信息(售電信息)與發電側信息(發電信息)為主,其他種類信息為輔[2]。發電信息與售電信息能直接顯示出電力企業的供需水平,方便電力企業進行改革與建設。
然而,電力交易平臺發電信息與售電信息規模較大,分布較為混亂,很難對其進行統一處理,加大了發電信息與售電信息獲取的難度。為了解決上述問題,提出基于改進CNN 的電力交易平臺發售電信息一體化聚類算法研究,創新性地構建發售電信息一體化模型,通過Adam 算法改進卷積神經網絡模型(CNN),確定了發售點信息聚類中心與最佳距離閾值,實現電力交易平臺發售電信息的一體化聚類。
為了提升發售電信息聚類效果,首要任務為深度分析電力交易平臺發售電信息的供給過程與復雜性,具體分析過程如下:
為了保障電力市場運營的公平性,需要對發售電信息進行披露,以此來規范電力市場行為,以便于發售電信息的處理與應用[3-4]。針對發售電信息,供給過程主要分為六種,具體如下:
1)供給過程1:發電側——電力交易平臺。依據已定規范,發電側向電力交易平臺提交發電信息,主要包括發電能力、企業概況等;
2)供給過程2:用電側——電力交易平臺。依據已定規范,用電側向電力交易平臺提交售電信息,主要包括交易信息、用電信息等;
3)供給過程3:電網企業——電力交易平臺。電網企業提交信息主要包絡電力供給與需求預測信息、售電結算信息等;
4)供給過程4:調度平臺——電力交易平臺。調度平臺提交信息主要包括安全發電信息、約束售電信息等;
5)供給過程5:監管平臺——電力交易平臺。監管平臺提交信息為發售電相關政策規則信息;
6)供給過程6:直接披露信息——電力交易平臺。直接披露信息是指分布在平臺上的直接信息,大部分為發售電信息,需要對其進行收集與處理。
由上述發售電信息供給過程分析可知,其在電力交易平臺信息中占據著至關重要的位置,產生過程較為復雜,與多個子平臺均存在著緊密的聯系。為了清晰展示發售電信息的復雜性,對電力交易平臺組成部分之間的關聯性進行簡化顯示,具體如圖1所示。

圖1 電力交易平臺關聯圖
如圖1 所示,發售電信息與多個子平臺均具有關系,在電力交易平臺中分布較為分散,并無規律可循,這無疑加大了發售電信息的聚類難度,影響電力供需水平的獲取,從而制約電力企業的發展[5]。
上述過程闡述了發售電信息的供給過程與復雜性,完成了發售電信息的深度分析,為后續發售電信息模型的構建提供支撐[6]。
以上述發售電信息深度分析結果為基礎,構建發售電信息一體化模型,對發售電信息一致性進行檢驗,為最終發售電信息一體化聚類的實現做準備[7]。
依據發電信息與售電信息具有的特性,構建發售電一體化模型,如圖2 所示。

圖2 發售電一體化模型示意圖
目前,電力交易市場以計劃交易為主,缺失現貨電力交易。在最新電力改革過程中,電力市場成員呈現跨數量級增長,會導致核心業務量劇增,容易造成電力交易平臺節點故障,產生電力交易信息不一致現象,從而影響發售電信息的聚類。因此,該研究利用Raft算法來檢驗發售電信息的一致性[8]。
設置電力交易平臺服務器集群為Ci(i=1,2,…,m),m代表服務器集群總數量。每個服務器集群節點集合為Sj(j=1,2,…,n),n代表服務器集群節點總數量[9]。在發售電信息一致性檢驗過程中,構建Raft 組,表達式為:
需要注意的是,式中,只有滿足p≤n,Raft 組才能構建成功。在p個Raft 組中選舉出一個leader,以此為基礎,調試組內節點參數,保障組內信息的一致性[10]。由此可見,通過判定Raft 組內是否存在leader節點即可實現發售電信息一致性的檢驗。leader 節點判定規則如下:
式中,ri表示leader 節點判定參數;α與β3表示判定參數計算輔助因子;sgn(·) 表示Raft 組量化函數表達式;r*表示leader 節點判定閾值,需要根據實際發售電信息情況進行設置。
應用式(2)即可對發售電信息進行一致性檢驗。若發售電信息滿足一致性,將其整理至一體化模型中;若發售電信息未滿足一致性,需要對信息進行校準,再整理至一體化模型中[11]。
上述過程完成了發售電信息一體化模型的構建,并對發售電信息一致性進行了相應的檢驗,為后續發售電信息聚類的精準度提供保證。
基于卷積神經網絡模型信息聚類結果極容易陷入局部最優,并且學習訓練速度較慢,無法滿足現今電力交易平臺的需求[12]。
在卷積神經網絡模型改進過程中,如何通過快速地學習訓練使得損失函數達到最小化,是CNN 改進終極目標[13]。改進CNN 中,采用Adam 算法更新訓練樣本參數,此種方式更新與執行速度較快,并可以計算出每個參數的自適應學習率,能有效提升模型訓練速度。Adam 算法參數更新表達式為:
式中,θt與θt+1分別表示更新前、后的參數;η表示學習率;Vt與分別表示更新前、后的梯度方差;ε表示誤差數值;Mt與分別表示更新前、后的梯度平均值;與表示梯度方差與平均值更新輔助因子,與CNN 的學習率關系密切,取值范圍為[0,1]。
參數更新會導致損失函數產生波動,為了顯示CNN 的改進效果,以某個損失函數為例,通過曲線圖展示損失函數優化過程,如圖3 所示。

圖3 損失函數優化過程示例圖
如圖3 所示,隨著參數的更新,損失函數會發生不同幅度波動,并且存在最小值,表明Adam 算法的應用不但能夠加快卷積神經網絡模型的學習訓練速度,還能使損失函數達到最小化,滿足卷積神經網絡模型的改進需求。
以上述改進CNN 為依據,結合發售電信息一體化模型,推出發售電信息進行一體化聚類算法,實現電力交易平臺發售電信息的一體化聚類[14]。
在發售電信息一體化聚類中,將發售電信息看作一個個數據點,以局部密度與距離來刻畫數據點的特性,完成發售電信息的分類與聚合,具體步驟如下。
步驟一:計算每個數據點(發售電信息)的局部密度與距離,計算公式為:
式中,ρi表示第i個數據點(發售電信息)的局部密度;γ(dij-dc) 表示取 值函數,若dij-dc<0,γ(dij-dc)取值為1;若dij-dc≥0,γ(dij-dc)取值為0;dij表示第i個與第j個數據點之間的距離;dc表示截斷距離;κi表示數據點i相對于數據點j(局部密度更大)的距離。
由于發售電信息規模較大,一體化聚類中心很難分辨,故有效融合數據點的局部密度與距離變量,以此來獲取信息聚類綜合考慮參數,表達式為:
式中,ζi表示第i個數據點(發售電信息)的聚類綜合考慮參數值;Θ 表示運算符號;Γ 表示變量融合輔助因子;ωi表示第i個數據點占全部數據點的權重數值。
以式(5)計算結果ζi為基礎,對全部數據點(發售電信息)進行降序排列,從大到小截取若干個數據點,將其作為聚類中心。
以確定的數據點(發售電信息)聚類中心為依據,確定自適應距離閾值。距離閾值滿足條件為:
式中,κv與κv+1表示距離閾值相鄰值;f(κv)與f(κv+1) 表示大于距離閾值κv與κv+1的數據點個數。
當式(6)計算結果f達到最大值時,對應的自適應距離閾值即為最佳距離閾值。以聚類中心為核心,將小于或者等于距離閾值的數據點歸類到類別中,依此類推,直到全部數據點歸類結束為止[15]。
通過上述過程實現了電力交易平臺發售電信息的一體化聚類,為發售電信息的處理與應用提供更有效的算法支撐,也為電力交易平臺穩定運行提供保障。
為了驗證提出算法的應用性能,選取基于DTW直方圖的電力負荷數據聚類算法[16]作為對比算法,設計對比實驗,具體實驗過程如下。
選取某區域電力交易中心產生的發售電信息作為實驗對象,雖然選取的實驗對象是小區域范圍內的電力交易中心,但用戶數量依然可觀,發售電信息數量級仍居高不下。為了方便進行實驗,以某一星期電力交易中心產生的發售電信息為實驗數據,以此來減少實驗數據量,保障實驗的穩定性。
以選取的實驗對象為基礎,為了量化顯示發售電信息一體化聚類效果,選取聚類準確率、歸一度及其調整Rand 指數作為評價指標,計算公式為:
式中,ACC、NMI 與ARI 分別表示聚類準確率、歸一度及其調整Rand 指數;Ncor表示正確聚類的發售電信息數量;N表示發售電信息總數量;I(X,Y)表示任意兩個發售電信息的關聯度;H(X)與H(Y)分別表示發售電信息X與Y的最大熵;RI 表示聚類系數;E[R I] 與MAX[R I] 分別表示聚類系數誤差值與最大值。
上述過程完成了發售電信息一體化聚類評價指標的選取,指標取值范圍為[ ]0,1,評價指標數值越大,則表明聚類效果越好。
通過實驗獲得的聚類準確率數據如表1 所示。

表1 聚類準確率數據表
如表1數據所示,與對比算法相比較,應用提出算法獲得的聚類準確率更高,最大值能夠達到91.45%,表明提出算法正確聚類的發售電信息數量更多。
通過實驗獲得歸一度與調整Rand指數如圖4所示。

圖4 歸一度與調整Rand指數示意圖
如圖4 所示,與對比算法相比較,應用提出算法獲得的歸一度與調整Rand 指數數值更大,最大值分別能夠達到0.98 與0.92。
應用提出算法獲得的聚類準確率、歸一度與調整Rand 指數均較大,充分證實了提出算法發售電信息一體化聚類效果更好。
文中對卷積神經網絡CNN 進行了改進,并以此為基礎提出了電力交易平臺發售電信息一體化聚類算法,極大地提升了聚類準確率、歸一度與調整Rand 指數數值,能夠為發售電信息一體化聚類提供更有效的算法支撐,也為信息聚類相關研究提供一定的借鑒及其參考。