



[關鍵詞]電網;遺傳算法;數據壓縮;監控;K-Means 聚類
[中圖分類號]TM76 [文獻標志碼]A [文章編號]2095–6487(2024)11–0126–03
電網運行調度監控數據量快速增長、動態變化的特征使得數據的調度和查詢功能受到了嚴重影響。數據量的增大會導致系統查詢時間延長以及信息延遲,難以滿足電網運行調度的實時性需求,進而導致關鍵性信息的遲報或漏報,甚至可能會引起警告的延遲或消失,從而嚴重威脅到電網運行的安全可靠性。此外,海量數據的存儲不僅會增加集群存儲空間的壓力,還會提高數據傳輸的成本。在此背景下,創新性地將遺傳算法與K-Means 聚類算法相結合,并對門控循環神經網絡進行優化,設計出了一種電網運行調度的監控數據壓縮模型,以期在提高監控數據的調度效率的同時,減少集群存儲空間的壓力。
1基于遺傳算法的電網運行調度監控數據壓縮模型構建
1.1基于遺傳優化聚類算法的數據壓縮模型設計
國網調度監控系統采用基于Hadoop 的分布式集群架構,這一架構可支持大規模的數據存儲與處理。數據的壓縮過程可分為兩個主要階段,第一階段是基于輸入數據構建出概率分布模型,第二階段是將此概率分布模型與編碼器相結合實現文件的壓縮。數據壓縮的效果通常通過壓縮率來評估,壓縮率越小,則表明文件壓縮得越小,即壓縮效果就越好。數據壓縮的數學表達式如下。
遺傳算法是一種高效的搜索算法,其能夠借鑒生物學中遺傳、變異等現象,來解決最佳化的搜索問題。而K-Means 算法可通過最小化每個數據點到其對應的聚類中心的距離之和來優化分類效果。因此,研究將這兩種算法的優勢相結合,構建出一個電網運行調度的監控數據壓縮模型。該模型可利用K-Means 算法對相同特征的數據進行聚類,并通過提升聚類中心點的相似度,來提升壓縮效率。基于遺傳優化聚類算法的數據壓縮模型的工作步驟是,先在輸入電網運行監控數據之后,進行種群的初始化并對染色體進行編碼。接著,通過交叉和變異等操作生成新的個體,然后利用K-Means 算法對這些個體進行聚類。在聚類過程中,將聚類結果相同的個體去除,其目的是減少重復的數據,以提高數據的處理效率。
1.2遺傳優化的門控循環神經網絡數據壓縮設計
基于遺傳優化聚類算法的數據壓縮模型能夠去除具有相似性的數據信息,然而對于不相似的數據,其壓縮效果有限。因此,為了解決這一問題,研究提出了一種基于門控循環神經網絡的電網運行調度監控數據壓縮模型,該模型旨在更全面地處理數據壓縮。門控循環神經網絡是改進后的循環神經網絡,其不僅解決了傳統循環神經網絡面臨的梯度消失和梯度爆炸問題,還提供了更好的長期依賴性能。基于門控循環神經網絡的電網運行調度監控數據壓縮模型框架如圖1所示。
如圖1 所示,在該模型框架中先對監控數據進行了初步的聚類處理,并將處理后的聚類數據輸入到門控循環神經網絡結構中進行關聯性分析。然后,通過門控循環神經網絡對數據的狀態進行傳遞,并以此預測出每個數據的分布概率,并將其整理為分布表。最后,將這一預測數據與聚類數據一同應用于算術編碼過程中進行數據的高效壓縮,再將壓縮后的數據存儲于磁盤上,從而完成整個數據壓縮過程。
2基于遺傳算法的電網運行調度監控數據壓縮模型驗證
為了驗證基于遺傳優化聚類算法的壓縮效果,研究選取了9 個電網運行的實測監控數據集作為試驗對象,以驗證不同算法的壓縮效果。研究將該算法與普通K-Means 聚類算法、密度聚類(DBSCAN)算法以及層次聚類(Hierarchical Clustering,HC)算法等壓縮效果進行對比分析,不同聚類算法的壓縮率對比如圖2 所示。從圖2 中可以看出,研究的遺傳優化聚類算法壓縮率顯著低于其他3 種聚類算法,最低時為13.7%。因此可以看出,基于遺傳算法優化的聚類壓縮模型有效地提高了壓縮效果。
為了驗證基于門控循環神經網絡的電網運行調度監控數據壓縮模型的壓縮效果,研究將該方法與其他3 種先進的壓縮方法進行對比分析。這3 種壓縮方法分別是LZMA、DeepCABAC 和Gzip 等算法。不同壓縮算法的壓縮率對比如圖3 所示。從圖3 中可以看出,基于遺傳優化聚類的門控循環神經網絡壓縮算法的壓縮率最低,為0.98%,與LZMA、DeepCABAC和Gzip 等壓縮算法此時的壓縮率相比,分別降低了2.44%、2.95% 和9.99%。綜合來看,基于門控循環神經網絡的電網運行調度監控數據壓縮模型具有更優的壓縮性能。
為了驗證壓縮前后的集群空間性能,研究在數據集3中對不同壓縮方法和未壓縮前的集群空間進行對比分析,壓縮前后的集群空間對比如圖4 所示。從圖4 中可以看出,在數據集3 中未壓縮前集群空間為32.8 GB,壓縮后研究的基于遺傳優化聚類算法的壓縮方法、LZMA、DeepCABAC 和Gzip 等壓縮方法的集群空間占用分別為0.09 GB、4.38 GB、6.91 GB 和18.3 GB, 分別降低了99.72%、86.64%、78.93% 和44.20%。綜合可以看出,基于門控循環神經網絡的電網運行調度監控數據壓縮模型有效降低了集群存儲空間。
3結束語
面對國網調度監控數據存在的存儲空間大且調度效率低下等問題,研究通過將遺傳優化聚類算法與門控循環神經網絡相結合,進行了數據壓縮優化研究。基于門控循環神經網絡的電網運行調度監控數據壓縮模型有效壓縮了數據,并降低了集群存儲空間。研究僅針對壓縮效果進行分析,未考慮壓縮時間,因此未來的研究應在保障壓縮效果的同時縮短壓縮時長。