



摘要:電力系統數據具有隱私性,容易發生完整性攻擊,被注入虛假數據,造成完整性破壞,為此提出了隱私保護下的電力系統數據完整性檢測方案。因此,本文首先對電力系統數據進行去、離散化以及標準化處理,提取數據中殘差特征突變特征并融合在一起,然后采用深度神經網絡構建完整性判斷模型,實現電力系統數據完整性檢測,保護隱私數據安全,最后實施仿真實驗。測試結果表明,該方案的電力系統數據完整性檢測Kappa系數均在0.9以上,獲得了較高精度的電力系統數據完整性檢測結果。
關鍵詞:隱私保護;電力系統數據;深度神經網絡;完整性檢測
一、引言
隨著各種微電網的加入,傳統電網逐漸無法滿足調控需求。為了提高調控工作效率,智慧電網的概念被提出,成為電網公司重點發展目標。智慧電網的出現和使用,可以將電力運營的各環節聯系在一起,采集電力系統數據后,通過通信網絡將其傳輸至控制端進行挖掘和分析,使電力系統與控制終端結合更加緊密,解決了傳統電網調控不利的難題。因此電力系統數據對于智慧電網至關重要,需要作為隱私數據被嚴密保護。然而,部分不法分子利用網絡的開放性非法獲取或者破壞有價值的數據。智慧電網的數據網絡安全問題越來越突出,受到的惡性攻擊類型越來越多,發現這類問題時,啟用預先設計好的應急響應計劃,以快速穩定系統和防止進一步損失,并根據事件類型和范圍,采取相應的應急響應措施,例如隔離受影響的設備、停止服務、斷開網絡連接等,其中完整性攻擊就是典型的一種。一旦電力公司未及時識別不完整的虛假數據,將其當作真實數據進行利用,就會得出錯誤判斷和決策,給電力公司造成重大損失。
因此,對電力系統數據隱私進行保護,對電力系統數據的完整性檢測具有重要的意義。所以,本文結合研究經驗,提出一種隱私保護下的電力系統數據完整性檢測方案。通過該研究,以期為電力系統數據保護提供參考。
二、隱私保護下的電力系統隱私數據完整性檢測方案
電力系統數據具有較高的利用價值,對于電力公司發展而言具有重要意義,因此也就成為惡意攻擊的對象。惡意攻擊的目的是破壞數據的完整性,將假數據混入其中或者取代真實數據,以實現數據竊取或者破壞。這種方法由于并非改變所有數據,因此具有一定的隱蔽性,很難被發現,危害性極大。因此,為了保護電力系統數據的安全,基于隱私保護需要對電力系統數據完整性進行檢測。該研究分為三部分,即電力系統數據預處理、電力系統數據特征提取以及數據完整性判斷。
(一)電力系統數據預處理
為了檢測數據的完整性,需要提供良好的數據基礎,對數據進行預處理。本文設計的預處理方法包括數據去噪、數據標準化。通過數據去噪的離群剝離,發現與噪聲混合在一起的惡意攻擊壞數據;電力系統數據序列使完整數據和攻擊數據混合在一起,不容易檢測。因此,需要根據屬性關聯性,通過數據離散化切斷完整數據和攻擊數據的時間關聯性,僅依據屬性關聯性進行檢測。為了提高數據處理效率,對量綱不同數據進行標準化處理,使數據可以得到同步檢測,然后消除重復數據,完成數據預處理。
1.噪聲數據去除
電力系統數據經過多道“工序”才能傳輸至數據處理終端當中。該過程中,電力系統數據的質量本身會受干擾,存在噪聲數據。這些噪聲數據的存在會嚴重干擾壞數據的發現,因此預處理的第一個步驟就是去除掉噪聲數據,讓原始中只存在真實的電力系統數據,以及可能存在惡意攻擊的注入的壞數據。異常值又稱離群點,檢測方法如下:
2.電力系統數據標準化
電力系統數據存在量綱不同的問題,為了方便數據的同步處理,需要進行標準化。
3.電力業務系統重復數據剔除
目前電力系統業務系統復雜,包含大量的省側自建系統,系統之間集成錯綜復雜,數據之間存在大量的重復錄入。目前電力系統正在開展清楚數據重復錄入和雙軌制專項行動。目標為:為服務基層一線,減輕班組負擔,切實推動數字化賦能賦智,聚焦設備、營銷專業的常態、高頻次應用場景,全面盤清基層重復錄入、雙軌制情況,加強問題診斷分析,解決一批基層反映強烈的數據重復錄入問題,下線一批雙軌運行老舊系統,建立健全長效管控機制,防止重復錄入、雙軌制問題反復出現,數據重復剔除方法如下:
假設內容識別的滑動窗口固定寬度為k,在數據塊中選取一大一小兩個整數值A、b,Agt;b,則k=A-b。刪除對象數據的序列為S=S1,S2,…,Sn,若,
則位置K屬于D-match。若數據塊的指紋計算窗口邊緣位置為v,則生成子序列為。窗口內,位置K是數據塊的刪除邊界,內容檢測窗口如圖1所示。
從數據塊的首位數字開始,將K寬度的滑動窗口中的數據作為Hash函數的子序列,計算每個窗口位置的指紋。當序列中的數字滿足指定條件時,就將窗口所在位置的邊界作為數據塊的邊界。重復上述過程,直到電力系統中的數據被劃分,再用Hash函數計算出每個劃分的數據塊Hash值。
Hash函數在識別數據時具有唯一性,且識別概率較高,在一張表中記錄數據單元,并構造了存儲位置的映射函數。在數據冗余情況下,可以通過重復數據消除過程來提高檢測效率。
(二)電力系統數據特征提取
(三)電力系統數據完整性判斷
為了實現電力系統隱私數據保護,在使用前完整性檢測必不可少。通過完整性檢測能夠有效判斷是否存在惡意攻擊,以此來實現隱私保護。在這里結合深度學習算法,構建電力系統數據完整性判斷模型。該模型如圖2所示。從圖2中看出,基于深度學習的電力系統數據完整性判斷模型主要分為三層,其中隱含層由多層疊加而成。判斷模型應用分為兩部分,前一部分為訓練,后一部分為應用測試。針對前者,首先將融合后特征輸入到輸入層,經輸入層后,進入到隱含層第一層,按照下述公式進行計算,計算公式如下:
計算輸出結果Ij與訓練樣本的預期結果的差值。通過差值進行反向誤差傳播,以此調整權值和閾值。利用訓練好的電力系統數據完整性判斷模型實現完整性檢測,找出隱藏在真實數據中的壞數據,實現電力系統隱私數據保護。
三、仿真測試
將基于變色龍認證樹的檢測方法、基于多分支樹結構的檢測方法、基于索引-存根表的檢測方法作為對比項,以MATLAB實驗平臺作為對比項,驗證所研究檢測方法的對比項。電力系統數據分布式仿真環境采用Hadoop框架配置;數據時間序列串行環境采用普通PC機。實驗平臺為多個節點組成的Cluster。系統搭建Hadoop節點集群,集群通信基于MPI實現。系統數據集選擇某電力公司的開放數據集,該數據集提供多種規模數據集,將數據集寫入HDFS中。
(一)方法測試樣本
方法測試樣本由5類電力系統數據組成,即完整數據1、2和不完整數據3、4、5。每類數據的樣本數量如圖3所示。
(二)檢測結果對比分析
利用研究方法以及基于變色龍認證樹的檢測方法、基于多分支樹結構的數據完整性檢測方法、基于索引-存根表的檢測方法對電力系統數據樣本進行完整性檢測,然后根據檢測結果統計Kappa系數,結果如圖4所示。從圖4中看出,與基于變色龍認證樹的檢測方法、基于多分支樹結構的數據完整性檢測方法、基于索引-存根表的檢測方法相比,研究檢測方法的Kappa系數均更大。
四、結束語
電力系統數據對于電力公司而言具有較高的利用價值,因此在電力公司看來是一種重要的隱私數據。為了保證這些數據安全,提出一種基于隱私保護的電力系統數據完整性檢測方法,該方法對電力系統數據進行預處理,提取攻擊前后虛假數據注入前后電力系統數據呈現的殘差特征和突變特征,檢測模型由深度神經網絡構成,實現電力系統數據完整性檢測。最后通過實驗測試,研究檢測方法Kappa系數更大,證明了該方法數據完整性檢測效果較好。然而,本研究仍然有許多問題需要解決,如收集更廣泛、更全面的電力系統數據樣本、優化判斷模型參數等。
作者單位:李洪波 廣州泓盈信息科技有限公司
李曉云 北京中電普華信息技術有限公司
參考文獻
[1]薛安成,常乃超,等.電力系統同步相量異常數據檢測與修復研究現狀與展望[J].中國電機工程學報,2021,41(20):6869-6886.
[2]李秀艷,劉明曦,等.基于云存儲的動態組共享數據完整性驗證方案[J].計算機工程與設計,2022,43(06):1510-1519.
[3]李桐,王剛,等.基于變色龍認證樹的云邊端協同流式數據完整性驗證模型[J].信息網絡安全,2022,22(01):37-45.
[4]王凌宇,陸治軍,張向東等.基于多分支樹結構的電力繳費終端數據完整性驗證方案[J].重慶郵電大學學報(自然科學版),2020,32(03):377-384.
[5]趙海春,鄭雪峰等.基于索引-存根表的云存儲數據完整性審計[J].工程科學學報,2020,42(04):490-499.
[6]陳麗莎,李雪蓮,高軍濤.支持數據完整性驗證的可問責數據交易方案[J].系統工程與電子技術,2022,44(04):1364-1371.
[7]李慶丹,張澤輝,等.支持隱私保護和公平支付的數據完整性驗證方案[J].計算機研究與發展,2022,59(06):1343-1355.
[8]王春波等.基于標簽分類的云數據完整性驗證審計方案[J].吉林大學學報(工學版),2021,51(04):1364-1369.