陳天宇
(廣東電網(wǎng)有限責(zé)任公司汕尾供電局, 廣東 汕尾 516600)
電力系統(tǒng)作為關(guān)鍵基礎(chǔ)設(shè)施之一,積累了大量的敏感數(shù)據(jù),包括能源交易信息、用戶(hù)隱私數(shù)據(jù)和網(wǎng)絡(luò)安全相關(guān)數(shù)據(jù)等。然而,隨著電力系統(tǒng)的數(shù)字化和信息化程度不斷提高,電力公司面臨著日益增長(zhǎng)的敏感數(shù)據(jù)泄露風(fēng)險(xiǎn)。電力敏感數(shù)據(jù)泄露可能帶來(lái)嚴(yán)重后果。
1)商業(yè)機(jī)密的泄露將導(dǎo)致競(jìng)爭(zhēng)劣勢(shì)和經(jīng)濟(jì)損失。泄露的市場(chǎng)分析、價(jià)格策略和財(cái)務(wù)數(shù)據(jù)等信息可能被惡意競(jìng)爭(zhēng)對(duì)手利用,對(duì)電力公司的業(yè)務(wù)和聲譽(yù)造成負(fù)面影響。
2)用戶(hù)隱私的泄露會(huì)對(duì)個(gè)人權(quán)益產(chǎn)生威脅。電力公司持有用戶(hù)的個(gè)人信息和能源使用情況,如果這些信息遭到竊取和濫用,將對(duì)個(gè)人隱私安全構(gòu)成嚴(yán)重風(fēng)險(xiǎn)。
3)數(shù)據(jù)泄漏還會(huì)引起電力系統(tǒng)的出現(xiàn)安全漏洞,促使網(wǎng)絡(luò)安全受到脅迫,進(jìn)而影響電力供應(yīng)的穩(wěn)定性和可靠性。
目前,傳統(tǒng)的數(shù)據(jù)泄露監(jiān)測(cè)方法主要基于規(guī)則和統(tǒng)計(jì)模型,往往無(wú)法適應(yīng)復(fù)雜的場(chǎng)景和新型的攻擊方式。因此,需要引入更先進(jìn)的方法來(lái)進(jìn)行電力敏感數(shù)據(jù)泄露風(fēng)險(xiǎn)監(jiān)測(cè)。基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的方法在圖像處理、自然語(yǔ)言處理等問(wèn)題取得很大的勝利,并在深度學(xué)習(xí)中展現(xiàn)出了強(qiáng)大的特征提取和模式識(shí)別能力。將CNN 引入電力敏感數(shù)據(jù)泄露風(fēng)險(xiǎn)監(jiān)測(cè)中,可以自動(dòng)地學(xué)習(xí)數(shù)據(jù)中隱藏的模式和規(guī)律,并進(jìn)行實(shí)時(shí)的異常檢測(cè)和預(yù)警。
近年來(lái)已經(jīng)有很多學(xué)者對(duì)泄露電力敏感數(shù)據(jù)風(fēng)險(xiǎn)監(jiān)測(cè)方法開(kāi)始分析,文獻(xiàn)[1]提出了基于SOM聚類(lèi)的電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警方法,文獻(xiàn)[2]提出了基于大數(shù)據(jù)分析的公安核心業(yè)務(wù)數(shù)據(jù)防泄露方法。但這些方法存在一些缺點(diǎn)。基于SOM聚類(lèi)的方法可能依賴(lài)于初始參數(shù)選擇和數(shù)據(jù)集特征,導(dǎo)致聚類(lèi)不準(zhǔn)確或模型不穩(wěn)定。該方法可能只關(guān)注特定的電力運(yùn)行數(shù)據(jù)特征,忽略其他重要特征,可能導(dǎo)致監(jiān)測(cè)不全面。另外,該方法可能需要進(jìn)行數(shù)據(jù)預(yù)處理和處理,增加了額外的時(shí)間和努力。而基于大數(shù)據(jù)分析的方法可能受限于特定領(lǐng)域的應(yīng)用,需要復(fù)雜的數(shù)據(jù)處理和分析,以及對(duì)數(shù)據(jù)隱私和安全性的保護(hù)。
為解決上述方法中存在的問(wèn)題,本研究旨在基于卷積神經(jīng)網(wǎng)絡(luò)開(kāi)發(fā)一種電力敏感數(shù)據(jù)泄露風(fēng)險(xiǎn)監(jiān)測(cè)方法,以提高對(duì)電力系統(tǒng)中敏感數(shù)據(jù)泄露的檢測(cè)能力和響應(yīng)速度。通過(guò)深度學(xué)習(xí)技術(shù)的應(yīng)用,提高泄露風(fēng)險(xiǎn)的識(shí)別準(zhǔn)確性,并及時(shí)采取措施保護(hù)敏感數(shù)據(jù)的安全性。該研究對(duì)于電力行業(yè)保護(hù)敏感數(shù)據(jù),防范數(shù)據(jù)泄露風(fēng)險(xiǎn),維護(hù)電力系統(tǒng)安全和可靠運(yùn)行具有重要意義。
電力敏感數(shù)據(jù)預(yù)處理是指在進(jìn)行數(shù)據(jù)分析和處理之前,對(duì)電力敏感數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換和歸一化的過(guò)程。這一步驟對(duì)于后續(xù)的數(shù)據(jù)分析和風(fēng)險(xiǎn)監(jiān)測(cè)非常重要,因?yàn)樗軌驇椭岣邤?shù)據(jù)的質(zhì)量和可靠性,從而確保得到準(zhǔn)確的結(jié)果。首先需要對(duì)原始數(shù)據(jù)進(jìn)行清洗。這包括去除重復(fù)的數(shù)據(jù)點(diǎn)、處理缺失值,并進(jìn)行異常值檢測(cè)和處理。清洗后的數(shù)據(jù)將更加整潔和可靠,有助于后續(xù)分析的準(zhǔn)確性。清洗過(guò)程可以表示為:
式中:X 為原始數(shù)據(jù)集;xi為數(shù)據(jù)點(diǎn);xclean為經(jīng)過(guò)清洗后的數(shù)據(jù)集。
通過(guò)將數(shù)據(jù)進(jìn)行轉(zhuǎn)換,可以將其表達(dá)成更具可解釋性和可比性的形式[3]。例如,可以將時(shí)間序列數(shù)據(jù)轉(zhuǎn)換為頻域表示或相關(guān)統(tǒng)計(jì)特征。另外,根據(jù)不同度量單位數(shù)據(jù),需要經(jīng)過(guò)歸一化管理,來(lái)保證它們?cè)谕粋€(gè)數(shù)據(jù)范圍內(nèi),避免某個(gè)維度對(duì)分析結(jié)果產(chǎn)生過(guò)大的影響。數(shù)據(jù)轉(zhuǎn)換可以表示為:
式中:f(X)為數(shù)據(jù)轉(zhuǎn)換函數(shù);Xtransformed為轉(zhuǎn)換后的數(shù)據(jù)集。
通過(guò)選擇最具信息量和相關(guān)性的特征[4],可以減少計(jì)算負(fù)荷并去除冗余信息,提高數(shù)據(jù)處理的效率。特征提取可以表示為:
式中:g(Xtransformed)為特征選擇函數(shù);Xselected為通過(guò)特征選擇后的數(shù)據(jù)集。
通過(guò)清洗、轉(zhuǎn)換和歸一化等技術(shù)手段,可以提高數(shù)據(jù)質(zhì)量和可靠性,為后續(xù)的分析和決策提供有力支持。
構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)監(jiān)測(cè)模型是為了有效地應(yīng)對(duì)電力敏感數(shù)據(jù)泄露風(fēng)險(xiǎn)的挑戰(zhàn)。在這個(gè)過(guò)程中,可以利用CNN 的優(yōu)勢(shì)來(lái)從數(shù)據(jù)中學(xué)習(xí)和識(shí)別模式[5-7],以便準(zhǔn)確地檢測(cè)和預(yù)測(cè)潛在的敏感數(shù)據(jù)泄露風(fēng)險(xiǎn)。
首先,為了構(gòu)建一個(gè)基于CNN 的監(jiān)測(cè)模型,須要計(jì)劃神經(jīng)網(wǎng)絡(luò)的構(gòu)造。全面的網(wǎng)絡(luò)的輸入與輸出表示為:
式中:Xinput為通過(guò)特征選擇后的輸入數(shù)據(jù)集;Youtput為相對(duì)的輸出類(lèi)別集合。
接下來(lái),需要定義CNN 模型的損失函數(shù),用于衡量模型在訓(xùn)練過(guò)程中的誤差。損失函數(shù)的公式表示如下:
式中:L(θ)為單個(gè)樣本的損失函數(shù);f(xi,θ)為通過(guò)CNN 模型計(jì)算得到的預(yù)測(cè)輸出;yi為真實(shí)的輸出類(lèi)別;θ 為CNN 模型的參數(shù);N 表示樣本數(shù)量。
為了優(yōu)化CNN 模型的性能,須要選隨機(jī)梯度下降(Stochastic Gradient Descent,SGD)以此更新參數(shù)的模型。參數(shù)更新的計(jì)算公式具體如下:
式中:θt為第t 個(gè)迭代步驟的參數(shù)模型;η 為學(xué)習(xí)率;為損失函數(shù)對(duì)參數(shù)模型的梯度。
通過(guò)以上步驟,可以構(gòu)建一個(gè)基于卷積神經(jīng)網(wǎng)絡(luò)的監(jiān)測(cè)模型,用于有效地監(jiān)測(cè)電力敏感數(shù)據(jù)泄露風(fēng)險(xiǎn)。該模型將從數(shù)據(jù)中學(xué)習(xí)并識(shí)別關(guān)鍵特征[8-10],為決策者提供準(zhǔn)確的風(fēng)險(xiǎn)預(yù)測(cè)和監(jiān)測(cè)結(jié)果。基于卷積神經(jīng)網(wǎng)絡(luò)的電力敏感數(shù)據(jù)泄露風(fēng)險(xiǎn)監(jiān)測(cè)流程圖如圖1 所示。

圖1 卷積神經(jīng)網(wǎng)絡(luò)的電力敏感數(shù)據(jù)泄露風(fēng)險(xiǎn)監(jiān)測(cè)流程
為實(shí)現(xiàn)本文研究的方法的穩(wěn)定性,分別使用文獻(xiàn)[1]方法、文獻(xiàn)[2]方法和本文方法對(duì)電力敏感數(shù)據(jù)泄露風(fēng)險(xiǎn)進(jìn)行監(jiān)測(cè),以監(jiān)測(cè)誤差率為指標(biāo),對(duì)比其可靠性。誤差率越低,其中檢測(cè)穩(wěn)定性越高,對(duì)比結(jié)果具體如下。
通過(guò)對(duì)圖2 的分析可得知,本文方法在監(jiān)測(cè)誤差率方面表現(xiàn)出色,始終保持在20%以下,而其他兩種方法的誤差率則超過(guò)了60%。這顯著展示了本文方法相對(duì)于其他方法在減少誤報(bào)方面的改進(jìn)。準(zhǔn)確度是評(píng)估一個(gè)監(jiān)測(cè)方法可靠性的重要指標(biāo),而較低的誤差率意味著本文方法更能夠有效地識(shí)別和預(yù)測(cè)電力敏感數(shù)據(jù)泄露風(fēng)險(xiǎn)。基于這些結(jié)果,可以得出結(jié)論,本文方法具有更高的監(jiān)測(cè)準(zhǔn)確率,并且在實(shí)際場(chǎng)景中表現(xiàn)更為可靠。本文方法的優(yōu)勢(shì)可能源于多個(gè)方面。首先,本文方法可能采用了更先進(jìn)和精準(zhǔn)的數(shù)據(jù)處理和特征提取算法,使得模型能夠更好地學(xué)習(xí)和識(shí)別敏感數(shù)據(jù)泄露的模式和特征。其次,該方法可能充分考慮了與電力敏感數(shù)據(jù)泄露相關(guān)的因素,包括特定的數(shù)據(jù)類(lèi)型、運(yùn)行環(huán)境和風(fēng)險(xiǎn)指標(biāo)等,從而提高了監(jiān)測(cè)的精確性和可靠性。另外,還可能使用更大規(guī)模的數(shù)據(jù)集通過(guò)練習(xí)與論證,鞏固模型的泛化能力。

圖2 電力敏感數(shù)據(jù)泄露風(fēng)險(xiǎn)監(jiān)測(cè)誤差率對(duì)比
為了進(jìn)一步驗(yàn)證本文方法的有效性,以預(yù)測(cè)完成的時(shí)間為標(biāo)準(zhǔn),分別采用本文方法、文獻(xiàn)[1]方法、文獻(xiàn)[2]方法對(duì)電力敏感數(shù)據(jù)泄露風(fēng)險(xiǎn)進(jìn)行監(jiān)測(cè),其時(shí)間越短,效率越高,越具有有效性。具體的對(duì)比結(jié)果如表1 所示。

表1 不同方法作用下對(duì)電力敏感數(shù)據(jù)泄露風(fēng)險(xiǎn)監(jiān)測(cè)時(shí)間
根據(jù)對(duì)表1 的詳細(xì)分析,可以明顯地看出本文所提出的基于卷積神經(jīng)網(wǎng)絡(luò)的電力敏感數(shù)據(jù)泄露風(fēng)險(xiǎn)監(jiān)測(cè)方法在監(jiān)測(cè)過(guò)程中所需的時(shí)間僅為10 s。與之相比,文獻(xiàn)[1]所使用的方法需要約60 s 的時(shí)間,而文獻(xiàn)[2]的方法則需要大約78 s。這一結(jié)果清晰地顯示出本文方法具有更快的響應(yīng)速度和更高的監(jiān)測(cè)效率。
本文方法實(shí)現(xiàn)高效監(jiān)測(cè)的原因可能有多個(gè)方面。首先,將卷積神經(jīng)網(wǎng)絡(luò)用于電力敏感數(shù)據(jù)泄露風(fēng)險(xiǎn)監(jiān)測(cè),利用其并行計(jì)算和有效的特征提取能力,加速了數(shù)據(jù)處理和模式識(shí)別過(guò)程。其次,在方法設(shè)計(jì)中可能采用了相應(yīng)的優(yōu)化策略和算法,使得模型在處理大規(guī)模數(shù)據(jù)時(shí)更加高效。此外,可能還采用了并行計(jì)算的技術(shù)或硬件加速器來(lái)提高計(jì)算速度。基于以上結(jié)果,可以得出結(jié)論,本文所提出的基于卷積神經(jīng)網(wǎng)絡(luò)的電力敏感數(shù)據(jù)泄露風(fēng)險(xiǎn)監(jiān)測(cè)方法在處理時(shí)間上具備明顯的優(yōu)勢(shì)。快速響應(yīng)和高效監(jiān)測(cè)對(duì)于及時(shí)掌握和應(yīng)對(duì)潛在風(fēng)險(xiǎn)至關(guān)重要,尤其是在電力領(lǐng)域這樣對(duì)實(shí)時(shí)性要求較高的環(huán)境中。
提出了基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的電力工程造價(jià)數(shù)據(jù)異常的識(shí)別方法在研究中顯示出了良好的準(zhǔn)確性和魯棒性。該方法通過(guò)大量數(shù)據(jù)的收集和預(yù)處理,很好的設(shè)計(jì)包含卷積層、池化層與全連接層的CNN 模型,用于學(xué)習(xí)和識(shí)別異常造價(jià)數(shù)據(jù)的模式。實(shí)驗(yàn)證明該方法具有潛在的應(yīng)用前景。
現(xiàn)代工業(yè)經(jīng)濟(jì)和信息化2023年11期