劉曉霞,周明哲
(國(guó)網(wǎng)內(nèi)蒙古東部電力有限公司信息通信分公司,內(nèi)蒙古 呼和浩特 010010)
智能電網(wǎng),其實(shí)就是應(yīng)用信息與通信技術(shù)智能化、全系統(tǒng)管理電力系統(tǒng)的輸電、發(fā)電、變電及用電情況。智能電網(wǎng)為我國(guó)電力行業(yè)產(chǎn)品創(chuàng)新與有效管理提供了技術(shù)保障,但在電力系統(tǒng)建設(shè)期間,智能電網(wǎng)信息采集是否完整和真實(shí),通常會(huì)對(duì)其運(yùn)行效果產(chǎn)生重大影響[1]。所以,有必要深度挖掘智能電網(wǎng)信息異常數(shù)據(jù)。陳杰等學(xué)者結(jié)合孤立森林算法與Wasserstein 生成式對(duì)抗網(wǎng)絡(luò),并提出異常數(shù)據(jù)辨識(shí)方法。對(duì)距離生成對(duì)抗網(wǎng)絡(luò)(英文簡(jiǎn)稱WGAN)交互訓(xùn)練生成器與判別器進(jìn)行有效融合,將電力統(tǒng)計(jì)數(shù)據(jù)分布特征提取出來(lái),借助隔離樹算法識(shí)別均衡數(shù)據(jù),再對(duì)模型識(shí)別查全率、準(zhǔn)確率和查準(zhǔn)率等展開比較,研究結(jié)果發(fā)現(xiàn),這一異常數(shù)據(jù)強(qiáng)化算法能夠大大提升異常數(shù)據(jù)識(shí)別能力。學(xué)者李婧等在大規(guī)模電網(wǎng)異常負(fù)荷聚類中運(yùn)用自適應(yīng)k-means++,并檢驗(yàn)了不同聚類狀態(tài)下的聚類結(jié)果,有效防止人工設(shè)置產(chǎn)生的聚類結(jié)果偏移,實(shí)現(xiàn)異常負(fù)荷分類精度的有效提升。本文在數(shù)據(jù)挖掘中應(yīng)用云計(jì)算技術(shù),基于智能電網(wǎng)信息流特性,將異常數(shù)據(jù)輸入空間映射至特征空間,從而實(shí)現(xiàn)異常數(shù)據(jù)線性判定函數(shù)的構(gòu)造。
信息數(shù)據(jù)挖掘,指的是數(shù)據(jù)倉(cāng)或數(shù)據(jù)庫(kù)內(nèi),通過(guò)各種分析技術(shù),分析、歸納和整理以往積累的繁雜數(shù)據(jù),提取有用信息數(shù)據(jù),為決策者提供有用的資訊資料,其中包括離群分析、分類算法、關(guān)聯(lián)規(guī)則等。當(dāng)前,針對(duì)電力系統(tǒng)的特點(diǎn),提出了一種基于概率論的電力系統(tǒng)建模方法。評(píng)價(jià)適合于只對(duì)少數(shù)網(wǎng)絡(luò)信息數(shù)據(jù)進(jìn)行處理的電力系統(tǒng)模擬模式等,面對(duì)海量數(shù)據(jù)處理,應(yīng)改進(jìn)傳統(tǒng)算法,可采用預(yù)測(cè)算法與聚類算法,改進(jìn)傳統(tǒng)信息數(shù)據(jù)挖掘算法,最后,將該方法用于電力系統(tǒng)的負(fù)載預(yù)報(bào)和電力消費(fèi)的研究中。
本項(xiàng)目擬從云計(jì)算的基本特征出發(fā),針對(duì)智慧電網(wǎng)應(yīng)用的實(shí)際應(yīng)用,提出了一種新的解決方案:云基礎(chǔ)設(shè)施層、平臺(tái)層、應(yīng)用軟件集合層、業(yè)務(wù)接入層。由于智能電網(wǎng)的網(wǎng)絡(luò)規(guī)模很大,任何一個(gè)節(jié)點(diǎn)或者一個(gè)計(jì)算機(jī)終端的運(yùn)算需求都必須通過(guò)云端來(lái)進(jìn)行配置;這樣一來(lái),中央的壓力就更大了,而且權(quán)限的判斷也很繁瑣,極易導(dǎo)致網(wǎng)絡(luò)阻塞。因?yàn)殡娏ο到y(tǒng)有著清晰的分層空中、分級(jí)管理層次,所以,可根據(jù)級(jí)別創(chuàng)建主云與子云,以限定權(quán)限與資源分配,減少了對(duì)系統(tǒng)中多余的資源分配和權(quán)限的管理,實(shí)現(xiàn)云計(jì)算資源的合理化,同時(shí)該系統(tǒng)還可以實(shí)現(xiàn)對(duì)電力系統(tǒng)的實(shí)時(shí)處理。
智能電網(wǎng)信息數(shù)據(jù)驅(qū)動(dòng)體系中,通過(guò)云計(jì)算技術(shù)搭建智能電網(wǎng)信息異常數(shù)據(jù)處理平臺(tái),借助該云計(jì)算軟件,對(duì)數(shù)據(jù)計(jì)算單元進(jìn)行設(shè)置,以展開數(shù)據(jù)處理,同時(shí)在輸出端與區(qū)塊鏈系統(tǒng)相連接,區(qū)塊鏈選擇分布式數(shù)據(jù)存儲(chǔ),表現(xiàn)為加密算法、對(duì)點(diǎn)傳輸以及共識(shí)機(jī)制等特性,將其應(yīng)用在智能電網(wǎng)中,既有助于永久性存儲(chǔ)數(shù)據(jù),又具備數(shù)據(jù)保密特性,便于用戶數(shù)據(jù)共享[2]。
在構(gòu)建智能電網(wǎng)的過(guò)程中,節(jié)點(diǎn)j 是一個(gè)數(shù)據(jù)點(diǎn),j 表示的是信息流任意數(shù)據(jù)點(diǎn),aj表示的是智能電網(wǎng)信息流,En表示的是信息流輸入空間,n 為空間維度。通過(guò)φ(.):En→G映射電網(wǎng)信息流輸入空間至特征空間,因此,在該特征空間構(gòu)建了一種用于電力系統(tǒng)的信息流動(dòng)的線性決策方程,具體公式為:f(a)=εT.φ(a)-p,該公式中,φ(a)表示智能電網(wǎng)的信息流映射向量,線性判定函數(shù)f(a)偏移量采用P 表示,T 時(shí)刻下f(a)歸一化矢量采用εT表示。轉(zhuǎn)化p、εT的二次規(guī)劃問(wèn)題為對(duì)偶問(wèn)題,通過(guò)精準(zhǔn)判斷其極值條件,對(duì)智能電網(wǎng)信息異常數(shù)據(jù)進(jìn)行有效挖掘,具體公式為:
在該公式中,K(aj,a)為智能電網(wǎng)信息異常數(shù)據(jù)監(jiān)測(cè)函數(shù),信息異常數(shù)據(jù)監(jiān)測(cè)響應(yīng)系數(shù)由λj表示[3]。
明確電網(wǎng)信息異常數(shù)據(jù)隸屬度,對(duì)信息異常數(shù)據(jù)的多維度屬性進(jìn)行了高效的抽取,然后對(duì)其進(jìn)行了清晰的劃分,并用公式對(duì)信息異常數(shù)據(jù)進(jìn)行了計(jì)算,從而對(duì)其求解,公式是:
該公式中,x 代表的是智能電網(wǎng)信息異常數(shù)據(jù)的目標(biāo)函數(shù)值,δpq為異常信息數(shù)據(jù)特征向量隸屬度,代表的是第a、b 個(gè)異常信息數(shù)據(jù)之間的距離。以信息異常數(shù)據(jù)為基礎(chǔ),以此為基礎(chǔ),有效地提取智能電網(wǎng)中的異常信息特征。公式表示是:
該公式中,M 是指網(wǎng)絡(luò)狀態(tài)下的異常值與簇群中心的間距,φ代表了網(wǎng)絡(luò)異常狀態(tài)下的權(quán)重。根據(jù)信息異常數(shù)據(jù)x 的資訊熵,將智能電網(wǎng)信息的異常數(shù)據(jù)輸入云端,并對(duì)其進(jìn)行參數(shù)關(guān)聯(lián)程度的計(jì)算,具體為:
該公式中,β代表的是信息異常數(shù)據(jù)特征相關(guān)參數(shù)關(guān)聯(lián)系數(shù)[4]。
利用云計(jì)算技術(shù),預(yù)處理智能電網(wǎng)內(nèi)部異常數(shù)據(jù)信息,并對(duì)其進(jìn)行高效挖掘。在對(duì)智能電網(wǎng)內(nèi)部異常信息數(shù)據(jù)進(jìn)行挖掘期間,將信息異常數(shù)據(jù)的復(fù)雜性定義為f(pq),那么,智能電網(wǎng)數(shù)據(jù)庫(kù)包括:p 個(gè)異常數(shù)據(jù)庫(kù)和q 個(gè)正常數(shù)據(jù)庫(kù),經(jīng)過(guò)反復(fù)篩選之后,得到了如下的公式:f(pq)=f(qo),p≠q,該公式中,異常信息數(shù)據(jù)特征數(shù)由o 表示。
在篩選出的異常信息資料的基礎(chǔ)上,準(zhǔn)確地計(jì)算出智能電網(wǎng)的異常信息資料在空間上的分布,求解電力系統(tǒng)中的異常信息的權(quán)重,具體公式是:
該公式中,ωi表示的是第i 類別中的智能電網(wǎng)信息異常數(shù)據(jù)對(duì)應(yīng)權(quán)值,而ξi代表的是智能電網(wǎng)信息異常數(shù)據(jù)的波動(dòng)系數(shù)[5]。
為對(duì)云計(jì)算下的智能電網(wǎng)信息異常數(shù)據(jù)挖掘性能進(jìn)行有效驗(yàn)證,通過(guò)實(shí)驗(yàn)平臺(tái)的搭建,展開測(cè)試,采用Windows 11 系統(tǒng),同時(shí)搭載頻率為200GHz、8GB 內(nèi)存的CORE i8 系統(tǒng)處理器,使用MySQL 2020 作為電力網(wǎng)絡(luò)中的異常數(shù)據(jù)源,并使用Java 軟件來(lái)建立試驗(yàn)數(shù)據(jù)源。
通過(guò)對(duì)一個(gè)實(shí)際的電力系統(tǒng)的實(shí)際運(yùn)行資料進(jìn)行分析,選取了200 條異常資料,其中,接地故障49 條,電壓故障34 條,共計(jì)26 次故障和91 次發(fā)電設(shè)備故障。
為確保電網(wǎng)信息異常數(shù)據(jù)挖掘質(zhì)量,采用準(zhǔn)確率指數(shù)來(lái)度量電力系統(tǒng)中異常信息的挖掘準(zhǔn)確度,如果存在較高的查準(zhǔn)率,說(shuō)明電網(wǎng)具有越高的信息異常數(shù)據(jù)挖掘精度。查準(zhǔn)率計(jì)算公式為:
其中,Gp為電網(wǎng)信息異常數(shù)據(jù)特征關(guān)聯(lián)度,Tr為電網(wǎng)信息異常數(shù)據(jù)采集周期,而hb代表的是智能電網(wǎng)的異常資料特征。
對(duì)電力系統(tǒng)中的異常信息資料進(jìn)行了挖掘,利用冗余指數(shù)對(duì)電力系統(tǒng)中的異常信息資料進(jìn)行分析,計(jì)算公式為:
該公式中,ψj為電網(wǎng)異常信息數(shù)據(jù)挖掘均衡性,S則為電網(wǎng)異常信息數(shù)據(jù)觀測(cè)向量。
該實(shí)驗(yàn)為突出基于云計(jì)算的電網(wǎng)信息異常數(shù)據(jù)挖掘優(yōu)越性,比較了兩種基于適應(yīng)性的K-means++和基于改進(jìn)的支持型對(duì)抗網(wǎng)絡(luò)兩種不同的數(shù)據(jù)挖掘方法。在模擬實(shí)驗(yàn)平臺(tái)中,對(duì)三種方法的異常數(shù)據(jù)挖掘冗余度、查準(zhǔn)率展開挖掘,最后發(fā)現(xiàn),在檢驗(yàn)智能電網(wǎng)信息異常挖掘精度的同時(shí),由于數(shù)據(jù)規(guī)模不斷增大,三種算法的準(zhǔn)確率也在不斷提高,其中,基于云計(jì)算的電力系統(tǒng)異常挖掘準(zhǔn)確率最高。針對(duì)200 個(gè)電力系統(tǒng)中的異常數(shù)據(jù),其準(zhǔn)確率達(dá)到98.9%;當(dāng)有200 個(gè)電力網(wǎng)絡(luò)資料不正常時(shí),該算法的召回率僅為72.3%,適用于進(jìn)行異常數(shù)據(jù)的分析。在圖1 中顯示了電力系統(tǒng)信息的異常數(shù)據(jù)挖掘的冗余。

圖1 電網(wǎng)信息異常數(shù)據(jù)挖掘的冗余度
通過(guò)分析圖1 可知,針對(duì)當(dāng)前電力系統(tǒng)中的異常數(shù)據(jù)日益增多,現(xiàn)有三種挖掘方法的冗余程度都小于50%,采用基于K 均值和基于改進(jìn)的產(chǎn)生式對(duì)抗網(wǎng)絡(luò)的電力系統(tǒng)異常挖掘技術(shù),可使電力系統(tǒng)的異常挖掘冗余超過(guò)20%,應(yīng)用本文所提出的方法對(duì)信息異常數(shù)據(jù)進(jìn)行挖掘,雖然有200 個(gè)信息異常,但冗余還是不到10%,可見基于云計(jì)算的智能電網(wǎng)信息異常數(shù)據(jù)挖掘,有助于數(shù)據(jù)挖掘質(zhì)量的提升。
基于云計(jì)算下的智能電網(wǎng)信息異常數(shù)據(jù)挖掘中,深入分析智能電網(wǎng)中的異常數(shù)據(jù),能夠?qū)崿F(xiàn)對(duì)信息異常數(shù)據(jù)準(zhǔn)確性、挖掘效率的全面提升。但該研究仍有一系列缺陷,主要是智能電網(wǎng)信息異常數(shù)據(jù)通常會(huì)由于時(shí)間的變遷而發(fā)生變化,所以挖掘?qū)崟r(shí)狀態(tài)的電網(wǎng)信息異常數(shù)據(jù)是今后需重點(diǎn)研究的課題之一。