999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數(shù)據(jù)挖掘的電力自動(dòng)化系統(tǒng)運(yùn)行數(shù)據(jù)中臺資源檢索技術(shù)研究

2023-06-14 02:07:48張旭東謝民黃建平王政
關(guān)鍵詞:數(shù)據(jù)挖掘

張旭東 謝民 黃建平 王政

摘要:目前,電網(wǎng)包含了大量多源信息數(shù)據(jù)。想要對其數(shù)據(jù)信息進(jìn)行高效、準(zhǔn)確的檢索并非易事。為了解決這一問題,經(jīng)過查閱文獻(xiàn)資料,分析實(shí)際電力運(yùn)行系統(tǒng)的數(shù)據(jù)特點(diǎn)及多源數(shù)據(jù)庫樣本,引入了基于互信息和并行計(jì)算理論的優(yōu)化式?jīng)Q策樹算法,并在此基礎(chǔ)上構(gòu)建了決策樹模型,最后設(shè)置仿真實(shí)驗(yàn)以各種系統(tǒng)數(shù)據(jù)庫為樣例對模型進(jìn)行模擬驗(yàn)證。結(jié)果發(fā)現(xiàn)基于互信息和并行計(jì)算的優(yōu)化式?jīng)Q策樹算法對于大型數(shù)據(jù)庫可以實(shí)現(xiàn)迅速、精確、有效的多源數(shù)據(jù)檢索目的,同時(shí)還可以完成對實(shí)時(shí)數(shù)據(jù)的有效處理。該算法按照代表性特征集合直接對數(shù)據(jù)庫的原始數(shù)據(jù)進(jìn)行挖掘,并根據(jù)索引信息量大小進(jìn)行排序。以改進(jìn)的決策樹算法為核心技術(shù)的數(shù)據(jù)挖掘方法具有較高的精度,對于電網(wǎng)的多源數(shù)據(jù)信息能夠較好的實(shí)現(xiàn)挖掘,不但能避免數(shù)據(jù)重復(fù)現(xiàn)象,而且可以滿足工程的決策要求,為提高電網(wǎng)數(shù)據(jù)的高效挖掘提供了可靠的技術(shù)支撐。

關(guān)鍵詞:數(shù)據(jù)挖掘;電力運(yùn)行系統(tǒng);互信息;決策樹;仿真實(shí)驗(yàn)

中圖分類號:S816.2文獻(xiàn)標(biāo)志碼:A文章編號:1001-2443(2023)02-0119-07

引言

目前,隨著智能電網(wǎng)的持續(xù)開發(fā),電網(wǎng)運(yùn)維產(chǎn)生的數(shù)據(jù)量呈指數(shù)級擴(kuò)大,電力行業(yè)開始進(jìn)入大數(shù)據(jù)時(shí)代[1]。電力大數(shù)據(jù)不僅包含了大數(shù)據(jù)的廣義特征,即數(shù)據(jù)量大、數(shù)據(jù)類別多、數(shù)據(jù)發(fā)展速度快、數(shù)據(jù)價(jià)值密度低,還承載著能源行業(yè)的獨(dú)特標(biāo)志,包括大量多維時(shí)空數(shù)據(jù)、相關(guān)數(shù)據(jù)和實(shí)時(shí)響應(yīng)數(shù)據(jù)[2]。另外,這些電力數(shù)據(jù)分別集成在貫通調(diào)度管理系統(tǒng)、生產(chǎn)管理系統(tǒng)、地理信息系統(tǒng)、用電信息管理系統(tǒng)等不同的信息管理系統(tǒng)中。并且,不同的管理平臺之間的數(shù)據(jù)互不兼容,它們之間包括很多重疊數(shù)據(jù)[3]。另一方面,這些多源數(shù)據(jù)也具有互補(bǔ)關(guān)系,包括多種多樣的電力運(yùn)行信息。因此,如何利用現(xiàn)有信息管理系統(tǒng)的信息,迅速、精確地檢索所需信息,是構(gòu)建配電網(wǎng)多維數(shù)據(jù)融合管理系統(tǒng)的基礎(chǔ)和關(guān)鍵[4]。

現(xiàn)階段,電力物聯(lián)網(wǎng)發(fā)展正處于泛化的特殊時(shí)期,因此,對于電網(wǎng)多源數(shù)據(jù)的檢索就需要更加準(zhǔn)確、高效以及采用獨(dú)特的開發(fā)方法。也就是說,現(xiàn)有的信息檢索方法大多與電網(wǎng)數(shù)據(jù)特征不相匹配,所以找到適應(yīng)電網(wǎng)數(shù)據(jù)特點(diǎn)的信息檢索方法就顯得尤為關(guān)鍵[5]。例如,基于電網(wǎng)事故信息并且采取分類以及回歸算法的檢索方式的提出[6];以電力數(shù)據(jù)維數(shù)特征為背景,給出以流形排序?yàn)榛A(chǔ)的電網(wǎng)數(shù)據(jù)信息檢索方式[7];針對電網(wǎng)數(shù)據(jù)組成結(jié)構(gòu)繁雜的特點(diǎn),提出的一種以B+樹和倒排索引相結(jié)合的多模塊索引結(jié)構(gòu)[8];根據(jù)海量電網(wǎng)狀態(tài)監(jiān)測數(shù)據(jù)管理平臺的架構(gòu)體系和作用,設(shè)計(jì)的一種基于Map Reduce的海量數(shù)據(jù)檢索方式[9];利用模糊特征聚類方法對電力數(shù)據(jù)實(shí)施劃分,提取特征向量,然后采取云計(jì)算手段完成分布式檢索[10]。然而,決策樹算法作為一種適用于數(shù)據(jù)分類和檢索的手段,不僅可以提高檢索的精準(zhǔn)度,也能實(shí)現(xiàn)信息檢索速度的加快。現(xiàn)階段,常用的決策樹核心算法為ID3(Iterative Dichotomiser 3)算法,該算法利用信息熵來對分類進(jìn)行判斷,并且對系統(tǒng)的有序程度進(jìn)行衡量,以此來完成區(qū)分任務(wù)。ID3算法不但能夠在樣本劃分時(shí)以信息最大屬性為選取依據(jù),而且還可以對算法的速度以及精度進(jìn)一步加強(qiáng)[11]。另外,除了ID3算法,其它常用的決策樹算法還包括C4.5(Classification 4.5)、Sprint、PUBLIC(Pruning and Building Integrated in Classification)等算法[12],這些算法都是以ID3算法為基礎(chǔ)優(yōu)化形成的,所以對于更多的實(shí)際問題都能夠進(jìn)行針對性的處理。

現(xiàn)有的電力系統(tǒng)數(shù)據(jù)檢索技術(shù)大部分是通過對海量數(shù)據(jù)庫的直接檢索來完成用戶的查詢要求,這種方式顯然存在花費(fèi)時(shí)間長且準(zhǔn)確度較低等問題。另外,大部分檢索方法的適用范圍較局限,比如只適用于文本數(shù)據(jù)和Web數(shù)據(jù),但對存在多源數(shù)據(jù)的電力系統(tǒng)數(shù)據(jù)庫進(jìn)行檢索時(shí),就顯得不太適用。因此,為了解決上述問題,首先將決策樹算法引入到電力運(yùn)行系統(tǒng)中,其次利用互信息理論對決策樹算法進(jìn)行優(yōu)化,以此設(shè)計(jì)出電力系統(tǒng)檢索模型,最后設(shè)置仿真實(shí)驗(yàn)對算法以及檢索模型效果進(jìn)行驗(yàn)證。希望此方法能夠提高電力系統(tǒng)的信息檢索能力,從而方便相關(guān)工程人員使用。

1 材料與方法

1.1 改進(jìn)的決策樹信息檢索算法

1.1.1 決策樹算法 決策樹算法是一種逼近離散函數(shù)值的方法。它是一種典型的分類方法,首先對數(shù)據(jù)進(jìn)行處理,利用歸納算法生成可讀的規(guī)則和決策樹,然后使用決策對新數(shù)據(jù)進(jìn)行分析。本質(zhì)上決策樹算法是通過一系列規(guī)則對數(shù)據(jù)進(jìn)行分類的過程[13]。

因?yàn)闆Q策樹算法是通過構(gòu)造決策樹來發(fā)現(xiàn)數(shù)據(jù)中蘊(yùn)涵的分類規(guī)則,所以,如何構(gòu)造精度高、規(guī)模小的決策樹就是決策樹算法的核心內(nèi)容。決策樹構(gòu)造可以分兩步進(jìn)行。第一步,決策樹的生成:由訓(xùn)練樣本集生成決策樹的過程。一般情況下,訓(xùn)練樣本數(shù)據(jù)集是有一定綜合程度的,用于數(shù)據(jù)分析處理的數(shù)據(jù)集。第二步,決策樹的剪枝:決策樹的剪枝是對上一階段生成的決策樹進(jìn)行檢驗(yàn)、校正的過程,主要是用新的樣本數(shù)據(jù)集(稱為測試數(shù)據(jù)集)中的數(shù)據(jù)校驗(yàn)決策樹生成過程中產(chǎn)生的初步規(guī)則,將那些影響準(zhǔn)確性的分枝剪除。

1.1.2 基于互信息的決策樹算法 互信息是計(jì)算語言學(xué)模型分析的常用方法,它度量兩個(gè)對象之間的相互性。在過濾問題中用于度量特征對于主題的區(qū)分度。互信息的定義與交叉熵近似。互信息本來是信息論中的一個(gè)概念,用于表示信息之間的關(guān)系,是兩個(gè)隨機(jī)變量統(tǒng)計(jì)相關(guān)性的測度,使用互信息理論進(jìn)行特征抽取是基于如下假設(shè):在某個(gè)特定類別出現(xiàn)頻率高,但在其它類別出現(xiàn)頻率比較低的詞條與該類的互信息比較大。通常用互信息作為特征詞和類別之間的測度,如果特征詞屬于該類的話,它們的互信息量最大。由于該方法不需要對特征詞和類別之間關(guān)系的性質(zhì)作任何假設(shè),因此非常適合于文本分類的特征和類別的配準(zhǔn)工作[14]。

互信息可定義為:

通過基于互信息的決策樹算法能夠完成數(shù)據(jù)分類和數(shù)據(jù)過濾,數(shù)據(jù)過濾算法流程的具體步驟如圖1所示。

圖1表明,利用基于互信息的決策樹算法對數(shù)據(jù)進(jìn)行檢索時(shí),數(shù)據(jù)的互信息和過濾多余數(shù)據(jù)的可能性成正向增長關(guān)系。即互信息值越大,過濾的無用數(shù)據(jù)就越多,查詢到所需數(shù)據(jù)的概率就越大。在這個(gè)過程中,不但大幅度過濾了非相關(guān)信息,減少了檢索時(shí)間,而且還能夠提高檢索的精度[15]。

1.1.3 基于并行計(jì)算的決策樹算法 電力系統(tǒng)所產(chǎn)生的數(shù)據(jù)可以區(qū)分為靜態(tài)數(shù)據(jù)和動(dòng)態(tài)數(shù)據(jù),其中在較大時(shí)間尺度中數(shù)據(jù)不發(fā)生變化時(shí),可以認(rèn)為是靜態(tài)數(shù)據(jù)。除此之外,在小時(shí)間尺度中不斷更新或者累積的數(shù)據(jù)稱為動(dòng)態(tài)數(shù)據(jù)。電力系統(tǒng)中數(shù)據(jù)龐大,尤其是對于動(dòng)態(tài)數(shù)據(jù)上千節(jié)點(diǎn)的數(shù)據(jù)采集會(huì)造成巨大的數(shù)據(jù)累積。動(dòng)態(tài)數(shù)據(jù)的處理對于能否有效挖掘關(guān)鍵數(shù)據(jù)至關(guān)重要,但許多算法直接在一定時(shí)間內(nèi)忽略最新的動(dòng)態(tài)數(shù)據(jù),而采用歷史數(shù)據(jù),這對于實(shí)時(shí)變化的電力系統(tǒng)來說可能會(huì)影響巨大。因此需要通過技術(shù)處理實(shí)時(shí)更新數(shù)據(jù)以實(shí)現(xiàn)動(dòng)態(tài)數(shù)據(jù)的挖掘。此外,不同的關(guān)鍵詞檢索也將對靜態(tài)數(shù)據(jù)的數(shù)據(jù)處理產(chǎn)生不同的要求。這些對于計(jì)算機(jī)的要求將大大增加。

因此,為了對電力系統(tǒng)數(shù)據(jù)進(jìn)行更加精確的挖掘,在此還將創(chuàng)建基于Spark Map Reduce的并行決策樹算法。該算法是由多個(gè)map (映射)以及 reduce (歸約) 函數(shù)組組成,并支持轉(zhuǎn)換 (transformations) 和行動(dòng)(actions),它們的實(shí)現(xiàn)基于RDD。多個(gè)數(shù)據(jù)行組成一個(gè)RDD,數(shù)據(jù)行的內(nèi)容可以是數(shù)字、數(shù)組或者是混合類型的數(shù)據(jù)。Spark Map Reduce將計(jì)算資源分為一個(gè)master 節(jié)點(diǎn)和多個(gè)worker節(jié)點(diǎn),master向空閑的worker 分配工作。該算法可以通過對各個(gè)數(shù)據(jù)庫分類并行的進(jìn)行數(shù)據(jù)獲取和解析并通過決策樹進(jìn)行數(shù)據(jù)挖掘,可以大大的提高數(shù)據(jù)處理效率并降低計(jì)算時(shí)間。

1.2 決策樹算法在電力自動(dòng)化系統(tǒng)信息檢索中的應(yīng)用

1.2.1 基于決策樹算法的電力系統(tǒng)信息檢索應(yīng)用模型設(shè)計(jì) 通過研究基于互信息的決策樹算法發(fā)現(xiàn),該算法不僅能夠?qū)Σ煌瑢傩院筒煌瑪?shù)據(jù)庫之間的關(guān)系實(shí)現(xiàn)高效的衡量,而且還能完成屬性對分類重要程度的區(qū)分。此外,引入權(quán)因子后,該算法可以在實(shí)際應(yīng)用中通過增加權(quán)重來提高檢索速度以及精度。按照電力系統(tǒng)的實(shí)際要求,現(xiàn)對基于決策樹算法的電網(wǎng)輔助決策系統(tǒng)應(yīng)用模型進(jìn)行構(gòu)建。模型具體框架如圖2所示。

圖2表明,該模型能夠通過用戶提供的關(guān)鍵詞條完成數(shù)據(jù)的迅速檢索,并通過反復(fù)檢查后將信息回饋給用戶,若用戶對結(jié)果有疑問,則可以進(jìn)行再次檢索或調(diào)整關(guān)鍵詞條,從而完成電網(wǎng)的輔助決策。另外,當(dāng)電網(wǎng)發(fā)生故障時(shí),該模型還可以得到更多關(guān)于系統(tǒng)的其它數(shù)據(jù),從而完成多源數(shù)據(jù)共享。模型的運(yùn)行功能如圖3所示。

(1) 數(shù)據(jù)處理:通過處理缺失數(shù)據(jù)和問題數(shù)據(jù)來達(dá)到提高數(shù)據(jù)質(zhì)量的目的。此外,在數(shù)據(jù)處理的過程中,數(shù)據(jù)集成會(huì)把多源數(shù)據(jù)組合為整體數(shù)據(jù)集,數(shù)據(jù)的轉(zhuǎn)變能夠?qū)?shù)據(jù)進(jìn)行規(guī)范化處理以此得到更貼切實(shí)際的呈現(xiàn)方式。

(2) 數(shù)據(jù)挖掘:數(shù)據(jù)挖掘工作包含實(shí)時(shí)性和精確度等重要特點(diǎn)。而針對數(shù)據(jù)的實(shí)時(shí)性,可利用Boosting手段,通過把新數(shù)據(jù)引入到?jīng)Q策樹中,以此產(chǎn)生決策樹集合,從而加大數(shù)據(jù)挖掘的深度。

(3) 模式評估:針對挖掘的數(shù)據(jù)是否有效,需要對其進(jìn)行驗(yàn)證以及評價(jià)。第一步是將數(shù)據(jù)與數(shù)據(jù)庫不斷對比,以此確定數(shù)據(jù)的精度。

(4) 用戶交互:在此功能下,用戶能夠自主進(jìn)行數(shù)據(jù)檢索,建立數(shù)據(jù)要求。

(5) 系統(tǒng)主動(dòng)問詢:在該系統(tǒng)中,用戶不但可以自主查詢數(shù)據(jù),并且系統(tǒng)還設(shè)置了系統(tǒng)接口。

1.2.2 仿真實(shí)驗(yàn) 為了驗(yàn)證基于互信息和并行計(jì)算的決策樹算法的模型的實(shí)用性,首先利用實(shí)驗(yàn)室環(huán)境來搭建仿真平臺,其次通過提出的檢索模型對生產(chǎn)管理系統(tǒng)數(shù)據(jù)庫Oracle、地理信息系統(tǒng)數(shù)據(jù)庫ArcSDE(Spatial Database Engine)以及監(jiān)控和數(shù)據(jù)采集系統(tǒng)數(shù)據(jù)庫SCADA(Supervisory Control And Data Acquisition)進(jìn)行數(shù)據(jù)檢索,最后記錄檢索所花費(fèi)的時(shí)間以及分類結(jié)果。

2 結(jié)果與分析

2.1 改進(jìn)決策樹算法的性能

2.1.1 改進(jìn)前后的決策樹算法的信息檢索性能 將改進(jìn)的決策樹算法與傳統(tǒng)的ID3算法進(jìn)行比較后得到的結(jié)果如圖4所示。

圖4表明,改進(jìn)的決策樹算法和傳統(tǒng)的ID3算法在對不同數(shù)據(jù)集進(jìn)行數(shù)據(jù)挖掘時(shí),其算法的性能存在差異。對于生產(chǎn)管理系統(tǒng)數(shù)據(jù)集,ID3算法下的數(shù)據(jù)挖掘精度為99.59%,改進(jìn)決策樹算法在人工常量設(shè)置為1和靈活值時(shí)的數(shù)據(jù)挖掘精度分別為99.67%和99.72%;對于地理信息系統(tǒng)數(shù)據(jù)集,ID3算法下的數(shù)據(jù)挖掘精度為90.02%,改進(jìn)決策樹算法在人工常量設(shè)置為1和靈活值時(shí)的數(shù)據(jù)挖掘精度分別為93.92%和94.27%;對于監(jiān)控和數(shù)據(jù)采集系統(tǒng)數(shù)據(jù)集,ID3算法下的數(shù)據(jù)挖掘精度為94.61%,改進(jìn)決策樹算法在人工常量設(shè)置為1和靈活值時(shí)的數(shù)據(jù)挖掘精度分別為95.85%和96.12%。由此說明,改進(jìn)的決策樹算法對于數(shù)據(jù)集的數(shù)據(jù)挖掘更加精確。

2.1.2 基于決策樹算法的信息檢索方法的實(shí)際應(yīng)用效果 為進(jìn)一步驗(yàn)證基于決策樹算法的信息檢索性能,選取 500 kV 變電站作為測試試點(diǎn),實(shí)驗(yàn)數(shù)據(jù)共 96.2 MB。其中包含一次設(shè)備信息6萬余條,天氣數(shù)據(jù)20 MB。通過準(zhǔn)確率和召回率證明變電站設(shè)備信息決策樹算法的檢索效果,并同時(shí)與傳統(tǒng)的關(guān)鍵詞檢索方法進(jìn)行比較,得到的結(jié)果如表1所示。

表1表明,基于互信息和并行計(jì)算的決策樹檢索方法在準(zhǔn)確率和召回率兩個(gè)指標(biāo)上整體高于傳統(tǒng)的關(guān)鍵詞檢索方法。在信息檢索條件為3時(shí),指標(biāo)相差最大。以上數(shù)據(jù)表明,基于互信息和并行計(jì)算的決策樹檢索系統(tǒng)能夠滿足日常檢索需求,它可以快速有效的檢索設(shè)備信息,能減少錯(cuò)誤操作,提高智能變電站的安全性。

2.2 電力系統(tǒng)信息檢索應(yīng)用模型效果

2.2.1 生產(chǎn)管理系統(tǒng)數(shù)據(jù)庫檢索分類結(jié)果 利用基于改進(jìn)決策樹算法的電力系統(tǒng)信息檢索應(yīng)用模型對生產(chǎn)管理系統(tǒng)數(shù)據(jù)庫的數(shù)據(jù)進(jìn)行檢索分類,得到的結(jié)果如圖5所示。

圖5表明,利用該檢索模型對生產(chǎn)管理系統(tǒng)數(shù)據(jù)庫進(jìn)行數(shù)據(jù)分類,當(dāng)分類器中數(shù)據(jù)量為20、15、12、10、3時(shí),模型挖掘出的可用數(shù)據(jù)量分別為1、3、5、5、2。以上說明該檢索模型對于數(shù)據(jù)集的挖掘分類具有一定效果。

2.2.2 不同數(shù)據(jù)庫數(shù)據(jù)檢索所花費(fèi)的時(shí)間 利用提出的檢索模型對生產(chǎn)管理、地理信息以及監(jiān)控和數(shù)據(jù)采集三種系統(tǒng)數(shù)據(jù)庫的數(shù)據(jù)進(jìn)行檢索,并不斷提高數(shù)據(jù)量級別,檢索花費(fèi)時(shí)間如圖6所示。

圖6表明,對于不同的檢索條數(shù),該模型檢索所花費(fèi)的時(shí)間不同。當(dāng)檢索條數(shù)分別為0.8萬、1.6萬、12萬、32萬、63萬、130萬時(shí),該模型檢索所花費(fèi)的時(shí)間分別為0.04s、0.07s、0.61s、2.12s、4.17s、7.82s。以上結(jié)果表明,隨著檢索條數(shù)的不斷增加,該模型檢索所花費(fèi)的平均時(shí)間越來越小。這充分說明了基于互信息決策樹的分類方法的適用性。

3 結(jié)論與討論

目前,將電力系統(tǒng)中的海量數(shù)據(jù)進(jìn)行高效提取從而更好的輔助工程人員決策是一項(xiàng)關(guān)鍵問題。通過研究發(fā)現(xiàn),現(xiàn)階段的信息檢索技術(shù)存在單一性、數(shù)據(jù)不完整性等諸多局限性。針對數(shù)據(jù)庫信息的特點(diǎn),研究所做工作以及得到的結(jié)論如下:(1) 設(shè)計(jì)了一種基于互信息的決策樹算法,利用互信息對索引信息量進(jìn)行判斷,從而對多源數(shù)據(jù)關(guān)鍵詞實(shí)現(xiàn)快速檢索,并嘗試將并行計(jì)算加入到?jīng)Q策樹算法當(dāng)中,實(shí)現(xiàn)多種電網(wǎng)系統(tǒng)數(shù)據(jù)的精確挖掘;(2) 以基于互信息的決策樹算法為基礎(chǔ),對電力系統(tǒng)應(yīng)用的電網(wǎng)輔助決策系統(tǒng)模型進(jìn)行了搭建,此模型可以實(shí)現(xiàn)對當(dāng)前電網(wǎng)信息的快速檢索以輔助用戶決策;(3) 基于互信息和并行計(jì)算的決策樹檢索方法在準(zhǔn)確率和召回率兩個(gè)指標(biāo)上整體高于傳統(tǒng)的關(guān)鍵詞檢索方法。

不足之處在于設(shè)計(jì)的信息檢索方法在實(shí)際的電力系統(tǒng)中的應(yīng)用較少,后續(xù)將針對實(shí)際應(yīng)用進(jìn)行研究,旨在進(jìn)一步提高電網(wǎng)數(shù)據(jù)的挖掘能力和效果。

參考文獻(xiàn)

[1] 趙海波. 電力行業(yè)大數(shù)據(jù)研究綜述[J]. 電工電能新技術(shù), 2020, 39(12):11.

[2] 吳雷. 能源互聯(lián)網(wǎng)下電力大數(shù)據(jù)的特征及應(yīng)用分析[J]. 科技創(chuàng)新導(dǎo)報(bào), 2021, 18(8):3.

[3] 彭冰月, 張宸, 于翔,等. 基于數(shù)據(jù)系統(tǒng)的電力桿塔共享運(yùn)營策略探析[J]. 機(jī)電信息, 2021(23):2.

[4] ZHANG Y, CONG W, LI G, et al. Single-ended MMC-MTDC line protection based on dual-frequency amplitude ratio of traveling wave[J]. Electric Power Systems Research, 2020, 189(3):106808.

[5] DING Z, WANG J, CHENG Y. A long short-term memory network-based intrusion detection method for power grid middle platform[J]. Journal of Physics: Conference Series, 2021, 1815(1):012007.

[6] 費(fèi)宏運(yùn), 楊陽. 基于保信系統(tǒng)的電網(wǎng)事故智能分析與決策[J]. 光源與照明, 2021(12):2.

[7] SHI Z, SUN T, WU D, et al. Research on the integration technology of power engineering design materials based on fuzzy retrieval[J]. IOP Conference Series: Earth and Environmental Science, 2021, 632(4):042030.

[8] GAO L C, YAO L M, YANG Z W, et al. Research on hybrid index method of double-layer B+ tree for power big data considering knowledge graph[J]. Journal of Physics: Conference Series, 2021, 1771(1):012004.

[9] 宋辰萱, 孔祥文. MongoDB與Hadoop MapReduce的海量非結(jié)構(gòu)化數(shù)據(jù)處理方案[J]. 電子技術(shù)與軟件工程, 2021(2):2.

[10] FADELELMOULA A A. Exploiting cloud computing and web services to achieve data consistency, availability, and partition tolerance in the large-scale pervasive systems[J]. International Journal of Interactive Mobile Technologies (iJIM), 2021, 15(15):74.

[11] QIANG G, SUN L, HUANG Q. ID3 algorithm and its improved algorithm in agricultural planting decision[J]. IOP Conference Series Earth and Environmental Science, 2020, 474:032025.

[12] LIU Q, XIA X. Construction of classification model of academic library websites in Jiangsu based on decision? tree? algorithm and? link analysis? method[J]. Open Access Library Journal, 2022, 9(1):9.

[13] 韓成成, 增思濤, 林強(qiáng),等. 基于決策樹的流數(shù)據(jù)分類算法綜述[J]. 西北民族大學(xué)學(xué)報(bào)(自然科學(xué)版), 2020, 41(2):11.

[14] 王雅輝, 錢宇華, 劉郭慶. 基于模糊優(yōu)勢互補(bǔ)互信息的有序決策樹算法[J]. 計(jì)算機(jī)應(yīng)用, 2021, 41(10):8.

[15] ZHAO Y. Research on personal credit evaluation of internet finance based on blockchain and decision tree algorithm[J]. EURASIP Journal on Wireless Communications and Networking, 2020, 2020(1):1-12.

Research on Station Resource Retrieval Technology in Operation Data of Power Automation System Based on Data Mining

ZHANG Xu-dong, XIE Min, HUANG Jian-ping, WANG Zheng

(State Grid Zhejiang Electric Power CO.,LTD. , Hangzhou 310007,China)

Abstract: At present, the power grid contains a large number of multi-source information data. It is not easy to retrieve its data information efficiently and accurately. In order to solve this problem, after consulting the literature, analyzing the data characteristics of the actual power operation system and multi-source database samples, an optimized decision tree algorithm based on mutual information and parallel computing theory is introduced, and a decision tree model is built on this basis. Finally, simulation experiments are set to verify the model with various system databases as examples. The results show that the optimized decision tree algorithm based on mutual information and parallel computing can achieve fast, accurate and effective multi-source data retrieval for large databases, and can also effectively process real-time data. The algorithm directly mines the original data of the database according to the representative feature set, and sorts according to the size of the index information. The data mining method with the improved decision tree algorithm as the core technology has a high precision. It can better realize the mining of the multi-source data information of the power grid. It can not only avoid data duplication, but also meet the decision-making requirements of the project, providing a reliable technical support for improving the efficient mining of power grid data.

Key words: data mining; power operation system; mutual information; decision tree; simulation experiment

(責(zé)任編輯:馬乃玉)

猜你喜歡
數(shù)據(jù)挖掘
基于數(shù)據(jù)挖掘的船舶通信網(wǎng)絡(luò)流量異常識別方法
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費(fèi)中的應(yīng)用淺析
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
數(shù)據(jù)挖掘在高校圖書館中的應(yīng)用
數(shù)據(jù)挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數(shù)據(jù)挖掘研究
利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)LIS數(shù)據(jù)共享的開發(fā)實(shí)踐
主站蜘蛛池模板: 久久亚洲AⅤ无码精品午夜麻豆| 青青青草国产| 亚洲无码高清一区二区| 久久久亚洲色| 91麻豆国产在线| 成年女人a毛片免费视频| 国产va在线观看| 99精品热视频这里只有精品7 | 91国内在线视频| 色婷婷国产精品视频| 美女被操黄色视频网站| 国产视频资源在线观看| 97国产精品视频自在拍| 91福利国产成人精品导航| 视频二区国产精品职场同事| 亚洲综合久久一本伊一区| 日韩高清在线观看不卡一区二区 | 高清久久精品亚洲日韩Av| yjizz视频最新网站在线| 日韩高清无码免费| 中文字幕日韩丝袜一区| 亚洲欧洲日韩综合| 99人妻碰碰碰久久久久禁片| 伊人精品视频免费在线| 成人午夜视频网站| 高清大学生毛片一级| 国产午夜无码片在线观看网站| 天天色综合4| 日韩国产欧美精品在线| 中文字幕伦视频| 在线色国产| 亚洲欧洲一区二区三区| 国产裸舞福利在线视频合集| 久久99国产乱子伦精品免| 欧美成人免费| 国产人人乐人人爱| 国产成人资源| 中文字幕人妻无码系列第三区| 国产精品妖精视频| 青青热久麻豆精品视频在线观看| 国产va视频| 久久性妇女精品免费| 久久人人妻人人爽人人卡片av| 国产91小视频在线观看| 日本不卡免费高清视频| 国内精品免费| 91精品视频播放| 久久精品aⅴ无码中文字幕| 亚洲动漫h| 99精品一区二区免费视频| 无码精品国产VA在线观看DVD| 免费毛片在线| 19国产精品麻豆免费观看| 久久久久久尹人网香蕉| 在线观看精品自拍视频| 高h视频在线| 亚洲欧洲日本在线| 欧美成人看片一区二区三区 | 亚洲AV无码一区二区三区牲色| 国产办公室秘书无码精品| 综合社区亚洲熟妇p| 久久综合婷婷| 美女被狂躁www在线观看| 国产一级在线观看www色| 波多野结衣中文字幕一区二区| 亚洲最大情网站在线观看| 区国产精品搜索视频| 国产成年无码AⅤ片在线| 呦系列视频一区二区三区| 国产va在线| 亚洲成人精品久久| 国产精品大尺度尺度视频| 另类重口100页在线播放| 亚洲高清国产拍精品26u| 亚洲成A人V欧美综合| 国产精品三区四区| 成人福利在线视频| 久久精品只有这里有| 精品久久久久无码| 亚洲日本www| 日韩一区二区三免费高清| 五月激情婷婷综合|