999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于XML的電力營銷數據智能抽取方法研究

2023-02-03 02:56:14余向前
自動化儀表 2023年1期
關鍵詞:信息方法設計

余向前

(國網甘肅省電力公司,甘肅 蘭州 730030)

0 引言

電力信息化發展推動了電力事業的蓬勃發展。在電力信息系統中包含大量的子系統。作為其主體部分的營銷業務子系統[1-2],擁有大量的電力用戶信息以及電力交易信息。營銷業務系統的信息種類較為復雜。因此,為保證其信息存儲的有效性與安全性,常采用電力營銷數據倉庫的形式提升信息存儲的可靠性。

電力營銷數據倉庫是集數據采集、信息發布、統計分析、預警和決策支持于一體的現代信息管理決策體系[3]。在電力營銷數據倉庫的使用過程中,電力營銷數據的抽取作為數據倉庫的入口,控制著數據倉庫的安全。在抽取的過程中,需要讀取與分解源數據,而后再復制所需的部分數據,以方便進一步處理。

在目前的電力營銷數據的提取過程中,常采用基于興趣點(point of interest,POI)優化的數據抽取方法[4]或基于可變時間窗口的數據抽取方法[5]。但應用這兩種方法時會出現抽取數據召回率偏高的問題。

可擴展標記語言(extensible markup language,XML)是1種用于標記電子文件以使其具有結構性的標記語言,具有較強的數據轉換能力。因此,本研究采用XML技術,設計了1種新的電力營銷數據智能抽取方法,以彌補傳統數據抽取方法的不足,提升電力營銷數據抽取的精度與可靠性。

1 方法設計

XML是1種網絡信息語言,具有相應的信息結構性。為將其更好地應用于電力營銷數據智能抽取過程,需對數據抽取流程展開優化。基于XML的電力營銷數據抽取流程如圖1所示。

圖1 基于XML的電力營銷數據抽取流程圖

將圖1所示流程作為電力營銷數據抽取方法的設計基礎,針對傳統數據抽取方法在使用中出現的問題,采用設定數據轉化算法的形式對其展開優化。

1.1 獲取電力營銷數據源

在抽取電力營銷系統數據的過程中,獲取電力營銷數據源是數據抽取的第一個環節[6]。只有獲取可用、穩定、可靠的數據源,才能使數據抽取工作變得簡單。

一般來說,電力營銷數據的穩定性較差,時常出現結構變化的問題。因此,在數據源獲取的過程中,采用電力營銷系統數據庫作為數據來源。

此次設計在廣域數據獲取的基礎上,設定1種適用于小范圍電力營銷數據的獲取方法,并將其應用于數據提取。為保證電力營銷信息可展開小范圍獲取工作,將原有的數據獲取鏈接方式更改為小范圍數據鏈接。小范圍數據鏈接如圖2所示。

圖2 小范圍數據鏈接示意圖

圖2中:圓形為信息數據;箭頭表示信息之間的鏈接。將數據鏈接設定為小范圍數據鏈接的形式后,通常會使用超文本敏感標題搜索(hyperlink-induced topic search,HITS)算法完成數據鏈接。但該算法難以適用于小范圍數據鏈接,因而需對HITS算法展開優化[7]。將電力營銷系統中的網頁視作有向圖G(A,B)。其中:A為電力營銷系統中的數據存儲有效頁面,A={ai|1≤i≤n};B為A中不同信息元素的有序對集合,將其視為存儲頁面之間的連接,則B={bj|1≤j≤n}。在使用小范圍數據鏈接后,對原有的有向圖展開加權,形成新的有向圖G′(A′,B′)。在A不變的條件下,B′采用原有的設定,包含信息存儲網頁的間接鏈接[8]。在此基礎上,采用HITS算法中的加權數據矩陣P對網頁中的信息展開處理。在初始化過程中設定B′的權值為0,則信息對應模式為(m,n),在信息中存在的鏈接為P(m,n)=sup(i,j);反之,P(m,n)=0。將信息數據權威向量設定為D、中心向量設定為O,更新后的權威向量可以表示為D=PG′O。將上述設定部分進行整合,則可獲得電力營銷數據源,為:

(1)

式中:r為特征干擾項。

上述過程對電力營銷系統中的數據進行處理,通過向量控制數據抽取的有效性。

1.2 數據轉換

對上述獲取到的電力營銷數據源進行數據轉換。在此次設計中,設計基于XML的轉換工具,完成數據轉換過程。現將此模型設定為3層,分別為源數據層、數據庫層以及目標數據庫層。數據轉換工具模型如圖3所示。

圖3 數據轉換工具模型

電力營銷數據轉換的過程分為2個部分,分別為遷移式數據轉換與合并式數據轉換。采用上述方法設計的數據轉換工具將源數據庫內數據轉移至目標數據庫內,并根據源數據庫設定目標數據庫。

在數據轉換過程中,啟動數據轉換工具中的數據調用部分,再采用息屏顯示(always on display,AOD)技術[9]連接源數據并獲取數據來源信息,根據事先設定好的數據轉換需求完成數據轉換。在此部分中,采用C語言編程的形式,控制XML數據轉換工具對數據的轉換過程。部分編程如下所示。

if(this.dgvconfig.Rows.Count>1)

//采用一對多或多對一復雜條件轉換

if(this.dgvconfig.Rows[0].Cells[0].Value.ToString()

//采用一對一數據轉換

for(inti=1;i

采用上述編程控制數據轉換過程,并將轉換數據設定為數據庫形式進行存儲,以便后續數據處理。

1.3 數據區域定位

在數據區域定位中,需要解決的核心問題是將XML定位描述符導入處理后的數據中,并通過此定位描述符確定需要抽取數據的位置。

在電力營銷數據轉換結果中,其數據多為文檔對象模型(document object model,DOM)樹結構。這是1種數據嵌套式結構。對此結構進行分析,可獲取數據轉換結果的分布特征。根據數據分布特征,將設定的XML定位描述符分為2個部分。具體內容如下。

①信息數據布局標簽[10]用于劃分電力營銷數據存儲的區域,是1種容器標簽。

②數據內容特征標簽用于描述數據信息特征。通過此標簽,可以完成數據抽取。

由于數據庫內的數據區域是所有電力營銷信息記錄中的最小區域,因而采用自上而下的方式對數據標簽展開檢測。范圍計算過程為:

(2)

式中:L為布局標簽的最大直徑;y為子節點與中心點的距離;v為子節點擴展速度;t為完成信息數據布局所需的時間。

設定信息數據布局標簽為z,其子節點中最大面積為zi,則zi滿足式(3)。

(3)

式中:area(z)為節點中的數據規模;α為閾值。

當出現滿足上述條件的數據標簽時,采用特殊標志對此數據進行定位。

1.4 數據抽取

通過上述設計,完成電力營銷數據智能抽取方法的基礎設計部分,并在此基礎上實現對數據抽取過程的設計。為保證數據抽取過程的可控性,對抽取過程中出現的字段進行設定。數據抽取過程設定情況統計如表1所示。

表1 數據抽取過程設定情況統計表

通過表1的設定,對數據抽取過程進行控制,并設計相應的數據抽取規則。采用抽取規則產生器設定數據抽取規則。數據抽取規則生成流程如圖4所示。

圖4 數據抽取規則生成流程

將抽取規則與數據抽取過程設定相結合,引用至原有的數據抽取方法設定中,并在原有的數據抽取方法中增加相應的數據映射[11-12]部分,以實現數據抽取。至此,基于XML的電力營銷數據智能抽取方法設計完成。

2 試驗測試與結果分析

為驗證基于XML的電力營銷數據智能抽取方法的有效性,設計以下仿真試驗加以檢驗。

2.1 測試環境與內容

為保證測試過程的有效性,設定測試中使用的設備與軟件的運行環境如下所示。

開發環境為Visual Basic.NET。

運行環境為Win 10.0系統。

近年來,電力營銷系統受到信息入侵的情況比比皆是。為了提升電力營銷系統的數據抽取安全性,在測試過程中,將測試環境分為平穩運行環境與存在入侵數據環境這2種狀態,以觀察在安全程度不同的環境下的電力營銷數據抽取有效性。

為進一步對比基于XML的電力營銷數據智能抽取方法的使用性能,將其與傳統的基于POI優化的數據抽取方法、基于可變時間窗口的數據抽取方法作對比。

在測試的過程中,采用某地級市電力營銷系統中的數據作為測試數據來源。設定此次測試數據訓練集中共包含數據20 000條,采用上述3種方法對其中的電力交易數據進行抽取,并對比3種方法的抽取效果。

2.2 測試指標設定

在此次測試中,將數據抽取結果的召回率以及數據抽取過程的耗時作為測試指標。其中,召回率是反映數據抽取效果的重要指標,可以反映數據抽取方法的抽取精度。召回率越低,說明抽取精度越高。根據數據抽取過程的耗時,可以判斷不同方法的運行效率。耗時越短,則表明數據抽取方法的效率越高。

2.3 平穩運行狀態下的測試結果

平穩運行狀態下召回率測試結果如圖5所示。

圖5 平穩運行狀態下召回率測試結果

分析圖5可知,在平穩運行狀態下,隨著待抽取數據總量的不斷增加,不同方法抽取結果的召回率也在不斷變化。基于XML的數據抽取方法的召回率在4%上下。基于POI優化的數據抽取方法的召回率介于9%~13%之間。基于可變時間窗口的數據抽取方法的召回率介于8%~11%之間。相比之下,本文設計的基于XML的數據抽取方法的召回率更低,說明該方法對電力營銷數據抽取的精度更高。

2.4 數據入侵狀態下召回率測試結果

數據入侵狀態下召回率測試結果如圖6所示。

圖6 數據入侵狀態下召回率測試結果

由圖6可知,在數據入侵狀態下,隨著待抽取數據總量的不斷增加,不同方法抽取結果的召回率也在不斷變化。相比于平穩運行狀態,此時基于XML的數據抽取方法的召回率有所增加,但也始終保持在7%之下。基于POI優化的數據抽取方法的召回率基本在12%~15%之間。基于可變時間窗口的數據抽取方法的召回率在8%~11%之間。相比之下,本文設計的基于XML的數據抽取方法的召回率依舊較低,說明該方法對電力營銷數據抽取的精度也更高。

2.5 數據抽取過程耗時測試結果

在上述檢驗不同方法抽取結果召回率的基礎上,將數據抽取過程耗時作為檢驗指標進行測試。數據抽取過程耗時測試結果如圖7所示。

圖7 數據抽取過程耗時測試結果

由圖7可知,隨著待抽取數據總量的不斷增加,不同方法的抽取過程耗時也在不斷變化。基于XML的數據抽取方法的抽取過程耗時始終保持在800 ms以下。基于POI優化的數據抽取方法的抽取過程耗時先增加后下降,最大耗時達到1 200 ms。基于可變時間窗口的數據抽取方法的抽取過程耗時呈不斷增加態勢,最大超過1 400 ms。相比之下,本文設計的基于XML的數據抽取方法的抽取過程耗時更少,說明該方法對電力營銷數據的抽取效率更高。

3 結論

針對傳統的數據抽取方法在使用中存在的抽取結果召回率偏高的問題,本文引用XML技術優化電力營銷數據抽取過程。在此次研究中,主要完成了以下工作:首先,對電力營銷源數據采用小規模鏈接的形式,并獲取數據源信息,從根本上提升數據抽取的精度;然后,通過XML技術,控制數據的區域定位;最后,通過測試確定了基于XML的電力營銷數據智能抽取方法的可靠性。

猜你喜歡
信息方法設計
瞞天過海——仿生設計萌到家
藝術啟蒙(2018年7期)2018-08-23 09:14:18
設計秀
海峽姐妹(2017年7期)2017-07-31 19:08:17
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
有種設計叫而專
Coco薇(2017年5期)2017-06-05 08:53:16
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
設計之味
舒適廣告(2008年9期)2008-09-22 10:02:48
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 99热最新网址| lhav亚洲精品| 国产手机在线观看| 美女无遮挡拍拍拍免费视频| 亚洲人精品亚洲人成在线| 国模极品一区二区三区| 国产人前露出系列视频| 亚洲国产成人自拍| 青青草原国产| 22sihu国产精品视频影视资讯| 中文字幕亚洲综久久2021| 日韩一区精品视频一区二区| 亚洲毛片网站| аⅴ资源中文在线天堂| 亚洲一区二区三区国产精品| 日韩av在线直播| 国产乱人伦偷精品视频AAA| 国产综合日韩另类一区二区| 成人国产小视频| 亚洲一区二区成人| 国产成人乱码一区二区三区在线| 综合人妻久久一区二区精品| 六月婷婷综合| 国产www网站| 狠狠ⅴ日韩v欧美v天堂| 国产成人你懂的在线观看| 精品一区国产精品| 欧美日韩中文字幕在线| 亚洲人成人无码www| 亚洲欧美精品日韩欧美| 99这里只有精品免费视频| 免费观看成人久久网免费观看| 视频一本大道香蕉久在线播放| 成人午夜在线播放| 成年人视频一区二区| 中文字幕在线永久在线视频2020| 黄片一区二区三区| 婷婷色一二三区波多野衣| 久久亚洲国产一区二区| 亚洲国产中文在线二区三区免| 久久精品娱乐亚洲领先| 狠狠v日韩v欧美v| 免费国产高清精品一区在线| 波多野结衣二区| 国产色爱av资源综合区| 在线国产你懂的| 免费va国产在线观看| 国产超薄肉色丝袜网站| 国产精品女熟高潮视频| 亚洲精品视频在线观看视频| 国产精品视频导航| 亚洲Va中文字幕久久一区 | 国产va免费精品| 亚洲娇小与黑人巨大交| 亚洲视频黄| 国产成年女人特黄特色大片免费| 最新国产精品鲁鲁免费视频| 久久网综合| 久久这里只精品国产99热8| 精品午夜国产福利观看| 美女被躁出白浆视频播放| 日韩在线观看网站| 91精品国产福利| 色天天综合| 中文天堂在线视频| 日韩欧美国产中文| 99久久人妻精品免费二区| 中文字幕永久视频| 激情影院内射美女| 免费观看男人免费桶女人视频| 亚洲三级影院| 久青草网站| 国产成人高清在线精品| 亚洲第一成年免费网站| 国产高清在线观看91精品| 视频一区视频二区中文精品| 欧美日韩免费| 99这里只有精品在线| 久久精品国产国语对白| 欧美区一区| 午夜精品区| 免费一级毛片在线观看|