999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數(shù)據(jù)挖掘的業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔自動更新模型

2022-09-02 06:25:24蕭展輝孫剛鄒文景
電子設(shè)計工程 2022年16期
關(guān)鍵詞:數(shù)據(jù)挖掘模型系統(tǒng)

蕭展輝,孫剛,鄒文景

(南方電網(wǎng)數(shù)字電網(wǎng)研究院有限公司,廣東廣州 510000)

業(yè)務(wù)系統(tǒng)的應(yīng)用發(fā)展會受到兩大因素的阻礙,一是與業(yè)務(wù)領(lǐng)域相關(guān)的分析模型比較復(fù)雜,用戶在應(yīng)用時不知道如何采用智能手段對業(yè)務(wù)進行持續(xù)改進;二是業(yè)務(wù)系統(tǒng)中的元數(shù)據(jù)質(zhì)量較低,無法保證用戶獲取到的元數(shù)據(jù)文檔是準(zhǔn)確無誤的[1]。業(yè)務(wù)系統(tǒng)中的元數(shù)據(jù)文檔質(zhì)量問題逐漸受到了社會各界的廣泛重視,基于此,要加大力度讓更多人認識到元數(shù)據(jù)文檔在管理與應(yīng)用中的重要性。在業(yè)務(wù)系統(tǒng)中,元數(shù)據(jù)文檔自動更新處于整個系統(tǒng)結(jié)構(gòu)的核心部分[2]。元數(shù)據(jù)文檔貫穿于業(yè)務(wù)系統(tǒng)中整個數(shù)據(jù)流動的全過程,只有對元數(shù)據(jù)文檔進行自動更新,才能為業(yè)務(wù)系統(tǒng)提供一個全局視圖,把握好業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔的組成、轉(zhuǎn)換以及來龍去脈,從而對元數(shù)據(jù)文檔的質(zhì)量進行有效管理[3]。目前,在業(yè)務(wù)系統(tǒng)中元數(shù)據(jù)文檔自動更新是對其進行集中且統(tǒng)一管理的新課題,可以從根本上解決業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔在數(shù)據(jù)管理上的難題。

針對動態(tài)摘要信息缺乏、冗余嚴重的問題,文獻[4]提出了一種自動更新動態(tài)摘要的方法,根據(jù)動態(tài)摘要的認證方案,對動態(tài)摘要信息的多樣性和主題代表性進行綜合評價,并利用所提出的主題簽名模型來評價動態(tài)摘要的新奇程度,動態(tài)摘要生成策略可以減少更新方案實現(xiàn)的復(fù)雜度,實驗結(jié)果表明,張禎等人提出的更新方法不需要進行語言匹配和模型訓(xùn)練,大大降低了實現(xiàn)的復(fù)雜度,提高了提取動態(tài)摘要的效率;考慮到云計算數(shù)據(jù)在網(wǎng)絡(luò)應(yīng)用中經(jīng)常遭到非法竊取,文獻[5]利用密文策略屬性提出了動態(tài)更新操作加密方案,通過線性分段的方式將云計算數(shù)據(jù)分成數(shù)據(jù)塊,利用密文策略屬性的加密技術(shù)對每一塊云計算數(shù)據(jù)進行加密,實現(xiàn)云數(shù)據(jù)的動態(tài)更新,結(jié)果顯示,提出的更新方案可以有效減少云數(shù)據(jù)更新的時間開銷。

基于以上研究背景,提出基于數(shù)據(jù)挖掘的業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔自動更新模型,將數(shù)據(jù)挖掘應(yīng)用到業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔的自動更新模型設(shè)計中,從而提高業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔自動更新性能。

1 業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔自動更新模型設(shè)計

1.1 優(yōu)化設(shè)計業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔存儲結(jié)構(gòu)

在對業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔的存儲結(jié)構(gòu)進行優(yōu)化設(shè)計的過程中,存儲結(jié)構(gòu)的基礎(chǔ)是采集與觸發(fā)業(yè)務(wù)系統(tǒng)元數(shù)據(jù),通過觸發(fā)業(yè)務(wù)系統(tǒng)建立緩沖區(qū),利用系統(tǒng)中的預(yù)處理模塊將元數(shù)據(jù)文檔發(fā)送到主控計算機[6],通過對元數(shù)據(jù)文檔進行聚類處理,分析緩沖區(qū)元數(shù)據(jù)文檔的頻譜,結(jié)合抗干擾操作,保證業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔在存儲過程中的負載均衡性。業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔存儲結(jié)構(gòu)如圖1 所示。

圖1 業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔存儲結(jié)構(gòu)

對于業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔而言,先采用非線性時間序列重組的方式[7],對業(yè)務(wù)系統(tǒng)中的元數(shù)據(jù)文檔進行重組,假設(shè)元數(shù)據(jù)文檔在業(yè)務(wù)系統(tǒng)中的任意兩個聚類簇為Ki和Kj,采用分布式自適應(yīng)篩選的方式,壓縮業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔的特征,過濾并刪除冗余數(shù)據(jù)文檔,建立元數(shù)據(jù)文檔特征壓縮器,表示為:

式中,Ai表示業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔的幅值,θi(t)表示相位。

根據(jù)業(yè)務(wù)系統(tǒng)中元數(shù)據(jù)冗余數(shù)據(jù)具有的丟失文檔特征,采用特征壓縮器得到一個最優(yōu)函數(shù)[8],對元數(shù)據(jù)文檔特征進行匹配,得到壓縮處理后的元數(shù)據(jù)文檔分塊輸出結(jié)果,表示為:

采用以上步驟對元數(shù)據(jù)文檔進行處理后,可以降低業(yè)務(wù)系統(tǒng)的存儲開銷,采用數(shù)據(jù)挖掘算法對元數(shù)據(jù)文檔進行聚類操作,優(yōu)化元數(shù)據(jù)文檔的存儲結(jié)構(gòu)[9]。數(shù)據(jù)挖掘算法的輸出函數(shù)表示為:

式中,Gh表示元數(shù)據(jù)文檔在計算過程中的開銷負載量,φ表示權(quán)重值,Hi表示沖擊響應(yīng)函數(shù),m×n表示元數(shù)據(jù)文檔的幅值。

元數(shù)據(jù)文檔的聚類屬性特征產(chǎn)生之后,需要對其進行聚類,為了減少元數(shù)據(jù)文檔在存儲過程中的冗余,令元數(shù)據(jù)文檔在存儲空間中的存儲介質(zhì)性能衰減函數(shù)為:

式中,k表示元數(shù)據(jù)文檔的特征融合中心,那么得到元數(shù)據(jù)文檔的融合集合為:

式中,q1、q2,…,qm分別表示元數(shù)據(jù)文檔在融合時的嵌入維度系數(shù)。

假設(shè)X=[X1,X2,…,Xk,…,XN]T表示業(yè)務(wù)系統(tǒng)中元數(shù)據(jù)文檔分布的訓(xùn)練樣本集,采用數(shù)據(jù)挖掘算法對元數(shù)據(jù)文檔進行處理[10],得到業(yè)務(wù)系統(tǒng)對元數(shù)據(jù)文檔的存儲區(qū)域函數(shù),表示為:

式中,Qfi表示元數(shù)據(jù)文檔在挖掘時的聚類中心,N表示元數(shù)據(jù)文檔的采集頻率,ui表示數(shù)據(jù)挖掘的模糊隸屬函數(shù)。

利用以上步驟,完成業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔存儲結(jié)構(gòu)的優(yōu)化設(shè)計。

1.2 檢索業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔

通過對業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔存儲結(jié)構(gòu)進行優(yōu)化設(shè)計,可以將原始的元數(shù)據(jù)文檔過濾,但是往往忽略了業(yè)務(wù)系統(tǒng)包含的元數(shù)據(jù)文檔[11]??梢酝ㄟ^采用數(shù)據(jù)挖掘算法確定業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔的重要性,判斷元數(shù)據(jù)文檔在檢索時的優(yōu)先級順序,對元數(shù)據(jù)文檔進行檢索。

假設(shè)B和Bi分別表示業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔的頁面,在Bi中存在一個指向B的連接,這就說明Bi的擁有者認為B是重要的,將Bi的一部分重要性賦予給B,記做,其中,P(B)表示元數(shù)據(jù)文檔頁面B的PageRank 值,C(Bi)表示元數(shù)據(jù)文檔頁面Bi中的出鏈數(shù)量,P(B)的計算公式為:

式中,S表示阻尼系數(shù),通過調(diào)節(jié)S的大小可以調(diào)節(jié)業(yè)務(wù)系統(tǒng)中其他元數(shù)據(jù)文檔頁面對B的重要性。

在業(yè)務(wù)系統(tǒng)中,從錨文本和URL 地址兩個方面,分析元數(shù)據(jù)文檔的主題與鏈接的相關(guān)性,計算公式為:

式中,M表示特征詞總數(shù)。

對R1和R2進行加權(quán)平均運算[12],可以得到元數(shù)據(jù)文檔的主題相關(guān)度計算公式,即:

根據(jù)式(10)的計算,可以得到PageRank 值,通過判斷元數(shù)據(jù)文檔在檢索過程中的優(yōu)先級順序,對元數(shù)據(jù)文檔進行檢索,完成業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔的檢索。

1.3 構(gòu)建業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔自動更新模型

基于業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔的檢索,可以通過以下過程對業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔進行更新。業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔在更新前,需要提取出元數(shù)據(jù)文檔,將更新前和更新后的相同數(shù)量元數(shù)據(jù)文檔進行疊置并比較,實現(xiàn)元數(shù)據(jù)文檔的增量式更新[13]。

令元數(shù)據(jù)文檔在更新之前的集合為A′,表示為:

式中,m表示更新之前的元數(shù)據(jù)文檔對象。更新之后的元數(shù)據(jù)文檔集合為B′,表示為:

式中,v表示更新之后的元數(shù)據(jù)文檔對象。將A′與B′合并,得到集合C′,表示為:

綜上,可以得到元數(shù)據(jù)文檔的增加集合,表示為:

元數(shù)據(jù)文檔的刪除集合,表示為:

根據(jù)以上過程得到的元數(shù)據(jù)增量文檔就是增加部分和刪除部分,需要將其分別儲存在增加表和刪除表中[14],便于后續(xù)的更新。

業(yè)務(wù)系統(tǒng)中元數(shù)據(jù)文檔的增量融合是更新環(huán)節(jié)中最重要的一步,其將元數(shù)據(jù)的增量文檔寫到目標(biāo)數(shù)據(jù)庫中,對元數(shù)據(jù)文檔進行更新[15]。由于元數(shù)據(jù)文檔在增量識別過程中已經(jīng)將其劃分為增加和刪除兩部分,因此對元數(shù)據(jù)文檔的增量融合就是其處理過程。對于增加元數(shù)據(jù)文檔中的增加表來說,文檔的處理過程比較簡單,只需要將元數(shù)據(jù)文檔增加表中的要素轉(zhuǎn)移到目標(biāo)層[16]。

在元數(shù)據(jù)文檔的識別與融合過程中,通過數(shù)據(jù)挖掘算法實現(xiàn)業(yè)務(wù)系統(tǒng)的同步更新,實現(xiàn)元數(shù)據(jù)文檔的自動更新。綜上所述,通過優(yōu)化設(shè)計業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔存儲結(jié)構(gòu),檢索了業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔,結(jié)合業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔自動更新模型的構(gòu)建,實現(xiàn)了業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔的自動更新。

2 實驗對比分析

為了驗證基于數(shù)據(jù)挖掘的業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔自動更新模型的性能,引入文獻[4]和文獻[5]的元數(shù)據(jù)文檔自動更新模型進行對比,從自動更新召回率、更新效率兩個方面進行測試,3 個模型的召回率測試結(jié)果如圖2 所示。

從圖2 的結(jié)果可以看出,隨著元數(shù)據(jù)文檔數(shù)量的增加,3 個元數(shù)據(jù)文檔自動更新模型的召回率都在逐漸增加。該文模型的召回率增加較快,當(dāng)元數(shù)據(jù)文檔數(shù)量達到500 個時,召回率達到了90.5%,當(dāng)元數(shù)據(jù)文檔數(shù)量達到3 000 個時,召回率達到了91.5%,而其他兩個元數(shù)據(jù)文檔自動更新模型的召回率還不到82%,說明基于數(shù)據(jù)挖掘的業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔自動更新模型在召回率方面具有明顯的優(yōu)勢。

圖2 不同模型召回率測試結(jié)果

3 個元數(shù)據(jù)文檔自動更新模型的更新效率測試結(jié)果如圖3 所示,采用更新耗時來衡量元數(shù)據(jù)文檔的自動更新效率。

圖3 不同模型元數(shù)據(jù)文檔自動更新效率測試結(jié)果

從圖3 的結(jié)果可以看出,基于數(shù)據(jù)挖掘的業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔自動更新模型在對元數(shù)據(jù)文檔進行自動更新時,更新的時間是最短的,由于該更新模型在業(yè)務(wù)系統(tǒng)中可以對元數(shù)據(jù)文檔的存儲結(jié)構(gòu)進行優(yōu)化設(shè)計,并利用數(shù)據(jù)挖掘算法減少業(yè)務(wù)系統(tǒng)中的元數(shù)據(jù)文檔傳輸量,減少了元數(shù)據(jù)文檔自動更新的用時,提高了業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔的自動更新效率。

3 結(jié)束語

該文提出了基于數(shù)據(jù)挖掘的業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔自動更新模型,采用數(shù)據(jù)挖掘算法對元數(shù)據(jù)文檔的存儲結(jié)構(gòu)進行了優(yōu)化設(shè)計,通過檢索業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔,構(gòu)建了業(yè)務(wù)系統(tǒng)元數(shù)據(jù)文檔自動更新模型,實現(xiàn)了元數(shù)據(jù)文檔的自動更新。結(jié)果顯示,該更新模型在召回率和更新效率方面具有更好的性能。

猜你喜歡
數(shù)據(jù)挖掘模型系統(tǒng)
一半模型
Smartflower POP 一體式光伏系統(tǒng)
WJ-700無人機系統(tǒng)
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
ZC系列無人機遙感系統(tǒng)
北京測繪(2020年12期)2020-12-29 01:33:58
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
3D打印中的模型分割與打包
主站蜘蛛池模板: 激情综合网址| 色婷婷亚洲综合五月| 99久久婷婷国产综合精| 99国产精品免费观看视频| 亚洲无线国产观看| 伊人查蕉在线观看国产精品| 成年女人a毛片免费视频| 国产69囗曝护士吞精在线视频| 在线欧美国产| 久久精品一卡日本电影| 极品av一区二区| 亚洲欧美日韩成人在线| 免费一级大毛片a一观看不卡| 一级毛片在线免费看| 无码电影在线观看| 国产成人资源| 精品福利视频网| 国产91线观看| 国产精品白浆在线播放| 91亚洲精选| 日韩在线第三页| 欧美一区二区三区香蕉视| 波多野结衣在线一区二区| 中文字幕无码av专区久久| yy6080理论大片一级久久| 国产精品欧美在线观看| 波多野结衣一区二区三区四区| 国内精品久久久久鸭| 4虎影视国产在线观看精品| 欧美日韩在线国产| 亚洲AV无码久久精品色欲| 亚洲天堂.com| 国产亚洲欧美在线中文bt天堂| 国产综合在线观看视频| 亚洲狼网站狼狼鲁亚洲下载| 成人日韩视频| 一区二区三区四区日韩| 国产成人亚洲无吗淙合青草| 日韩精品无码免费一区二区三区 | 五月婷婷精品| 国产最新无码专区在线| 国产精品9| 孕妇高潮太爽了在线观看免费| 99re66精品视频在线观看| 在线看片免费人成视久网下载| 日韩资源站| 国产大全韩国亚洲一区二区三区| 毛片国产精品完整版| 中国精品自拍| 国产一级无码不卡视频| 欧美国产精品不卡在线观看| 亚洲AV电影不卡在线观看| 亚洲欧洲一区二区三区| 亚洲AV无码精品无码久久蜜桃| 美女扒开下面流白浆在线试听| 午夜久久影院| 在线国产三级| 一本大道视频精品人妻| 欧美中文字幕无线码视频| 露脸一二三区国语对白| 欧美福利在线| 欧美成人免费一区在线播放| 精品自拍视频在线观看| 国产综合亚洲欧洲区精品无码| 欧美一级专区免费大片| 91精品国产自产在线老师啪l| 亚洲中文字幕在线一区播放| 国产日韩欧美在线播放| 国产成人做受免费视频| 亚洲无码A视频在线| 久久情精品国产品免费| 伊人丁香五月天久久综合| 国产激情无码一区二区免费| 在线国产毛片| 无码综合天天久久综合网| 波多野结衣在线se| 精品综合久久久久久97超人| 另类专区亚洲| 亚洲欧美不卡| 日本尹人综合香蕉在线观看| 国产免费怡红院视频| 114级毛片免费观看|