999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于貝葉斯網(wǎng)的高維數(shù)據(jù)隱藏模式挖掘

2021-11-18 05:04:48陳傳毅戴衛(wèi)軍
計算機仿真 2021年1期
關鍵詞:數(shù)據(jù)挖掘方法

陳傳毅,戴衛(wèi)軍

(澳門城市大學,澳門 999078)

1 引言

高維數(shù)據(jù)就是指多維數(shù)據(jù),是一維數(shù)據(jù)或者能夠?qū)懗杀磉_式的二維數(shù)據(jù),而高維數(shù)據(jù)同樣可以類推,不過在維數(shù)較高時,很難直觀地表示,因此目前高維數(shù)據(jù)挖掘是重點研究對象。高維數(shù)據(jù)挖掘是指在大量的數(shù)據(jù)內(nèi),找出事先未知、隱含的,同時有用知識的一項任務[1]。是計算技術研究中一個非常具有價值的新領域,主要融合了統(tǒng)計學、機器學習、人工智能以及數(shù)據(jù)庫等多個領域的技術以及理論,成為數(shù)據(jù)庫領域以及國際信息的最新研究方向之一,受到工業(yè)界以及學術界的廣泛關注[2]。

文獻[3]采用無線傳輸技術,對異常數(shù)據(jù)進行降噪處理,結(jié)合FFD技術完成數(shù)據(jù)互通,根據(jù)FIFO挖掘思想,挖掘數(shù)據(jù)并設計挖掘流程,實現(xiàn)大規(guī)模高維數(shù)據(jù)挖掘算法。該方法的數(shù)據(jù)挖掘可靠性強。文獻[4]運用分段向量量化編碼技術,分析云數(shù)據(jù)空間存儲結(jié)構(gòu),根據(jù)閉頻繁項集檢測方法,信息融合處理云數(shù)據(jù)并提關聯(lián)規(guī)則特征,結(jié)合尺度分解方法,降維處理云數(shù)據(jù),采用模糊聚類方法,對云數(shù)據(jù)進行分類挖掘。該方法數(shù)據(jù)挖掘的聚類性能較好。當前高維數(shù)據(jù)隱藏模式挖掘能夠利用降維把數(shù)據(jù)從高維降低至低維,通過增量方法以及并行方法來提升計算性能。而當前高維數(shù)據(jù)隱藏模式挖掘精度較低,挖掘執(zhí)行時間較長,且挖掘過程工作量較大,挖掘過程較為復雜,很難滿足實際需求。

針對上述問題,本文提出一種基于貝葉斯網(wǎng)的高維數(shù)據(jù)隱藏模式挖掘方法,通過有向無環(huán)圖像以及概率表所構(gòu)成貝葉斯網(wǎng)絡,利用信號處理的方法來對數(shù)據(jù)信息進行特征提取,對子空間降維處理,采用自適應級聯(lián)濾波完成數(shù)據(jù)的降噪,將多通道聲的傳感信息數(shù)據(jù)完成自適應進行波束構(gòu)成,聚焦數(shù)據(jù),從而完成高維數(shù)據(jù)的隱藏挖掘。

2 貝葉斯網(wǎng)絡理論

貝葉斯網(wǎng)絡構(gòu)成,具體步驟有以下兩個部分:

第一步:有向無環(huán)圖像(DAG),其中所有節(jié)點都表示一個數(shù)據(jù)變量Xi,Pai表示Xi父節(jié)點集合。

第二步:另外一個條件的概率表(CPT),在表內(nèi)所有元素代表數(shù)據(jù)變量Xi條件的概率密度p(Xi,Pai)。

貝葉斯網(wǎng)絡主要是針對概率推理與圖理論所建立的模型,此模型具體表示為有向無環(huán)圖,是利用節(jié)點與弧進行構(gòu)成的,在其中節(jié)點表示變量的關系,具體表示為證據(jù)或者事件,在兩個節(jié)點之間,弧表示時間之間的關聯(lián)性,是作為單項式的,而進行反饋環(huán)路并不存在[6]。根據(jù)此特性,就能夠?qū)Ω缸庸?jié)點間的關系或者是相連節(jié)點之間的互相關聯(lián)概率進行確認。

貝葉斯網(wǎng)絡在應用于條件概率時,假如某些已經(jīng)發(fā)生的證據(jù)事件E是針對假設性H的,那么H與E二者則同時具有的概率P(H,E)能夠被定義成P(H,E)=P(H)P(E|H)。

具體網(wǎng)絡結(jié)構(gòu)的表達節(jié)點之間具有條件獨立的聯(lián)系,且存在3種局部構(gòu)造[7],具體如下所示:

順連圖像:

圖1 貝葉斯網(wǎng)絡順連結(jié)構(gòu)示意圖

具體公式為:

P(A,B,C)=P(C|B)P(B|A)P(A)

(1)

分連圖像:

圖2 貝葉斯網(wǎng)絡分連結(jié)構(gòu)示意圖

具體公式為:

P(A,B,C)=P(C|B)P(A|B)P(B)

(2)

匯連圖像:

圖3 貝葉斯網(wǎng)絡匯連結(jié)構(gòu)示意圖

具體公式為:

P(A,B,C)=P(B|C,A)P(C)P(A)

(3)

根據(jù)乘法定律的交換性質(zhì),假如H與E二者相關,則說明E就一定會與H有關系,基于此聯(lián)合概率代表公式為

P(H,E)=P(H)P(E|H)=P(E)P(H|E)

(4)

所以

(5)

式(5)為葉貝斯公式,依據(jù)統(tǒng)計學角度,P(H)表示因假設H所引起的E產(chǎn)生條件概率,被稱為H對于E似然估計[8]。證明了H是在真實情況中E所產(chǎn)生的信度。P(H|E)是后驗的概率,如:E產(chǎn)生條件中H所出現(xiàn)概率。

貝葉斯網(wǎng)推斷的基本步驟是:首先選取一個概率密度的函數(shù)π(θ),代表在獲取數(shù)據(jù)前某一個參數(shù)θ信念,將其稱為先驗的分布,對一個模型π(x|θ)進行選取,能夠反映出給定參數(shù)θ狀態(tài)中對于x信念,在獲取數(shù)據(jù)X1,X2,…,Xn之后,對信念進行更新,同時計算后驗的分布π(θ|X1,X2,…,Xn),在后驗分布內(nèi)獲取點的估計與區(qū)間的估計。

貝葉斯網(wǎng)絡可以提供一種便利的表示因果知識路徑,在其網(wǎng)絡中,節(jié)點是能夠作為“輸出節(jié)點”來對類符號的屬性進行表示,且能夠同時存在多個輸出節(jié)點,而對于分類過程所返回類標號的屬性分布概率,就可以對所有類概率完成預測[9]。具體主要來源不確定:

1)該方面的領域?qū)<覍τ谧约赫莆盏闹R的不確定性。

2)在建模的領域自身中存在的不確定因素。

3)知識工程師的表示知識、試圖翻譯而造成的不確定因素。

4)對于知識本身準確性以及所獲取的知識方面,所具有不確定的因素。

通過概率方法完成不準確性步驟的推理,具體過程如下:

第一步:將待處理的問題域,進行抽象成一組隨機的變量集X=X1,X2,…,Xn。

第二步:將相關此問題的知識,代表成一個聯(lián)合概率的分布P(X)。

3 高維數(shù)據(jù)隱藏模式挖掘

3.1 數(shù)據(jù)挖掘框架分析

基于數(shù)據(jù)挖掘質(zhì)量分析的系統(tǒng)框架結(jié)構(gòu)圖像,具體如圖4所示。

圖4 數(shù)據(jù)挖掘與質(zhì)量的框架分析

數(shù)據(jù)挖掘的質(zhì)量分析一般分成4步:

數(shù)據(jù)預處理:當轉(zhuǎn)換規(guī)則與對照表的指導下,來對初始數(shù)據(jù)進行元素化以及標準化的處理,構(gòu)成預處理之后的數(shù)據(jù)信息,而元素化就是解析地址等自由的格式化的文本數(shù)據(jù)信息[10]。

挖掘規(guī)則:該步驟是在預處理之后的數(shù)據(jù)上,選取數(shù)據(jù)的挖掘方法,隱藏挖掘規(guī)則等。

數(shù)據(jù)分析:利用挖掘出的規(guī)則對異常數(shù)據(jù)進行發(fā)現(xiàn),同時進行對應的標記或者結(jié)合領域內(nèi)知識完成修正。

類似重復的記錄匹配與合并:對相似對象識別,清除重復記錄與冗余字段,完成記錄合并。

3.2 降維處理與降噪處理

利用信號處理方法對數(shù)據(jù)信息進行特征提取,完成數(shù)據(jù)高維數(shù)據(jù)隱藏信息的挖掘。首先對高維數(shù)據(jù)進行子空間降維,利用貝葉斯網(wǎng)絡對高維數(shù)據(jù)縮小開銷計算,而相對于高維數(shù)據(jù)的時間序列x1,x2,…,xn,…,能夠?qū)⑵湓O置成采樣數(shù)據(jù)時間的序列長度是N,而序列{Xi}時間的延遲是jτ,具體數(shù)據(jù)構(gòu)造之間的自相關函數(shù)公式是

(6)

以此可以固定j,獲取高維數(shù)據(jù)特征的矢量子空間,具體的子空間函數(shù)公式是

Xq=UDXTRxx(jτ)

(7)

式(7)中:U表示正交函數(shù),把上述奇異值(SVD)分解,D表示高維數(shù)據(jù)的子空間類間的平均距離大小排序,XT表示非零的特征值。經(jīng)過以上的子空間降維,完成數(shù)據(jù)的維度降低。然后以此作為基礎,利用自適應級聯(lián)濾波完成數(shù)據(jù)的降噪[11]。

如果數(shù)據(jù)的挖掘背景噪聲內(nèi),具有Nx個正弦的信號,那么就說明所有的結(jié)構(gòu)單元Hi(z)都是可變參數(shù)θ1i(k),最后選取可以使系統(tǒng)輸出噪聲更小的,具體濾波器傳遞函數(shù)公式為

(8)

與簡化梯度的算法進行結(jié)合,利用級聯(lián)的Nv個陷波器將濾波函數(shù)改成

(9)

式(9)中:陷波器頻率的參數(shù)a與帶寬的參數(shù)r,φi(k)主要是作為第i級梯度的信號,在經(jīng)過上述處理,就能夠完成對數(shù)據(jù)降噪,提升數(shù)據(jù)的挖掘精度。

3.3 數(shù)據(jù)隱藏模式挖掘

經(jīng)過上述的降維處理與降噪濾波之后,能夠?qū)⒍嗤ǖ赖膫鞲行畔?shù)據(jù)完成自適應的波束構(gòu)成,然后利用提取特征的方式來對數(shù)據(jù)完成聚焦[12],具體輸入高維數(shù)據(jù)的噪聲p(ek|uk),方差與均值服從的分布公式為

(10)

相對于多個已知的干擾線譜內(nèi)的高維特征矢量,建立自適應的波束形成器公式為

xmin,j=min{H(z)(xmax,j-xmin,j)}

(11)

xmax,j=max{H(z)(xmax,j-xmin,j)}

(12)

(13)

經(jīng)過自適應的波束構(gòu)成,其高維數(shù)據(jù)的矢量x(t)以及波束的聚焦核K-P(t,u)是作為基函數(shù)所展開的,具體構(gòu)成新的映射公式為

(14)

將up軸定義成po階段的Fourier域,則噪聲與干擾的情況,就能夠利用自適應的波束所形成,以此完成高維數(shù)據(jù)的隱藏挖掘。

4 實驗結(jié)果分析

為了驗證所提方法的有效性,在仿真為MATLABR2014的環(huán)境下,選擇浪潮XEON服務器,CPU主頻選擇2.4GHz,內(nèi)存選擇4GB,軟件選擇Windows 2003,程序選擇Delphi7編寫進行實驗。在實驗中的6組數(shù)據(jù)集是T40.I30.D8000K,其項目數(shù)分別為5000、10000、15000、20000、25000,事務量分別為2000、4000、6000、8000、10000,通過IBM數(shù)據(jù)發(fā)生器構(gòu)成,存在高維大數(shù)據(jù)集特征。分別采用文獻[3]方法、文獻[4]方法和所提方法對高維數(shù)據(jù)隱藏模式挖掘的執(zhí)行時間進行對比,具體對比結(jié)果如圖5所示。

圖5 不同方法高維數(shù)據(jù)隱藏模式挖掘執(zhí)行時間

分析圖5可知,隨著事務量的增加,不同方法的高維數(shù)據(jù)隱藏模式挖掘執(zhí)行時間均增加。其中,文獻[3]方法的高維數(shù)據(jù)隱藏模式挖掘平均執(zhí)行時間為28.8s,文獻[4]方法的高維數(shù)據(jù)隱藏模式挖掘平均執(zhí)行時間為24.4s,而所提方法的高維數(shù)據(jù)隱藏模式挖掘平均執(zhí)行時間為9s。由此可知,所提方法的高維數(shù)據(jù)隱藏模式挖掘執(zhí)行時間較短,本文主要采用貝葉斯網(wǎng)絡確認父子節(jié)點間的關系或相連節(jié)點之間的互相關聯(lián)概率,從而有效縮短高維數(shù)據(jù)隱藏模式挖掘執(zhí)行時間。

在此基礎上分別采用文獻[3]方法、文獻[4]方法與所提方法對高維數(shù)據(jù)隱藏模式挖掘工作量進行對比。minlen是評價高維數(shù)據(jù)隱藏模式挖掘過程工作量大小的指標。minlen越大,說明高維數(shù)據(jù)隱藏模式挖掘工作量越少,反之,minlen越小,說明高維數(shù)據(jù)隱藏模式挖掘工作量越多,如果minlen太小了,則交集的事務量增加明顯,導致高維數(shù)據(jù)隱藏模式挖掘執(zhí)行時間較長,從而影響了整體的性能。具體對比結(jié)果如圖6所示。

圖6 不同方法高維數(shù)據(jù)隱藏模式挖掘工作量

分析圖6可知,當項目數(shù)為25×103時,文獻[3]方法的minlen值最大為4,文獻[4]方法的minlen值最大為10,而所提方法的minlen值最大為17。由此可知,所提方法的高維數(shù)據(jù)隱藏模式挖掘工作量越少,挖掘過程較為簡單。

為了進一步驗證所提方法的精度,在同一條件下,選取6組數(shù)據(jù)集,將所提方法與文獻[3]方法、文獻[4]方法進行對比,具體對比結(jié)果如圖7所示。

圖7 不同方法高維數(shù)據(jù)隱藏模式挖掘精度

通過圖7能夠看出,文獻[3]方法和文獻[4]方法的高維數(shù)據(jù)隱藏模式挖掘精度僅在70%左右,在實際應用時,經(jīng)常會出現(xiàn)部分數(shù)據(jù)挖掘遺漏的情況。而所提方法的高維數(shù)據(jù)隱藏模式挖掘精度在90%左右,雖然同樣存在部分遺漏,但相對于文獻[3]方法和文獻[4]方法遺漏的數(shù)量較少,在實際應用效果較好。由此可以看出,所提方法的高維數(shù)據(jù)隱藏模式挖掘精度較高,本文主要利用自適應級聯(lián)濾波對高維數(shù)據(jù)降噪處理,有效提升數(shù)據(jù)的挖掘精度。

5 結(jié)束語

目前計算機技術各種類型數(shù)據(jù)收集工作量越來越大,致使數(shù)據(jù)庫的規(guī)模逐漸變大,數(shù)據(jù)維度也越來越高。而這些高維的數(shù)據(jù)中,僅有部分的數(shù)據(jù)是有用的,所以需要在其中進行挖掘,尋找出有用的數(shù)據(jù)進行利用。而當前數(shù)據(jù)挖掘方法,由于挖掘精度低,執(zhí)行時間較長,且挖掘過程工作量較大,過程較為復雜,很難達到實際應用需求。本文提出一種基于貝葉斯網(wǎng)的高維數(shù)據(jù)隱藏模式挖掘方法,先闡述貝葉斯網(wǎng)絡的構(gòu)成,通過貝葉斯網(wǎng)來計算高維數(shù)據(jù),減少計算開銷,利用信號的方式來對數(shù)據(jù)特征信息提取,完成高維數(shù)據(jù)子空間信息的降維操作,采用自適應級聯(lián)濾波對高維數(shù)據(jù)進行降噪,最終把多通道聲傳感信息的數(shù)據(jù)完成自適應進行波束構(gòu)成,聚焦數(shù)據(jù),完成數(shù)據(jù)挖掘。實驗結(jié)果表明,所提方法能夠有效縮短高維數(shù)據(jù)隱藏模式挖掘執(zhí)行時間,且數(shù)據(jù)挖掘精度,其挖掘過程工作量較小,挖掘過程較為簡單。

猜你喜歡
數(shù)據(jù)挖掘方法
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
學習方法
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)挖掘技術在中醫(yī)診療數(shù)據(jù)分析中的應用
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
數(shù)據(jù)挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
主站蜘蛛池模板: 热re99久久精品国99热| 青青草原国产一区二区| 大香伊人久久| 亚洲愉拍一区二区精品| 99久久人妻精品免费二区| 亚洲αv毛片| 久久国产精品无码hdav| 亚洲国产成熟视频在线多多| 国产原创演绎剧情有字幕的| 无码AV日韩一二三区| 亚洲综合久久一本伊一区| 精品黑人一区二区三区| 亚洲人成在线精品| 免费在线成人网| 国产H片无码不卡在线视频| 国产女人18水真多毛片18精品| 亚洲国产精品一区二区第一页免| 欧美成人综合在线| 中文字幕人成乱码熟女免费| 熟女日韩精品2区| 亚洲中文字幕在线观看| 伊人色在线视频| 国产91av在线| 国产精品视频导航| 97在线免费| 99999久久久久久亚洲| 制服丝袜国产精品| 国产二级毛片| 久久伊人久久亚洲综合| av免费在线观看美女叉开腿| 操国产美女| 亚洲日韩国产精品综合在线观看| 黄色网页在线观看| 中文字幕亚洲精品2页| 色婷婷视频在线| 国产美女精品一区二区| 91视频国产高清| 久草青青在线视频| 成年免费在线观看| 亚洲av无码专区久久蜜芽| 免费看一级毛片波多结衣| 国产美女在线观看| 欧美中文一区| 欧美激情伊人| 日韩免费视频播播| 免费在线观看av| 91福利国产成人精品导航| 国产午夜不卡| 99精品在线视频观看| 国产亚洲精品va在线| 欧美一区精品| 国产精品福利社| 九色在线视频导航91| 欧美日韩v| 国产精品综合久久久| 亚洲va在线观看| 欧美成人手机在线观看网址| 成人午夜网址| 亚洲最大福利视频网| 毛片久久网站小视频| 国产一级二级在线观看| 久久精品人人做人人综合试看| 少妇精品网站| 日韩在线视频网| 91香蕉视频下载网站| 亚洲欧美极品| 伊人久久大香线蕉影院| 91人妻日韩人妻无码专区精品| 日韩精品毛片人妻AV不卡| 第一区免费在线观看| 欧美亚洲另类在线观看| 2021天堂在线亚洲精品专区| 91九色国产porny| 狠狠色丁婷婷综合久久| 全色黄大色大片免费久久老太| 9cao视频精品| 久久国产精品77777| 最新精品久久精品| 午夜激情福利视频| 91无码视频在线观看| 一本大道视频精品人妻| 视频一区视频二区日韩专区 |