李 潔
(馬鞍山學(xué)院,安徽 馬鞍山 243000)
隨著圖數(shù)據(jù)頻繁模式分布數(shù)據(jù)結(jié)構(gòu)的發(fā)展,采用圖數(shù)據(jù)頻繁模式數(shù)據(jù)結(jié)構(gòu)方法進(jìn)行數(shù)據(jù)庫構(gòu)造,提高數(shù)據(jù)的存儲(chǔ)和檢測(cè)能力.在進(jìn)行圖數(shù)據(jù)頻繁模式數(shù)據(jù)庫設(shè)計(jì)中,需要進(jìn)行圖數(shù)據(jù)頻繁模式挖掘,建立圖數(shù)據(jù)頻繁模式的挖掘模型.結(jié)合圖模式結(jié)構(gòu)分析方法,進(jìn)行圖數(shù)據(jù)頻繁模式挖掘,研究圖數(shù)據(jù)頻繁模式挖掘方法在實(shí)現(xiàn)圖數(shù)據(jù)頻繁模式數(shù)據(jù)庫設(shè)計(jì)和數(shù)據(jù)信息檢測(cè)中具有重要意義[1].對(duì)圖數(shù)據(jù)頻繁模式挖掘是建立在對(duì)圖數(shù)據(jù)頻繁項(xiàng)檢測(cè)的基礎(chǔ)上,采用閉頻繁項(xiàng)特征分析方法,建立圖數(shù)據(jù)頻繁模式挖掘的圖模式解耦模型.但傳統(tǒng)方法進(jìn)行圖數(shù)據(jù)頻繁模式挖掘的自適性不高,因此,提出了基于解耦概要圖的圖數(shù)據(jù)頻繁模式挖掘算法.構(gòu)建閉頻繁項(xiàng)特征分析模型,以MySQL為數(shù)據(jù)庫進(jìn)行圖數(shù)據(jù)頻繁模式數(shù)據(jù)可視化系統(tǒng)構(gòu)造[2],實(shí)現(xiàn)圖數(shù)據(jù)頻繁模式挖掘.首先建立圖數(shù)據(jù)頻繁模式挖掘的模糊相關(guān)性融合模型,采用解耦概要圖檢測(cè)方法進(jìn)行圖數(shù)據(jù)頻繁模式挖掘過程中的特征提取,其中,引入了關(guān)聯(lián)規(guī)則進(jìn)行數(shù)據(jù)的處理,以實(shí)現(xiàn)深度挖掘數(shù)據(jù)的信息,然后,提取圖數(shù)據(jù)頻繁模式的模糊屬性特征,利用STARMA(1,1)統(tǒng)計(jì)分析模型,實(shí)現(xiàn)了尋優(yōu)控制,建立圖數(shù)據(jù)頻繁模式挖掘的特征提取和分類模型,最后實(shí)驗(yàn)分析結(jié)果表明,本文方法能夠在一定程度上提高圖數(shù)據(jù)頻繁模式挖掘能力.
為了實(shí)現(xiàn)基于解耦概要圖的圖數(shù)據(jù)頻繁模式挖掘,需要采用解耦概要圖模式分析方法進(jìn)行圖數(shù)據(jù)頻繁模式特征檢測(cè),根據(jù)圖數(shù)據(jù)頻繁模式數(shù)據(jù)的混合分類屬性進(jìn)行相似度分析,提取圖數(shù)據(jù)頻繁模式數(shù)據(jù)的數(shù)值屬性特征和分類特征,提取圖數(shù)據(jù)頻繁模式數(shù)據(jù)的數(shù)值屬性特征和分類屬性特征,完成圖數(shù)據(jù)頻繁模式數(shù)據(jù)優(yōu)化挖掘[3],采用點(diǎn)、線、面狀要素聯(lián)合分析方法,建立圖數(shù)據(jù)頻繁模式數(shù)據(jù)的信息屬性鏈模型,建立圖數(shù)據(jù)頻繁模式數(shù)據(jù)挖掘的模糊決策特征分布函數(shù),采用自適應(yīng)尋優(yōu)方法,進(jìn)行圖數(shù)據(jù)頻繁模式數(shù)據(jù)的優(yōu)化挖掘和信息檢測(cè).建立圖數(shù)據(jù)頻繁模式數(shù)據(jù)的屬性鏈表,得到圖數(shù)據(jù)頻繁模式數(shù)據(jù)的空間分布結(jié)構(gòu)模型如圖1所示.

圖1 圖數(shù)據(jù)頻繁模式數(shù)據(jù)的空間分布結(jié)構(gòu)模型Fig. 1 Spatial distribution structure model of graph data frequent pattern data
根據(jù)圖1所示的圖數(shù)據(jù)頻繁模式數(shù)據(jù)分析模型,采用分塊區(qū)域融合方法檢測(cè)模式信息,建立圖數(shù)據(jù)頻繁模式信息特征分布集,采用多元回歸分析方法[4],建立模糊信息融合模型,進(jìn)行圖數(shù)據(jù)頻繁模式挖掘的自適應(yīng)學(xué)習(xí),建立圖數(shù)據(jù)頻繁模式挖掘的量化分析模型,得到圖數(shù)據(jù)頻繁模式挖掘的統(tǒng)計(jì)函數(shù)為:

式中,ζ表示挖掘評(píng)價(jià)的約束指標(biāo)參量集,R為圖數(shù)據(jù)頻繁模式挖掘的解耦特征量,結(jié)合模糊度檢測(cè)方法,進(jìn)行圖數(shù)據(jù)頻繁模式挖掘.
根據(jù)圖數(shù)據(jù)頻繁模式挖掘的模糊特征分布集,對(duì)圖數(shù)據(jù)頻繁模式數(shù)據(jù)進(jìn)行自適應(yīng)挖掘[5],圖數(shù)據(jù)頻繁模式挖掘的更新規(guī)則如式(3):

其中

式中,λ表示圖數(shù)據(jù)頻繁模式挖掘的大數(shù)據(jù)模糊度分布因子,F(xiàn)?μ為統(tǒng)計(jì)特征分量,ωw為自適應(yīng)加權(quán)系數(shù),結(jié)合自相關(guān)特征檢測(cè)方法[6]進(jìn)行圖數(shù)據(jù)頻繁模式挖掘的統(tǒng)計(jì)分析,建立圖數(shù)據(jù)頻繁模式挖掘的模糊相關(guān)性融合模型,結(jié)合統(tǒng)計(jì)分析方法進(jìn)行圖數(shù)據(jù)頻繁模式挖掘的圖模型設(shè)計(jì),構(gòu)建圖數(shù)據(jù)頻繁模式挖掘的統(tǒng)計(jì)分析模型的表達(dá)式為:

建立圖數(shù)據(jù)頻繁模式挖掘的關(guān)聯(lián)規(guī)則分布集RN與XN,得到圖數(shù)據(jù)頻繁模式的關(guān)聯(lián)分布關(guān)系為:

通過挖掘圖數(shù)據(jù)頻繁模式數(shù)據(jù)的語義關(guān)聯(lián)特征量[7],結(jié)合模糊屬性特征檢測(cè)方法,實(shí)現(xiàn)圖數(shù)據(jù)頻繁模式數(shù)據(jù)集統(tǒng)計(jì)的檢測(cè),結(jié)合自相關(guān)特征檢測(cè)方法[8]進(jìn)行圖數(shù)據(jù)頻繁模式挖掘的統(tǒng)計(jì)分析,建立圖數(shù)據(jù)頻繁模式挖掘的模糊相關(guān)性融合模型,建立圖數(shù)據(jù)頻繁模式數(shù)據(jù)的特征分割模型,計(jì)算式定義為:

其中,wij為第i個(gè)點(diǎn)的圖數(shù)據(jù)頻繁模式數(shù)據(jù)挖掘的全局加權(quán)值,構(gòu)建圖數(shù)據(jù)頻繁模式數(shù)據(jù)的STARMA(1,1)統(tǒng)計(jì)分析模型,進(jìn)行圖數(shù)據(jù)頻繁模式數(shù)據(jù)挖掘的尋優(yōu)控制,其計(jì)算式為:

其中,di和dj為圖數(shù)據(jù)頻繁模式數(shù)據(jù)挖掘的模糊規(guī)則特征量,采用統(tǒng)計(jì)信息分析方法,建立圖數(shù)據(jù)頻繁模式數(shù)據(jù)挖掘關(guān)聯(lián)特征分布集[9],表示為:

其中

式中,NB為解耦概要圖的閉頻繁項(xiàng)集,NS為語義分割域S中的解耦概要圖分布域.
采用大數(shù)據(jù)融合方法進(jìn)行圖數(shù)據(jù)頻繁模式挖掘的模式匹配和信息融合聚類,在特征點(diǎn)i處,得到t時(shí)刻的圖數(shù)據(jù)頻繁模式分布集表示為(w1j,w2j,…,wtj) ,其中,t表示為圖數(shù)據(jù)頻繁模式數(shù)據(jù)的編號(hào)數(shù)目,wtj為圖數(shù)據(jù)頻繁模式數(shù)據(jù)挖掘的加權(quán)系數(shù),通過語義動(dòng)態(tài)特征分割方法,得到標(biāo)準(zhǔn)誤差系數(shù)為:

其中,maxlFreqij為圖數(shù)據(jù)頻繁模式數(shù)據(jù)挖掘?qū)?yōu)的模糊約束特征量.建立圖數(shù)據(jù)頻繁模式數(shù)據(jù)挖掘的存儲(chǔ)模塊和信息查詢模塊,采用解耦概要圖檢測(cè)方法進(jìn)行圖數(shù)據(jù)頻繁模式挖掘過程中的特征提取[10],建立圖數(shù)據(jù)頻繁模式挖掘的特征提取和分類模型,得到挖掘輸出:

式中

采用圖數(shù)據(jù)頻繁模式數(shù)據(jù)特征提取方法進(jìn)行圖數(shù)據(jù)頻繁模式挖掘.
為了驗(yàn)證本文方法的應(yīng)用性能,在Matlab仿真平臺(tái)上進(jìn)行實(shí)驗(yàn),對(duì)圖數(shù)據(jù)頻繁模式采樣的傳感節(jié)點(diǎn)數(shù)為80,頻繁項(xiàng)分布集為80,圖數(shù)據(jù)頻繁模式數(shù)據(jù)分布的空間維數(shù)為12,信息采樣的時(shí)延為1.4 ms,根據(jù)上述仿真參數(shù)設(shè)定,進(jìn)行圖數(shù)據(jù)頻繁模式數(shù)據(jù)挖掘,得到數(shù)據(jù)采樣的時(shí)域分布(圖2).

圖2 圖數(shù)據(jù)頻繁模式挖掘時(shí)域分布Fig. 2 Time domain distribution of graph data frequent pattern mining
以圖2所示的數(shù)據(jù)為研究對(duì)象,采用大數(shù)據(jù)融合方法進(jìn)行圖數(shù)據(jù)頻繁模式挖掘的模式匹配和信息融合聚類,根據(jù)信息融合結(jié)果實(shí)現(xiàn)對(duì)圖數(shù)據(jù)頻繁模式挖掘優(yōu)化,得到挖掘輸出(圖3).

圖3 圖數(shù)據(jù)頻繁模式數(shù)據(jù)挖掘輸出Fig. 3 Graph data frequent pattern data mining output
分析圖3得知,本文方法的特征聚斂性較好.測(cè)試不同方法數(shù)據(jù)挖掘的精度,結(jié)果見表1.分析表1得知,本文方法的精度較高,平均為95.94%,而文獻(xiàn)[4]方法、文獻(xiàn)[6]方法和文獻(xiàn)[7]方法的平均精度分別為90.2%、89.5%和84.34%.由此可見,本文方法的數(shù)據(jù)挖掘精度較高,優(yōu)于其他方法,具有更好的應(yīng)用性能.

表1 數(shù)據(jù)挖掘的精度對(duì)比Tab. 1 Precision comparison of data mining
筆者提出了基于解耦概要圖的圖數(shù)據(jù)頻繁模式挖掘算法.采用多元回歸分析方法,建立模糊信息融合模型,進(jìn)行圖數(shù)據(jù)頻繁模式挖掘的自適應(yīng)學(xué)習(xí),結(jié)合統(tǒng)計(jì)分析方法進(jìn)行圖數(shù)據(jù)頻繁模式挖掘的圖模型設(shè)計(jì),通過語義動(dòng)態(tài)特征分割方法,建立圖數(shù)據(jù)頻繁模式數(shù)據(jù)挖掘的存儲(chǔ)模塊和信息查詢模塊,采用解耦概要圖檢測(cè)方法進(jìn)行圖數(shù)據(jù)頻繁模式挖掘過程中的特征提取.研究得知,采用本文方法進(jìn)行圖數(shù)據(jù)頻繁模式挖掘的自適應(yīng)性較好,挖掘精度較高.