999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數(shù)據(jù)集序列模式挖掘算法分析

2020-03-10 02:56:55李克
科學(xué)與財(cái)富 2020年33期
關(guān)鍵詞:大數(shù)據(jù)

李克

摘 要:大數(shù)據(jù)時(shí)代背景下,網(wǎng)絡(luò)技術(shù)和數(shù)據(jù)技術(shù)的使用非常關(guān)鍵,對(duì)于社會(huì)發(fā)展也起到了重要的作用。本文筆者針對(duì)大數(shù)據(jù)集序列模式挖掘算法進(jìn)行了分析研究,文章中闡述了大數(shù)據(jù)以及序列模式挖掘,并針對(duì)BLSPM算法進(jìn)行試驗(yàn)和結(jié)果分析。

關(guān)鍵詞:大數(shù)據(jù);BLSPM算法;序列模式挖掘

1 大數(shù)據(jù)和序列模式挖掘的概念

1.1 大數(shù)據(jù)的概念

大數(shù)據(jù)是信息社會(huì)發(fā)展過程中形成的數(shù)據(jù)集合,其發(fā)展的背景信息化技術(shù)。計(jì)算機(jī)技術(shù)問世,其兩方面技術(shù)應(yīng)用最為廣泛,其一是數(shù)據(jù)運(yùn)算,其二就是數(shù)據(jù)信息管理,能夠?qū)崿F(xiàn)數(shù)據(jù)的儲(chǔ)存和分析。而隨著社會(huì)技術(shù)的發(fā)展,數(shù)據(jù)量也不斷增加,當(dāng)前在社會(huì)發(fā)展的過程中,信息技術(shù)開始逐漸朝向數(shù)據(jù)技術(shù)發(fā)展,形成了大數(shù)據(jù)技術(shù)。大數(shù)據(jù)當(dāng)前而言主要包括兩個(gè)方面。其一,是數(shù)據(jù)處理儲(chǔ)存量不斷增大,計(jì)算機(jī)技術(shù)中數(shù)據(jù)處理的單位從MB已經(jīng)達(dá)到了ZB,其數(shù)據(jù)變化巨大,并且相關(guān)數(shù)據(jù)專家預(yù)測,數(shù)據(jù)技術(shù)的儲(chǔ)存容量還會(huì)繼續(xù)增大10倍甚至20倍。另外一方面,大數(shù)據(jù)技術(shù)應(yīng)用于數(shù)據(jù)分析,其中包括數(shù)據(jù)庫分析、數(shù)據(jù)關(guān)系分析以及數(shù)據(jù)結(jié)構(gòu)分析等,數(shù)據(jù)分析技術(shù)在當(dāng)前社會(huì)中應(yīng)用更加廣泛,其具體分析過程中還包括數(shù)據(jù)采集、數(shù)據(jù)導(dǎo)入、數(shù)據(jù)統(tǒng)計(jì)以及數(shù)據(jù)挖掘等多個(gè)技術(shù)部分,對(duì)于數(shù)據(jù)的分析處理有非常重要的作用。在未來,數(shù)據(jù)容量更大,數(shù)據(jù)采集技術(shù)更加先進(jìn)、數(shù)據(jù)挖掘也將會(huì)被更多的應(yīng)用,大數(shù)據(jù)將會(huì)對(duì)世界帶來重大的改變[2]。

1.2 序列模式挖掘的概念

序列模式挖掘是大數(shù)據(jù)背景下對(duì)數(shù)據(jù)挖掘的重要技術(shù)模式,在當(dāng)前社會(huì)中的應(yīng)用非常廣泛,信息市場調(diào)研、預(yù)測天氣變化、市場變化趨勢、網(wǎng)絡(luò)網(wǎng)站訪問模式等。在序列模式挖掘具體應(yīng)用的過程中,是在序列數(shù)據(jù)庫當(dāng)中將子序列頻繁出現(xiàn)作為數(shù)據(jù)的挖掘模式進(jìn)行數(shù)據(jù)分析,能夠?qū)崿F(xiàn)數(shù)據(jù)挖掘分析的精度提升。應(yīng)用較為早期的序列模式挖掘算法為Apriori,其在計(jì)算中使用到關(guān)聯(lián)性原則,而隨著現(xiàn)代社會(huì)中數(shù)據(jù)量的逐漸增大,所以在實(shí)際的社會(huì)應(yīng)用中Apriori算法應(yīng)用精度較差,所以現(xiàn)代社會(huì)發(fā)展中,急需一種適應(yīng)社會(huì)的序列發(fā)展模式,保證數(shù)據(jù)使用更加高效。

2 大數(shù)據(jù)集序列模式挖掘算法

2.1 BLSPM算法和實(shí)驗(yàn)結(jié)果

BLSPM是一種新式序列模式挖掘算法,其發(fā)展的前身是PrefixSpan算法以下是對(duì)該算法進(jìn)行的分析研究。在BLSPM算法中,提出了利用隔層投影和剪枝策略的相互合作數(shù)據(jù)挖掘計(jì)算模式,可以減少數(shù)據(jù)庫處理中的投影數(shù)據(jù)量,并完成對(duì)最小支持度數(shù)據(jù)序列模式的剪枝刪除,從而保證數(shù)據(jù)分析更加精準(zhǔn)。

為了研究BLSPM算法,本文針對(duì)算法應(yīng)用進(jìn)行了具體的試驗(yàn),試驗(yàn)中設(shè)立數(shù)據(jù)庫為S(圖1),并且設(shè)置為min_sup=2。以下是對(duì)BLSPM 算法挖掘記性的相關(guān)闡述。1.初始挖掘運(yùn)算中,數(shù)據(jù)庫開始完成對(duì)1個(gè)長度單位的序列模式進(jìn)行查找,查找過程中對(duì)BLSPM序列集進(jìn)行全盤掃描,挖掘頻繁序列模式以及非頻繁序列模式,并對(duì)費(fèi)頻繁序列模式進(jìn)行減除。2.實(shí)際的數(shù)據(jù)挖算法中利用序列集中的頻繁序列項(xiàng)作為X軸和Y軸,從而構(gòu)建形成M矩陣。以下圖2為S矩陣構(gòu)建圖。通過矩陣圖構(gòu)建能夠完成對(duì)數(shù)據(jù)的有效采集,從而保證數(shù)據(jù)處理更加高效。

3.利用序列模式數(shù)據(jù)庫進(jìn)行子集查找。支持度不小于 2序列模式在數(shù)據(jù)集中查找,遞歸地挖掘頻繁序列的子集。4. BLSPM算法中第四部是對(duì)兩部分進(jìn)行重復(fù)查找和執(zhí)行,并對(duì)所有的長度頻繁序列進(jìn)行集合,從而保證頻繁序列集合查找更加精準(zhǔn)。5.是BLSPM算法的最終結(jié)果步驟,其中包括頻繁項(xiàng)目集的序列模式并將進(jìn)行排序。以下表三為最終序列圖。

2.2 基于Map-Reduce的BLSPM算法和結(jié)果

基于Map-Reduce的BLSPM算法也是當(dāng)前BLSPM算法的發(fā)展,在其行和具體計(jì)算的過程中其計(jì)算主要分為以下幾方面內(nèi)容;1.數(shù)據(jù)分片是BLSPM算法中的重要組成部分,在實(shí)際的計(jì)算過程中,選擇將BLSPM的大數(shù)據(jù)集進(jìn)行分部,將其分部成連續(xù)性的數(shù)據(jù)片,從而做好數(shù)據(jù)分類。2.數(shù)據(jù)并行計(jì)數(shù)。數(shù)據(jù)并行技術(shù)也是利用大數(shù)據(jù)庫進(jìn)行掃描,實(shí)際的計(jì)算過程中,選擇利用Map-Reducwe型進(jìn)行序列支持度計(jì)算,計(jì)算全局的長度為 1 的頻繁項(xiàng)集Flist。3.建立三角矩陣。在Map-Reduce的BLSPM算法中,也是利用Flist1 中 n 個(gè)序列進(jìn)行三角矩陣設(shè)計(jì),分別建設(shè)X軸和Y軸。4.均衡分組設(shè)計(jì)。均衡分組設(shè)計(jì)是在實(shí)際的計(jì)算過程中,選擇使用到負(fù)載均衡策略進(jìn)行序列模式分組,制定成為新Glist數(shù)據(jù)表。5. 在Map-Reduce的BLSPM算法中選擇使用并性挖掘技術(shù)對(duì)大數(shù)據(jù)集中的組別進(jìn)行劃分,利用Glist數(shù)據(jù)表進(jìn)行并行數(shù)據(jù)挖掘,也選擇使用Map-Reduce軟件來完成第二階段的數(shù)據(jù)挖掘,完成對(duì)序列集的數(shù)據(jù)挖掘和計(jì)算。以下是Map-Reduce軟件的數(shù)據(jù)計(jì)算代碼。

Input: key is the number of each shard, value is T

Output: , where key is the item of T ,value is the number of item

Begin

String str= value.toString();

While(str.hasNext())

{

Item=str.next();

//輸出

Context.Write (item,1);

}

End

3.結(jié)束語

本文以具體試驗(yàn)詳細(xì)闡述了BLSPM算法與Map-Reduce的BLSPM算法的計(jì)算過程,希望能夠?qū)Υ髷?shù)據(jù)集序列模式挖掘算法的發(fā)展有所幫助。

參考文獻(xiàn):

[1]曾毅, 張福泉. 基于多效用閾值的分布式高效用序列模式挖掘[J]. 計(jì)算機(jī)工程與設(shè)計(jì), 2020, 041(002):449-457.

(河北省信息資源管理中心? 河北? 石家莊? 050000)

猜你喜歡
大數(shù)據(jù)
基于在線教育的大數(shù)據(jù)研究
中國市場(2016年36期)2016-10-19 04:41:16
“互聯(lián)網(wǎng)+”農(nóng)產(chǎn)品物流業(yè)的大數(shù)據(jù)策略研究
中國市場(2016年36期)2016-10-19 03:31:48
基于大數(shù)據(jù)的小微電商授信評(píng)估研究
中國市場(2016年35期)2016-10-19 01:30:59
大數(shù)據(jù)時(shí)代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數(shù)據(jù)在出版業(yè)的應(yīng)用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯(lián)網(wǎng)+”對(duì)傳統(tǒng)圖書出版的影響和推動(dòng)作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數(shù)據(jù)環(huán)境下基于移動(dòng)客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
科技視界(2016年20期)2016-09-29 10:53:22
數(shù)據(jù)+輿情:南方報(bào)業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 精品一区二区三区水蜜桃| 国产成人三级| 国模极品一区二区三区| 久久毛片网| 国产亚洲精品yxsp| 国产自在线拍| 精品人妻系列无码专区久久| 国产在线八区| 中文字幕无码制服中字| 91视频国产高清| 99成人在线观看| 久久免费成人| 国产玖玖视频| 久久婷婷色综合老司机| 无码高潮喷水在线观看| 日韩乱码免费一区二区三区| 一级在线毛片| 国产综合日韩另类一区二区| 狠狠综合久久久久综| 国产免费观看av大片的网站| 国产91精品调教在线播放| 日韩无码黄色| 啦啦啦网站在线观看a毛片| 亚洲精品成人7777在线观看| 九色在线视频导航91| 人妻丝袜无码视频| 熟女日韩精品2区| 99激情网| 狼友视频国产精品首页| 成人久久精品一区二区三区| 色香蕉网站| 一区二区三区毛片无码| h视频在线播放| 日本色综合网| 亚洲不卡无码av中文字幕| 狼友av永久网站免费观看| 亚洲国产欧美国产综合久久| 日本人真淫视频一区二区三区| 欧美视频二区| 男女男精品视频| 国产成人无码Av在线播放无广告| 色有码无码视频| 免费在线国产一区二区三区精品| 日本三级欧美三级| 在线欧美日韩| 一级毛片在线播放免费| 99伊人精品| 高清亚洲欧美在线看| 大陆精大陆国产国语精品1024| 91九色视频网| 91免费国产高清观看| 亚洲成人一区二区| 国产福利影院在线观看| 四虎永久在线视频| 91免费国产高清观看| 国产鲁鲁视频在线观看| 久久国产av麻豆| 久久一级电影| 尤物精品国产福利网站| 国产成人夜色91| 亚洲精品免费网站| 51国产偷自视频区视频手机观看| 美女被狂躁www在线观看| 国产一级在线观看www色| 国产人人射| 伊人成人在线视频| 国产精品一区二区无码免费看片| 色综合中文字幕| 亚洲一区国色天香| 精品国产自在现线看久久| 国产av色站网站| 伊人激情综合| 欧美三级视频网站| 小说 亚洲 无码 精品| 久久久久人妻一区精品色奶水| 国产精品视频免费网站| 9999在线视频| 欧美成人a∨视频免费观看| 亚洲愉拍一区二区精品| 99re视频在线| 午夜久久影院| 国产成人亚洲欧美激情|