999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

關于數據挖掘中關聯規則算法的相關問題研究

2017-11-16 21:21:44李艷
科技創新與應用 2017年33期
關鍵詞:數據挖掘研究

李艷

摘 要:經濟的發展帶動了信息技術的發展,數據挖掘技術的應用愈加廣泛,無論是生產還是生活都離不開這一技術的支持。關聯規則算法是數據挖掘技術中應用最為活躍的一種算法,能夠有效處理規模較大的信息與數據,并在數據庫中挖掘價值較高的信息。文章將對數據挖掘技術的內容與表現進行闡述,分析關聯規則算法的含義與相關內容,最后對關聯規則算法中的Apriori算法進行探究與討論。

關鍵詞:數據挖掘;關聯規則算法;相關問題;研究

中圖分類號:G250.74 文獻標志碼:A 文章編號:2095-2945(2017)33-0161-02

互聯網上涵蓋的信息數量是巨大的,且信息的數量與規模呈現出了明顯的上升趨勢,如何在海量的數據中找到有用的信息是人們需要重點思考的問題。傳統的數據搜索方法作用有限,只能將表層信息收集起來,但是深層次的信息卻無法被挖掘出來,這對信息的有效應用來說是極為不利的。為了提高數據的適應價值,數據挖掘技術產生并得到廣泛應用。關聯規則算法在數據挖掘方面顯現出了極大的優勢,對此展開探究有著重要的現實意義。

1 數據挖掘技術的內容與表現

1.1 內容

數據挖掘技術屬于重要的信息處理技術,其商業價值極為明顯,在該技術的幫助下,人們對技術的獲取與了解將會從聯機查詢這種較為低層次的方式轉化為較高層次的數據對策支持分析預測。根據知識類型的差異,數據挖掘技術可以分為:關聯范圍、預測范圍、差異范圍、廣義范圍這幾種。使用較為廣泛的數據挖掘方法有數據分析法、數據集成法、證據理論法、近似推理法以及元模式法等。而從對象的角度來分析,數據挖掘技術可以分為以下幾類,即時態數據庫、空間數據庫、多媒體數據庫、異質數據庫、遺產數據庫以及文本數據庫等。

1.2 主要表現

數據挖掘技術的主要表現有四種,第一是規則歸納,即統計數據,在這個過程中系統會對數據項中的某些屬性以及集合予以反映,AQ算法就是歸納算法的一種,利用數據挖掘技術,人們可以找出數據庫中潛藏的某些位置信息。第二是支持向量機,它是一種結構風險,其建立基礎為數學理論,在應用時,它會利用處于高空多維空間的超平面隔離開兩類不同的數據,以便于將最小分類錯誤率降到最低,顯性問題是其顯著的優勢。第三是模糊集,在處理數據時,模糊集表現為兩點,一是不完整數據,二是不確定數據,其針對性不強,應用模糊集對數據進行處理能夠提高處理的簡便性與有效性。第四是統計方法,即統計并分析事物數量,這樣能夠及時找出其中的規律,當發現數據線索后,就可以以此為基礎展開假設,分析可行性,統計方法的優點在于精確性高。

2 關聯規則算法的含義與相關問題

數據挖掘中的關聯規則算法即指在數據集中找到相關關系或者特殊的關聯,找到頻繁項集(出現頻率較高的屬性值

集),然后再依據頻繁項集將關聯規則描述出來的整個過程。其中涉及到的數據集具有較大的規模,涵蓋的數據信息、屬性較多,具有尋找的價值。在關聯規則算法中,規則興趣度的度量依據為置信度與支持度,這兩個度量依據能夠對規則所具有的簡潔性、新穎性、確定性以及有用性予以準確的反映。在實際應用的過程中,信任度與支持度的門限通常用最小支持度與最小置信度來表示。數據挖掘中關聯規則算法的相關問題可以歸納為兩點,首先,要將不小于用戶指定的支持度最小的存在于事務數據庫中的數據項集全部找出,即找出強項集。其次,要對最大數據項對應的關聯規則予以利用,以用戶所指定的置信度規則最小值的取舍情況為依據,獲得最終需要的強關聯規則。

3 Apriori算法研究

3.1 基本操作步驟

Apriori算法為關聯規則中的經典算法,具有重要的研究意義。Apriori算法認為若M屬于頻繁項目集,則M中包含的子集都在其中;相反,如果M不是頻繁項目集,那么M的全部超集都在其中。為了將所有的頻繁項集都找出來,Apriori算法會應用逐層迭代法搜集相關內容,即逐層掃描各集合。其具體操作步驟如下:首先要全面了解用戶的實際需求,然后依次為依據確定最小支持度與最小置信度,并逐步找出頻繁相;其次要將最小支持度作為操作的參考依據,如候選集規模較大,那么就可以將其作為頻繁項集合中的某一個項,當反復掃描頻繁項集后,所需要的數據就可以被準確的挖掘出來。然后就可以根據實際情況執行算法,要先將數據項完整的錄入到數據庫當中,繼而將關鍵項挖掘出來,再將集合與候選2項有效結合到一起。此時再次掃描數據庫,并重復上述操作,最終挖掘出最高層次的頻繁項集,使數據得到有效優化。

3.2 局限性

雖然在以往的應用過程中,Apriori算法顯現出了較為明顯的優勢,如應用便捷、結構簡單等,但是在實際執行的過程中,Apriori算法仍然具有局限性。首先雖然其推導過程相對簡便,但是卻具有較高的重復率,系統需要多次掃描數據庫,且每次都需要全面搜索候選項集,當產生最小置信度與最小支持度后,若頻繁項集對應的最大程度為M,那么掃描的次數則為K。在此情況下,如果事務數據庫的規模較大,那么掃描的次數會相應增多,而工作效率則會極大的下降。其次,Apriori算法采取逐層迭代法搜索,雖然可以適時對步驟進行必要的優化,刪減了部分候選項集,但是中間項集的數量仍然極大,算法效率相對較低。最后,從理論方面來看,當頻繁項集增加長度后,相關的支持事務會明顯的減少,而計算時間不會發生變化;但是從實際來看,事務開銷會明顯的增加,此時運算時間必然會提升。

3.3 優化方法

Apriori算法的優化方法有三種,第一是應用Partition算法中的數據分割法,由于Apriori算法的掃描過程繁瑣,次數較多,此時為了提高工作效率就可以應用數據分割法進行操作,在邏輯的基礎上將數據庫合理分割成不相交的模塊,在此情況下,系統就能夠分別掃描各個模塊,然后生產對應的頻集,在計算時再將各個分散的頻集合并到一起,最終挖掘出有效的頻集;第二是應用Sampling算法中的采樣技術,組合分析掃描獲得的數據庫信息,這項工作的工作量是極為巨大的,而在第一次掃描的過程中,系統能夠對相關規則予以總結,繼而在第二次掃描中直接采樣,在反復掃描與總結的過程中,算法可以得到必要的改進,如果采樣中獲得的規律是合理的,其余的掃描過程就可以得到簡化;第三是利用DHP算法刪減候選項集,這能夠有效提升系統的運行效率,并降低計算的成本投入。

3.4 改進措施

要對Apriori算法進行簡化,減少掃描的次數,使系統通過一次掃描就可以找到項目頻集,讓LK-1自鏈接對應的項集CK在數據庫中生成,在簡化的過程中要關注支持度的變化,將比最小支持度還小的項集刪減掉,提升算法的實際效率。在性能改進方面,算法的計算量能夠極大的降低,第一次掃描中就可以產生候選項集,然后統計相應事務,計算時間將有效縮短。

4 結束語

Apriori算法是數據挖掘關聯規則算法中應用最為廣泛的一種算法,其應用優勢較為明顯,能夠幫助用戶深入挖掘信息價值,并簡化推導過程。但是Apriori算法也存在一定的不足與局限,在使用的過程中應當對其進行必要的優化與改進。

參考文獻:

[1]李仕瓊.數據挖掘中關聯規則挖掘算法的分析研究[J].電子技術與軟件工程,2015(04).

[2]楊帆,杜瑋,陳經優.數據挖掘中關聯規則算法的研究[J].電子技術與軟件工程,2014(21).

[3]楊澤民.數據挖掘中關聯規則算法的研究[J].軟件,2013(11).

[4]楊艷,韓衛媛,李文成.改進的關聯規則算法在數據挖掘中的探討[J].制造業自動化,2012(12).

[5]蘆海燕.數據挖掘中關聯規則算法的研究[J].電腦知識與技術,2011(26).endprint

猜你喜歡
數據挖掘研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
探討人工智能與數據挖掘發展趨勢
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
新版C-NCAP側面碰撞假人損傷研究
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 国产精品久久自在自2021| 波多野结衣中文字幕一区| 欧美成人免费| 久久国产亚洲偷自| 波多野结衣国产精品| 亚洲欧美一区二区三区蜜芽| 丰满人妻中出白浆| 红杏AV在线无码| 国产亚洲精品自在久久不卡| 99re经典视频在线| 国产精品极品美女自在线网站| 午夜视频在线观看区二区| 无码精品一区二区久久久| 日韩小视频在线观看| 国产精品lululu在线观看| 毛片久久久| 免费国产好深啊好涨好硬视频| 白浆视频在线观看| 欧美日韩在线亚洲国产人| 国产xxxxx免费视频| 99视频精品在线观看| 为你提供最新久久精品久久综合| 国产九九精品视频| 亚洲AV无码一区二区三区牲色| 中文字幕天无码久久精品视频免费| 9久久伊人精品综合| 久久伊伊香蕉综合精品| 国产精品网拍在线| 中国国产一级毛片| 青草视频网站在线观看| 亚洲精品免费网站| AV老司机AV天堂| 国产爽妇精品| 中文字幕免费在线视频| 久久a级片| 中文字幕伦视频| 在线色国产| 最新国产精品第1页| www精品久久| 精品人妻无码中字系列| 伊人激情综合网| 国内自拍久第一页| 国产精品 欧美激情 在线播放| 99久久精品久久久久久婷婷| 色国产视频| 天天激情综合| 黄色国产在线| 中文字幕中文字字幕码一二区| 91在线视频福利| 黄色在线不卡| 人妻精品久久无码区| 久久精品无码一区二区国产区 | 熟妇丰满人妻| 亚洲一级毛片在线观播放| 亚洲午夜天堂| 国产成人8x视频一区二区| 国产精品成人免费综合| jizz国产在线| 伊人国产无码高清视频| 国产高清在线观看91精品| 中文国产成人久久精品小说| 日本精品影院| 一级爱做片免费观看久久| 美女裸体18禁网站| 一区二区三区国产| 国产精品亚欧美一区二区 | 99久视频| 人妻熟妇日韩AV在线播放| 91精品专区国产盗摄| 久久夜色精品| 欧美一级在线| 最新无码专区超级碰碰碰| 激情在线网| 国产午夜一级毛片| 91精品专区国产盗摄| 国产精品妖精视频| 国产区精品高清在线观看| 波多野结衣爽到高潮漏水大喷| 欧美国产日韩在线| 免费又黄又爽又猛大片午夜| 亚洲精品无码人妻无码| 欧美色视频日本|