999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于極大頻繁項集的粒關聯規則方法

2018-11-06 03:20:42李山山張正炳付青青
長江大學學報(自科版) 2018年21期
關鍵詞:關聯定義規則

李山山, 張正炳,付青青

(長江大學電子信息學院,湖北 荊州 434023)

數據挖掘廣泛應用于零售、網絡日志、生物、化工、醫藥等領域,在日常生活中扮演著越來越重要的角色。粒關聯規則(GR)[1,2]是一種結合粒計算[3]和粗糙集[4]的相關知識,通過源覆蓋、目標覆蓋、源置信度和目標置信度來尋找多元關系數據表中隱藏模式的新方法。在恰當設置4個指標的閾值后,就可以得到一些語義比關聯規則挖掘更加豐富的規則。粒關聯規則適用于推薦系統[5,6]的冷啟動問題[7],但粒關聯規則挖掘結果存在冗余等問題。為解決這一問題,筆者利用極大頻繁項集可以緊湊地表示頻繁項集的特點,提出了基于極大頻繁項集的粒關聯規則方法(MGR算法)。

1 基本概念

針對粒關聯規則挖掘所得規則存在冗余的問題,類比頻繁項集[8]和極大頻繁項集[8]的定義,筆者給出源頻繁粒、目標頻繁粒、源極大頻繁粒和目標極大頻繁粒的定義(見定義1和定義2),并證明根據極大頻繁粒集的源覆蓋和目標覆蓋可以表示其子集的源覆蓋和目標覆蓋的范圍(見性質1),為基于極大頻繁項集的粒關聯規則方法(MGR算法)解決上述問題奠定基礎。

引理1[2]假定S=(U,A)為一個信息系統,其中,U=(x1,x2…,xn)表示所有對象集合,A={a1,a2,…,am}表示所有屬性集合,若A′?A,則(A′,x)決定信息系統的一個粒。

引理3[2]若(U,A)和(V,B)為2個信息系統,R?U×V是從U到V的二元關系,則ES=(U,A,V,B,R)表示一個多對多實體關系系統。

定義1對于A′?A,B′?B,A′和B′構成粒關聯規則GR,給定源覆蓋和目標覆蓋分別為ms,mt,若scov(GR)≥ms,則稱(A′,x)決定的粒為源頻繁粒;同理,若tcov(GR)≥mt,則稱(B′,y)決定的粒為目標頻繁粒。

根據文獻[1]和定義2,筆者給出MGR的基本形式:

(1)

MGR中源覆蓋、目標覆蓋、源置信度和目標置信度的定義如下:

(2)

(3)

因為源置信度和目標置信度之間存在相互制約的關系,計算任意一個需要確定另外一個的值[1]。在給定目標置信度tc的條件下,源置信度的定義式為:

(4)

2 MGR算法

筆者將以定義1、定義2、性質1和式(1)為基礎,介紹MGR算法。算法包含2個部分,即MaxApriori算法(算法1)和MSandwich算法(算法2),其中算法1用于挖掘出所有的極大頻繁粒集,該結果作為算法2的輸入,算法2用于生成規則。

2.1 算法1

輸入為多對多實體關系系統[1,2]、源覆蓋和目標覆蓋閾值,輸出為源極大頻繁粒集MSG和目標極大頻繁粒集MTG。算法第1步利用式(2)、式(3)分別獲得的1-頻繁粒集,該步需要掃描數據庫一次;第2步利用粒的定義[3]求得1-頻繁粒集的外延,該過程需要掃描數據庫一次;第3步針對每個1-頻繁粒集利用Apriori性質求得k-頻繁粒集和其對應的粒的外延;第4步利用定義2和粒的外延求得k-1-極大頻繁粒集;第5步將k-頻繁粒集添加到極大頻繁粒集。

算法1求出所有的極大頻繁粒集的過程只需要2次掃描數據庫。

2.2 算法2

算法2的輸入為算法1輸出結果MSG和MTG,輸出為一組規則集。算法2首先分別取出MSG和MTG中對應的源極大頻繁粒g和目標極大頻繁粒g′,然后利用二元關系R得到候補規則集,最后輸出滿足tconf(MGR)≥tc,sconf(MGR)≥sc的規則集。

2.3 算法時間復雜度問題

MGR算法時間復雜度與GR算法時間復雜度[2]相似,都可以用公式表述為:

O(|MSG(ms)|×|MTG(mt)|×|U|×|V|)

(5)

3 試驗

試驗數據來自MovieLens數據集,目前已被廣泛的應用于推薦系統。采用的數據表為一個含有943個用戶的用戶信息表、一個含有1682部電影的電影信息表和一個用戶對電影的100000條評分記錄表。為避免無用數據,這100000條評分記錄中每個用戶至少評價了20部電影??紤]到挖掘過程中用戶和電影之間的二元關系,忽略評分記錄表中的5個等級評分對試驗結果產生的影響,采用“1”和“0”區分評分和未評分重構評分記錄表。由于原始用戶信息表中用戶年齡范圍介于7~73歲,電影信息表中電影上映年份介于1922~1998,為了更好地挖掘規則,對這2個數據表中的數據采用離散預處理。將用戶年齡劃分為6個區間:[7,22),[22,27),[27,31),[31,39),[39,48)和[48,73),并用0~5表示這6個區間;將電影上映時間劃分為7個區間[1922,1980),[1980,1993),[1993,1994),[1994,1995),[1996,1996),[1996,1997)和[1997,1998),并用0~6表示這7個區間。針對電影類型的多值屬性問題,利用多值屬性方法進行處理。

圖1 規則數量

圖2 運行時間

3.1 不同閾值下算法的規則數量和運行時間

設置sc=tc=0.2,ms=mt,隨著ms(mt)變化時可以得到不同閾值條件下MGR算法和GR算法的規則數量和運行時間,分別對應圖1和圖2。

3.2 MGR算法獲得的規則是否存在損失

造成規則損失是因為MGR算法是建立在2個論域上的規則,通過多對多實體關系系統來實現。在多對多實體關系系統中,利用MGR算法中的算法1得到的極大頻繁粒集的子集包含了粒關聯規則算法中的全部頻繁粒集,這說明算法1得到極大頻繁粒集的過程是無信息損失的,在算法2建立規則過程中,存在少量的極大頻繁粒的真子集滿足二元關系R而生成對應的規則,這個過程在MGR算法中未能體現出來,從而造成少量的規則損失。

3.3 不同閾值條件下算法的準確率

圖3 不同閾值條件下訓練集和測試集的準確率

由于利用MGR算法在得到規則時存在規則損失,為評價這個損失對推薦系統造成的影響,下面就冷啟動問題利用MGR算法和GR算法進行推薦,推薦的效果用準確率[1]來衡量。在試驗過程中,對冷啟動問題采用60%的訓練集和40%的測試集的劃分比率,為使試驗得到的結果更加準確,每個閾值下的試驗都進行30次,求得30次試驗的平均值。設置sc=tc=0.4,ms=mt,隨著ms(mt)變化得到不同閾值下的結果,如圖3所示。

由圖3可以看出,2種算法在訓練集的推薦準確率比測試集推薦準確率高,且在訓練集和測試集上MGR算法的推薦準確率比GR算法的準確率高。由此可以看出在利用MGR算法的過程中雖然會造成少量的規則損失,但在推薦準確率方面卻有所提升。這說明利用MGR算法可以在降低挖掘規則冗余度的同時提高推薦的準確率。

3.4 不同劃分比例訓練集和測試集

圖4 不同劃分比例訓練集和測試集的準確率

考慮到訓練集和測試集的劃分比例可能對冷啟動問題的推薦準確率造成影響,設置sc=tc=0.4,ms=mt=0.005,將訓練集和測試集的劃分比例從0.3增加到0.8,得到訓練集和測試集的推薦準確率如圖4所示。

由圖4可知,隨著訓練集劃分比例逐漸增大,訓練集和測試集在推薦準確率上基本呈現遞增趨勢,這說明隨著訓練集劃分比例增大,有更多已有用戶和電影的評分記錄,從而可以挖掘出更適于用戶的規則。此外,MGR算法的推薦準確率比GR算法推薦準確率略高,說明MGR算法具有較強的穩定性,在不同的劃分比例下推薦準確率依然比GR算法高。

4 結語

猜你喜歡
關聯定義規則
撐竿跳規則的制定
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
成功的定義
山東青年(2016年1期)2016-02-28 14:25:25
修辭學的重大定義
當代修辭學(2014年3期)2014-01-21 02:30:44
山的定義
公務員文萃(2013年5期)2013-03-11 16:08:37
主站蜘蛛池模板: 亚洲无码91视频| 四虎影视8848永久精品| 日韩小视频在线观看| 欧美三级日韩三级| 亚洲丝袜第一页| 国产在线观看高清不卡| 免费无遮挡AV| 日韩精品欧美国产在线| 国产精品蜜芽在线观看| 国产黑丝一区| 国产成人做受免费视频| 亚洲午夜福利精品无码| 亚洲高清在线播放| 成人福利视频网| 亚洲天堂网2014| 久久精品这里只有国产中文精品| 97久久精品人人做人人爽| 久久亚洲综合伊人| 精品视频在线观看你懂的一区| 久久久久国产一区二区| 日韩成人在线视频| 高清国产va日韩亚洲免费午夜电影| 波多野结衣无码视频在线观看| 国产91导航| 色成人亚洲| 欧美成人第一页| 亚洲欧洲免费视频| 亚欧乱色视频网站大全| 国产在线一区二区视频| 亚洲人在线| 精品国产三级在线观看| 暴力调教一区二区三区| 久久亚洲国产一区二区| 色婷婷综合激情视频免费看| 久久福利网| 天天综合网色中文字幕| 网友自拍视频精品区| 一级看片免费视频| 久久久久亚洲AV成人网站软件| 国产视频a| 中文无码伦av中文字幕| 一级香蕉视频在线观看| 欧美日韩成人| 国产91小视频在线观看| 在线精品亚洲国产| 亚洲清纯自偷自拍另类专区| 国产欧美另类| 国产91精品最新在线播放| 亚洲人视频在线观看| 亚洲性日韩精品一区二区| 欧美精品在线观看视频| 国产在线拍偷自揄拍精品| 青草视频久久| 亚洲人成影院午夜网站| 国产精品永久不卡免费视频| 亚洲一本大道在线| 精品国产网站| 一本大道香蕉高清久久| 亚洲婷婷在线视频| 久久99精品久久久大学生| 中文字幕人妻av一区二区| 亚洲无码视频喷水| 免费观看成人久久网免费观看| 午夜精品区| 久久久久无码国产精品不卡| 成年网址网站在线观看| 日韩午夜福利在线观看| 91精品国产无线乱码在线| 本亚洲精品网站| 亚洲日本中文字幕乱码中文| 天堂亚洲网| 黄色一级视频欧美| A级全黄试看30分钟小视频| 国产白浆视频| 国产屁屁影院| 日韩黄色大片免费看| 国产超碰一区二区三区| 国产成人h在线观看网站站| 精品欧美日韩国产日漫一区不卡| 凹凸精品免费精品视频| 国产丝袜一区二区三区视频免下载| 午夜国产精品视频|