999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

R語言在關聯規則算法(Apriori)中的實現

2016-09-03 07:27:31劉靜頤朱桂玲云南大學
科學中國人 2016年23期
關鍵詞:關聯規則癥狀

劉靜頤,朱桂玲云南大學

R語言在關聯規則算法(Apriori)中的實現

劉靜頤,朱桂玲
云南大學

一、關聯分析的原理

關聯規則(Association):揭示數據之間的相互關系,而這種關系沒有在數據中直接表示出來。

關聯關系的任務就是發現事物之間的關聯規則或稱相關程度。關聯規則的一般形式是:如果A發生,則B有百分之C的可能發生。C稱關聯規則的置信度(Confidence)

利用關聯分析能尋找數據庫中大量數據的相關聯系或相互依賴性,如分析客戶在超市買牙刷的同時又買牙膏的可能性。

二、關聯規則算法

常用關聯規則算法見下表:

算法名稱Apriori FP-Tree灰色關聯度HotSpot算法描述一種最有影響的挖掘布爾關聯規則頻繁項集的算法,其核心是基于兩階段頻集思想的遞推算法針對Apriori算法的固有缺陷,J.Han等提出了不產生碗蕨頻繁項集的方法,FP-樹頻集算法以分析和確定各因素之間的影響程度或若干子因素(子序列)對主因素(母序列)的貢獻程度二進行的一種分析方法挖掘得到樹形結構顯示的感興趣的目標最大化/最小化的一套規則,最大化/最小化的利益目標變量/值。

在此我們只介紹Apriori?;镜乃惴ú襟E如下:(1)選出滿足支持度最小閾值的所有項集,即頻繁項集;(2)從頻繁項集中找出滿足最小置信度的所有規則。

三、R中Apriori的實現

在此數據分析中我們用兩個專用于關聯分析的軟件包——arules和arulesViz.

前一個用于關聯規則的數字化生成,而另一個arulesViz軟件包作為arules的擴展包,提供了關聯規則的可視化技術,使得關聯分析從算法運行到結果呈現一體化。

(一)相關函數

在R中實現Apriori算法,其核心函數為apriori(),來源于arules軟件包,函數基本格式為:

apriori(data,parameter=NULL,apprearance=NULL,control= NULL)

其中parameter參數可以對支持度(support)、置信度(Confi?dence0、沒個項集所含項數的最大最小值(maxlen/minlen),以及輸出結果(target)等重要參數進行設置。

參數appearance可以對先決條件X和關聯結果Y中具體包含哪些項進行限制。

Control參數則用來控制函數性能,如可以設定對項集進行升序(sort=1)還是降序(sort=-1)排序,是否向使用者報告進程(ver?bose=FALSE/TRUE)等

(二)數據提取和處理

R中提取數據如下:

1.數據整合

將數據轉化為疏散矩陣形式,有取1,無取0(疏散矩陣),之后將疏散矩陣轉化為apriori函數可用的數據結構。如下所示:

癥狀與中藥的關聯關系。

運用關聯算法時,我們先嘗試對apriori函數以最少的限制,來觀察它的輸出,再以此決定下一步操作。這里將支持度的最小閾值(minsup)設置為0.5,,置信度最小閾值(mincon)設為0.6,其他參數不進行設定取默認值,并將所得關聯規則名記為rules0,并使用inspect函數展示詳細的關聯規則,代碼如下所示:

在上述結果中,lhs列是關聯規則的左側,rhs列是關聯規則的右側,support、confidence、lift分別是支持度、信任度和提升度。

在兩參數共同調整過程中,如果更注重關聯項集在總體中所占的比例,則可以適當的多提高支持度,若是更注重規則本身的可靠性,則可多提高一些置信度值。

提升度表示在含有X的條件下同時含有Y的可能性與沒有這個條件下項集中含有Y的可能性之比,即在Y自身出現可能性P (Y)的基礎上,X的出現對于Y的“出鏡率”P(Y|X)的提升程度:

該指標與置信度同樣用于衡量規則的可靠性,可以看做置信度的一種互補指標。

當lift值為1時表示X與Y相互獨立,X對Y出現的可能性沒有提升作用,而其值越大(>1)則表明X對Y的提升程度越大,即表明關聯性越強。

由于上述理論知識,我們知道提升度可以說是關聯規則最可靠的指標,且得到的結論也是有用的,所以在設置參數時,我們依據lift只進行升序排序來選出最有用的幾條關聯規則。

規則一:{舌紅、生石膏、杏仁、甘草}=>{魚腥草}

規則二:{胸痛、舌紅、杏仁、甘草}=>{魚腥草}

規則三:{發熱、舌紅、杏仁、甘草}=>{魚腥草}

說明癥狀有舌紅和胸痛或發熱,服用過生石膏、杏仁、甘草的患者,之后會服用魚腥草。

癥狀與癥狀之間的關聯關系。

規則一:{胸痛、口渴、脈滑數}=>{苔黃}

規則二:{胸痛、口渴、咳黃(稠)粘痰}=>{苔黃}

規則三:{胸痛、口渴、咳黃(稠)粘痰、脈滑數}=>{苔黃}

說明有胸痛、口渴、咳黃(稠)粘痰、脈滑數的癥狀的,絕大可能性會出現苔黃的癥狀。

關聯規則的可視化。

1、癥狀與癥狀之間的關聯關系

按lift參數為a52和a47關聯強度最強,即苔黃和脈滑數的關聯強度最大,而從support參數(即按size大小來看)a4和a4關聯強度最大,這沒什么意思,a52和a4次之,即胸痛和脈滑數關聯強度最強。

2、癥狀與中藥之間的關聯關系

按lift參數(即按color顏色深度來看)為a52和c39關聯強度較強,即蘆根和脈滑數的關聯強度較大,而從support參數(即按size大小來看)a4和a11關聯強度最大,即胸痛和咳黃(稠)粘痰關聯強度最大。

劉靜頤,女,單位:云南大學(數學與統計學院),研究生,研究方向:科技統計。

猜你喜歡
關聯規則癥狀
Don’t Be Addicted To The Internet
保健醫苑(2022年1期)2022-08-30 08:39:40
撐竿跳規則的制定
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
可改善咳嗽癥狀的兩款藥膳
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
主站蜘蛛池模板: 黄色国产在线| 欧美亚洲国产日韩电影在线| 亚洲免费毛片| 99资源在线| 国产精品yjizz视频网一二区| 婷婷六月综合网| 女高中生自慰污污网站| 亚洲国产欧美中日韩成人综合视频| 澳门av无码| 国产日本一区二区三区| 亚洲国产一区在线观看| 国产亚洲欧美日韩在线一区| 久久香蕉国产线看观看式| 天堂在线亚洲| 三上悠亚精品二区在线观看| 国产精品美女自慰喷水| 91探花国产综合在线精品| www.99精品视频在线播放| 人妖无码第一页| 国产成人啪视频一区二区三区| 久久国产精品无码hdav| 福利视频久久| 一区二区影院| 国产精品美女在线| 久久精品无码国产一区二区三区| 高潮毛片无遮挡高清视频播放| 一级香蕉视频在线观看| 欧美日韩成人| 99资源在线| 国产亚洲欧美在线人成aaaa| 亚洲综合狠狠| 在线99视频| 国产第一页第二页| 高清免费毛片| 亚洲综合天堂网| 中文字幕天无码久久精品视频免费 | 免费在线视频a| 国产成人亚洲精品色欲AV| 欧美成人h精品网站| 欧美亚洲另类在线观看| 成年女人a毛片免费视频| 人人91人人澡人人妻人人爽| 色丁丁毛片在线观看| 91久久国产热精品免费| 怡红院美国分院一区二区| 久久久噜噜噜| 一级福利视频| 2018日日摸夜夜添狠狠躁| 国产精品污污在线观看网站| 精品91在线| 青青草原国产一区二区| 欧美中文字幕第一页线路一| 99伊人精品| 中文字幕一区二区视频| 亚洲天堂视频在线观看免费| 国产成人一区免费观看| 99久久这里只精品麻豆| 99久久精品免费看国产电影| 国产精品亚洲天堂| 91亚洲精选| 福利在线不卡| 999国内精品视频免费| 激情综合图区| 国产精品刺激对白在线| 国产aaaaa一级毛片| 四虎永久在线视频| 五月天综合婷婷| 永久免费无码成人网站| 亚洲区第一页| 成人福利免费在线观看| 亚洲第一区欧美国产综合| 精品国产成人a在线观看| 福利片91| 国产激爽大片在线播放| 91啦中文字幕| 国产欧美一区二区三区视频在线观看| 亚洲成a∧人片在线观看无码| 国产欧美日韩91| 青青青草国产| 欧美日韩国产在线观看一区二区三区 | 免费无码AV片在线观看中文| 日韩专区第一页|