999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于R語言的關聯規則應用實例

2018-04-09 01:13:37
福建質量管理 2018年6期
關鍵詞:關聯規則數據庫

(四川大學 四川 成都 610000)

一、關聯規則

關聯規則是美國IBM Almaden Research Center Rakeesh Agrawal等人于1993年首先提出來的KDD研究的一個重要課題。關聯規則挖掘本質是從大量的數據中或對象間抽取關聯性,它可以揭示數據間的依賴關系,根據這種關聯性就可以從某一數據對象的信息來推斷另一個的信息。

二、關聯規則在股票市場中的應用

在證券交易市場中,每天都有以交易行情為主的大量數據匯入數據庫。如果把同一天股票的上升(或下降)事件看成是被放入同一個貨籃的貨物,那么一個時期的股票交易數據就會形成多個貨籃數據。既然可以挖掘出規則:“如果一個貨籃中有嬰兒紙尿布,那么該貨籃中有啤酒的概率是80%”,也可以挖掘出同一時期內股票上升(或下跌)的聯動規則。Apriori 算法恰好是解決這類問題的有效方法,但是,由于股票行情數據是以時間序列方式存儲在數據庫中,無法直接用Apriori 算法進行數據挖掘;要在股票行情數據庫中挖掘出根據時間而前后聯動的關聯規則,需要在貨籃數據中多引入一個參數:時間間隔。

另外,為了提高挖掘過程的有效性,還應確定目標關聯規則(即元規則)的形式。根據上面給出的用戶感興趣的規則形式:“T時間內,當A股票價格上漲時,B股票價格也會隨之上漲”。所以我們主要關心的是股票交易的時間和漲跌幅,其他如開盤價、成交量等可以認為是一些無關信息。

(一)數據來源

本文從國泰君安數據庫中選取從2016年8月至2017年8月所有交易日下編號靠前的部分股票作為測試樣本,以探求關聯規則在股票市場中的應用,剔除停盤日后初始下載樣本數為52109條。

(二)數據預處理

1.導入數據

首先,我們將包含編號(gtacode)、股票名稱(Title)、交易日期(accpertime)、開盤價(Opnprc_JY)、收盤價(Clsprc_JY)和漲跌幅在內的原始數據通過txt的形式導入到R語言中。

>setwd(“/Users/zhongzhong/Documents”)

>mydata

導入數據后,使用View(mydata)將會在軟件中顯示出所導入的數據。

2.數據的檢驗

(1)缺失值

①識別缺失值

我們首先用is.na()函數識別數據中的缺失值。

②探究缺失值

然后我們用sum(is.na())函數計算上海這個數據框中缺失值的數目,得到為1。

(2)錯誤值

除了缺失值以外,我們還需要檢驗數據中有沒有不符合實際的情況,比如漲跌幅中不可能有超過+10%和-10%的股票。經檢驗,沒有出現這種情況。

(3)變量類型

在數據錄入過程中,我們通過str()函數發現gtacode為數值型(int),Title和時間為(Factor),其余都為類別型(chr),所有在后面的數據清理當中需要進行類型的轉換。

3.數據的清理

(1)缺失值的處理

通過na.omit()移除所有含有缺失值的觀測,使得數據中不再含有缺失值。

(2)類型的轉換

通過as.character()對Title進行轉換為字符型,然后通過as.Data()對時間進行轉換。

4.數據的規整

考慮到主要關鍵信息是股票交易的時間和漲跌幅,所以只篩選出編號、時間和漲幅三列有效數據:

>mydata<-mydata[,c(1,3,6)]

為了清晰明了的挖掘出用戶感興趣的規則形式:“T時間內,當A股票價格上漲時,B股票價格也會隨之上漲”,我們首先設定出一個時間間隔,同時限定最小漲幅來減少工作量。

定義1 設最小漲幅Zmin,|Zmin|<10%

定義2 設過票交易集T={T1,T2,…,Ts},其中T1=2016-08-02,Ts=2017-08-02

按最小漲幅篩選之后,可以由下圖看到,之前5萬多條數據驟減到了1345條,故時間段上我們將不做篩選調整,保留一年交易日的數據:

>mydata1<-subset(mydata,漲跌幅>=0.05)

>view(mydata1)

5.apriori算法運用

這樣之后,我們將mydata1讀出為txt格式,為后面讀入成transactions數據格式做準備。然后使用read.transactions函數轉換成事務型數據,可以利用dim(trans)和summary(trans)來查看數據集的基本情況。

圖1 apriori算法代碼展示

上圖得到前五個item的支持度分別為0.10169492、0.10169492、0.09322034、0.08898305、0.08898305。

這里我們所做的是在生成規則:知道了頻繁項集,過濾掉非頻繁項集,并找出第一步的頻繁項集中的規則:

>sum(itemFreq)

>trans[size(trans)>1]

>myrules=apriori(trans,parameter=list(support=0.01,confidence=0.1,minlen=2,maxlen=20,target=“rules”))

接下來我開始使用apriori算法生成一條關聯規則myrules如上圖:支持度為0.01,置信度為0.1,這里的minlen和maxlen是指規則的LHS+RHS的并集的元素個數,具體的規則顯示在下圖中。

圖2 apriori算法顯示

從返回結果中看,可以看到總共有1299條規則生成。同時,有236條交易記錄的transaction,225個商品item等信息。然后使用summary(myrules)可以查看規則匯總信息如下,包括每個籃子(交易)中含有的股票數目以及支持度、置信度的最小值、最大值和中位數等信息。

圖3 規則匯總信息

第一部分:規則的長度分布:就是minlen到maxlen之間的分布。如上例,len=2有492條規則,len=3有372條規則…

第二部分:quality measure的統計信息

第三部分:挖掘的相關信息。

了解了這些信息以后,我們所最關心的就是具體規則了,使用inspect()函數進行查看具體的規則,下面我們先展現前十條規則:

圖4規則的具體展示

三、相關結果

本文選擇了國泰安數據庫中的部分股票進行關聯規則的應用實驗分析,得到了許多有意義的規則。如上圖,在支持度為1%,置信度為10%的條件下,代碼為000026和000678的兩只股票有同時上漲的趨勢,在上述挖掘結果的基礎上,我們可以進行二次挖掘,進一步分析各支股票之間趨勢變化的周期性和多維相似性等,得到更多有用的結果。

【參考文獻】

[1]Usama Fayyad,Gregpru Oatesdu-Shapiro,Padhraic Smyth,RAMASACY UTHURU SAMYMY,ETAL.Advances in Knowledge Discovery and Data Mining[M].AAAI Press/The MIT Press,1996.

[2]Gregory Piatesdy-Shapiro,Willam J Frawley,Editors.Knowledge Discovery in Databases[M].AAAI Press,1991.

[3]陸麗娜,陳亞萍,揚麥順,等.挖掘關聯規則算法的優化處理[J].計算機工程與應用,2000,(8):99~102.

[4]鄭朝霞,劉延建.關聯規則在股票分析中的應用[J].成都大學學報,2002,(12),46-49.

猜你喜歡
關聯規則數據庫
撐竿跳規則的制定
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
數據庫
財經(2017年2期)2017-03-10 14:35:35
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
主站蜘蛛池模板: 国产午夜福利亚洲第一| 在线观看免费人成视频色快速| 国产一区成人| 成人另类稀缺在线观看| 午夜视频免费试看| 国产99视频精品免费视频7| 一本一道波多野结衣一区二区| 亚洲天堂.com| 国产99视频精品免费观看9e| 国产在线97| 91网在线| 欧美a在线看| 国产第一页亚洲| 在线观看热码亚洲av每日更新| 天天躁狠狠躁| 一本视频精品中文字幕| 国产地址二永久伊甸园| 国产97公开成人免费视频| 亚洲91精品视频| 欧美一道本| 2020国产精品视频| 曰韩免费无码AV一区二区| 啊嗯不日本网站| 婷婷中文在线| 国产精品对白刺激| 国产福利一区在线| 又大又硬又爽免费视频| 国产噜噜噜视频在线观看| 国产亚洲精久久久久久无码AV| 亚洲va视频| 国产av剧情无码精品色午夜| 五月婷婷导航| 国产网站免费| 男女男精品视频| 亚洲自偷自拍另类小说| 97国产精品视频自在拍| 国产激情国语对白普通话| 成年人视频一区二区| 国产在线自在拍91精品黑人| 鲁鲁鲁爽爽爽在线视频观看| 国产91在线|中文| 欧美日韩国产在线人成app| 全免费a级毛片免费看不卡| 综合久久五月天| 亚洲国产精品一区二区第一页免| www.精品视频| 成·人免费午夜无码视频在线观看| 91欧美在线| 国产精品久久久久久搜索| 久久精品一品道久久精品| 免费国产黄线在线观看| 91精品aⅴ无码中文字字幕蜜桃| 成人国产免费| 无码区日韩专区免费系列| 亚洲国产AV无码综合原创| 91美女视频在线| 国产日本欧美亚洲精品视| av大片在线无码免费| 国产精品第一区在线观看| 97久久免费视频| 久久99国产精品成人欧美| 露脸国产精品自产在线播| 熟女成人国产精品视频| 国产www网站| 天天婬欲婬香婬色婬视频播放| 国产成人无码AV在线播放动漫| 在线亚洲小视频| 日韩美女福利视频| 国产精品手机视频一区二区| 91精品福利自产拍在线观看| 中文字幕亚洲精品2页| 亚洲Aⅴ无码专区在线观看q| 成人国产免费| 国产尹人香蕉综合在线电影| 91精品国产综合久久香蕉922 | 国产一级妓女av网站| 日韩成人免费网站| 国产国拍精品视频免费看| 国产一在线| 国产最新无码专区在线| 91娇喘视频| 国产亚洲精品精品精品|