999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于決策樹技術的CET-4成績數據挖掘研究

2015-12-01 07:06:32劉靜
赤峰學院學報·自然科學版 2015年24期
關鍵詞:數據挖掘規(guī)則分類

劉靜

(阜陽師范學院 教育科學學院,安徽 阜陽 236037)

基于決策樹技術的CET-4成績數據挖掘研究

劉靜

(阜陽師范學院 教育科學學院,安徽 阜陽 236037)

本文運用決策樹分類技術進行數據挖掘,從中發(fā)現CET-4考試四個部分對總成績的影響程度.其中由決策樹提取出分類規(guī)則,對于大學英語教學具有一定的指導意義.

數據挖掘;決策樹;ID3算法

1 引言

CET-4考試是國家教育部組織的標準化英語教學水平考試,教育管理機構把它當作檢查大學英語教學效果的一個有效尺度.每一年學校的數據庫系統(tǒng)中都存放著海量的CET-4成績信息,學校的數據庫能夠實現數據的快速錄入、查找、計算等操作,卻無法發(fā)現成績數據中隱藏的關系和規(guī)則.本文主要研究的就是如何從海量數據中發(fā)現隱藏的關系和規(guī)則,分析潛在影響學生成績的因素,從而為提高教學質量與教育管理提供依據.

2 數據挖掘決策樹技術

數據挖掘是指從大量的數據中通過算法發(fā)現隱藏于其中關系和規(guī)則的過程.數據挖掘有很多領域,分類就是非常重要的一個分支.決策樹是一種較為流行的分類技術,采用自頂向下的遞歸方式生成一個類似于流程圖的樹型結構.

3 ID3算法

1986年J·Ross Quinlan提出了著名的ID3算法.該算法就是信息增益屬性劃分,找出分裂后信息增益屬性最大的再次劃分.然后繼續(xù)同樣的過程,直到生成的決策樹能完美分類訓練樣例.

4 決策樹技術在CET-4成績分析中的應用

4.1數據獲取和數據預處理

4.1.1數據的獲取

從教務處下載了我校普通本科班2012屆學生某專業(yè)某次四級成績匯總表.

圖1 大學英語四級成績原始數據

4.1.2數據預處理

去除原有數據源EXCEL表格中的不相關字段,保留CET-4總成績、聽力成績、閱讀成績、寫作成績、綜合測試成績.使用忽略元組的方法將缺考學生的記錄刪除,共計175條.經過數據預處理后參加模型構建的樣本數共計3384條,而預處理前的樣本總數是3559條,樣本的有效率達90.8%.

將樣本數據進行離散化的處理.CET-4考試的試卷總分數為710分,將425分作為分割點,把CET-4成績字段y離散為“pass”、“nopass”兩個部分.

聽力部分滿分249分,閱讀部分滿分249分,寫作和翻譯部分滿分142分,綜合部分滿分70分.分別將聽力字段(st)、閱讀字段(sy)、寫作和翻譯字段(sx)、綜合字段(sz)的所有記錄按照 st<=125、125<=st<199、st>=199、sy<=125、125<=sy<199、sy>=199、sx<=71、71<=sx<100、st>=100、sz<35、35<=sz<45、sz>=45離散化為“C”、“B”、“A”三段.

4.2決策樹分類模型的構造

根據ID3算法構造決策樹,操作過程如下:

(1)計算決策樹分類屬性的期望信息量

經過數據預處理、離散化操作后,用于構造決策樹的記錄為3384條,其中,“pass”和“nopass”記錄分別為2015條、1359條.由公式定計算出分類屬性的期望信息量為:

(2)依次算出st、sy、sx、sz 4個屬性字段的信息量

算出st屬性字段的信息量.st值為“C”的樣本數707個,記為 (25,682);st值為“B”的樣本數2580個,記為(1893,687);st值為“A”的樣本數97個,記為(97,0).

計算sy的信息量.sy值為“C”的樣本數468個,記為(7,461);sy值為“B”的樣本數2747個,記為(1839,908);sy值為“A”的樣本數169個,記為(169,0).

計算sz的信息量.sz值為“C”的樣本數442個,記為(53,389);sz值為“B”的樣本數2360個,記為(1414,946);sz值為“A”的樣本數582個,記為(548,34).

計算sx的信息量.sx值為“C”的樣本數645個,記為(59,586);sx值為“B”的樣本數2333個,記為(1560,773);sx值為“A”的樣本數406個,記為(396,10).

(3)分別計算st、sy、sx、sz的信息熵

(4)分別計算出st、sy、sx、sz的信息增益量

比較以上4個屬性字段的信息增益量,找出信息增益量最大的st字段,把該字段當作決策樹的根節(jié)點,計算st字段的3個屬性值構造出下面的分支.

圖2 CET-4決策樹

(5)提取分類規(guī)則

研究顯示,在CET-4考試中,對CET-4分數影響最大的是聽力部分,然后是閱讀,接下來是寫作和綜合.下面從決策樹模型中,根據分類結果為“pass”或“nopass”,提取得到了學生能否能夠通過CET-4考試的分類規(guī)則.

提取出CET-4考試結果為“pass”的分類規(guī)則為:

IF“st”=“A”,THEN分類結果是“pass”;

IF“st”=“B”AND“sy”=“A”,THEN分類結果是“pass”;

IF“st”=“B”AND“sy”=“B”AND“sx”=“B”,THEN分類結果是“pass”;

IF“st”=“B”AND“sy”=“B”AND“sx”=“A”,THEN分類結果是“pass”;

IF“st”=“B”AND“sy”=“B”AND“sx”=“B”AND“sz”=“A”,THEN分類結果是“pass”;

提取出CET-4考試結果為“nopass”的規(guī)則為:

IF“st”=“C”,THEN分類結果是“nopass”;

IF“st”=“B”AND“sy”=“C”,THEN分類結果是“nopass”;

IF“st”=“B”AND“sy”=“B”AND“sx”=“B”AND“sz”=“C”,THEN分類結果是“nopass”;

IF“st”=“B”AND“sy”=“B”AND“sx”=“B”AND“sz”=“B”,THEN分類結果是“nopass”.

5 結論

由決策樹提取出來的分類規(guī)則,可以輔助指導大學生的英語學習.CET-4考試中,聽力部分對能否通過CET-4考試起到了關鍵性的作用;然后,是閱讀部分,對CET-4考試影響較大;最后,寫作部分和綜合部分對CET-4考試的影響較小.在英語學習中有些學生認為,CET-4考試中,閱讀和寫作是決定CET-4成績高低的關鍵,這種認識缺少科學依據,學生需要扭轉觀念,盡早調整自己的英語學習計劃,將聽力部分作為復習重點來強化練習.同學們在備考的過程中,可以參考決策樹模型以及分類規(guī)則的結果,找出自己英語學習中的短板,進一步強化自己的長項,制定適合自己的學習目標和學習計劃,進行針對性的復習,科學有效的提高CET-4成績.

〔1〕Jiawei Han,Micheline Kamber.數據挖掘:概念與技術[M].北京:機械工業(yè)出版社,2007.188-198.

〔2〕王永梅,胡學鋼.決策樹中ID3算法的研究[J].安徽大學學報(自然科學版),2011(3):35-37.

〔3〕劉紅巖,等.數據挖掘中的數據分類綜述[J].清華大學學報(自然科學版),2002,42(6):727-730.

〔4〕陳昌川.數據挖掘在大學英語考試中的應用研究[D].重慶:重慶大學,2009.

〔5〕韓亞峰.P2P流媒體數據調度策略研究[J].河南科技學院學報(自然科學版),2013,41(1):86~90.

〔6〕張科星.基于云計算的數字資源系統(tǒng)設計[J].河南科技學院學報(自然科學版),2013,41(1):91~94.

TP391

A

1673-260X(2015)12-0018-02

猜你喜歡
數據挖掘規(guī)則分類
撐竿跳規(guī)則的制定
數獨的規(guī)則和演變
分類算一算
探討人工智能與數據挖掘發(fā)展趨勢
分類討論求坐標
數據分析中的分類討論
讓規(guī)則不規(guī)則
Coco薇(2017年11期)2018-01-03 20:59:57
教你一招:數的分類
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
TPP反腐敗規(guī)則對我國的啟示
主站蜘蛛池模板: 精品一区二区三区水蜜桃| 亚洲一区二区视频在线观看| 日韩午夜福利在线观看| 国产精品自拍合集| 国模极品一区二区三区| 亚洲区欧美区| av午夜福利一片免费看| 91无码视频在线观看| 她的性爱视频| 在线观看热码亚洲av每日更新| 美女被躁出白浆视频播放| 91成人免费观看在线观看| 久久精品日日躁夜夜躁欧美| 18黑白丝水手服自慰喷水网站| 男女精品视频| 亚洲美女AV免费一区| 高清不卡一区二区三区香蕉| 青草午夜精品视频在线观看| 免费看久久精品99| 亚洲永久视频| 日韩小视频网站hq| 午夜天堂视频| 亚洲精品桃花岛av在线| 日韩中文无码av超清 | 91娇喘视频| 婷婷色婷婷| 成人蜜桃网| 国产在线观看一区精品| 亚洲中字无码AV电影在线观看| 国产福利拍拍拍| 18禁高潮出水呻吟娇喘蜜芽| 99在线小视频| 亚洲Av激情网五月天| 一级毛片在线免费视频| 色偷偷一区| 99久久精彩视频| 国产导航在线| 亚洲美女一级毛片| 丁香五月婷婷激情基地| 97se亚洲综合在线| 亚洲久悠悠色悠在线播放| 亚洲精品日产AⅤ| 欧美色亚洲| 四虎永久在线| 青青久久91| 亚洲人成影视在线观看| 色婷婷天天综合在线| 特级做a爰片毛片免费69| 性欧美在线| 国产精品久久久久久久久久久久| 尤物成AV人片在线观看| 国产香蕉在线视频| 亚洲第一中文字幕| 日韩欧美国产中文| 国产精品成人AⅤ在线一二三四| 91精品情国产情侣高潮对白蜜| 国产波多野结衣中文在线播放| 一本大道香蕉中文日本不卡高清二区 | 亚洲欧美日韩久久精品| 97av视频在线观看| 亚洲日韩精品伊甸| 欧美天堂在线| 亚洲第一在线播放| 女人18毛片久久| 国产黄网永久免费| 久久久久青草大香线综合精品 | 亚洲男人的天堂久久香蕉| 中文字幕人妻av一区二区| 欧美伊人色综合久久天天| 久久综合激情网| 久久香蕉国产线看精品| 五月天在线网站| 亚洲人在线| 欧美三級片黃色三級片黃色1| 亚洲成A人V欧美综合| 久久中文电影| 亚洲中文字幕久久精品无码一区 | 国产亚卅精品无码| 国产成人资源| 伊人久热这里只有精品视频99| 在线观看热码亚洲av每日更新| 欧美精品aⅴ在线视频|