999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

關(guān)聯(lián)規(guī)則算法在計算機等級考試成績分析中的應(yīng)用

2021-05-14 13:57:32鄭秀月
關(guān)鍵詞:數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則

鄭秀月

(福州黎明職業(yè)技術(shù)學(xué)院,福建 福州 350001)

一、關(guān)聯(lián)規(guī)則

(一)關(guān)聯(lián)規(guī)則

關(guān)聯(lián)規(guī)則作為數(shù)據(jù)挖掘過程中不可或缺的算法規(guī)則,是當(dāng)前在數(shù)據(jù)挖掘領(lǐng)域被普遍采用的甚至有可能是使用最為頻繁、應(yīng)用范圍最為廣泛、研究最為深入的數(shù)據(jù)挖掘手段之一。

關(guān)聯(lián)規(guī)則的挖掘一般可以通過兩步程序來完成。第一步,定義高頻項和高頻項集合。高頻項為所有出現(xiàn)頻率相對高的項;所有高頻項的集合即為高頻項集,也就是支持度大于用戶給定的最低支持度的所有項的集合[1]。第二步,尋找高度關(guān)聯(lián)的規(guī)則。即從高頻度集合中找出確信度高的規(guī)則,也就是確信度比用戶給定的最低確信度大的規(guī)則[2]。

(二)Apriori 算法

Apriori 算法的重要之處在于其能影響高頻度集合的產(chǎn)生的準(zhǔn)確度,是人們在運用數(shù)據(jù)挖掘技術(shù)尋找關(guān)聯(lián)規(guī)則時最早使用的算法之一。通過采用對支持度按照相應(yīng)規(guī)則進行“剪枝”的技術(shù),可以達到減少候選高頻度集合產(chǎn)生的目的。

該算法通過逐層剖析的方法尋找出關(guān)聯(lián)規(guī)則,基本思想如下[3]:

第一步,規(guī)則A->B 是高確信度且B 只含一個項,則將類似的所有規(guī)則均提取出來。

第二步,將通過前一步驟篩選出來的規(guī)則的結(jié)果進行整合后重新生成候選規(guī)則。

第三步,刪除確信度低于最低確信度的規(guī)則,以達到滿足高度關(guān)聯(lián)規(guī)則的原則。

二、改進的Apriori 算法

Apriori 算法是在分析支持度和確信度的基礎(chǔ)上運算得出結(jié)論的,并未考慮所找出的不同規(guī)則對用戶的影響程度,所找到的很多規(guī)則往往對用戶的影響并不大,因此,這里引入了第三個參數(shù)影響度。

具體操作過程如下:對根據(jù)Apriori 算法產(chǎn)生的規(guī)則分別計算確信度和影響度,對于規(guī)則X->Y,影響度(RI)的公式如式1 所示。

其中,P(X )、P(Y )、P(XY )分別表示X、Y 以及X 和Y 同時出現(xiàn)的概率,經(jīng)改進后挖掘出的關(guān)聯(lián)規(guī)則除滿足支持度和確信度分別大于它們相應(yīng)的最小閾值外,還應(yīng)滿足影響度大于最小影響度閾值。

三、改進算法的應(yīng)用

由于考試中部分題型是平時的練習(xí)原題,這里不加以考慮,本文以福州黎明職業(yè)技術(shù)學(xué)院2017—2019 學(xué)年部分學(xué)生在福建省計算機一級等級考試中的成績和學(xué)生是否為學(xué)生干部、理論知識、操作能力(Word、Excel、PowerPoint)、錄入題的得分情況為研究對象,采用關(guān)聯(lián)規(guī)則中著名的Apriori 算法對它們進行挖掘計算,得出以上各因素對總成績優(yōu)秀率的影響。生成的成績表中列字段分別為姓名、性別、專業(yè)、年級、準(zhǔn)考證號、理論知識、Word 得分、Excel 得分、PowerPoint 得分、錄入題得分、是否為學(xué)生干部和總成績等數(shù)據(jù)。

(一)數(shù)據(jù)預(yù)處理

本文運用以下方法對上述收集到的成績表數(shù)據(jù)進行預(yù)處理:一是將成績表中少量屬性值為空的記錄采用平均值填充法;二是將缺考學(xué)生的數(shù)據(jù)剔除;三是將表中對挖掘結(jié)果不產(chǎn)生影響的字段剔除,如姓名、性別、專業(yè)、年級。經(jīng)過預(yù)處理后,剩下2500 條記錄。

(二)數(shù)據(jù)轉(zhuǎn)換

將上述預(yù)處理后學(xué)生的成績數(shù)據(jù)轉(zhuǎn)換為0、1、2 表示。具體的轉(zhuǎn)換規(guī)則如下:

計算機等級考試成績的證書分為兩個級別:優(yōu)秀、合格。總分大于等于85 分為優(yōu)秀用2 表示,60到84 分之間的為合格用1 表示,小于60 分的不達標(biāo)用0 表示。

將是否為學(xué)生干部、理論知識、Word、Excel、PowerPoint、錄入題等題型的得分情況也參照總成績正確率大于85%為優(yōu)秀,正確率在60%~85%為合格,否則為不達標(biāo)的方法進行等級劃分。劃分后選擇題的3 個檔分別為:25.5~30、18~24 以及小于24;理論知識3 個檔分別為22~26、16~21 以及小于16;Word 和 Excel 的 3 個檔分別為 12~14、9~11 以及小于9;PowerPoint 的 3 個檔分別為劃分 9~11、6.5~8 以及小于8;錄入題的3 個檔分別為5、3~4、0~2。查找高頻度集合時,用布爾型0與1表示更為方便,因此,將字段理論知識、Word、Excel、PowerPoint、錄入題、是否為學(xué)生干部、總成績分別用A、B、C、D、E、F、G 表示,A0 表示理論知識為不達標(biāo),A1 表示理論知識為合格,A2 表示理論知識為優(yōu)秀;運用同一方式表示B、C、D、E、G;F0 表示非學(xué)生干部,F(xiàn)1 表示學(xué)生干部。經(jīng)轉(zhuǎn)換后最終生成的學(xué)生成績?nèi)绫? 所示。

表1 經(jīng)處理后的學(xué)生成績表

(三)實施數(shù)據(jù)挖掘

通過預(yù)處理上述2500 名學(xué)生的成績數(shù)據(jù),事先假定確信度為0.5,假定影響度為1.2,假定最低的支持度為0.2,對上述轉(zhuǎn)換后的數(shù)據(jù)實施關(guān)聯(lián)規(guī)則挖掘。

首先,為找出影響成績優(yōu)秀的關(guān)鍵原因,從表1 中篩選出成績優(yōu)秀的記錄,刪除其余的記錄。

其次,分析上一步驟產(chǎn)生的成績優(yōu)秀的數(shù)據(jù),分別運算得出各種影響因素不同等級的支持度計數(shù)填入1-集合的數(shù)據(jù)表F1 中。這里只將支持度高于最低支持度的記錄添加到F1 表中。

再次,對F1 表進行自然連接分析并按規(guī)則制作出候選1-集合,并根據(jù)相應(yīng)的支持度運用“剪枝”技術(shù)制作出2-集合。以次類推制作出高頻率K-集合[4]。

最后,計算根據(jù)上述步驟產(chǎn)生的各高頻度集合的非空子集的支持度、確信度和影響度,并與事先假定的最低的支持度、最低的確信度和最低的影響度分別進行比較,保留滿足最低的支持度和最低的確信度的記錄[5],最終產(chǎn)生高度關(guān)聯(lián)規(guī)則。經(jīng)過數(shù)據(jù)挖掘得到關(guān)聯(lián)規(guī)則如表2 所示。

表2 關(guān)聯(lián)規(guī)則表

(四)結(jié)果分析

由表2 可以得出:理論知識和Word 得分同時為優(yōu)秀時,總成績有75%優(yōu)秀的可能性;理論知識、PowerPoint 的得分優(yōu)秀同時為學(xué)生干部時,總成績有95%優(yōu)秀的可能性;理論知識成績?yōu)楹细瘛xcel 得分為優(yōu)秀時,總成績有90%優(yōu)秀的可能性;理論知識、Word 和Excel 得分均為優(yōu)秀時,總成績有80%優(yōu)秀的可能性;Excel 和總成績優(yōu)秀時,理論知識優(yōu)秀、PowerPoint 得分良好的可能性有80%;Excel 得分優(yōu)秀時,Word 和錄入題得分同時優(yōu)秀的可能性為90%;總成績優(yōu)秀而且為學(xué)生干部時,理論知識為優(yōu)秀同時PowerPoint 得分為合格的可能性為95%;總成績?yōu)閮?yōu)秀時,理論知識為合格同時Excel 得分優(yōu)秀的可能性為92%。

通過上述數(shù)據(jù)挖掘過程,找出隱含在其中的一些有意義的規(guī)則,如不同題型間得分的關(guān)聯(lián),是否為學(xué)生干部對Word、Excel、PowerPoint得分的影響,某些題型得分的優(yōu)秀對總分的影響程度。針對如何提高優(yōu)秀率,提出以下建議:

首先,理論知識掌握的優(yōu)良程度對總分是否優(yōu)秀起著決定性作用。因此,教師在教學(xué)過程中要重視理論知識的教學(xué)并提示學(xué)生予以正確對待。

其次,學(xué)生干部經(jīng)常會幫助院部、系部整理一些文檔,Office 部分的三種題型相對掌握都挺好,能直接決定成績的優(yōu)良,所以要鼓勵學(xué)生課后對課堂所學(xué)的操作知識多加練習(xí),做到熟能生巧。

再次,Excel 作為試卷中最難的一部分,此題的得分情況能客觀體現(xiàn)學(xué)生的計算機操作水準(zhǔn)。數(shù)據(jù)挖掘的結(jié)論顯示,如果學(xué)生對這部分知識掌握較好,Word 和PowerPoint 得分也相對較高,其總成績基本是優(yōu)秀的。教師通過觀察學(xué)生對Excel 的掌握程度就能快速找出基礎(chǔ)薄弱的學(xué)生,并可針對其理論缺陷加以重點輔導(dǎo)。同時,可以提醒在該環(huán)節(jié)中得分高的學(xué)生要重點關(guān)注理論知識的學(xué)習(xí),爭取在等級考試中獲得更突出的成績。

(五)結(jié)果評價

將總成績?yōu)閮?yōu)秀的100條數(shù)據(jù)用于測試,得出結(jié)論是否為學(xué)生干部、理論知識、Excel 得分是影響總成績的關(guān)鍵因素,從而驗證了上述Apriori 算法產(chǎn)生的高度關(guān)聯(lián)規(guī)則是可信的。

結(jié)語

本文主要針對Apriori 算法中未考慮所產(chǎn)生的規(guī)則對用戶影響程度的問題,提出了影響度閾值的改進算法。并將改進的算法應(yīng)用到計算機一級等級考試成績分析中,從試卷題型等因素與總成績之間的關(guān)系角度進行數(shù)據(jù)挖掘,找出影響學(xué)生成績的關(guān)鍵因素,為教師改進教學(xué)方法提供參考,以此實現(xiàn)提高教師教學(xué)質(zhì)量并提高學(xué)生的計算機等級考試成績優(yōu)秀率的目的。

猜你喜歡
數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則
撐竿跳規(guī)則的制定
“苦”的關(guān)聯(lián)
數(shù)獨的規(guī)則和演變
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
奇趣搭配
讓規(guī)則不規(guī)則
Coco薇(2017年11期)2018-01-03 20:59:57
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規(guī)則對我國的啟示
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
主站蜘蛛池模板: 亚洲免费人成影院| 亚洲中文字幕97久久精品少妇| 天天摸夜夜操| 国产电话自拍伊人| 亚洲小视频网站| 国产成人AV男人的天堂| 巨熟乳波霸若妻中文观看免费| 婷婷色一二三区波多野衣| 久久青青草原亚洲av无码| 国产大片喷水在线在线视频 | 亚洲国产成熟视频在线多多| 久久婷婷国产综合尤物精品| 999国内精品久久免费视频| 99久久精品免费视频| 99在线视频免费| 中文字幕有乳无码| 国产微拍一区二区三区四区| 在线免费亚洲无码视频| 欧美第二区| 国产精品久久久久无码网站| 这里只有精品在线播放| 无码国产偷倩在线播放老年人| 欧美一区二区丝袜高跟鞋| 在线观看网站国产| 99热线精品大全在线观看| 午夜日b视频| 国产网友愉拍精品| 无套av在线| 国产精品妖精视频| 久久精品只有这里有| 91麻豆国产精品91久久久| 国产成人亚洲日韩欧美电影| 免费国产无遮挡又黄又爽| 婷婷久久综合九色综合88| 精品久久综合1区2区3区激情| 欧美激情视频一区二区三区免费| 在线精品欧美日韩| 男女性午夜福利网站| 久久成人18免费| 美女国产在线| 日韩第一页在线| 午夜综合网| 91原创视频在线| 无码'专区第一页| 国产一级二级在线观看| 伊人查蕉在线观看国产精品| 天天爽免费视频| 爆操波多野结衣| 亚洲精品在线影院| 日本欧美视频在线观看| 2019国产在线| 国产菊爆视频在线观看| 精品国产美女福到在线不卡f| 精品福利国产| 毛片免费在线| 五月天天天色| 国产综合精品一区二区| 国产精品伦视频观看免费| 操国产美女| 欧美亚洲国产一区| 九九热这里只有国产精品| 手机在线免费不卡一区二| 91欧美亚洲国产五月天| 国产天天色| 青青草91视频| 亚洲成AV人手机在线观看网站| 无码乱人伦一区二区亚洲一| 国产福利影院在线观看| 狠狠综合久久久久综| 91精品国产91久久久久久三级| 久操线在视频在线观看| 91精品国产自产91精品资源| 动漫精品中文字幕无码| 伊人网址在线| 国产精品自在拍首页视频8| 国产人免费人成免费视频| 国产福利免费视频| 丰满的少妇人妻无码区| 一区二区午夜| 国产日产欧美精品| 青青青伊人色综合久久| 99久久国产精品无码|