999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于關聯分析的高等數學試卷分析及其R軟件實現

2016-10-18 07:47:58李強麗李慧譚立云
現代計算機 2016年16期
關鍵詞:數據挖掘關聯規則

李強麗,李慧,譚立云

(華北科技學院基礎部,廊坊065201)

基于關聯分析的高等數學試卷分析及其R軟件實現

李強麗,李慧,譚立云

(華北科技學院基礎部,廊坊065201)

近年來數據挖掘技術得到了迅猛發展,其應用也越來越廣泛??刹捎肦軟件,利用Apriori算法對高等數學上、下冊試卷成績的進行關聯分析,從而揭示高等數學各主要知識點之間的關系,為學生的學習以及教師的教學提供指導。

試卷分析;R軟件;關聯規則

0 引言

高等數學是高等院校工科各有關專業最重要的基礎課之一,因此工科各有關專業學生必須具備高等數學的基本理論知識,并熟練掌握其基本運算方法。通過考試可以測驗學生對知識的掌握情況,而試卷分析是高等學校教學工作中的一個非常重要組成部分。

我國已有很多學者在試卷分析方面進行了研究,如邱翔[1]對高等數學上下冊成績之間的相關性進行了分析,陳石磊[2]利用常用的統計分析軟件SPSS對試卷成績進行描述性統計分析,試卷質量難度、區分度、信度分析。隨著數據挖掘技術的迅猛發展,其在各個領域中的應用也越來越廣泛,但是在教育領域中,數據挖掘技術應用仍處于初級階段。高等數學上、下冊知識點繁多,試卷內容復雜,考生的人數又多,產生了大量的數據,教師很難從中獲得隱藏的信息。若要成功地從大量試卷中獲得有用的信息,必然需要一種高效的數據處理方法。在這種情況下,數據挖掘技術發揮了它獨特的優勢[3]。通過數據挖掘可以幫助教師明確教學中存在的問題,幫助教師分析確定教學難點,協助完善教學策略,以及幫助教師開展更具針對性的教學輔導工作。

1 關聯分析的挖掘過程

關聯分析是數據挖掘的核心技術之一,其目的是從大量數據中發現項集之間的有趣關聯或相互關系,其中最經典的Apriori算法在關聯規則分析領域有很大的影響力,其挖掘過程可以分兩個步驟完成:

(1)產生頻繁項集。即找出所有那些支持度大于等于事先給定的最小支持度的項集。

(2)由頻繁項集產生關聯規則。即從頻繁項集中產生所有關聯規則,選擇置信度大于產或等于事先給定的最小置信度的關聯規則,組成有效規則集合。

在上述兩個步驟中,第一步是挖掘關聯規則的關鍵步驟,尋找頻繁集的過程是一個不斷迭代的過程,挖掘關聯規則的總體性能由第一步決定。

2 Apriori算法在R中的實現

R是一種開源軟件和免費軟件,作為一個可進行交互式數據分析和探索的強大平臺,被越來越多的數據分析和挖掘人員及公司使用。

2.1相關軟件包

R中有專用于關聯分析的軟件包——arules,用于關聯規則的數字化生成,提供Apriori快速挖掘頻繁項集和關聯規則算法的實現函數,下載安裝arules軟件包,并加載后即可使用。

2.2核心函數

在R中實現Apriori算法,其核心函數為apriori(),函數的基本格式為:

當放置相應的數據集,并設置各個參數值(如:支持度和置信度的閾值)后,運行該函數即可生成滿足需求的頻繁項集或關聯規則等結果,下面具體說明各參數的設置。

data參數是集合數據,一般使用as(…,"transaction")進行轉換[4]。

parameter參數可以對支持度(support)、置信度(confidence)、每個項集所包含項數的最大值或最小值(maxlen或minlen),以及輸出結果(target)等重要參數進行設置。如果沒有對齊進行設置,函數將對各參數取默認值。

appearance參數可以對先決條件X(lhs)和關聯結果Y(rhs)中具體包含哪些項進行限制,在默認情況下,所有項都將無限制出現[5]。

3 關聯分析在高等數學試卷分析?中的應用

3.1數據選取

(1)數據取自我院2012級工科各專業全體學生高等數學上、下冊的考試成績真實成績,即兩個學期的高等數學卷面總成績和每道題目的得分,數據完整,無遺漏和重復現象。

(2)將高等數學上、下冊的試卷的考點進行了總結,共分成九大知識點,如表1所示。

表1 高等數學各知識點總結

3.2數據預處理

(1)構造屬性:本文需要將表1中提到的九個知識點添加到數據集中,也就是要根據數據集中原有的屬性來構造新的屬性。具體的方法是按照表1所示的分類將每個知識點所對應的各個題目的得分進行累加,進而得到學生對每個知識點的得分。

(2)數據規范化:考慮到算法的要求,需要對數據進行處理,將其整理成事實表的格式。首先計算出各知識點的得分,若學生在該知識點得分超過該知識點總分的60%(如果結果是小數,則向上取整),即認為該學生掌握了這個知識點,記為1,否則認為該學生未掌握這個知識點,記為0,在Excel中完成上述操作后如表3所示,將數據保存為gaoshu.csv格式。

表2 《高等數學》九大知識點分布情況

表3 將數據整理為0與1的格式

3.3 R軟件實現對高等數學試卷的難度分析

apriori()函數可以輸出頻繁項集(frequent itemsets),對項集頻率進行降序排列后,就可以得到每個知識點相應的掌握情況,進而可以分析試卷中每個知識點的難易度,R軟件的實現代碼如下,R軟件運行后的結果見表4。

>a<-read.csv("gaoshu.csv",header=T)#導入數據

>data=as.matrix(a)#將數據轉換為矩陣格式

>data.class=as(data,"transactions")#將數據框轉換為可以被apriori算法調用的格式

>itemsets_apr=apriori(data,parameter=list(supp=0.1,target="frequent itemsets"),

control=list(sort=-1))#將apriori()中目標參數設為“頻繁項集”

>inspect(itemsets_apr)#觀測頻繁項集的輸出結果

表4 頻繁項集支持度

由表4可以得出,解析幾何、導數與微分相關的題目學生作答較好,屬于較容易的題目,而關于級數的題目學生作答較差,屬于較難的題目,學生對于高等數學上冊的掌握明顯好于下冊。

3.4 R軟件實現對高等數學試卷的關聯分析

使用R軟件對規范后的數據進行關聯規則分析,設置支持度閾值為0.3,置信度閾值為0.6,并按規則的提升度從大到小排序,主要程序如下,得到的結果見表5。

表5 關聯規則分析結果

>rules=apriori(data,parameter=list(support=0.3,confidence= 0.6))#支持度設為0.3,置信度設為0.6

>rules.sorted_lift=sort(rules,by="lift")#將規則按照提升度從大到小排序

>inspect(rules.sorted_lift)#查看規則

3.5關聯規則結果分析

(1)由第1-7條規則可知,導數和微分、積分學或者微分方程如果學習好的話,那么一定對極限知識掌握的非常好,這些規則的置信度都在75%以上,說明學好極限是很重要的,它是學好導數和微分、積分學和微分方程的基礎。

(2)由第8-18條及第21條規則可知,如果積分學、微分方程、解析幾何或者多元函數微分學習好的話,那么一定對導數和微分知識掌握的非常好,這些規則的置信度大部分都在87%以上。所以導數和微分又是學習積分學、微分方程、解析幾何及多元函數微分的基礎知識。

(3)由第19-20條規則可知,重積分、曲線與曲面積分如果學習好的話,那么一定對解析幾何掌握的非常好,而這些規則的置信度都高達96%以上。解析幾何能夠培養學生的空間想象能力,是學習重積分、曲面與曲線積分的基礎。

(4)比較這些規則,得出《高等數學》(上)是學習《高等數學》(下)的基礎,這不是從知識點的銜接上直接分析得來的,而是通過對學生的實際考試成績分析得出的結論,會更加具有說服力。所以教師在教學過程中不僅自己要清楚重點知識,還一定要讓學生知道學習每個知識點的作用,尤其是基礎知識點的作用,只有在前面打好基礎,才能更好地學習《高等數學》(下)的知識點。

4 結語

通過對高等數學試卷的關聯分析,學生在學習《高等數學》上、下冊的過程中要注意知識點之間的聯系,如果某個知識點沒學好,可以先去復習一下與其密切相關的知識。另外,教師們在教學中基本上是通過直觀的判斷來確定教學重點和難點,關聯分析的應用也為教師了解試卷的難度,把握教學內容的重點提供了理論依據和方法,從而能促有效促進教師的教學,提高教學質量。

[1]邱翔,莊海根,龐莉莉,侯志芳,李樺.工科學生《高等數學》成績的相關分析研究[J].沈陽師范大學學報(自然科學版),2014,32(2):291-295.

[2]陳石磊.SPSS在大學英語試卷分析中的應用研究[J].重慶交通大學學報(社會科學版),2014.14(6):135-138.

[3]張瑤,陳高云,王鵬.數據挖掘技術在試卷分析中的應用[J].西南民族大學學報(自然科學版),2008.34(4):839-842.

[4]李明.R語言實戰與網站分析[M].機械工業出版社,2014.

[5]黃文,王正林.數據挖掘:R語言實戰[M].電子工業出版社,2014.

Analysis of Higher Mathematics Test Papers Based on Association Analysis and Its Implementation with R Software

LI Qiang-li,LI Hui,TAN Li-yun
(Foundation Department,North China Institute of Science and Technology,Langfang 065201)

In recent years,data mining technology has been developed rapidly,and its application is becoming more and more extensive.It can use the Apriori algorithm to realize association rule analysis for higher mathematics test papers between volumeⅠand volumeⅡ,which is shown with R software,reveals the relationship between the main knowledge of higher mathematics,which can provide guide for the students how to learn and the teachers how to teach.

Paper Analysis;R Software;Association Rule

1007-1423(2016)16-0006-04DOI:10.3969/j.issn.1007-1423.2016.16.002

李強麗(1981-),女,河北南宮人,碩士研究生,講師,研究方向為數據挖掘、計算智能

李慧(1979-),女,山東曲阜人,碩士研究生,講師,研究方向為數據挖掘、信息論,

譚立云(1966-),男,湖南益陽人,碩士研究生,教授,研究方向為多元統計、數據挖掘

2016-03-29

2016-06-10

華北科技學院重點學科應用數學資助(HKXJZD201402)

猜你喜歡
數據挖掘關聯規則
撐竿跳規則的制定
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
探討人工智能與數據挖掘發展趨勢
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 精品国产自| 久久99蜜桃精品久久久久小说| 伊人蕉久影院| 在线永久免费观看的毛片| 婷婷成人综合| 91久久性奴调教国产免费| 视频一区视频二区中文精品| 国产一级二级三级毛片| 国产一级二级在线观看| 欧美日韩专区| 久久婷婷综合色一区二区| 五月婷婷综合在线视频| 午夜视频日本| 国产成人av一区二区三区| 国产成人免费高清AⅤ| 国产又大又粗又猛又爽的视频| 最新国产麻豆aⅴ精品无| 欧美亚洲另类在线观看| 四虎国产在线观看| 美女无遮挡拍拍拍免费视频| 亚洲人成网站在线播放2019| 亚洲天堂日韩在线| 精品人妻无码中字系列| 免费无码网站| 中国国产A一级毛片| 无码人妻热线精品视频| 成年免费在线观看| 国产精品第页| 无码丝袜人妻| 十八禁美女裸体网站| 午夜无码一区二区三区| 国产在线视频福利资源站| 国产原创演绎剧情有字幕的| 黄色福利在线| 婷婷色中文| 国产成人h在线观看网站站| 日韩无码黄色| 国产剧情无码视频在线观看| 欧美成人一级| 国产最新无码专区在线| 免费观看亚洲人成网站| 日韩二区三区无| 国产黑丝视频在线观看| 五月天丁香婷婷综合久久| 中文字幕天无码久久精品视频免费| 国产a网站| 国产网站一区二区三区| AⅤ色综合久久天堂AV色综合| 国产菊爆视频在线观看| a亚洲天堂| 色婷婷成人网| 欧美日韩精品综合在线一区| 国产在线观看精品| 永久免费av网站可以直接看的 | 国产精品视频系列专区| 看国产一级毛片| 欧美一级黄片一区2区| 性69交片免费看| 91久久精品国产| 国产美女在线观看| 国产永久在线视频| 国产xx在线观看| 91在线丝袜| 91精品久久久久久无码人妻| 老司机aⅴ在线精品导航| 无码高潮喷水在线观看| 999精品视频在线| 国产福利在线免费观看| 精品国产一区二区三区在线观看| 亚洲人人视频| 日本免费高清一区| 毛片卡一卡二| 亚洲最新地址| 素人激情视频福利| 日本久久免费| 青青草91视频| 成人毛片免费在线观看| 国产精品无码制服丝袜| av天堂最新版在线| 久久综合五月| 午夜精品影院| 精品国产免费观看|