999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據挖掘技術的考試作弊風險預警研究

2017-12-16 12:59:00劉麗娜
吉林省教育學院學報 2017年9期
關鍵詞:數據挖掘

劉麗娜

摘要:采用數據挖掘技術對廣州科技職業技術學院已畢業的2009級~2013級5個年級的學生信息進行分析評估。利用SPSS Modeler挖掘工具中的Apriori關聯規則模型對預處理后的數據進行挖掘,發現潛藏其中有應用價值的規則。最后將所挖掘出的規則進行分析解釋,將其應用到教學改革當中,對具有潛在作弊風險的學生進行教育引導,形成考試作弊的預警機制,降柢學生作弊輟學風險,提高學校教育教學質量。

關鍵詞:數據挖掘;Apriori;考試作弊;預警

中圖分類號:TP311.1 文獻標識碼:A 文章編號:1671-1580(2017)09-0120-03

一、數據挖掘技術概述

數據挖掘技術是從不同的角度分析數據并將其歸總為有用信息的過程——可以利用其以增加收入,降低成本或二者兼有之。雖然數據挖掘是一個相對較新的術語,但其技術卻不然,早在數據挖掘一詞出現的很多年前就有公司利用強大的電腦來篩選大量的超市掃描儀數據,并以此來分析市場研究報告。

一談到數據挖掘應用就不得不提到經典的商業零售之啤酒與尿片關聯分析銷售規則。就是人們在大量的購物清單的分析中發現,一般購買啤酒的客戶也會同時購買尿片,這可以啟發零售商有針對性地將這兩樣東西放同一個地方或附近以增加銷售量,事實證明這是一種效果顯著的銷售決策。

數據挖掘包括多種實現算法,不同的算法適用于不同的數據及分析角度,一般較為復雜的挖掘系統會以幾種算法相結合的方式運行。數據挖掘算法技術包括以下幾種常見的算法。

(一)關聯規則

關聯規則是一種規則,它意味著(如“一起出現”或“一個事件的出現必然包含另一個事件”)在數據庫中的某些關聯關系。

(二)遺傳算法

遺傳算法依靠其模仿生物的方法,常用于為運營商解決最優化和搜索問題。

(三)神經網絡

神經網絡近年來備受關注,它以模仿動物神經網絡的行為特征運行在自學學習的數學模型基礎上,為解決大型的負責問題提供了一種相對簡單有效的方法。

(四)決策樹

它是一種決策支持工具,用類似于樹的圖形或模型表示決策或可能的輸出結果。

二、關聯規則挖掘算法Apriori

關聯規則是數據挖掘算法中發現屬性之間關聯性的基于規則的機器學習方法,它主要用于發現“一起出現”或一個事務與另一事務之間出現的必然聯系。它的目的是利用識別措施來發現數據庫中有趣的關系,發現強規則。

Agrawal等人對關聯規則挖掘問題的定義為:設數據庫即所有交易的集合為D:{t1,t2,t3…tn},n為交易記錄數。所有項目(屬性)的集合為I-{i1,i2…im},m為項目(屬性)數量。在數據庫D中,每條記錄都有唯一的m,記錄里所包含的項目(屬性)都在集合I中。而規則的定義為:X→Y,且x,Y∈I。

每條規則都由兩個或兩個以上的項目(屬性)組成,X和Y,其中X稱為規則前項,Y稱為規則后項。

例如,在超市購物時,有一個交易記錄為I={青菜,豆腐,醬油,鹽,面包},在所有交易中選擇其中5條交易記錄組成一個小的數據庫D(如表1所示),用一個表格表示該數據庫,1表示交易中有購買該項商品,0則表示沒有購買該項商品。

該數據庫中的規則為{青菜,豆腐}→{鹽},則表示如果顧客購買了青菜和豆腐,那么他們同時也會購買鹽。

為了從所有可能的規則中找出強規則,關聯規則設置了最低約束指標置信度和支持度來篩選有趣的規則。在以上規則R=X→Y中,支持度為:

Sup=(COUNT(X∧Y)/COUNT(D))*100% (1)

其中COUNT(X∧Y)為同時包含X和Y的項目(屬性)交易記錄總數,COUNT(D)為數據庫記錄數。規則的置信度為:

Conf=(COUNT(X∧Y)/COUNT(X))*100% (2)

其中COUNT(X)為包含X項目(屬性)的交易記錄總數。

在以上例子中,規則{青菜,豆腐}→{鹽}的支持度為3/5*100%=60%,置信度為3/4*100%=75%。

Apriori關聯規則通常需要滿足用戶指定的最小支持度和最小置信度約束,關聯規則的運行程序分為兩個獨立的步驟:

(一)在數據庫中找到所有符合最小支持度的頻繁項集;

(二)在所有找到頻繁項集中根據最小置信度找到強規則。

三、學生數據關聯挖掘模型設計

(一)目標分析

數據挖掘的挖掘結果雖然通過數據分析挖掘才知道具體的規則方向,然而數據挖掘也有明確的挖掘主題和挖掘目標。從所收集到的各數據源進行分析挖掘找出潛在的關聯關系,之后分析關聯結果,并將其應用于教學決策當中。

(二)數據準備

在對數據進行挖掘之前,所有數據源所提供的數據都是雜亂無章的,或數據缺失,或存在噪聲等,增加了數據的運行處理時間,降低了數據的處理效率。因此,在數據挖掘前需對數據進行整合清洗,以使挖掘效率和挖掘結果更快捷準確。

1.聯接各數據源形成學生信息總表

將所收集到的數據源整理形成電子數據表,根據各數據表的主鍵(“學號”或“身份證號”)與外鍵的關系聯接合并為一張有唯一主鍵的多屬性學生信息總表。聯接后清除與挖掘主題無關的屬性,如“姓名”“身份證號”等。

2.數據泛化

數據泛化即將數據庫中包含的數據原始概念層的細節信息從較低的概念層抽象到較高層次的過程。例如學生成績中同專業同課程的成績屬性在0至100之間有大量的不同值,不利于數據關聯挖掘,故需對數據做泛化處理。成績在泛化時可以根據范圍[90,100],[80,90),[70,80),[60,70),[0,60)依次分為優秀、良好、中等、及格和不及格5個成績段,其他屬性以此類推形成各維度的數據總表。endprint

3.噪聲及缺省值處理

信息數據在泛化后有了較統一的結構模式,然而,無論是歷史數據還是現在進行的數據都因為文件錯誤或保存不當,大多存在噪聲或缺失值。數據的不完整性將影響挖掘規則的支持度及可信度,而全部剔除不完整的數據記錄則可能會使重要規則也被一并刪除又或者縮小原本的數據庫。不完整數據的處理方式一般有人工填寫、屬性均值填充、全局常量填充、同類均值填充和忽略記錄等幾種。本研究所收集的數據來自不同的數據源具有不同的表現形式,部分屬性缺失嚴重地選擇了舍棄,而其他缺失值根據數據的性質和類型采用同類均值填充法。

四、依托數據挖掘工具SPSS Modeler的學生數據挖掘實現

本研究以廣州科技職業技術學院已畢業的2009級一2013級5個年級的學生數據為研究對象,將預處理后的17381條記錄,28個維度導入SPSSModeler中的Apriori模型當中,設最小支持度:最小置信度=0.05。

數據經過過濾之后進行類型分類,再進入Apri-ori莫型,運行之后生成各個支持度與置信度的規則分析結果。

五、挖掘結果及規則理解

經Apriori挖掘模型得出的挖掘結果需再進行進一步解釋篩選,本研究所挖掘出的結果解釋如表2。

在所有缺課超過1/3、缺考、舞弊記錄當中(如表2所示),規則“高考成績:[360-400),貧困生=是→缺考違紀=是”以及規則“貧困生=是,圖書借閱次數=0→缺考違紀=是”,支持度和置信度分別為0.063,0.538和0.075,0.436,高考成績為360~400在案例學院(3本B線)所有的錄取成績當中屬于良好層次,在此規則中的學生高考成績較好且家庭比較貧困,在學費相對較高,來之不易的上學機會卻出現缺課或缺考甚至舞弊的現象。數據顯示這批學生大部分鮮少在圖書館借閱圖書。實驗抽取符合該規則中的4名入學成績良好的貧困學生進行調研,其中有2名學生為舍友且同輔導員,經調研發現他們皆因沉迷上網(網絡游戲、電子小說)。在上大學前家庭貧困且無需購置電腦(或手機),大學期間購置之后使他們沉迷于新事物(網絡游戲、電子小說)當中,最終因擔心成績不合格愧對家人繼而鋌而走險。這4名學生其中有2名互為舍友。在了解了這一規則后,學校可以未雨綢繆,幫助并挽救這些學生,同時,這些有網癮的學生有可能會影響整個宿舍,或帶動舍友一起玩游戲或影響他人作息,學??梢愿鶕撘巹t,在宿舍分配上做相應調整,比如學習好意志力強的學生中插入一些成績差的,把誤入歧途的學生引向正道。

六、結束語

本研究以廣州科技職業技術學院已畢業的5個年級的學生數據為研究對象,采用當前比較新穎的信息技術分析手段——數據挖掘技術,選取數據挖掘技術中的關聯規則Apriori算法模型,SPSS Model,er分析工具對預處理后的數據進行分析。對挖掘結果進行了分析,提出了一種基于數據挖掘的學生考試作弊風險預警機制:基于預警事件和其他事件之間存在依賴或關聯關系定義了一種預警規則知識,根據預警規則可找出存在作弊風險的學生,在學生可能實施作弊之前采取應對措施,防止其作弊。實驗顯示,該預警機制在我校實施取得了一定的效果,嚴肅考風考紀,規范學校管理,提高人才培養質量。

[責任編輯:周海秋]endprint

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 精品国产香蕉伊思人在线| 国产午夜在线观看视频| 国产精品开放后亚洲| 伊人成色综合网| 又猛又黄又爽无遮挡的视频网站| 亚洲最大在线观看| 国产91精品调教在线播放| 手机精品福利在线观看| 国产精品福利导航| 国产精品一区二区国产主播| 亚洲激情区| 自拍偷拍欧美日韩| 色综合久久久久8天国| 久久久精品无码一区二区三区| 亚洲日韩精品无码专区97| 伊人国产无码高清视频| 亚洲h视频在线| 丁香六月综合网| 色哟哟精品无码网站在线播放视频| 欧美乱妇高清无乱码免费| 2021最新国产精品网站| 国产自在线拍| 亚洲浓毛av| 国产一区免费在线观看| 成年看免费观看视频拍拍| 99久久亚洲综合精品TS| 免费不卡在线观看av| 成年人福利视频| 国产一区二区三区免费观看| 国产亚洲精品97AA片在线播放| 国产女同自拍视频| 久久性妇女精品免费| 毛片视频网址| 东京热av无码电影一区二区| 欧美激情视频一区二区三区免费| 国产h视频免费观看| 国产成人h在线观看网站站| 国产在线观看高清不卡| 国产亚洲精| 久久永久免费人妻精品| 不卡午夜视频| V一区无码内射国产| 波多野结衣二区| 天堂在线视频精品| 99精品国产电影| 一级毛片不卡片免费观看| 亚洲美女一区| 久久久久亚洲av成人网人人软件| 综合网天天| 亚洲中文字幕手机在线第一页| 国产精品成人久久| 免费a级毛片视频| 精品伊人久久久久7777人| 亚洲欧洲日产国产无码AV| 国产成人综合久久| 久热99这里只有精品视频6| 亚洲av综合网| 久久福利片| 国产在线无码一区二区三区| 大香网伊人久久综合网2020| 久久精品人人做人人爽电影蜜月 | 日韩欧美视频第一区在线观看| 国内丰满少妇猛烈精品播| www.精品国产| 精品视频一区在线观看| 不卡国产视频第一页| 成人毛片在线播放| AV熟女乱| 亚洲天堂免费| 久久综合丝袜日本网| 在线观看国产一区二区三区99| 在线国产91| 久久久久国产一级毛片高清板| 92午夜福利影院一区二区三区| 不卡无码h在线观看| a毛片在线播放| 国产激爽大片在线播放| 亚洲综合狠狠| 亚洲AV无码久久精品色欲| 在线观看国产精品一区| 成人一级黄色毛片| 四虎永久在线精品影院|