摘要:國(guó)內(nèi)各高校在教學(xué)過程中積累了眾多的數(shù)據(jù),但大部分?jǐn)?shù)據(jù)沒有得到很好的挖掘和研究利用,相反數(shù)據(jù)挖掘卻在電信、銀行、保險(xiǎn)等許多行業(yè)得到廣泛的應(yīng)用。本文對(duì)數(shù)據(jù)挖掘在教育中的應(yīng)用以及存在的問題和前景展望進(jìn)行研究探討。
關(guān)鍵詞:數(shù)據(jù)挖掘 教學(xué)應(yīng)用 管理應(yīng)用
一、數(shù)據(jù)挖掘技術(shù)概述
1.數(shù)據(jù)挖掘涵義
隨著計(jì)算機(jī)應(yīng)用的普及,信息技術(shù)的發(fā)展,產(chǎn)生了大量的數(shù)據(jù)。如何從大量數(shù)據(jù)中提取有用信息,找到隱藏信息成為亟待解決的問題。數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生,且伴隨數(shù)據(jù)庫(kù)技術(shù)發(fā)展而逐步得到完善。
數(shù)據(jù)挖掘(DM:Data Mining)也稱數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)KDD(Knowledge Discovery in Database),是從大量數(shù)據(jù)中提取或“挖掘”知識(shí)的過程,即從數(shù)據(jù)集合中抽取出隱藏在數(shù)據(jù)中的有用信息和知識(shí)的非平凡過程。數(shù)據(jù)挖掘是建立在人工智能、數(shù)據(jù)庫(kù)技術(shù)、統(tǒng)計(jì)學(xué)、可視化支柱技術(shù)、機(jī)器學(xué)習(xí)、并行計(jì)算等不同學(xué)科和領(lǐng)域知識(shí)基礎(chǔ)上,不同于信息檢索的一門數(shù)據(jù)庫(kù)技術(shù)。在大量數(shù)據(jù)中查找符合條件的記錄,或者在因特網(wǎng)中搜索查找需要的特定信息,均屬于信息檢索領(lǐng)域范疇。
常用的數(shù)據(jù)挖掘技術(shù)主要有關(guān)聯(lián)分析法、時(shí)間序列分析法、預(yù)測(cè)分析法、分類分析法、聚類分析法等。
2. 數(shù)據(jù)挖掘?qū)ο?/p>
數(shù)據(jù)挖掘?qū)ο笫谴罅慷喾N多樣的數(shù)據(jù),可以是關(guān)系型數(shù)據(jù)庫(kù)中的結(jié)構(gòu)化數(shù)據(jù);也可以是文本數(shù)據(jù)庫(kù)、多媒體數(shù)據(jù)庫(kù)、時(shí)態(tài)數(shù)據(jù)庫(kù)、歷史數(shù)據(jù)庫(kù)中的非結(jié)構(gòu)化數(shù)據(jù);甚至是萬維網(wǎng)(WEB)上的異構(gòu)型數(shù)據(jù)。
二、數(shù)據(jù)挖掘在教學(xué)和管理中的具體應(yīng)用
1.教學(xué)方法分析
在教學(xué)過程中,教師通常采用講授法、討論法、案例法、演示法、參觀學(xué)習(xí)法等多種教學(xué)方法完成對(duì)本門課程的教學(xué)任務(wù)。不同專業(yè)及層次的教學(xué)班級(jí)應(yīng)采取何種教學(xué)方法以滿足教學(xué)需要,且有利于學(xué)生對(duì)知識(shí)的掌握?大量的教學(xué)實(shí)踐經(jīng)驗(yàn)存放于教學(xué)數(shù)據(jù)庫(kù)中,運(yùn)用聚類分析、關(guān)聯(lián)規(guī)則或分類分析的方法對(duì)存放于教學(xué)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行挖掘,可以判斷出教學(xué)方法與學(xué)生之間存在的適合關(guān)系,對(duì)分類、分層次、分專業(yè)教學(xué)具有指導(dǎo)意義。
2.教與學(xué)的評(píng)價(jià)分析
教學(xué)評(píng)價(jià)包括教師“教”的評(píng)價(jià)和對(duì)學(xué)生“學(xué)”的評(píng)價(jià),是世界教育科學(xué)研究三大研究領(lǐng)域之一。目前,在各個(gè)高校中通過參考國(guó)內(nèi)外相關(guān)評(píng)價(jià)指標(biāo)體系且結(jié)合實(shí)際經(jīng)驗(yàn)和采取調(diào)查問卷等方式積累了大量教與學(xué)的評(píng)價(jià)數(shù)據(jù),包括學(xué)生綜合評(píng)價(jià)指標(biāo)、學(xué)生測(cè)評(píng)指標(biāo)、課堂教學(xué)評(píng)價(jià)指標(biāo)等,但對(duì)于各項(xiàng)指標(biāo)間的關(guān)系,進(jìn)行評(píng)價(jià)指標(biāo)體系研究的高校卻較少。[4]將粗糙集理論及關(guān)聯(lián)規(guī)則應(yīng)用到各評(píng)價(jià)系統(tǒng),進(jìn)行數(shù)據(jù)挖掘,可以容易地找到適合學(xué)校教學(xué)評(píng)價(jià)且簡(jiǎn)單易行的評(píng)價(jià)指標(biāo)體系。另可考查學(xué)生個(gè)別差異,便于因材施教,對(duì)學(xué)生的學(xué)習(xí)評(píng)價(jià)也是各個(gè)高校教育工作者的重要職責(zé)之一。
利用數(shù)據(jù)挖掘工具,如將關(guān)聯(lián)規(guī)則運(yùn)用于教學(xué)評(píng)價(jià)數(shù)據(jù)庫(kù)中的數(shù)據(jù),得到教學(xué)效果與教師的職稱、性別、年齡等之間的關(guān)系以及學(xué)生具備的素質(zhì)指標(biāo)之間的關(guān)系等,可以即時(shí)得到教學(xué)評(píng)價(jià)結(jié)果,從而對(duì)教師的“教”和學(xué)生的“學(xué)”進(jìn)行及時(shí)指正。
3. 課程設(shè)置分析
學(xué)校對(duì)學(xué)生課程的設(shè)置大多遵循先基礎(chǔ)、后專業(yè)、每學(xué)期的必修與選修課程的規(guī)律,課程與課程之間存在一定的關(guān)聯(lián)與前后順序關(guān)系,且學(xué)習(xí)室循序漸進(jìn)的。[5]怎樣能使每學(xué)期的課程設(shè)置大局與局部兼顧是一個(gè)值得教育工作者研究的問題。
學(xué)校學(xué)生成績(jī)數(shù)據(jù)庫(kù)中存放了歷屆學(xué)生的考試成績(jī)信息,運(yùn)用關(guān)聯(lián)分析、分類分析和時(shí)間序列分析對(duì)學(xué)習(xí)同一門課程的不同專業(yè)和班級(jí)的學(xué)生成績(jī)數(shù)據(jù)進(jìn)行挖掘,分析數(shù)據(jù)之間的相關(guān)性和規(guī)律性信息,找出影響學(xué)生學(xué)習(xí)成績(jī)的原因,從而對(duì)學(xué)校學(xué)生課程的設(shè)置做出合理安排。
4.學(xué)生學(xué)習(xí)及行為分析
依靠教師多年的教學(xué)經(jīng)驗(yàn)來解決,可以了解學(xué)生在學(xué)習(xí)過程中所遇到的困難,幫助學(xué)生克服學(xué)習(xí)中的障礙,但對(duì)于更新迅速的計(jì)算機(jī)學(xué)科,傳統(tǒng)的教學(xué)方法顯然不能滿足教學(xué)。因此可以利用數(shù)據(jù)挖掘技術(shù)從學(xué)生提交作業(yè)的數(shù)據(jù)庫(kù)中提取數(shù)據(jù)及時(shí)發(fā)現(xiàn)和解決問題。例如,本人近期對(duì)學(xué)生提交的C語言程序設(shè)計(jì)課程作業(yè)進(jìn)行數(shù)據(jù)挖掘,通過對(duì)評(píng)閱結(jié)果為語法錯(cuò)誤、語法警告和運(yùn)行錯(cuò)誤的記錄使用數(shù)據(jù)挖掘技術(shù),準(zhǔn)確地發(fā)現(xiàn)了學(xué)生程序中的語法及算法錯(cuò)誤的主要因素,使學(xué)生得到及時(shí)地反饋,并在日后的程序設(shè)計(jì)中避免類似錯(cuò)誤發(fā)生,從而明顯改善教學(xué)效果。
在信息技術(shù)高度普及的今天,利用數(shù)據(jù)挖掘工具對(duì)學(xué)生的獎(jiǎng)懲情況記錄數(shù)據(jù)庫(kù)、學(xué)生互評(píng)數(shù)據(jù)庫(kù)、學(xué)習(xí)行為記錄數(shù)據(jù)庫(kù)等進(jìn)行分析處理,對(duì)學(xué)生的行為進(jìn)行管理并對(duì)不良行為進(jìn)行及時(shí)指正,既減輕了教師的工作量,又達(dá)到了改善教學(xué)的目的。
5.學(xué)籍管理分析
各個(gè)高校在學(xué)生入學(xué)后,都為學(xué)生建立了學(xué)生檔案,包括學(xué)生的姓名、年齡、性別、家庭情況、健康狀況、特長(zhǎng)愛好、獎(jiǎng)懲情況、入學(xué)前后的成績(jī)、聯(lián)系方式等等。這些信息當(dāng)中隱含了大量的有價(jià)值的數(shù)據(jù),如每名學(xué)生的學(xué)習(xí)成績(jī)變化情況、行為記錄情況、身體健康變化情況等,運(yùn)用預(yù)測(cè)分析、演變分析、統(tǒng)計(jì)分析、聚類分析、關(guān)聯(lián)分析等方法,挖掘出有價(jià)值信息進(jìn)行分析,對(duì)提高學(xué)生學(xué)習(xí)能力、各方面素質(zhì)發(fā)展、糾正不良學(xué)習(xí)行為、學(xué)校的學(xué)生管理工作等均能起到指導(dǎo)作用。
三、數(shù)據(jù)挖掘應(yīng)用的困境及發(fā)展前景
數(shù)據(jù)挖掘存在著一個(gè)潛在的機(jī)會(huì)。從數(shù)據(jù)集中發(fā)現(xiàn)模式的可能性當(dāng)然存在,然而,也不應(yīng)就此掩蓋危險(xiǎn)。所有真正的數(shù)據(jù)集,即使那些是以完全自動(dòng)方式搜集的數(shù)據(jù),都有產(chǎn)生錯(cuò)誤的可能,關(guān)于人的數(shù)據(jù)集,例如事務(wù)和行為數(shù)據(jù),尤其有這種可能。與此相關(guān)聯(lián)的是如何確保任何所搜集到的模式是“真實(shí)的”,并為數(shù)據(jù)挖掘的可靠性提供保障。
目前,數(shù)據(jù)挖掘技術(shù)及應(yīng)用已是國(guó)際上的一個(gè)研究熱點(diǎn),并在許多行業(yè)中得到應(yīng)用,尤其在市場(chǎng)營(yíng)銷領(lǐng)域體現(xiàn)了其優(yōu)越性和發(fā)展?jié)摿Α?jù)國(guó)外專家預(yù)測(cè),隨著數(shù)據(jù)量的日益積累以及計(jì)算機(jī)的廣泛應(yīng)用,數(shù)據(jù)挖掘?qū)⒃谥袊?guó)形成一個(gè)產(chǎn)業(yè)。隨之而來的是數(shù)據(jù)挖掘技術(shù)在教育領(lǐng)域中的應(yīng)用也必將不斷壯大,發(fā)揮越來越大的作用,對(duì)日后教育的改革和發(fā)展起到指導(dǎo)和巨大的推動(dòng)作用。
參考文獻(xiàn):
[1](加)Jiawei Han Micheline Kamber著 范明 孟小峰 等譯.data Mining:Concepts and Techniques數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2001:3-17
[2] Margarent H.Dunham著郭崇慧 田鳳占等譯.數(shù)據(jù)挖掘教程[M].北京:清華大學(xué)出版社,2005:3-15
[3]張玉林.數(shù)據(jù)挖掘技術(shù)在教學(xué)過程中的指導(dǎo)作用[J].西安通信學(xué)院學(xué)報(bào),2006,5(2):38-40
[4]劉曉霞.數(shù)據(jù)挖掘技術(shù)在高校教學(xué)中的應(yīng)用[J].實(shí)踐與經(jīng)驗(yàn),2008(6):115-117