


摘 要:隨著大數(shù)據(jù)時(shí)代的到來,人們對(duì)各項(xiàng)業(yè)務(wù)數(shù)據(jù)的管理和使用不再限于簡(jiǎn)單的存儲(chǔ)備份和統(tǒng)計(jì),更多地開始利用數(shù)據(jù)挖掘的技術(shù),從枯燥的數(shù)據(jù)中挖掘出有用的、有趣的信息(或稱為知識(shí)),對(duì)既有業(yè)務(wù)進(jìn)行分析評(píng)價(jià),并可對(duì)將來業(yè)務(wù)進(jìn)行預(yù)測(cè)和指導(dǎo)。高校信息化管理積累了大量的教務(wù)及管理數(shù)據(jù),運(yùn)用關(guān)聯(lián)規(guī)則方法挖掘所收集的數(shù)據(jù),得出學(xué)生干部在班級(jí)整體學(xué)習(xí)風(fēng)氣中發(fā)揮何種作用以及如何更好地發(fā)揮作用的知識(shí)。
關(guān)鍵詞:數(shù)據(jù)挖掘;高校;學(xué)生干部
中圖分類號(hào):G641 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1002-4107(2013)12-0081-02
當(dāng)前已經(jīng)有很多成果利用數(shù)據(jù)挖掘技術(shù)進(jìn)行教學(xué)質(zhì)量評(píng)價(jià)、教師業(yè)績(jī)?cè)u(píng)價(jià)、學(xué)生成績(jī)的相關(guān)分析等,而在眾多文獻(xiàn)中[1-3],尚缺少對(duì)大學(xué)體系中一群重要角色,即學(xué)生干部的關(guān)注。因此,筆者結(jié)合自身實(shí)際教學(xué)工作,搜集所在單位大一至大三共16個(gè)小班自入學(xué)至2012年秋季學(xué)期為止的所有成績(jī)以及各班學(xué)生干部分工信息,試圖尋找學(xué)生干部在班級(jí)整體學(xué)習(xí)風(fēng)氣中發(fā)揮何種作用以及如何更好發(fā)揮作用的知識(shí)。
一、基本數(shù)據(jù)及預(yù)處理
本次研究工作收集的數(shù)據(jù)數(shù)量較大,如三年級(jí)學(xué)生經(jīng)歷5個(gè)學(xué)期約有40—50科成績(jī),200人就有一萬項(xiàng)數(shù)據(jù),數(shù)據(jù)量大可以為后期挖掘的準(zhǔn)確性、可靠性帶來保障,因此在預(yù)處理的過程中,盡可能保持?jǐn)?shù)據(jù)的規(guī)模,主要進(jìn)行三個(gè)預(yù)處理動(dòng)作:將采用五級(jí)制評(píng)分標(biāo)準(zhǔn)的科目成績(jī)轉(zhuǎn)換為百分制,即優(yōu)秀、良好、中等、及格、不及格分別換算為95、85、75、65和50分,去掉了所有采用二級(jí)制(即合格、不合格)評(píng)分標(biāo)準(zhǔn)的科目成績(jī),去掉了所有休/退學(xué)等成績(jī)不完整的學(xué)生數(shù)據(jù)。
二、數(shù)據(jù)統(tǒng)計(jì)加工
以班級(jí)為單位,統(tǒng)計(jì)出各班人數(shù)、各等級(jí)成績(jī)比率、學(xué)生干部數(shù)量、排名等常規(guī)信息;為配合筆者研究的主旨,還從中推導(dǎo)出幾個(gè)特殊信息:(1)學(xué)生干部的量:為屏蔽班級(jí)人數(shù)的差異性,學(xué)生干部的數(shù)量以“學(xué)生干部比率”替代,學(xué)生干部比率=班級(jí)內(nèi)學(xué)生干部數(shù)量÷班級(jí)人數(shù),保留一位小數(shù)。(2)學(xué)生干部的質(zhì):各班學(xué)生干部人數(shù)眾多,基于干部應(yīng)起到領(lǐng)袖示范作用的先驗(yàn)知識(shí),筆者取各班學(xué)生干部中最好的兩個(gè)排名的均值作為“學(xué)生干部最好排名”參與后期分析(同樣,為屏蔽班級(jí)人數(shù)的差異性,排名取其實(shí)際名次在班級(jí)總?cè)藬?shù)中的比率)。(3)班級(jí)學(xué)風(fēng):學(xué)風(fēng)本是指學(xué)生的行為規(guī)范和思想道德的集體表現(xiàn),是學(xué)生在學(xué)習(xí)過程中所表現(xiàn)出來的精神風(fēng)貌,是一個(gè)抽象的、定性的概念。鑒于學(xué)風(fēng)對(duì)于學(xué)習(xí)成績(jī)的重要影響作用,筆者還重點(diǎn)運(yùn)用到“中以上比率”定量地表達(dá)學(xué)風(fēng),中以上比率=優(yōu)秀率+良好率+中等率。
經(jīng)過以上的預(yù)處理和統(tǒng)計(jì)加工,得到如表1所示的數(shù)據(jù)表。
三、數(shù)據(jù)挖掘與分析
筆者采用關(guān)聯(lián)規(guī)則分析方法挖掘大二、大三年級(jí)的11個(gè)班級(jí)[4-5],在迭代頻繁項(xiàng)集過程中,學(xué)生干部比率基本呈現(xiàn)離散狀態(tài),直接取其值,另外按“優(yōu)秀率是否大于0”、“不及格率是否大于0”、“中以上比率是否大于0.7”、“學(xué)生干部最好排名是否小于0.25”將優(yōu)秀率、不及格率、中以上比率、學(xué)生干部最好排名等4列數(shù)據(jù)進(jìn)行了離散化,置信度閾值設(shè)為0.6,得出以下關(guān)聯(lián)規(guī)則:
(1)學(xué)生干部最好排名<0.25=>中以上比率>0.7
支持度0.63,置信度0.86
注:學(xué)生干部最好排名<0.25,即為40人以內(nèi)小班可保證實(shí)際名次在前10名。
(2)學(xué)生干部比率0.2=>優(yōu)秀率>0
支持度0.45,置信度0.6
(3)學(xué)生干部比率0.3=>優(yōu)秀率≯0
支持度0.45,置信度1
(4)學(xué)生干部比率0.3=>不及格率>0
支持度0.45,置信度0.8
(5)學(xué)生干部比率0.2=>不及格率≯0
支持度0.45,置信度0.8
從第(1)條規(guī)則可以看出,學(xué)生干部在班級(jí)中確實(shí)可以起到領(lǐng)袖示范作用,學(xué)生干部的學(xué)習(xí)質(zhì)量高,可帶動(dòng)整個(gè)班級(jí)建立良好的學(xué)習(xí)風(fēng)氣,學(xué)習(xí)效果理想。進(jìn)而,如何讓學(xué)生干部更好地發(fā)揮其作用是筆者力圖挖掘出的第二條知識(shí)。從第(2)—(5)條規(guī)則可以看出,學(xué)生干部比率為0.2時(shí),優(yōu)秀率、不及格率均比學(xué)生干部比率為0.3時(shí)更為理想,因此筆者認(rèn)為,一個(gè)班級(jí)中學(xué)生干部的比率以不超過20%為宜,過多的學(xué)生干部可能導(dǎo)致質(zhì)量良莠不齊、人浮于事不作為等脫離高等學(xué)校本質(zhì)的一些行政化不良現(xiàn)象,嚴(yán)重影響班級(jí)學(xué)風(fēng)。
四、數(shù)據(jù)知識(shí)的驗(yàn)證
以上工作的數(shù)據(jù)對(duì)象為本文全部數(shù)據(jù)源中大二、大三年級(jí)的班級(jí)數(shù)據(jù),為驗(yàn)證所挖掘知識(shí)的可靠性,用大一的6個(gè)班級(jí)數(shù)據(jù)(表2)進(jìn)行驗(yàn)證。
(1)學(xué)生干部比率超過0.2的5個(gè)班級(jí)中,4個(gè)班級(jí)的中以上比率≯0.7、不及格率>0,證明過多的學(xué)生干部不利于班級(jí)學(xué)風(fēng)建設(shè)。
(2)學(xué)生干部比率為0.2的雖只有1個(gè)班級(jí),但也滿足中以上比率>0.7的基本要求,學(xué)風(fēng)符合預(yù)期。
五、改進(jìn)學(xué)生干部評(píng)價(jià)的建議
通過以上的數(shù)據(jù)挖掘工作,已經(jīng)得到并驗(yàn)證了高校學(xué)生干部發(fā)揮作用的一些知識(shí),為進(jìn)一步給學(xué)生干部的評(píng)價(jià)提出建議,筆者將大二、大三年級(jí)關(guān)鍵數(shù)據(jù)繪制為圖表,以便說明。圖1所示為學(xué)生干部比率分別為0.3和0.2時(shí)各班級(jí)學(xué)生干部排名與班級(jí)中以上比率的對(duì)比關(guān)系,上方上揚(yáng)的曲線為班級(jí)中以上比率,下方的下行曲線是學(xué)生干部排名(如前所述排名取實(shí)際名次在班級(jí)總?cè)藬?shù)中的比率)。從圖1可以清楚地看出,在學(xué)生干部比率一定,并處于較大比率的情況下,學(xué)生干部的排名情況越好(數(shù)值越小)對(duì)班級(jí)學(xué)風(fēng)越有利(數(shù)值越大),學(xué)生干部比率為0.2的班級(jí)其影響趨勢(shì)相仿但不明顯。從中筆者認(rèn)為,在日常班級(jí)管理過程中,要及時(shí)基于成績(jī)數(shù)據(jù)的挖掘?qū)W(xué)生干部進(jìn)行評(píng)價(jià),尤其是學(xué)生干部數(shù)量較多的班級(jí),獲得中等以上成績(jī)的學(xué)生比率偏低(不超過70%)時(shí)必須對(duì)學(xué)生干部予以改選或免職,用定量的機(jī)制公平、公正、公開選拔學(xué)生干部,以促進(jìn)班級(jí)學(xué)風(fēng)的改良,提高學(xué)習(xí)質(zhì)量。
筆者利用數(shù)據(jù)挖掘技術(shù)中關(guān)聯(lián)規(guī)則分析方法,對(duì)一定數(shù)量的班級(jí)成績(jī)進(jìn)行統(tǒng)計(jì)、分析和提煉,得出并驗(yàn)證了高校學(xué)生干部自身質(zhì)量較高(班級(jí)排名前25%)、數(shù)量較少(占班級(jí)人數(shù)不超過20%)時(shí)能夠更好地發(fā)揮領(lǐng)袖示范作用,建設(shè)良好的學(xué)風(fēng)。同時(shí),也建議將班級(jí)的中等以上成績(jī)比率作為學(xué)生干部評(píng)價(jià)的定量數(shù)據(jù)參考。此外,在筆者所收集的數(shù)據(jù)中,有一條較為特殊的信息值得關(guān)注,即大一某班級(jí)學(xué)生干部比率0.3、學(xué)生干部最好排名也低至0.85,但班級(jí)總體的中以上比率卻高達(dá)97%,與文中所挖掘的知識(shí)并不相符。經(jīng)背景調(diào)查,該班級(jí)采用了當(dāng)前比較熱門的校企合作培養(yǎng)模式,是一個(gè)企業(yè)定制班,其學(xué)風(fēng)優(yōu)秀可以說明培養(yǎng)模式的創(chuàng)新確實(shí)對(duì)培養(yǎng)質(zhì)量有重要推動(dòng)作用,反觀學(xué)生干部的成績(jī)卻非常差,是否可以反思,傳統(tǒng)的學(xué)生干部選拔方式也要隨著社會(huì)的發(fā)展、高等教育的發(fā)展而進(jìn)行大力革新。
參考文獻(xiàn):
[1]王琪.數(shù)據(jù)挖掘技術(shù)在計(jì)算機(jī)課程教學(xué)評(píng)價(jià)中的應(yīng)用
[J].現(xiàn)代閱讀:教育版,2012,(9).
[2]楊琳,姜真.關(guān)聯(lián)規(guī)則技術(shù)在教務(wù)管理中的應(yīng)用[J].山
東理工大學(xué)學(xué)報(bào):自然科學(xué)版,2009,(11).
[3]謝秋麗.基于關(guān)聯(lián)規(guī)則的教學(xué)質(zhì)量評(píng)價(jià)數(shù)據(jù)挖掘[J].現(xiàn)
代計(jì)算機(jī):專業(yè)版,2008,(6).
[4]黃鶴.關(guān)聯(lián)規(guī)則算法綜述[J].軟件導(dǎo)刊,2009,(3).
[5][美]J.Han,[加]M.Kamber;范明等譯.數(shù)據(jù)挖掘:概念與
技術(shù)[M].北京:機(jī)械工業(yè)出版社,2001:132-142.