李超鋒++胡鵬



摘 要:利用Apriori算法對1355個課堂的學生評教結果進行了關聯規則挖掘。挖掘結果表明學生對具有碩士學位職稱為正高級年齡超過46歲的教師的教學效果評價較差,對具有副高級職稱年齡在35歲及以下的教師的教學效果評價較好。本文據此提出了相應的教學建議。
關鍵詞:學生評教;教師特征;關聯規則
0 引言
隨著我國高校信息化水平的不斷提高,幾乎所有高校的教務管理或教學質量監控部門都引入學生評教系統并開展了學生評教工作,積累了大量的學生評教數據。一些高校的教學管理人員已經意識到了學生評教數據中蘊含著對提高教學質量有用的潛在信息和知識,并逐步著手開展了對學生評教數據的分析與挖掘。其中,將數據挖掘中的關聯規則挖掘技術應用到學生評教數據以發現教師背景特征與學生評教得分之間的內在聯系是一個研究熱點。如周秀梅、李高菊等通過關聯分析發現教師的職稱和年齡會影響教學效果,教師的學歷和性別對評教結果的綜合分數無顯著影響[1-2]。張美華等通過對300份數據進行關聯挖掘發現30-40歲之間具有中級職稱的教師容易被學生接受,學生對初級職稱教師反映問題較多[3]。楊鈞的關聯規則挖掘結果表明,專業技術職務為正教授的教師平均得分最高,副教授和講師平均得分相差不多[4]。張硯雪利用分層次法關聯挖掘對教師測評系統數據庫中的數據進行分析發現,具有副高職稱的教師,學生評價分數很高,助教職稱的教師則沒有得到學生的認可[5]。
然而,通過對大量的文獻分析發現,目前研究人員在使用關聯規則挖掘學生評教數據時基本上只考慮了規則的有效性,對規則實用性的關注不夠。另外,所使用的數據來自于部分學院甚至個別專業的少量數據,數據的代表性和證明力略顯單薄。本文利用Apriori算法對某部屬高校學生評教的真實數據進行挖掘,找出高校教師自身特征與學生評教結果之間的關聯規則,以期為培養高素質的高校教師隊伍進而提升高校教學質量提供實證研究依據。
1 數據來源及預處理
本研究所需要的數據包括學生評教數據和教師自身特征基礎數據。學生評教數據來自于某部屬高校2014-2015學年度第2學期學生評教數據庫中的原始數據,教師自身特征數據來自于該校人事管理系統的基礎數據庫。
學生評教數據在使用之前進行了數據篩選、課堂評教平均得分計算和離散化、缺失值和異常值去除等預處理,共得到1399個課堂評教數據。其中缺失值是由于部分學生未對所修課程所有評分指標進行評分造成的。異常值包括因學生惡意差評[6]導致總分少于40分的學生數據記錄和評教人數少于10人的課堂記錄。評教得分離散處理時將全校所有課堂按最終平均得分排名,前三分之一為優等級,中間三分之一為中等級,后三分之一為差等級。
教師自身特征數據經過數據篩選、專業技術職務名稱統一和年齡離散化等處理,共得到1490位教師數據。其中原始數據中的教授和正高級統一為正高級職稱,副教授和其他副高級統一為副高級職稱,講師和其它中級統一為中級職稱,助教和其它初級統一為初級職稱。年齡的離散化處理將年齡為36歲以下的教師歸為青年教師,36-46歲之間為中年教師,46歲以為老年教師。
最后,將學生評教數據和教師自身特征基礎數據按教師工號連接合并。因部分外聘教師信息登記不全,連接后的數據中有44個課堂的教師基本信息存在缺失值,去除后剩余1355條記錄為本研究最終使用數據,結構如表1所示。
2 研究方法及工具
關聯規則挖掘用于發現數據項之間的密切程度或關系,對于給定的項和事務集,通過對事務集的分析,挖掘出項集中項之間的相關性。挖掘出的結果通常以規則的形式描述,稱為關聯規則。關聯規則的一般表示形式為X→Y。其中X稱為規則的前(左)項,可以是一個項或項集。Y稱為規則的后(右)項,一般為一個項,表示某種結論或事實。
一般情況下,可以從數據中找到很多關聯規則,但并不是所有的關聯規則都有效且實用。必須采用一定的測度指標篩選出有效且實用的關聯規則,這些規則稱為強關聯規則。強關聯規則常用的測度指標包括支持度(support)、可信度(confidence)和提升度(lift)。
支持度用于測度關聯規則應用的普適性,其值為前項與后項同時出現的概率,數學公式如式(1)所示,式中|T|表示事務總數。
可信度用于測度關聯規則的準確性,其值為包含前項的事務中同時也包含后項的概率,反映出前項出現的條件下后項出現的可能性,數學公式如式(2)所示,式中|T(X)|表示包含項X的事務數,|T(X∩Y)|表示同時包含項X和項Y的事務數。置信度高說明前項出現時后項出現的可能性高。
置信度和支持度用于測度規則的有效性,即那些具有較高置信度和較高支持度的規則才被認為是有效的規則。實際挖掘過程中,通常需要根據實際情況指定最小支持度和最小可信度。
有效的關聯規則并不一定實用。因為這些規則可能揭示的僅僅是一種隨機關聯關系,也可能揭示的是反向關聯關系[7]。因此,在進行關聯規則挖掘時不僅要考慮規則的有效性還要考慮規則的實用性。
提升度用于測度規則的實用性,其值為規則置信度與后項支持度之比,數學公式如式(3)所示。
提升度反映了規則前項的出現對規則后項出現的影響程度。有實用價值的規則是那些提升度大于1的規則,因為只有提升度大于1才能說明前項的出現對后項的出現有促進作用。
本研究利用關聯規則挖掘的思想挖掘學生評教平均得分等級與教師自身特征之間的強關聯規則,其前項為教師自身特征即性別、職稱、年齡和最高學位中一項或多項的組合,后項為平均得分等級。研究過程利用R語言中的相關函數實現。
3 挖掘過程及結果分析
采用R語言軟件,利用關聯規則挖掘技術中的Apriori挖掘算法,對預處理之后的數據進行挖掘。首先在R語言GUI窗口中安裝和加載Apriori函數包arules,通過read.table函數將預處理后的數據讀入到數據框Data中并轉換為Transaction類的實例格式,調用apriori函數進行關聯規則挖掘,最后去除冗余規則后利用inspect函數查看挖掘結果。用R語言實現過程如下:
install.packages("arules")#安裝相關包
library("arules")#加載相關包
Data<-read.table(file="data.txt",header=TRUE) #讀取預處理后數據
Trans<-as(Data,"transactions") #轉換為稀疏矩陣式,即Transaction類的實例
Rules <- apriori(Trans,parameter=list(support=0.01,confidence=0.5,minlen=2),
appearance=list(rhs=c("平均得分=差","平均得分=優","平均得分=中"),
default="lhs"))
SuperSetF<-is.subset(Rules,Rules) #冗余規則
inspect(Rules[-which(colSums(SuperSetF)>1)]) #查看去除冗余規則后結果
挖掘過程中最小支持度取1%,最小置信度取50%,最終結果中只選擇后項為平均得分等級的規則,結果如表2所示。
表2中3條規則的提升度均大于1,說明3條規則均具有實用性。第一條規則表明學生對具有碩士學位年齡在46歲以上正高級教師的評教結果并不理想。這一方面說明學生在評價教師授課質量時并未受教師職稱的影響,另一方面也反映了當前高校教學中的一種現象,即具有正高級職稱的教師由于兼職或只重視科研而并未將主要精力投入到教學中去。第2和第3條規則表明年齡在35歲及以下具有副高級職稱的青年教師深受學生青睞。通過與部分學生座談發現主要有以下幾個原因:一是這些教師年齡與學生接近,思維方式相差不大,易于被學生接受;二是這些教師基本上都是剛剛博士畢業不久,對本專業的知識掌握程度既有廣度又有深度,而且與現實比較貼近,容易引起學生共鳴;三是這些教師信息化教育水平較高,上課過程中善于利用多種教學手段,能夠較好地吸引學生的注意力;四是這些教師經過幾年的實際教學經歷具備了一定的教學經驗。
4 結論及建議
本研究共得到兩個主要的研究發現:第一,具有碩士學位職稱為正高級年齡超過46歲的教師的學生評教結果較差。第二,具有副高級職稱年齡在35歲及以下的教師的學生評教結果最好。
基于本研究的發現,我們提出了如下的教學建議。
(1)高校在強調讓具有正高級職稱的教師必須為本科生上課的同時,還應當通過思想教育和制度設計讓這些教師真正愿意投入精力為本科生上好課。
(2)教師教學發展研究中心應有針對性地多開展教師教學培訓與交流,對教學效果差的教師深入剖析原因,加強教育與培訓,對教學效果好的教學方式和手段大力推廣。
(3)組織人事部門應鼓勵教師攻讀博士學位或進修,進一步提高教師的業務水平。
總之,希望通過本文的研究結果一方面可以為我國高校建立科學的人事管理和決策制度提供依據,指導學校有針對性地加強對教師的教育、培養和培訓。另一方面可以幫助高校教師審視自己的教學過程,調動教師的教學積極性,提高教師對教學工作的重視程度和教學有效性。
基金項目:本文系湖北省教學研究項目“基于數據挖掘技術的高校教學質量評價研究”(項目編號:2014191)研究成果之一。
參考文獻
[1] 周秀梅,翁家銘,李石君.完全加權正負關聯規則算法及其在評教數據中的應用[J].內蒙古師范大學
學報(自然科學漢文版), 2016,45(2):242-248.
[2] 李高菊.數據挖掘在職業院校“學評教”體系中的應用[J].河北軟件職業技術學院,2016,18(3):47-50.
[3] 張美華,歐云. 關聯規則在高校評教系統中的應用[J].電腦知識與技術,2016,12(1):31-34
[4] 楊鈞,馬鐵明,吳磊,張穎.關聯規則在中醫院校學生評教系統中應用[J].遼寧中醫藥大學學報, 2016,18(11):
222-224.
[5] 張硯雪.應用關聯規則算法對高校教師測評數據進行分析]J].科技創新導報,2016(1):105,106,108.
[6] 陳磊,倪天倪.學生評教差評教師的有效性研究[J].高教探索,2012(1):84-90.
[7] 薛薇.基于R的統計分析與數據挖掘[M].北京:中國人民大學出版社,2015:323.