路玥



摘 要: 傳統英語教師教學能力評價方法受主觀因素制約,無法排除人為因素造成的影響,導致評價結果不可靠。為此,提出基于數據挖掘的英語教師教學能力評價方法。依據特征變量離散化原則對數據采取匿名化編碼處理,對存在大量特征值的英語教師教學特征變量進行離散化處理。對英語教師教學數據進行粗糙集約簡處理,將需挖掘的英語教師教學數據庫采用粗糙集方法進行處理,確定決策表,設定最小支持和最小置信度,通過關聯規則挖掘方法得出關聯規則,從而實現英語教師教學數據挖掘。通過主成分分析對挖掘的英語教師教學數據集結構進行描述,獲取評價指標。對英語教師教學能力指標進行計算,依據指標值評價英語教師教學能力。實驗結果表明,所提方法評價結果可靠,可體現教師真實能力。
關鍵詞: 數據挖掘; 英語教師; 教學能力; 評價; 約簡; 變量離散化
中圖分類號: TN911.1?34; TP391 文獻標識碼: A 文章編號: 1004?373X(2018)11?0153?04
Research on data mining based teaching ability evaluation of English teachers
LU Yue
(Tianjin University of Technology, Tianjin 300202, China)
Abstract: The traditional teaching ability evaluation methods of English teachers are influenced by subjective factors, and cannot eliminate the influence of human factors, which lead to the unreliable evaluation results. Therefore, a data mining based new teaching ability evaluation method of English teachers is proposed. According to the discretization principle of characteristic variables, the data is treated with anonymous encoding, and the English teachers′ teaching characteristic variables with large eigenvalues are discretized. The rough set reduction processing was performed for the teaching data of English teachers. The English teachers′ teaching database needed mining is processed with rough set method to confirm the decision table and set the minimum support and minimum confidence. The association rules mining method is used to get the association rules, so as to realize the teaching data mining of English teachers. The structure of teaching data set of English teachers is described by means of principal component analysis to get the evaluation index. The teaching ability indicators of English teachers are calculated to evaluate the teaching ability of English teachers. The experimental results show that the method has reliable evaluation result, and can reflect the true ability of teachers.
Keywords: data mining; English teacher; teaching ability; evaluation; reduction; variable discretization
教學能力評價為學校管理的關鍵階段,有效完成英語教師教學能力評價有助于英語教師教學方法和內容的改進,使得英語教師教學能力有所提升[1]。但教學能力評價是一個非常復雜的過程,所以對教學能力進行科學的評價是非常困難而值得研究的問題[2]。
英語教師教學能力評價被教育部門和各高校廣泛關注,最初通過人工形式進行評價,評價結果不可靠,無法體現真實的英語教師教學能力[3]。之后常通過專家系統實現英語教師教學能力的評價,然而由于與教學能力評價相關的因素較多,且專家系統容易受到自身水平的影響,無法排除人為因素導致的誤差,導致評價結果不可信[4]。
為了提高英語教師教學能力評價精度,本文提出基于數據挖掘的英語教師教學能力評價方法。經實驗驗證,與其他方法相比,本文方法評價結果更加科學,可體現英語教師真實的教學水平。
對全部英語教師教學樣本數據集進行分析,因樣本數據集中數據種類繁多,存在很多不相關數據。所以,需對數據進行篩選、離散化等預處理 ,以保證英語教師教學數據具有一定的規范性。本文遵循特征變量離散化原則,對表格采取匿名化編碼處理,對存在大量特征值的特征變量進行離散化處理,由此提高英語教師教學數據挖掘效率,得到滿意的挖掘結果[5]。通過預處理得到的樣本向量為:
[Ui=ui1,ui2,…,uik,…,uiK] (1)
式中:[i∈1,M],[M]描述樣本集合大小;[uik]描述樣本集合中第[i]個樣本[Ui]的第[k]個屬性值。
為了減少計算量,本節對英語教師教學數據進行粗糙集約簡處理。用[R=S,B=D?E,H,f]描述英語教師教學信息系統。其中,[S]表示有限對象集合,也就是論域,[D]表示條件屬性集,[E]表示決策屬性集,若[D?E]為空集,則認為[R]是決策系統,[H]表示[D]與[E]的值域;[fa,d∈Hd],[?d∈B],[a∈S。]由此,[S]中的對象[a]都能夠通過相應屬性值[B]進行描述,屬性值[B]代表[a]能夠得到的信息。在決策系統內,各條件屬性間通常具有一定的依附關系,即在不缺失關鍵信息的條件下,能夠通過最簡單的決策屬性對條件屬性集施行分類[6]。設[X]與[Y]是[S]中的等價關系[IND(X)],[Y]的[X]正域用[ZX(Y)]表示, [D1]表示條件屬性集[D]關于決策屬性集[E]的約簡。若符合以下條件:
1) [D1?D],[D1≠?];
2) [ZINDD1INDE=ZINDDINDE];
3) 不存在[D2?D1,]使[ZINDD2INDE=][ZINDD1INDE] 。
則[D]的全部[E]約簡集合可用[ξED]表示,[D]的全部[E]約簡的交集被稱作核,即[ψED=ξED]。可采用[D]關于[E]的任意約簡取代[D],不會對決策造成干擾。
本節采用粗糙集方法,將英語教師教學數據關聯規則挖掘問題轉變成求解關鍵數據集與其他數據集間關聯規則的問題。
對象屬性[B]由條件屬性集[D]和決策屬性集[E]構成,即[B=D?E]。把一個英語教師教學數據庫內需求解關聯規則的數據集通過粗糙集方式描述出來,即求解[R=S,B,H,f]中[D?E]的問題,其中,[D?E=?]。
在上述分析的基礎上,給出英語教師教學數據挖掘過程。設集合[A]為條件屬性集[D]的子集,根據[A]確定的等價類被稱作特征集,用[F]表示。若[A]中存在[n]個特征表述,則視[F]為[n]元特征集,用[Fn]表示,其中,[Fn]為[n]元特征描述,其表達式如下:
[Fn=D1∧D2∧…∧Dn] (2)
設關聯規則最小支持度為[ε],若規則[Fn?E]的支持度高于[ε,]則認為根據[Fn]得到的[n]元特征集為頻繁[n-]項集。用[Ln]描述頻繁[n-]項集集合, [Vn]為[n]元特征集合,被稱作[n]元候選集。
將需挖掘的英語教師教學數據庫采用粗糙集方法進行處理,確定決策表[R],設定最小支持[ε]和最小置信度[λ]。通過關聯規則挖掘方法,得出[D1?E]的關聯規則,從而實現英語教師教學數據挖掘,過程如下,:
1) 輸入[D1,][E,][ε,][λ];
2) 計算得到元候選集[Vn];
3) 求出候選集[Vn]的支持度,并與支持度[ε]相比,將大于[ε]的項保留,將小于[ε]的項去除;
4) 求出每個[n]元特征集[Fn,]并進行置信度判定,若大于置信度[λ],則跳至步驟5),反之仍保留在[Fn]中;
5) 刪掉[Fn,]把規則存至規則庫;
6) 采用交集運算得到[Vn+1,]并將[Vn+1]中無關項刪除;
7) 對得到的集合進行判定,若不為空集,則跳至步驟3);否則停止計算。
主成分分析法是一種把離散信息歸至指定指標的統計分析方法,指定指標即為主成分,通過主成分對挖掘的英語教師教學數據集結構進行描述,獲取評價指標[7]。主成分分析具體過程為:
1) 對指標數據進行歸一化處理;
2) 對指標間的相關性進行判定,計算各指標權重;
3) 得出主成分數量[N];
4) 對主成分進行描述和命名,得到的評價指標通常包括一級指標和二級指標。
主成分為可體現樣本成分的新變量,此變量能將與英語教師教學樣本信息主成分軸相應的變量全部體現出來。
對英語教師教學能力指標進行評價,評價指標值越大,表明英語教師教學能力越強[8?9]。本節評價指標值計算公式如下:
[Xi=j=1qQj?Pij] (3)
式中:[Xi]用于描述第[i]個英語教師教學能力評價值;[Qj]用于描述第[j]項指標的綜合權重;[Pij]用于描述第[i]個英語教師第[j]項指標通過歸一化處理后的評價值;[q]用于描述英語教師人數。
依據某學校的實際狀態,本文設計的英語教師教學能力評價指標包含5個一級指標,所有一級指標均含有若干二級指標,通過本文方法對該校英語教師教學能力進行評價。當前該校英語教師教學質量評價指標如表1所示,限于篇幅,僅給出部分指標。
為了驗證本文方法的可行性與準確性,在當地某學校進行實驗驗證,邀請10位英語教師參與實驗,通過本文方法對10位英語教師的教學能力進行評價。首先對采集數據進行離散化處理,結果用表2進行描述。
通過本文方法求出權重,同時完成屬性約簡,結果用表3進行描述。
依據權重和評價數據獲取10位英語教師教學能力評價結果,如表4所示。
通過本文方法對學校英語教師教學能力進行評價,結果如下:超過90分的教師占20%,超過80分低于90分的教師占30%,超過70分低于80分的教師占40%,低于70分的教師占10%。
為了驗證本文方法的有效性,將傳統加權平均值方法和模糊數學方法作為對比進行分析,加權平均值方法針對10位英語教師的評價結果如下:超過90分的教師占40%,超過80分低于90分的教師占40%,超過70分低于80分的教師占10%,低于70分的教師占10%。模糊數學方法針對10位英語教師的評價結果如下:超過90分的教師占70%,超過80分低于90分的教師占20%,超過70分低于80分的教師占10%,低于70分的教師占0%。顯然,采用本文方法得到的評價結果更加科學公正。
為了評價本文方法的優劣,將傳統加權平均值方法和模糊數學方法作為對比,將三種方法評價結果和實際結果的相關系數看作衡量評價方法優劣的標準,結果如圖1所示。
分析圖1可得出以下結論:本文方法評價精度比傳統加權平均值方法和模糊數學方法高,這是因為與其他兩種方法相比,本文方法能夠提供更多體現英語教師教學能力的信息,大大增強了評價精度,得到的評價結果可反映英語教師的真實教學水平。
本文提出基于數據挖掘的英語教師教學能力評價方法。對英語教師教學數據進行離散化處理,挖掘有效的英語教師教學數據。通過主成分分析對挖掘的英語教師教學數據集結構進行描述,獲取評價指標。求出英語教師教學能力指標值。經實驗驗證,所提方法評價結果可靠,可體現教師真實能力。
參考文獻
[1] 尹亞晶.基于數據挖掘的體育評價決策支持系統開發與研究[J].現代電子技術,2017,40(9):108?111.
YIN Yajing. Development and research on sports evaluation and decision support system based on data mining [J]. Modern electronics technique, 2017, 40(9): 108?111.
[2] 梅毅,熊婷,羅少彬.復雜屬性環境下NoSQL分布式大數據挖掘方法研究[J].科學技術與工程,2017,17(9):239?243.
MEI Yi, XIONG Ting, LUO Shaobin. Research on NoSQL distributed big data mining method in complex attribute environment [J]. Science technology and engineering, 2017, 17(9): 239?243.
[3] QI L, ZHENG Z. Trajectory prediction of vessels based on data mining and machine learning [J]. Journal of digital information management, 2016, 32(11): 131?134.
[4] 胡文紅,孫欣欣.基于時間序列的數據挖掘技術在城市內澇災害中的應用研究[J].科技通報, 2016,32(6):229?231.
HU Wenhong, SUN Xinxin. Study of data mining technology in application of city water logging based on time series [J]. Bulletin of science and technology, 2016, 32(6): 229?231.
[5] 楊可晗,馬瓊.大數據下提高遠程教育質量提取有效資源仿真[J].計算機仿真,2017,34(4):212?215.
YANG Kehan, MA Qiong. To improve the quality of distance education and the simulation of effective resources under the big data [J]. Computer simulation, 2017, 34(4): 212?215.
[6] 陳海建,戴永輝,韓冬梅,等.開放式教學下的學習者畫像及個性化教學探討[J].開放教育研究,2017,23(3):105?112.
CHEN Haijian, DAI Yonghui, HAN Dongmei, et al. Learner′s portrait and individualized teaching in open education [J]. Open education research, 2017, 23(3): 105?112.
[7] 蔡晶晶.高職青年英語教師教學能力核心指標研究[J].無錫職業技術學院學報,2014,13(1):51?54.
CAI Jingjing. Research on the key indicators of young English teachers′ teaching ability in higher vocational colleges [J]. Journal of Wuxi Institute of Technology, 2014, 13(1): 51?54.
[8] 陳春良,劉彥,張雅卿.基于IGAHP?熵?博弈論?Choquet積分的新型裝甲裝備通用質量特性評價模型研究[J].計算機測量與控制,2015,23(7):2438?2442.
CHEN Chunliang, LIU Yan, ZHANG Yaqing. Research on establishing evaluation index system of new type armored equipment common quality characters based on RST?QFD?Bayes [J]. Computer measurement & control, 2015, 23(7): 2438?2442.
[9] EKMEK?I E. Comparison of native and non?native English language teachers′ evaluation of EFL learners′ speaking skills: conflicting or identical rating behaviour? [J]. English language teaching, 2016, 9(5): 98.