摘要:以目前的高等學(xué)校教育為平臺(tái),就如何將數(shù)據(jù)挖掘技術(shù)與課堂教學(xué)質(zhì)量相結(jié)合的問題進(jìn)行了研究。首先介紹了模糊C均值聚類算法的原理及實(shí)現(xiàn)步驟,并通過對(duì)課堂教學(xué)評(píng)估指標(biāo)體系的有效挖掘,選取適當(dāng)?shù)木垲悈?shù),建立模糊劃分矩陣,然后用模糊C均值聚類算法進(jìn)行聚類,較好地實(shí)現(xiàn)了聚類目標(biāo)。
關(guān)鍵詞:數(shù)據(jù)挖掘;模糊聚類;課堂教學(xué)評(píng)估
中圖分類號(hào):G642文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2011)04-0858-02
Fuzzy Clustering in Classroom Teaching Assessment Application Research
ZHU Chang-jiang1, DUAN Yu-chun2
(1.School of Computer and Information Engineering HeNan University, Kaifeng 475004, China;2.Computer Center, Henan University, Kaifeng 475004, China)
Abstract: At the current higher school education as the platform, on how to make the data mining technology and combination of classroom teaching quality, the problem is studied. Firstly introduces fuzzy c-means clustering algorithm, the principle and implementation steps, and through the classroom teaching evaluation index system of effective mining, selecting proper clustering parameters, establishes fuzzy partition matrix,and then using the fuzzy c-means clustering algorithm clustering, have a better way to realize the clustering goals.
Key words: data mining; fuzzy clustering; classroom teaching assessment
目前,隨著高等教育規(guī)模的擴(kuò)大,鞏固和加強(qiáng)師資隊(duì)伍建議,促進(jìn)教師教學(xué)水平的提高,已成為學(xué)校教學(xué)管理工作的重要環(huán)節(jié)。與此同時(shí),對(duì)教師的考核評(píng)價(jià)制度日趨完善,考核體系越來越科學(xué)、合理。本文以高等教育為背景,將討論用模糊聚類的方法對(duì)教師的課堂教學(xué)進(jìn)行分類分析,從而給出比較科學(xué)的類別劃分,為教育管理者和決策者提供隱含在現(xiàn)代教學(xué)評(píng)價(jià)數(shù)據(jù)庫(kù)中的理想模式。實(shí)驗(yàn)結(jié)果證明了該方法的有效性,對(duì)促進(jìn)教育信息化管理和提高學(xué)校教學(xué)質(zhì)量等問題都具有一定的理論意義和應(yīng)用價(jià)值。
1 聚類分析
聚類分析根據(jù)研究對(duì)象特征對(duì)研究對(duì)象進(jìn)行分類的一種多元分析技術(shù),把性質(zhì)相近的個(gè)體歸為一類,使得同一類中的個(gè)體都具有高度的同質(zhì)性,不同類之間的個(gè)體具有高度的異質(zhì)性。聚類分析的作用是將特征空間中的樣本集合按照各個(gè)樣本點(diǎn)之間、樣本點(diǎn)與樣本點(diǎn)子集合之間以及樣本點(diǎn)子集合之間的相似性測(cè)度(距離或相似度)進(jìn)行聚類,得到的樣本點(diǎn)和子集合之間的關(guān)系體系。采用這種方法可以確定研究對(duì)象之間的“親疏關(guān)系”,從而達(dá)到對(duì)其進(jìn)行正確合理分類的目的。
傳統(tǒng)的聚類分析要求把數(shù)據(jù)集中的每一點(diǎn)都精確地劃分到某個(gè)類中,即所謂的硬劃分。但實(shí)際上大多數(shù)事物在屬性方面存在著模糊性,即事物間沒有明確的界限,不具有非此即彼的性質(zhì),所以模糊聚類的概念更適合事物的本質(zhì),能更客觀地反映現(xiàn)實(shí)。模糊聚類分析是一種基于函數(shù)最優(yōu)方法的聚類算法,使用微積分計(jì)算技術(shù)求最優(yōu)代價(jià)函數(shù)。模糊聚類中,每個(gè)樣本不再屬于某一類,而是以一定的隸屬度屬于每一類。也就是通過模糊聚類分析,得到了樣本屬于各個(gè)類的不確定性程度,即建立了樣本對(duì)于類別的不確定性描述,這樣更能準(zhǔn)確地反映現(xiàn)實(shí)世界。目前,模糊C均值(FCM)聚類算法是應(yīng)用最廣泛的一種模糊聚類算法。
2 FCM聚類算法
FCM算法是一種基于劃分的聚類算法,它的思想就是使得被劃分到同一類的對(duì)象之間相似度最大,而不同類之間的相似度最小。設(shè)聚類樣本集為:X=(x1,x2,…,xn),將樣本集X分為C個(gè)類,類中心的集合為V=(v1,v2,…,vc)。n×C維矩陣U=(uij)由每個(gè)樣本的隸屬度構(gòu)成的矩陣,uij表示每個(gè)樣本的隸屬度,其中i=1,2,…,n;j=1,2,…,C。FCM的目標(biāo)函數(shù)定義為:
且滿足:
其中uij∈[0,1]表示第i個(gè)數(shù)據(jù)點(diǎn)屬于第j個(gè)聚類中心的隸屬度;Cj為第j個(gè)聚類中心,初始值隨機(jī)選??;b∈[0,∞]為模糊度,隨著b的增大,聚類的模糊性增大,這里設(shè)b=2。模糊聚類通過迭代最優(yōu)化目標(biāo)函數(shù)JFCM實(shí)現(xiàn),這是一個(gè)進(jìn)行優(yōu)化的過程。模糊隸屬度uij和聚類中心Cj分別用下面公式獲得:
由此確定FCM聚類算法的迭代過程:
Step 1 :選取聚類個(gè)數(shù)C,隨機(jī)給定聚類中心V0=(v1,v2,…,vc),終止條件ε>0,設(shè)置當(dāng)前迭代次數(shù)t=0;
Step 2:根據(jù)式(2)計(jì)算或更新隸屬度矩陣Ut;
Step 3:根據(jù)式(3)求取下一代的聚類中心Vt+1;
Step 4:如果||Vt+1-Vt||<ε,則結(jié)束迭代;否則置t=t+1,返回Step 2。
3 FCM聚類算法的實(shí)際應(yīng)用
以下采用本校2010年度對(duì)10位教師的聽課記錄數(shù)據(jù),進(jìn)行模糊聚類分析。表1表示評(píng)估項(xiàng)目及各項(xiàng)分值和評(píng)估等級(jí),表2表示10位教師各個(gè)評(píng)估項(xiàng)目的得分情況。
表2 教師評(píng)估項(xiàng)目得分情況
聚類后的隸屬度矩陣:
聚類結(jié)果:
根據(jù)上面的聚類結(jié)果,10位教師分成3類,分別是{2,4,6,7,10}、{5,8}和{1,3,9},其等級(jí)分別為:B、C、A。該實(shí)驗(yàn)結(jié)果符合給定數(shù)據(jù)的劃分。
4 結(jié)束語(yǔ)
模糊聚類分析是一種探索性分析,在聚類過程中可以給出聚類數(shù), 但不必事先給出聚類標(biāo)準(zhǔn)。教師課堂教學(xué)評(píng)估的模糊聚類, 雖不能實(shí)現(xiàn)傳統(tǒng)上的排名, 但它很好的實(shí)現(xiàn)了評(píng)估的診斷功能。本文應(yīng)用FCM算法對(duì)教師課堂教學(xué)質(zhì)量進(jìn)行了模糊聚類分析,通過聚類便于將各個(gè)教師進(jìn)行整合,優(yōu)勢(shì)互補(bǔ),最大限度地挖掘出優(yōu)秀人才,做到人盡其才,物盡其用,促進(jìn)教師授課質(zhì)量及整體教學(xué)水平的提高,從而充分發(fā)揮評(píng)估的導(dǎo)向和激勵(lì)功能。隨著應(yīng)用領(lǐng)域的不斷拓寬,模糊聚類將有很大的發(fā)展空間。
參考文獻(xiàn):
[1] 劉光潔,王文永.基于模糊聚類的決策樹算法在教學(xué)質(zhì)量評(píng)價(jià)中的應(yīng)用[J].東北師大學(xué)報(bào):自然科學(xué)版,2009,41(3):36-39.
[2] 王文正.基于模糊聚類分析的簡(jiǎn)單學(xué)生考核方法[J].濱州職業(yè)學(xué)院學(xué)報(bào),2009,6(2):27-30.
[3] 馮梅.基于模糊聚類分析的教師課堂教學(xué)質(zhì)量評(píng)價(jià)[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2008,38(2):12-15.
[4] 哈申花,張春生.基于模糊聚類(FCM)的學(xué)生成績(jī)數(shù)據(jù)挖掘[J].學(xué)術(shù)探討,2010,2:47-48.
[5] 郭秀娟,袁月等.基于模糊聚類分析的教師授課質(zhì)量評(píng)價(jià)[J].微計(jì)算機(jī)信息,2010,26(1-3):32-34.
[6] 劉坤朋,羅可.改進(jìn)的模糊C均值聚類算法[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(21):97-98.