翟霞++黃磊
【摘 要】 本文首先介紹了數(shù)據(jù)挖掘在高校教學(xué)評價系統(tǒng)中使用的意義,明確了挖掘模塊的功能定義及挖掘具體的實現(xiàn)方案,然后詳細(xì)介紹了關(guān)聯(lián)規(guī)則挖掘在高校評教系統(tǒng)中的使用。全文以哈爾濱華德學(xué)院為實例,綜合了教務(wù)處、人力資源部、教學(xué)質(zhì)量監(jiān)督中心等部門的數(shù)據(jù)記錄形成教學(xué)評價初始數(shù)據(jù),經(jīng)過一系列數(shù)據(jù)預(yù)處理操作,形成挖掘?qū)ο螅ㄟ^使用關(guān)聯(lián)規(guī)則的Apriori算法對教師屬性與評教等級進(jìn)行了挖掘分析,最終得出了有參考價值的挖掘結(jié)果。
【關(guān)鍵詞】 教學(xué)評價 關(guān)聯(lián)規(guī)則 數(shù)據(jù)預(yù)處理 Apriori算法
目前,在高校的教學(xué)管理中都引入了教學(xué)評價體系,通過記錄相應(yīng)的評教信息,教務(wù)管理部門可以掌握教師的授課效果及學(xué)生對課程的滿意程度,并把相應(yīng)的反饋信息及時的反饋給任課教師,幫助教師提高自身的教學(xué)水平[1]。許多高校已經(jīng)將教學(xué)評價加入到教學(xué)管理規(guī)范的必要環(huán)節(jié),將評教結(jié)果作為考核教師工作業(yè)績的重要參考依據(jù)。而對于評教數(shù)據(jù)的內(nèi)在關(guān)聯(lián)學(xué)校卻未曾做過深層次的思考。將關(guān)聯(lián)規(guī)則的挖掘應(yīng)用于教學(xué)評價系統(tǒng)之中,可以多角度全方位的分析評價數(shù)據(jù),哪些老師受學(xué)生歡迎,授課效果好;評教得分較高的教師有哪些共同的特征;影響評教得分的主要因素有哪些等學(xué)校教務(wù)部門感興趣的信息,都會以直觀易于理解的信息形式展現(xiàn)出來,幫助管理部門完善教學(xué)質(zhì)量監(jiān)督并作為決策支持的依據(jù)。
目前我校已有在線教學(xué)評價系統(tǒng),學(xué)生每學(xué)期末在規(guī)定時間范圍內(nèi)登錄系統(tǒng),進(jìn)行本學(xué)期任課教師的評教工作,之后教務(wù)處教學(xué)質(zhì)量監(jiān)督中心會匯總學(xué)生的評教數(shù)據(jù)、專家評教數(shù)據(jù)及教師互評數(shù)據(jù),綜合三方面的整體情況,最終得出教師本學(xué)期的測評結(jié)果。現(xiàn)行的教學(xué)評價系統(tǒng)基本功能已經(jīng)具備,只需在其原系統(tǒng)之上,增加數(shù)據(jù)挖掘模塊,實現(xiàn)關(guān)聯(lián)規(guī)則挖掘,使評教數(shù)據(jù)在完成基本功能外,可以實現(xiàn)數(shù)據(jù)分析功能,找出隱含在其中的有價值的信息[2]。實現(xiàn)過程如圖1所示。下面,以哈爾濱華德學(xué)院為例,把數(shù)據(jù)挖掘模塊應(yīng)用到的評教系統(tǒng)中,幫助教學(xué)管理部門進(jìn)行深層次的數(shù)據(jù)分析。
數(shù)據(jù)挖掘所要處理的原始數(shù)據(jù)通常情況下都是不符合預(yù)期要求的,因為在這些數(shù)據(jù)之中有一部分會含有不規(guī)范或冗余的現(xiàn)象[3]。哈爾濱華德學(xué)院的教務(wù)系統(tǒng)中包含教學(xué)評教模塊,其中涵蓋學(xué)生、教師和專家近幾年的評價數(shù)據(jù),下面將針對學(xué)院教務(wù)系統(tǒng)中的大量歷史真實數(shù)據(jù)進(jìn)行預(yù)處理操作[4]。根據(jù)現(xiàn)實分析問題的要求,實現(xiàn)哈爾濱華德學(xué)院教學(xué)評價數(shù)據(jù)挖掘功能的數(shù)據(jù)源涉及到多個部門的數(shù)據(jù)信息,主要有人力資源部門的教師信息表、學(xué)工處的學(xué)生信息表、教務(wù)部門的評教信息表等,為了統(tǒng)一數(shù)據(jù)格式均以Excel表的形式將其導(dǎo)出保存。初始數(shù)據(jù)信息表的表結(jié)構(gòu)如表1所示。
教師年齡屬性取值范圍較廣,直接用于挖掘分析會使挖掘結(jié)果較分散,使用數(shù)據(jù)泛化,將年齡概括到更高層次的抽象,分別取值為青年、中年和老年。劃分的具體標(biāo)準(zhǔn)如表2所示。
學(xué)生在校成績?nèi)≈禐檫B續(xù)的數(shù)值,直接用于挖掘會使得挖掘結(jié)果得到的規(guī)則較多,不利于分析,所以將成績重新劃分為優(yōu)秀、良好、合格和較差四個等級,劃分標(biāo)準(zhǔn)如表3所示。
我校教師的額定課時量是192,根據(jù)教師擔(dān)任的行政職務(wù)級別,課時量會適當(dāng)?shù)目s減,但由于縮減量較小以及劃分等級較多,這里為了便于分析,忽略這種差異。根據(jù)額定課時量將課時量字段數(shù)據(jù)分段劃分標(biāo)準(zhǔn)如表4所示。
教師的科研能力主要從發(fā)表論文數(shù)量和科研課題來衡量,其中還考慮了論文所屬期刊的等級,省級及一般期刊系數(shù)乘1,國家中文核心期刊系數(shù)乘2,SCI及EI等重點期刊系數(shù)乘4,根據(jù)這一原則將教師科研等級劃分標(biāo)準(zhǔn)如表5所示。
綜合上述各屬性數(shù)據(jù)泛化準(zhǔn)則將初始教師評教信息表轉(zhuǎn)化為易于數(shù)據(jù)挖掘的新的數(shù)據(jù)表,Apriori算法要求挖掘數(shù)據(jù)來自于事物數(shù)據(jù)庫,因此,將得到的轉(zhuǎn)化后的數(shù)據(jù)表再進(jìn)一步轉(zhuǎn)化為每條記錄由字符代碼表示的數(shù)據(jù)表[5],代碼轉(zhuǎn)換依據(jù)表6和7所示。
一般情況下,在經(jīng)過處理的挖掘?qū)ο笾胁⒉皇撬械奶卣鲗傩远加斜匾獏⑴c數(shù)據(jù)挖掘,因為有一部分屬性自身和挖掘所要分析的問題聯(lián)系較弱,而且對挖掘結(jié)果的影響也微乎其微,參與挖掘往往影響挖掘效率。這樣,一般采取直接將其刪除的策略。針對本文挖掘研究的分析目標(biāo),挖掘前將初始數(shù)據(jù)信息表中與評價等級關(guān)聯(lián)較弱的教師編號、性別、是否進(jìn)修、入學(xué)成績四列做刪除處理。本文對教學(xué)評價系統(tǒng)中的30600條數(shù)據(jù)記錄進(jìn)行了挖掘分析,得到了年齡、職稱、學(xué)位、學(xué)生在校成績與評教等級之間的關(guān)聯(lián)關(guān)系。
設(shè)定最小支持度和最小置信度的閾值分別為12%和55%,得到的挖掘結(jié)果中滿足條件的項集如表8所示。
基于以上挖掘結(jié)果,我們得出年齡在36-45歲之間或是具有研究生學(xué)歷或是職稱為副教授的教師評教等級為優(yōu)秀的概率較大,現(xiàn)實中這些老師具有豐富的教學(xué)經(jīng)驗和良好的專業(yè)素養(yǎng),深受學(xué)生的歡迎;而評教得分較低的大多數(shù)來自于35歲以下的教師;成績?yōu)閮?yōu)秀的學(xué)生所做的評教等級多半為優(yōu)秀。
以上是單一屬性與評教等級的關(guān)聯(lián)關(guān)系,下面我們來分析評教等級為優(yōu)秀的教師具有什么樣的特征。首先從初始數(shù)據(jù)信息表中把評教等級為優(yōu)秀的記錄抽取出來,大約15000條,忽略學(xué)生成績和課時量屬性,設(shè)定最小支持度和最小置信度分別為6%和45%,通過Apriori算法最終得到頻繁項集L3,如表9所示。
由以上挖掘結(jié)果可以得出,年齡在36-45之間,職稱為副教授,學(xué)歷為研究生的教師被評為優(yōu)秀的概率較大。
參考文獻(xiàn):
[1]蔣暉等.數(shù)據(jù)挖掘及其一種關(guān)聯(lián)規(guī)則算法[J].計算機(jī)與數(shù)字工程,2011,39(6):38-42.
[2]王玉榮.關(guān)聯(lián)規(guī)則挖掘算法在大數(shù)據(jù)集上的應(yīng)用研究[D].江南大學(xué)碩士論文,2011:58-72.
[3]李云峰,陳建文,程代杰.關(guān)聯(lián)規(guī)則挖掘的研究及對Apriori算法的改進(jìn)[J].計算機(jī)工程與科學(xué),2012,(06):85-87.
[4]LI C,YANG T Q. Effective Mining of Fuzzy Quantitative Weighted Association Rules[C].International Conference on E-Business and E-Government,2010:1418-1421.
[5]李清峰.數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則的一種高效Apriori算法[J].計算機(jī)應(yīng)用與軟件,2009,21(12):84-86.endprint
【摘 要】 本文首先介紹了數(shù)據(jù)挖掘在高校教學(xué)評價系統(tǒng)中使用的意義,明確了挖掘模塊的功能定義及挖掘具體的實現(xiàn)方案,然后詳細(xì)介紹了關(guān)聯(lián)規(guī)則挖掘在高校評教系統(tǒng)中的使用。全文以哈爾濱華德學(xué)院為實例,綜合了教務(wù)處、人力資源部、教學(xué)質(zhì)量監(jiān)督中心等部門的數(shù)據(jù)記錄形成教學(xué)評價初始數(shù)據(jù),經(jīng)過一系列數(shù)據(jù)預(yù)處理操作,形成挖掘?qū)ο螅ㄟ^使用關(guān)聯(lián)規(guī)則的Apriori算法對教師屬性與評教等級進(jìn)行了挖掘分析,最終得出了有參考價值的挖掘結(jié)果。
【關(guān)鍵詞】 教學(xué)評價 關(guān)聯(lián)規(guī)則 數(shù)據(jù)預(yù)處理 Apriori算法
目前,在高校的教學(xué)管理中都引入了教學(xué)評價體系,通過記錄相應(yīng)的評教信息,教務(wù)管理部門可以掌握教師的授課效果及學(xué)生對課程的滿意程度,并把相應(yīng)的反饋信息及時的反饋給任課教師,幫助教師提高自身的教學(xué)水平[1]。許多高校已經(jīng)將教學(xué)評價加入到教學(xué)管理規(guī)范的必要環(huán)節(jié),將評教結(jié)果作為考核教師工作業(yè)績的重要參考依據(jù)。而對于評教數(shù)據(jù)的內(nèi)在關(guān)聯(lián)學(xué)校卻未曾做過深層次的思考。將關(guān)聯(lián)規(guī)則的挖掘應(yīng)用于教學(xué)評價系統(tǒng)之中,可以多角度全方位的分析評價數(shù)據(jù),哪些老師受學(xué)生歡迎,授課效果好;評教得分較高的教師有哪些共同的特征;影響評教得分的主要因素有哪些等學(xué)校教務(wù)部門感興趣的信息,都會以直觀易于理解的信息形式展現(xiàn)出來,幫助管理部門完善教學(xué)質(zhì)量監(jiān)督并作為決策支持的依據(jù)。
目前我校已有在線教學(xué)評價系統(tǒng),學(xué)生每學(xué)期末在規(guī)定時間范圍內(nèi)登錄系統(tǒng),進(jìn)行本學(xué)期任課教師的評教工作,之后教務(wù)處教學(xué)質(zhì)量監(jiān)督中心會匯總學(xué)生的評教數(shù)據(jù)、專家評教數(shù)據(jù)及教師互評數(shù)據(jù),綜合三方面的整體情況,最終得出教師本學(xué)期的測評結(jié)果。現(xiàn)行的教學(xué)評價系統(tǒng)基本功能已經(jīng)具備,只需在其原系統(tǒng)之上,增加數(shù)據(jù)挖掘模塊,實現(xiàn)關(guān)聯(lián)規(guī)則挖掘,使評教數(shù)據(jù)在完成基本功能外,可以實現(xiàn)數(shù)據(jù)分析功能,找出隱含在其中的有價值的信息[2]。實現(xiàn)過程如圖1所示。下面,以哈爾濱華德學(xué)院為例,把數(shù)據(jù)挖掘模塊應(yīng)用到的評教系統(tǒng)中,幫助教學(xué)管理部門進(jìn)行深層次的數(shù)據(jù)分析。
數(shù)據(jù)挖掘所要處理的原始數(shù)據(jù)通常情況下都是不符合預(yù)期要求的,因為在這些數(shù)據(jù)之中有一部分會含有不規(guī)范或冗余的現(xiàn)象[3]。哈爾濱華德學(xué)院的教務(wù)系統(tǒng)中包含教學(xué)評教模塊,其中涵蓋學(xué)生、教師和專家近幾年的評價數(shù)據(jù),下面將針對學(xué)院教務(wù)系統(tǒng)中的大量歷史真實數(shù)據(jù)進(jìn)行預(yù)處理操作[4]。根據(jù)現(xiàn)實分析問題的要求,實現(xiàn)哈爾濱華德學(xué)院教學(xué)評價數(shù)據(jù)挖掘功能的數(shù)據(jù)源涉及到多個部門的數(shù)據(jù)信息,主要有人力資源部門的教師信息表、學(xué)工處的學(xué)生信息表、教務(wù)部門的評教信息表等,為了統(tǒng)一數(shù)據(jù)格式均以Excel表的形式將其導(dǎo)出保存。初始數(shù)據(jù)信息表的表結(jié)構(gòu)如表1所示。
教師年齡屬性取值范圍較廣,直接用于挖掘分析會使挖掘結(jié)果較分散,使用數(shù)據(jù)泛化,將年齡概括到更高層次的抽象,分別取值為青年、中年和老年。劃分的具體標(biāo)準(zhǔn)如表2所示。
學(xué)生在校成績?nèi)≈禐檫B續(xù)的數(shù)值,直接用于挖掘會使得挖掘結(jié)果得到的規(guī)則較多,不利于分析,所以將成績重新劃分為優(yōu)秀、良好、合格和較差四個等級,劃分標(biāo)準(zhǔn)如表3所示。
我校教師的額定課時量是192,根據(jù)教師擔(dān)任的行政職務(wù)級別,課時量會適當(dāng)?shù)目s減,但由于縮減量較小以及劃分等級較多,這里為了便于分析,忽略這種差異。根據(jù)額定課時量將課時量字段數(shù)據(jù)分段劃分標(biāo)準(zhǔn)如表4所示。
教師的科研能力主要從發(fā)表論文數(shù)量和科研課題來衡量,其中還考慮了論文所屬期刊的等級,省級及一般期刊系數(shù)乘1,國家中文核心期刊系數(shù)乘2,SCI及EI等重點期刊系數(shù)乘4,根據(jù)這一原則將教師科研等級劃分標(biāo)準(zhǔn)如表5所示。
綜合上述各屬性數(shù)據(jù)泛化準(zhǔn)則將初始教師評教信息表轉(zhuǎn)化為易于數(shù)據(jù)挖掘的新的數(shù)據(jù)表,Apriori算法要求挖掘數(shù)據(jù)來自于事物數(shù)據(jù)庫,因此,將得到的轉(zhuǎn)化后的數(shù)據(jù)表再進(jìn)一步轉(zhuǎn)化為每條記錄由字符代碼表示的數(shù)據(jù)表[5],代碼轉(zhuǎn)換依據(jù)表6和7所示。
一般情況下,在經(jīng)過處理的挖掘?qū)ο笾胁⒉皇撬械奶卣鲗傩远加斜匾獏⑴c數(shù)據(jù)挖掘,因為有一部分屬性自身和挖掘所要分析的問題聯(lián)系較弱,而且對挖掘結(jié)果的影響也微乎其微,參與挖掘往往影響挖掘效率。這樣,一般采取直接將其刪除的策略。針對本文挖掘研究的分析目標(biāo),挖掘前將初始數(shù)據(jù)信息表中與評價等級關(guān)聯(lián)較弱的教師編號、性別、是否進(jìn)修、入學(xué)成績四列做刪除處理。本文對教學(xué)評價系統(tǒng)中的30600條數(shù)據(jù)記錄進(jìn)行了挖掘分析,得到了年齡、職稱、學(xué)位、學(xué)生在校成績與評教等級之間的關(guān)聯(lián)關(guān)系。
設(shè)定最小支持度和最小置信度的閾值分別為12%和55%,得到的挖掘結(jié)果中滿足條件的項集如表8所示。
基于以上挖掘結(jié)果,我們得出年齡在36-45歲之間或是具有研究生學(xué)歷或是職稱為副教授的教師評教等級為優(yōu)秀的概率較大,現(xiàn)實中這些老師具有豐富的教學(xué)經(jīng)驗和良好的專業(yè)素養(yǎng),深受學(xué)生的歡迎;而評教得分較低的大多數(shù)來自于35歲以下的教師;成績?yōu)閮?yōu)秀的學(xué)生所做的評教等級多半為優(yōu)秀。
以上是單一屬性與評教等級的關(guān)聯(lián)關(guān)系,下面我們來分析評教等級為優(yōu)秀的教師具有什么樣的特征。首先從初始數(shù)據(jù)信息表中把評教等級為優(yōu)秀的記錄抽取出來,大約15000條,忽略學(xué)生成績和課時量屬性,設(shè)定最小支持度和最小置信度分別為6%和45%,通過Apriori算法最終得到頻繁項集L3,如表9所示。
由以上挖掘結(jié)果可以得出,年齡在36-45之間,職稱為副教授,學(xué)歷為研究生的教師被評為優(yōu)秀的概率較大。
參考文獻(xiàn):
[1]蔣暉等.數(shù)據(jù)挖掘及其一種關(guān)聯(lián)規(guī)則算法[J].計算機(jī)與數(shù)字工程,2011,39(6):38-42.
[2]王玉榮.關(guān)聯(lián)規(guī)則挖掘算法在大數(shù)據(jù)集上的應(yīng)用研究[D].江南大學(xué)碩士論文,2011:58-72.
[3]李云峰,陳建文,程代杰.關(guān)聯(lián)規(guī)則挖掘的研究及對Apriori算法的改進(jìn)[J].計算機(jī)工程與科學(xué),2012,(06):85-87.
[4]LI C,YANG T Q. Effective Mining of Fuzzy Quantitative Weighted Association Rules[C].International Conference on E-Business and E-Government,2010:1418-1421.
[5]李清峰.數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則的一種高效Apriori算法[J].計算機(jī)應(yīng)用與軟件,2009,21(12):84-86.endprint
【摘 要】 本文首先介紹了數(shù)據(jù)挖掘在高校教學(xué)評價系統(tǒng)中使用的意義,明確了挖掘模塊的功能定義及挖掘具體的實現(xiàn)方案,然后詳細(xì)介紹了關(guān)聯(lián)規(guī)則挖掘在高校評教系統(tǒng)中的使用。全文以哈爾濱華德學(xué)院為實例,綜合了教務(wù)處、人力資源部、教學(xué)質(zhì)量監(jiān)督中心等部門的數(shù)據(jù)記錄形成教學(xué)評價初始數(shù)據(jù),經(jīng)過一系列數(shù)據(jù)預(yù)處理操作,形成挖掘?qū)ο螅ㄟ^使用關(guān)聯(lián)規(guī)則的Apriori算法對教師屬性與評教等級進(jìn)行了挖掘分析,最終得出了有參考價值的挖掘結(jié)果。
【關(guān)鍵詞】 教學(xué)評價 關(guān)聯(lián)規(guī)則 數(shù)據(jù)預(yù)處理 Apriori算法
目前,在高校的教學(xué)管理中都引入了教學(xué)評價體系,通過記錄相應(yīng)的評教信息,教務(wù)管理部門可以掌握教師的授課效果及學(xué)生對課程的滿意程度,并把相應(yīng)的反饋信息及時的反饋給任課教師,幫助教師提高自身的教學(xué)水平[1]。許多高校已經(jīng)將教學(xué)評價加入到教學(xué)管理規(guī)范的必要環(huán)節(jié),將評教結(jié)果作為考核教師工作業(yè)績的重要參考依據(jù)。而對于評教數(shù)據(jù)的內(nèi)在關(guān)聯(lián)學(xué)校卻未曾做過深層次的思考。將關(guān)聯(lián)規(guī)則的挖掘應(yīng)用于教學(xué)評價系統(tǒng)之中,可以多角度全方位的分析評價數(shù)據(jù),哪些老師受學(xué)生歡迎,授課效果好;評教得分較高的教師有哪些共同的特征;影響評教得分的主要因素有哪些等學(xué)校教務(wù)部門感興趣的信息,都會以直觀易于理解的信息形式展現(xiàn)出來,幫助管理部門完善教學(xué)質(zhì)量監(jiān)督并作為決策支持的依據(jù)。
目前我校已有在線教學(xué)評價系統(tǒng),學(xué)生每學(xué)期末在規(guī)定時間范圍內(nèi)登錄系統(tǒng),進(jìn)行本學(xué)期任課教師的評教工作,之后教務(wù)處教學(xué)質(zhì)量監(jiān)督中心會匯總學(xué)生的評教數(shù)據(jù)、專家評教數(shù)據(jù)及教師互評數(shù)據(jù),綜合三方面的整體情況,最終得出教師本學(xué)期的測評結(jié)果。現(xiàn)行的教學(xué)評價系統(tǒng)基本功能已經(jīng)具備,只需在其原系統(tǒng)之上,增加數(shù)據(jù)挖掘模塊,實現(xiàn)關(guān)聯(lián)規(guī)則挖掘,使評教數(shù)據(jù)在完成基本功能外,可以實現(xiàn)數(shù)據(jù)分析功能,找出隱含在其中的有價值的信息[2]。實現(xiàn)過程如圖1所示。下面,以哈爾濱華德學(xué)院為例,把數(shù)據(jù)挖掘模塊應(yīng)用到的評教系統(tǒng)中,幫助教學(xué)管理部門進(jìn)行深層次的數(shù)據(jù)分析。
數(shù)據(jù)挖掘所要處理的原始數(shù)據(jù)通常情況下都是不符合預(yù)期要求的,因為在這些數(shù)據(jù)之中有一部分會含有不規(guī)范或冗余的現(xiàn)象[3]。哈爾濱華德學(xué)院的教務(wù)系統(tǒng)中包含教學(xué)評教模塊,其中涵蓋學(xué)生、教師和專家近幾年的評價數(shù)據(jù),下面將針對學(xué)院教務(wù)系統(tǒng)中的大量歷史真實數(shù)據(jù)進(jìn)行預(yù)處理操作[4]。根據(jù)現(xiàn)實分析問題的要求,實現(xiàn)哈爾濱華德學(xué)院教學(xué)評價數(shù)據(jù)挖掘功能的數(shù)據(jù)源涉及到多個部門的數(shù)據(jù)信息,主要有人力資源部門的教師信息表、學(xué)工處的學(xué)生信息表、教務(wù)部門的評教信息表等,為了統(tǒng)一數(shù)據(jù)格式均以Excel表的形式將其導(dǎo)出保存。初始數(shù)據(jù)信息表的表結(jié)構(gòu)如表1所示。
教師年齡屬性取值范圍較廣,直接用于挖掘分析會使挖掘結(jié)果較分散,使用數(shù)據(jù)泛化,將年齡概括到更高層次的抽象,分別取值為青年、中年和老年。劃分的具體標(biāo)準(zhǔn)如表2所示。
學(xué)生在校成績?nèi)≈禐檫B續(xù)的數(shù)值,直接用于挖掘會使得挖掘結(jié)果得到的規(guī)則較多,不利于分析,所以將成績重新劃分為優(yōu)秀、良好、合格和較差四個等級,劃分標(biāo)準(zhǔn)如表3所示。
我校教師的額定課時量是192,根據(jù)教師擔(dān)任的行政職務(wù)級別,課時量會適當(dāng)?shù)目s減,但由于縮減量較小以及劃分等級較多,這里為了便于分析,忽略這種差異。根據(jù)額定課時量將課時量字段數(shù)據(jù)分段劃分標(biāo)準(zhǔn)如表4所示。
教師的科研能力主要從發(fā)表論文數(shù)量和科研課題來衡量,其中還考慮了論文所屬期刊的等級,省級及一般期刊系數(shù)乘1,國家中文核心期刊系數(shù)乘2,SCI及EI等重點期刊系數(shù)乘4,根據(jù)這一原則將教師科研等級劃分標(biāo)準(zhǔn)如表5所示。
綜合上述各屬性數(shù)據(jù)泛化準(zhǔn)則將初始教師評教信息表轉(zhuǎn)化為易于數(shù)據(jù)挖掘的新的數(shù)據(jù)表,Apriori算法要求挖掘數(shù)據(jù)來自于事物數(shù)據(jù)庫,因此,將得到的轉(zhuǎn)化后的數(shù)據(jù)表再進(jìn)一步轉(zhuǎn)化為每條記錄由字符代碼表示的數(shù)據(jù)表[5],代碼轉(zhuǎn)換依據(jù)表6和7所示。
一般情況下,在經(jīng)過處理的挖掘?qū)ο笾胁⒉皇撬械奶卣鲗傩远加斜匾獏⑴c數(shù)據(jù)挖掘,因為有一部分屬性自身和挖掘所要分析的問題聯(lián)系較弱,而且對挖掘結(jié)果的影響也微乎其微,參與挖掘往往影響挖掘效率。這樣,一般采取直接將其刪除的策略。針對本文挖掘研究的分析目標(biāo),挖掘前將初始數(shù)據(jù)信息表中與評價等級關(guān)聯(lián)較弱的教師編號、性別、是否進(jìn)修、入學(xué)成績四列做刪除處理。本文對教學(xué)評價系統(tǒng)中的30600條數(shù)據(jù)記錄進(jìn)行了挖掘分析,得到了年齡、職稱、學(xué)位、學(xué)生在校成績與評教等級之間的關(guān)聯(lián)關(guān)系。
設(shè)定最小支持度和最小置信度的閾值分別為12%和55%,得到的挖掘結(jié)果中滿足條件的項集如表8所示。
基于以上挖掘結(jié)果,我們得出年齡在36-45歲之間或是具有研究生學(xué)歷或是職稱為副教授的教師評教等級為優(yōu)秀的概率較大,現(xiàn)實中這些老師具有豐富的教學(xué)經(jīng)驗和良好的專業(yè)素養(yǎng),深受學(xué)生的歡迎;而評教得分較低的大多數(shù)來自于35歲以下的教師;成績?yōu)閮?yōu)秀的學(xué)生所做的評教等級多半為優(yōu)秀。
以上是單一屬性與評教等級的關(guān)聯(lián)關(guān)系,下面我們來分析評教等級為優(yōu)秀的教師具有什么樣的特征。首先從初始數(shù)據(jù)信息表中把評教等級為優(yōu)秀的記錄抽取出來,大約15000條,忽略學(xué)生成績和課時量屬性,設(shè)定最小支持度和最小置信度分別為6%和45%,通過Apriori算法最終得到頻繁項集L3,如表9所示。
由以上挖掘結(jié)果可以得出,年齡在36-45之間,職稱為副教授,學(xué)歷為研究生的教師被評為優(yōu)秀的概率較大。
參考文獻(xiàn):
[1]蔣暉等.數(shù)據(jù)挖掘及其一種關(guān)聯(lián)規(guī)則算法[J].計算機(jī)與數(shù)字工程,2011,39(6):38-42.
[2]王玉榮.關(guān)聯(lián)規(guī)則挖掘算法在大數(shù)據(jù)集上的應(yīng)用研究[D].江南大學(xué)碩士論文,2011:58-72.
[3]李云峰,陳建文,程代杰.關(guān)聯(lián)規(guī)則挖掘的研究及對Apriori算法的改進(jìn)[J].計算機(jī)工程與科學(xué),2012,(06):85-87.
[4]LI C,YANG T Q. Effective Mining of Fuzzy Quantitative Weighted Association Rules[C].International Conference on E-Business and E-Government,2010:1418-1421.
[5]李清峰.數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則的一種高效Apriori算法[J].計算機(jī)應(yīng)用與軟件,2009,21(12):84-86.endprint