周劍云 施秋萍 唐秀忠







摘要:隨著教育信息化的迅速發(fā)展,以及國家對高等教育高質(zhì)量發(fā)展的進一步要求,人才培養(yǎng)質(zhì)量評價的方法和技術(shù)手段的科學(xué)化和信息化在不斷增強。文章通過數(shù)字媒體技術(shù)專業(yè)的人才培養(yǎng)方案的課程相關(guān)性分析,發(fā)現(xiàn)專業(yè)主要課程的相關(guān)性信息,對專業(yè)主干課程為一線教師和教學(xué)管理者提供了一種方法和思路借鑒,從而不斷促進我們的教育教學(xué)水平和人才培養(yǎng)質(zhì)量不斷提升。
關(guān)鍵詞:人才培養(yǎng);課程;數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則
中圖分類號:G642? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2022)34-0068-03
1 引言
“十三五”期間,我國已建成世界規(guī)模最大的高等教育體系,并提出了“雙一流”建設(shè)要求。進一步推動了各高校更加關(guān)注學(xué)科建設(shè)。而專業(yè)建設(shè)是學(xué)科人才培養(yǎng)的基礎(chǔ),學(xué)科建設(shè)是專業(yè)持續(xù)發(fā)展的動力。可以說專業(yè)建設(shè)是高等學(xué)校最重要的教學(xué)基本建設(shè),是教學(xué)工作中的重要生命線[1]。專業(yè)建設(shè)決定著人才培養(yǎng)的格局與辦學(xué)水平,對高等學(xué)校的改革與發(fā)展具有深遠的影響。
本文以本校數(shù)字媒體技術(shù)專業(yè)學(xué)生大學(xué)期間所上專業(yè)基礎(chǔ)課程、專業(yè)主干課程成績?yōu)閿?shù)據(jù)對象,來示例分析專業(yè)人才培養(yǎng)方案中主要課程的相關(guān)性,從而為專業(yè)負責(zé)人和學(xué)院專業(yè)建設(shè)提供參考和決策支持。
2 相關(guān)技術(shù)
2.1 數(shù)據(jù)挖掘技術(shù)
隨著教育信息化的普及,教學(xué)過程管理產(chǎn)生了大量的數(shù)據(jù),需要通信息技術(shù)把這些海量數(shù)據(jù)中蘊含的信息挖掘出來,幫助我們更好地開展教育教學(xué)管理和改革,從而數(shù)據(jù)挖掘技術(shù)在教育系統(tǒng)也得到了廣泛應(yīng)用。
數(shù)據(jù)挖掘即指的是從數(shù)據(jù)準備到結(jié)果分析的一個完整的過程,該過程從大量數(shù)據(jù)中挖掘先前未知的、有效的、可使用的信息,并使用這些信息做出決策或豐富知識。數(shù)據(jù)挖掘按挖掘指導(dǎo)方法可分為有指導(dǎo)數(shù)據(jù)挖掘和無指導(dǎo)數(shù)據(jù)挖掘。有指導(dǎo)數(shù)據(jù)挖掘是利用可用的數(shù)據(jù)建立一個模型,這個模型是對一個特定屬性的描述。無指導(dǎo)數(shù)據(jù)挖掘是在所有的屬性中尋找某種關(guān)系。數(shù)據(jù)挖掘按功能來分,常見的有分類、估值、預(yù)測、關(guān)聯(lián)規(guī)則、聚類等,也即分類、估值和預(yù)測屬于有指導(dǎo)的數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則和聚類屬于無指導(dǎo)的數(shù)據(jù)挖掘[2]。隨著信息技術(shù)、大數(shù)據(jù)技術(shù)的發(fā)展,數(shù)據(jù)挖掘已不只這些。
分類,它首先從數(shù)據(jù)中選出已經(jīng)分好類的訓(xùn)練集,在該訓(xùn)練集上運用數(shù)據(jù)挖掘技術(shù),建立一個分類模型,再將該模型用于對沒有分類的數(shù)據(jù)進行分類。估值,與分類類似,但估值最終的輸出結(jié)果是連續(xù)型的數(shù)值,估值的量并非預(yù)先確定。估值可以作為分類的準備工作。預(yù)測,是通過分類或估值來進行,通過分類或估值的訓(xùn)練得出一個模型,如果對于檢驗樣本組而言該模型具有較高的準確率,可將該模型用于對新樣本的未知變量進行預(yù)測。聚類,是自動尋找并建立分組規(guī)則的方法,它通過判斷樣本之間的相似性,把相似樣本劃分在一個簇中。關(guān)聯(lián)規(guī)則,其目的是發(fā)現(xiàn)哪些事項總是一起發(fā)生。
2.2 數(shù)據(jù)挖掘工具之——Weka
Weka (Waikato Environment for Knowledge Analysis) 即懷卡托智能分析環(huán)境,是新西蘭懷卡托大學(xué)基于JAVA環(huán)境下開源的機器學(xué)習(xí)(machine learning) 以及數(shù)據(jù)挖掘(data mining) 的著名開源軟件,該系統(tǒng)自1993年開始由新西蘭政府資助,至今已經(jīng)歷近30年的發(fā)展,其功能已經(jīng)十分強大和成熟。它包括對數(shù)據(jù)進行預(yù)處理,分類,回歸、聚類、關(guān)聯(lián)規(guī)則以及在新的交互式界面上的可視化。
3 研究示例
數(shù)據(jù)挖掘過程主要包括:數(shù)據(jù)獲取、數(shù)據(jù)預(yù)處理、模型建立、整體分析歸納[3]。本文數(shù)據(jù)直接從教務(wù)系統(tǒng)導(dǎo)出2016級數(shù)字媒體技術(shù)專業(yè)學(xué)生大學(xué)四年所修的10門主要專業(yè)基礎(chǔ)課、專業(yè)必修課成績作為研究對象。以此分析過程為專業(yè)人才培養(yǎng)課程相關(guān)性研究提供分析參考。
當(dāng)?shù)玫皆紨?shù)據(jù)之后,就需要對數(shù)據(jù)進行預(yù)處理,為后續(xù)建模奠定基礎(chǔ)。
3.1 數(shù)據(jù)預(yù)處理
預(yù)處理包括數(shù)據(jù)清理、數(shù)據(jù)變換和特征描述等。總體目的就是去除無效數(shù)據(jù)、不規(guī)范數(shù)據(jù)、錯誤數(shù)據(jù),補齊缺失數(shù)據(jù),對數(shù)據(jù)范圍、量綱、格式、類型等進行統(tǒng)一化處理,以便進行后續(xù)計算[5]。
對于初步獲取的數(shù)據(jù),首先需要去除那些與最終分析不相關(guān)的字段列,如學(xué)生類別、姓名、性別、班級等,保留學(xué)號、課程號、成績值并刪除那些缺考或是多次重修的成績,保留所選的10門課程每名學(xué)生有一條記錄。然后,為了分析課程之間的相關(guān)性,需要把數(shù)據(jù)轉(zhuǎn)置為每名學(xué)生所修的全部課程為一條記錄。最后由于關(guān)聯(lián)分析需對數(shù)據(jù)進行離散化處理,處理數(shù)據(jù)對照表1,最終我們得到如表2的成績數(shù)據(jù),其中sNO是學(xué)號,其他列的列名是課程號。
3.2 課程相關(guān)性挖掘
將預(yù)處理得到的Excel數(shù)據(jù)另存為CSV格式文件,選擇Weka數(shù)據(jù)挖掘軟件導(dǎo)入數(shù)據(jù)。這里我們還需要注意一定要把數(shù)值型(Numeric) 數(shù)據(jù)轉(zhuǎn)換為常規(guī)(Norminal) 數(shù)據(jù),方法為選擇Preprocess頁的Filter組,點擊Choose按鈕選擇NumericToNorminal選項,如圖1。
關(guān)聯(lián)規(guī)則分析,選擇Associate選項卡進行挖掘算法選擇,這里我們選擇經(jīng)典的Apriori算法進行關(guān)聯(lián)規(guī)則(Association Rule) 分析。該算法主要分兩步進行:第一步,生成所有的頻繁項目集。一個頻繁項目集(Frequent Itemset) 是一個支持度高于最小支持度閥值(min_sup) 的項目集;第二步,從頻繁項目集中生成置信度大于最小置信度閥值(min_conf) 的規(guī)則。支持度和置信度是衡量關(guān)聯(lián)規(guī)則強度的兩個重要指標,他們分別反映著所發(fā)現(xiàn)規(guī)則有用性和確定性。例如最經(jīng)典的關(guān)聯(lián)規(guī)則的例子:嬰兒尿不濕-->啤酒(支持度=10%,置信度=70%) ,這個規(guī)則是說,在所有顧客中,有10%的顧客同時購買了嬰兒尿不濕和啤酒,而在所有購買了嬰兒尿不濕的顧客中,有70%的人同時還購買了啤酒。在Weka中對Apriori算法設(shè)置的參數(shù)可參照表3。
可反復(fù)嘗試設(shè)置最小支持度和最小置信度閾值,以發(fā)現(xiàn)最精練和有意義的規(guī)則。本文這里設(shè)置最小支持度0.3,最小置信度0.9,得到以下5條規(guī)則,如圖2。若最小支持度0.2,最小置信度0.9,得到規(guī)則,如圖3。
3.3 挖掘結(jié)果分析
在規(guī)則中課程號310200102是概率論與數(shù)理統(tǒng)計,14060093是繪畫基礎(chǔ),618100603是計算機網(wǎng)絡(luò)基礎(chǔ),618100902是廣告策劃與創(chuàng)意,618100803是計算機圖形學(xué),618101503是計算機平面設(shè)計。通過挖掘結(jié)果可以反映出:
1) 從選擇的10門專業(yè)主要課程中,以上6門的相關(guān)性較高。
2) 課程之間,可以發(fā)現(xiàn),若學(xué)生概率論與數(shù)理統(tǒng)計學(xué)不好,那計算機網(wǎng)絡(luò)基礎(chǔ)課程成績只是勉強及格的概率也極高。而繪畫基礎(chǔ)課程成績好的同學(xué),廣告策劃與創(chuàng)意課程和計算機圖形學(xué)課程成績一般也較好。
3) 課程群,可以發(fā)現(xiàn),要重點注意概率與數(shù)據(jù)統(tǒng)計、計算機網(wǎng)絡(luò)基礎(chǔ)兩門課程之間;繪畫基礎(chǔ)、廣告策劃與創(chuàng)意、計算機圖形學(xué)三門課程之間。
因此,對于該專業(yè)的人才培養(yǎng)方案中,要高度重視這幾門課程的安排。重視對課程的學(xué)期設(shè)置,即前導(dǎo)課與后續(xù)課程關(guān)系的安排,以提升專業(yè)課程結(jié)構(gòu)設(shè)置的合理性。同時,要求相應(yīng)課程教師,注意關(guān)聯(lián)課程中學(xué)生成績狀況,采取一定的改進措施,促進學(xué)生學(xué)業(yè)成績提升。
4 結(jié)束語
在教育信息化日益發(fā)展的今天,諸多研究都表明,教師和學(xué)校決策者對數(shù)據(jù)的有效利用可以促使學(xué)生獲得更高的學(xué)業(yè)成就,促進學(xué)校教學(xué)水平提升[6-10]。作為一線教師和教育工作者都需要掌握教育支持方法和分析工具,例如數(shù)據(jù)挖掘方法,開源的Weka工具等,通過了解并熟悉分析教育過程數(shù)據(jù)的方法,再借助方便的分析工具,對廣大教師和教學(xué)管理者都是一種極大的教育教學(xué)能力提升,從而不斷提高我們的教育教學(xué)水平和人才培養(yǎng)質(zhì)量。
參考文獻:
[1] 胡欽太,伍文燕,馮廣,等.人工智能時代高等教育教學(xué)評價的關(guān)鍵技術(shù)與實踐[J].開放教育研究,2021,27(5):15-23.
[2] 張曾蓮.基于非營利性、數(shù)據(jù)挖掘和科學(xué)管理的高校財務(wù)分析、評價與管理研究[M].北京:首都經(jīng)濟貿(mào)易大學(xué)出版社,2014.
[3] 葉福蘭.數(shù)據(jù)挖掘技術(shù)在教學(xué)質(zhì)量監(jiān)控中的應(yīng)用[J].福建電腦,2020,36(6):102-105.
[4] 高鐵剛,杜娟,王寧.學(xué)校智慧教育生態(tài)建設(shè)研究[J].中國電化教育,2021(12):26-32.
[5] 廖宣植.數(shù)據(jù)挖掘在醫(yī)學(xué)高校課程關(guān)聯(lián)和成績預(yù)測上的應(yīng)用[J].信息與電腦(理論版),2019(2):154-156.
[6] 馮仰存.數(shù)據(jù)驅(qū)動的教師教學(xué)決策研究綜述[J].中國遠程教育,2020,41(4):65-75.
[7] 付達杰.教育大數(shù)據(jù)對教學(xué)決策的影響及優(yōu)化策略[J].湖北成人教育學(xué)院學(xué)報,2018,24(2):90-93.
[8] 管玨琪,孫一冰,祝智庭.智慧教室環(huán)境下數(shù)據(jù)啟發(fā)的教學(xué)決策研究[J].中國電化教育,2019(2):22-28,42.
[9] McNaughton S,Lai M K, Hsiao S.Testing the effectiveness of an intervention model based on data use: A replication series across clusters of schools[J]. School Effectiveness and School Improvement, 2012,23(2):203-228.
[10] Schildkamp K,Ehren M.From “intuition”- to “data”-based decision making in Dutch secondary schools?[M]//Data-based Decision Making in Education.Dordrecht:Springer Netherlands,2013:49-67.
【通聯(lián)編輯:王力】