劉靜
(南京航空航天大學 國際教育學院,江蘇 南京 210016)
隨著信息時代的快速發(fā)展,大量的數(shù)據(jù)被人類搜集和存儲,通過數(shù)據(jù)庫我們可以方便的存儲這些海量數(shù)據(jù),但是由于之前的數(shù)據(jù)庫功能缺乏,無數(shù)據(jù)分析和研究功能,數(shù)據(jù)并不能得到有效利用。而數(shù)據(jù)挖掘技術則可以方便有效的對復雜的數(shù)據(jù)進行分析和處理,在商業(yè)、金融等領域已得到了廣泛使用。數(shù)據(jù)挖掘技術在許多行業(yè)已經(jīng)有了比較成熟的技術和相應的挖掘工具軟件[1-3]。
目前,許多高等院校都開放了各自的教務管理系統(tǒng),也初步具備了日常管理功能,具有一定的信息處理分析功能[4-6]。但國內(nèi)的教務管理系統(tǒng),仍停留在日常事務處理的操作層面上,僅僅是從手工管理過渡到計算機上而已,沒有涉及到面向主題和歷史數(shù)據(jù)的分析決策層面上,也缺乏成熟的分析系統(tǒng)。總體上來說,教務管理的信息化仍處于初級階段,離真正的信息化和決策化水平尚有較大的差距。因此,借助于數(shù)據(jù)挖掘技術對成績進行分析、并找出隱藏在課程和成績之間的關系規(guī)律,找出不同院系不同專業(yè)學生的就業(yè)率,使得決策者準確把握專業(yè)動向,合理進行決策安排,具有顯著的現(xiàn)實意義。
一般意義上的數(shù)據(jù)挖掘是一個進行探究海量數(shù)據(jù)的分析過程,該過程以大規(guī)模的數(shù)據(jù)為研究對象。通過數(shù)據(jù)分析找出數(shù)據(jù)之間的某種聯(lián)系,并將這些規(guī)律應用到新的數(shù)據(jù)庫中。而數(shù)據(jù)分析的主要目的是進行預測,預測也是數(shù)據(jù)挖掘技術最主要的應用之一。
數(shù)據(jù)挖掘(Data mining),它是數(shù)據(jù)庫知識發(fā)現(xiàn)中的一個步驟。數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程。數(shù)據(jù)挖掘通常與計算機科學有關,并通過統(tǒng)計、在線分析處理、情報檢索、機器學習、專家系統(tǒng)(依靠過去的經(jīng)驗法則)和模式識別等諸多方法來實現(xiàn)上述目標。
數(shù)據(jù)挖掘可以分為3個步驟:即數(shù)據(jù)準備、規(guī)律查找和規(guī)律展示。數(shù)據(jù)準備指的是從已有的數(shù)據(jù)源中選取有用的數(shù)據(jù)并將歸類為數(shù)據(jù)挖掘的數(shù)據(jù)集;規(guī)律查找是采用特定的數(shù)學方法將數(shù)據(jù)集所包含的內(nèi)在規(guī)律找出來;規(guī)律展示是指采用比較易于理解的模式(如可視化)將已經(jīng)找出的規(guī)律表示出來。典型的數(shù)據(jù)挖掘結(jié)構如圖1所示。

圖1 典型數(shù)據(jù)挖掘系統(tǒng)結(jié)構圖Fig.1 Typical data mining system structure
聚類分析指將物理或抽象對象的集合分組成為由類似的對象組成的多個類的分析過程。該技術來源于生物學、統(tǒng)計學和機器學習等。因此在目前的聚類分析中,往往由聚類產(chǎn)生組,組集合為簇,不同簇的之間的對象和對象相互具有很高的相異性。聚類分析具有不同方法:如基于密度的分析方法、層次的分析方法、劃分的分析方法、基于模型的分析方法、基于網(wǎng)格的分析方法等。
數(shù)據(jù)挖掘方法中另外一個主要方面是分類和預測。分類和預測方法是指在給定條件下能夠得到哪些值,其中決策樹是數(shù)據(jù)挖掘中的一個重要方法。決策樹可以分為分類樹決策和回歸樹決策。數(shù)據(jù)庫中離散的變量采用分類樹模型,其中的連續(xù)型變量采用回歸樹模型。決策樹分析的基礎是需要知道不同狀況下的事件的發(fā)生概率,故決策樹模型是一種基于數(shù)據(jù)的預測模型,它表示的是不同對象屬性和其對象值之間的一種映射關系。
數(shù)據(jù)挖掘另外一個重要的分析方法是人工神經(jīng)網(wǎng)絡。人工神經(jīng)網(wǎng)絡是一種應用類似于大腦神經(jīng)突觸聯(lián)接的結(jié)構進行信息處理的數(shù)學模型。在工程與學術界也常直接簡稱為神經(jīng)網(wǎng)絡或類神經(jīng)網(wǎng)絡。神經(jīng)網(wǎng)絡是一種運算模型,由大量的節(jié)點(或稱神經(jīng)元)之間相互聯(lián)接構成。人工神經(jīng)網(wǎng)絡能夠?qū)崿F(xiàn)大規(guī)模的并行計算,它能夠利用海量的計算單元形成的特定網(wǎng)絡,該模型可以分為自組織網(wǎng)絡、前饋式網(wǎng)絡和反饋式網(wǎng)絡等。
從設計思路上來看,教務管理系統(tǒng)作為一個典型信息管理綜合系統(tǒng),涉及到的信息有很多,主要有學生、教職工、成績、課程等。這些數(shù)據(jù)處理表示方法如下。
入學時,管理人員以班級為單位將學生的學籍信息錄入學校教務管理系統(tǒng),與此同時,將各自教學計劃錄入系統(tǒng)。每次考試結(jié)束后,由工作人員將學生考試成績錄入。當學生需要調(diào)換專業(yè)等操作時,則可由學校專門教師進行修改。在教師評價中,將學生及各部門對教師評價所打分數(shù)錄入管理系統(tǒng)中,為將來數(shù)據(jù)挖掘做充分準備。該系統(tǒng)由兩部分組成:即日常教務管理系統(tǒng)、以及數(shù)據(jù)挖掘子分析系統(tǒng)。
從功能上來看,本次設計的教務管理系統(tǒng)可以包括以下幾個子模塊:成績管理子模塊、學生管理子模塊、課程管理子模塊、教師管理子模塊、系統(tǒng)設置子模塊、數(shù)據(jù)挖掘分析子模塊等。
教務管理信息系統(tǒng)主要工作之一為數(shù)據(jù)庫的設計,對于該類系統(tǒng)來講,合適的數(shù)據(jù)庫是數(shù)據(jù)倉庫數(shù)據(jù)的重要來源。因此,設計數(shù)據(jù)庫時,需要進行合理的數(shù)據(jù)搜集,使之不容易出現(xiàn)冗余,從而能夠加快訪問速度和效率。
本次設計中,系統(tǒng)的主要對象為學生、教師、課程和成績。不同的對象對應不同的屬性,如學生的屬性有學號、姓名、性別、籍貫、民族、聯(lián)系方式以及班級等。教師的屬性主要有工號、教師姓名、性別、學歷、專業(yè)、取得學位、職稱、聯(lián)系方式等。應該根據(jù)實體關系所確定的模型,通過合理設計數(shù)據(jù)庫表,將所涉及到的屬性信息輸入進去。
數(shù)據(jù)倉庫的設計不同于數(shù)據(jù)庫,數(shù)據(jù)庫主要目的是存儲數(shù)據(jù),而建立數(shù)據(jù)倉庫是為了滿足復雜的數(shù)據(jù)統(tǒng)計分析需要。教務管理系統(tǒng)中的數(shù)據(jù)通過處理,轉(zhuǎn)移到數(shù)據(jù)倉庫中,從而可以讓管理者通過數(shù)據(jù)倉庫進行數(shù)據(jù)挖掘,最終實現(xiàn)對學生學習培養(yǎng)、教師素質(zhì)提高提供決策支持。本次設計的數(shù)據(jù)倉庫包括幾個部分:1)數(shù)據(jù)源;2)數(shù)據(jù)提取;3)數(shù)據(jù)預處理;4)數(shù)據(jù)集市;5)分析工具。
由于本文研究的主要對象是教務管理系統(tǒng),因此重點關注內(nèi)容應該是學生和教師的信息。這就需要在模型設計時,要研究學生數(shù)據(jù)模型以及教師數(shù)據(jù)模型。
1)學生數(shù)據(jù)模型
學生數(shù)據(jù)中主要考慮學生的基本信息,如性別、學分、成績、籍貫、班級等。針對不同學生,建立學生數(shù)據(jù)模型:
①根據(jù)性別建立數(shù)據(jù)模型;②根據(jù)性別建立數(shù)據(jù)模型;③根據(jù)民族建立數(shù)據(jù)模型;④根據(jù)成績建立數(shù)據(jù)模型;⑤根據(jù)學分建立數(shù)據(jù)模型。
2)教師數(shù)據(jù)模型
①根據(jù)性別建立數(shù)據(jù)模型;②根據(jù)學歷建立數(shù)據(jù)模型;③根據(jù)年齡建立數(shù)據(jù)模型;④根據(jù)職稱建立數(shù)據(jù)模型;⑤根據(jù)教師評價建立數(shù)據(jù)模型。
數(shù)據(jù)挖掘模型建立以后,必須通過編程語言和其他一些工具進行數(shù)據(jù)挖掘。本系統(tǒng)在設計功能上,實現(xiàn)了教務管理系統(tǒng)的許多基本功能,比如學生管理、成績管理、教師管理等。
日常事務管理主要分為系統(tǒng)登陸模塊和學生管理模塊兩類。系統(tǒng)登陸模塊主要功能是用戶啟動系統(tǒng),出現(xiàn)登錄界面,選擇身份。如圖2所示。

圖2 系統(tǒng)登陸模塊Fig.2 Login module
學生管理模塊的功能主要實現(xiàn)學生信息的獨自錄入、修改、刪除等功能。
可以使用聚類分析法對任課教師評價數(shù)據(jù)進行合理的數(shù)據(jù)挖掘。教師評價指標主要有:教學內(nèi)容、教學方式、教學態(tài)度和知識能力。在進行教學評價時,往往以班級為單位,組織學生自己,運用教務管理系統(tǒng)為教師打分。
之后就可以使用數(shù)據(jù)挖掘模塊對打分結(jié)果進行聚類分析,那么從聚類分析結(jié)果來看,結(jié)合實際評分的結(jié)果,通過人工分析得出,聚類分析更能正確的進行教學評價分析。
以副教授為例,其所占全部教師比例為5%,若評價均值為80。因該類教師年齡較大,且主要經(jīng)歷在科學研究方面,平時授課時間相對較少,且每次講課方式和方法比較固定,導致上課時和學生溝通較少。故該類教師的教學評價較低。
以上對于聚類分析結(jié)果進行了分析,得出學歷較高職稱較高的教師得到的評價較高,這是由于這類教師經(jīng)驗豐富、知識面廣。學院管理者可以通過聚類分析的結(jié)果對每類教師進行相應的培養(yǎng),以便可以提高教師的教學水平。
由于課程之間的相互影響是客觀存在的,在實際應用過程中,通過對學生考試成績進行充分的數(shù)據(jù)挖掘和分析研究,從而找出安排課程合理規(guī)律,為學院制定人才培養(yǎng)計劃,安排教學內(nèi)容提供合理的參考。我們可以使用教務管理系統(tǒng)設計的課程關聯(lián)性使用分析功能模塊,實現(xiàn)對數(shù)據(jù)倉庫中有用的相關數(shù)據(jù)進行關聯(lián)情況規(guī)則分析,比如使用Aprior算法,可以產(chǎn)生數(shù)據(jù)挖掘結(jié)果。
通過分析可以看出,不同課程之間不是雜亂無章的,而是內(nèi)在存有很強的聯(lián)系,這往往在考試成績差與平時成績好的學生能夠明顯的體現(xiàn)出來,因此在制定相關的人才培養(yǎng)計劃時,必須考慮到課程之間的相關性,并考慮到課程的開設順序,影響學生學習效果的方面,實踐中不能將課程提前開設或者向后開設、同時開設。本次研究的成果,所得到的數(shù)據(jù)挖掘結(jié)果應用,可以作為管理者參考的依據(jù),同時也可以成為學生選課的依據(jù)。
本次研究,設計了一個基于數(shù)據(jù)挖掘的高校教務管理系統(tǒng),從功能上來看,對數(shù)據(jù)倉庫和數(shù)據(jù)表進行詳細的設計,實現(xiàn)了教務管理系統(tǒng)中往往難以實現(xiàn)的功能,給出了重要模塊的實現(xiàn)過程。模型將聚類分析方法應用到教師和學生評價中,并且將關聯(lián)分析植入到學生成績評定中,最后 對系統(tǒng)進行了功能和性能方面的測試,從而驗證了系統(tǒng)運行的正確性。
由于作者能力有限,本次設計的系統(tǒng)中挖掘的內(nèi)容相對單一和數(shù)量較少,除了文中所涉及的挖掘內(nèi)容外,尚有諸多內(nèi)容,仍待繼續(xù)改進。
在教務管理過程中,往往涉及到大量的數(shù)據(jù),采用傳統(tǒng)的方法無法適應日益增長的數(shù)據(jù)規(guī)模需要,因此隨著社會進步及計算機和網(wǎng)絡技術的應用,數(shù)據(jù)挖掘技術為我們提供了合適的工具,本文基于此,研究分析了數(shù)據(jù)挖掘技術在高校教務管理系統(tǒng)的應用和實現(xiàn)。論證了數(shù)據(jù)挖掘的概念、分析方法,提出了教務管理系統(tǒng)的數(shù)據(jù)挖掘模型,分別對學生模塊和教師模塊應建立的模型進行了分析,通過實例分析可知,本系統(tǒng)模型能夠極大提高管理者的效率,本研究為類似項目研究提供了一個借鑒。
[1]姚志鴻.數(shù)據(jù)挖掘技術在教學管理中的應用與實現(xiàn) [J].電子測試,2014(6):108-109.YAO Zhi-hong.The realization and application of data mining technology in teaching management[J].Electronic Test,2014(6):108-109.
[2]吳天真,李文靜.數(shù)據(jù)挖掘技術在高校教務管理中的應用綜述[J].科協(xié)論壇,2013(7):75-76.WU Tian-zhen,LI Wen-jing.Overview of application of data mining technology in the colleges and universities teaching management[J].Science and Technology Association Forum,2013(7):75-76.
[3]李素朵.數(shù)據(jù)挖掘技術在高職院校教務管理系統(tǒng)中的應用研究[D].石家莊:河北科技大學,2013.
[4]林麗.數(shù)據(jù)挖掘技術在高校教務管理系統(tǒng)中的應用[J].輕工科技,2012(4):89-90.LIN Li.Application of data mining technology in the university educational administration management system[J].Light Industrial Science and Technology,2012(4):89-90.
[5]魏韞怡.數(shù)據(jù)挖掘技術在電大教務管理中的應用[J].科技視界,2012,8(22):98-100.WEI Yun-yi.Application of data mining technology in the teaching management in TV University[J].Science and Technology View,2012,8(22):98-100.
[6]歐振用.數(shù)據(jù)挖掘技術在教務管理系統(tǒng)中應用研究[D].北京:北方工業(yè)大學,2011.