
【摘要】利用數(shù)據(jù)挖掘技術,針對現(xiàn)在學分制的高校教務管理系統(tǒng)進行改革和創(chuàng)新,先將數(shù)據(jù)挖掘的概念引入到教務管理系統(tǒng)的使用中,分析了其實現(xiàn)的可行性。針對教務管理系統(tǒng)中的高校統(tǒng)考課程成績這一項數(shù)據(jù)進行整理和建模。
【關鍵詞】教務管理;數(shù)據(jù)挖掘
一、引言
隨著信息技術在高校管理中的應用,日常使用中教學管理系統(tǒng)會遺留下海量的數(shù)據(jù),這些數(shù)據(jù)已經(jīng)形成一個關于教學信息的數(shù)據(jù)庫。在現(xiàn)代化建設的的條件下,如果對這些海量數(shù)據(jù)進行分析和挖掘,就可以發(fā)現(xiàn)對教務管理、學生管理當中有規(guī)律并具有指導意義的信息。
數(shù)據(jù)挖掘作為一種工具,將其應用于高校的教學管理工作,可以幫助管理者從以往的數(shù)據(jù)中發(fā)現(xiàn)隱藏的規(guī)律或模式,為決策提供信息支持,從而不斷提高教學管理質(zhì)量,促進教育管理的進一步改革、完善和發(fā)展,從而提高管理的科學性、針對性和高效率。不管是國內(nèi)還是國外,越來越多的高校利用數(shù)據(jù)挖掘等等技術進行決策系統(tǒng)的構建,為更高的決策提供數(shù)據(jù)基礎。
二、數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的定義
數(shù)據(jù)倉庫是決策支持系統(tǒng)(dss)和聯(lián)機分析應用數(shù)據(jù)源的結構化數(shù)據(jù)環(huán)境。數(shù)據(jù)倉庫研究和解決從數(shù)據(jù)庫中獲取信息的問題。數(shù)據(jù)倉庫的特征在于面向主題、集成性、穩(wěn)定性和時變性。數(shù)據(jù)倉庫不僅僅是是一個簡單的數(shù)據(jù)集合,還是一個決策系統(tǒng),它將相關聯(lián)的的數(shù)據(jù)重新組織,并且為其找出一定的規(guī)律,從而對以后的數(shù)據(jù)進行預測,以供最終用戶直接完成對數(shù)據(jù)的查詢、分析與決策[1][2]。這些元素被收集在模型下,例如:
預測:估計銷售量、預測服務器負載或服務器停機時間;
風險和概率:選擇目標郵遞的最佳客戶、確定風險方案的可能保本點、將概率分配給診斷或其他結果;
建議:確定哪些產(chǎn)品有可能一起銷售并生成建議;
查找序列:分析購物車中的客戶選擇,并預測接下來可能發(fā)生的事件;
分組:將客戶或事件劃分到相關的項目分類,分析和預測相關性。
目前,常用的數(shù)據(jù)挖掘分析方法有:關聯(lián)規(guī)則分析、聚類分析、分類分析、特征、變化和偏差分析、web頁挖掘等幾種[3]。
三、數(shù)據(jù)挖掘在教務管理中的應用
隨著時代的發(fā)展,對學生的要求也越來越趨向于個性化、多元化。學生可以自主選擇自己感興趣的課程,感興趣的老師。這樣就導致學校在定制人才培養(yǎng)方案的時候出現(xiàn)的盲區(qū)。或者我們可以通過調(diào)查問卷的方式提取學生的個人特征、學習情況和興趣愛好。并對學校的教學計劃、課程設置以及資源分配進行統(tǒng)籌。這樣的方式會耗費大量的時間和精力,并有在這樣的過程中,也會因為收調(diào)查的人群不同而得到不一樣的結果。針對這種部分代表全部的方式,得到的結果也會有所誤差。利用信息化的教務管理系統(tǒng),我們在正常使用下就已經(jīng)留下了學生信息、課程設置、成績等等的大量信息。
在教務管理中運用不同的數(shù)據(jù)挖掘方法可以挖掘出相關的有價值的信息知識。按照不同的關聯(lián)規(guī)則,對數(shù)據(jù)的分類也是不一樣的,從而反應出的映射類別也是不一樣的。選擇合適的方法能夠優(yōu)化速度,更準確的預測,為決策提供更為精確的數(shù)據(jù)。按照不同的關聯(lián)規(guī)則提取數(shù)據(jù),并用對提取數(shù)據(jù)進行分析[4]。
例如存在A+B—C的規(guī)則。那么根據(jù)學生的A行為和B行為就可以推出可能要發(fā)生的C行為,這樣就可以及時制定策略去鼓勵或遏制C行為的產(chǎn)生。以A學生和B學生在一起的行為來說,推導出A和B在一起是起著積極作用還是負面的影響,進而可以選定學生之間的關聯(lián),促進學生之間的互助行為。通過這樣的規(guī)律就可以更好的在學校內(nèi)使用互幫互助的學生集合。并且利用分類規(guī)則對于學生的分類和判斷,可以對于不同的學生采用不同的教學方法和教學課程,可以進一步實施分層次教學,提高教學質(zhì)量。另外,利用數(shù)據(jù)挖掘技術挖掘教務管理系統(tǒng)中積累的有用信息,可以使學校的相關院系針對人才培養(yǎng)方案,進行課程的調(diào)節(jié)。通過選課率、通過率及相關信息,鼓勵和引導學生選擇互補的課程,這有利于學生整體素質(zhì)的提高,也有利于教學資源的合理分配。
四、模型的建立
大部分的學校選用學分制的教務系統(tǒng),采取分專業(yè)、分班教學的方式來測量學生的學習情況,在繁雜的的教務系統(tǒng)中,以統(tǒng)考課程成績作為數(shù)據(jù)倉庫的基礎數(shù)據(jù),利用數(shù)據(jù)挖掘的相關方法對學生的成績進行分析和歸類,并對課程的選擇進行預測,更好的為學校制定人才培養(yǎng)方案提供基礎數(shù)據(jù)和預測數(shù)據(jù)。進一步的為學校的管理者提供決策支持,更好的、更準確的制定學校的發(fā)展方案。于此同時也可以為學校提高教學質(zhì)量、優(yōu)化教學資源提供可靠的數(shù)據(jù)依據(jù)。
首先,在基于B/S的三層體系結構中,表示層、中間層、數(shù)據(jù)層被分割成三個相對獨立的單元。利用數(shù)據(jù)倉庫的三層體系結構,搭建屬于高校統(tǒng)考課程成績數(shù)據(jù)倉庫的應用模型的體系[5]。
其中,這三層結構由五部分組成,如圖4-1所示。
其中,五個部分分別是:
(1)數(shù)據(jù)源,包含著以后分析所需要的所有基礎數(shù)據(jù)。例如學生基本信息、試卷信息、題型信息、課程信息、教師信息等。
(2)ETL階段,即數(shù)據(jù)的抽取、轉(zhuǎn)換、裝載和刷新,數(shù)據(jù)的來自于不用的數(shù)據(jù)源,在不同的數(shù)據(jù)源中的信息表述也不盡相同,這些數(shù)據(jù)在抽取的過程中需要進行過濾,得到質(zhì)量高的信息,并針對不同表述的數(shù)據(jù)轉(zhuǎn)換成同種的格式,方便后面數(shù)據(jù)的刷新,并裝載到另一層的數(shù)據(jù)倉庫中。
(3)中心數(shù)據(jù)倉庫,即高校統(tǒng)考課程成績數(shù)據(jù)倉庫。這個中心數(shù)據(jù)倉庫內(nèi)存放的是經(jīng)過清洗和轉(zhuǎn)換以后的數(shù)據(jù),在經(jīng)過進一步加工以后存儲于多維數(shù)據(jù)庫中,學生可以利用數(shù)據(jù)的分析進行課程的選擇,從而達到?jīng)Q策支持的效果。
(4)OLAP服務層,利用OLAP技術或是DM技術對統(tǒng)考成績數(shù)據(jù)倉庫中的數(shù)據(jù)進行查詢訪問,得到輔助決策信息。
(5)信息展示層,利用數(shù)據(jù)分析工具得到的知識通過各種可視化的信息展示技術,比如有圖標、文本、視頻、聲音等方法將分析結果更加直觀和全面的展示給用戶。
其中題型難度表,分數(shù)表,考試狀態(tài)信息表作為表述的元素。
在教務系統(tǒng)中,針對課程成績某一功能,利用數(shù)據(jù)挖掘技術,將其應用于某個課程成績中,將學生成績數(shù)據(jù)進行清洗、轉(zhuǎn)換、加載,完成數(shù)據(jù)的匯總。并使用OLAP技術對學生成績進行全方位、多角度的分析,例如:學生的總結性評估、學生的個性特征等等,通過這些信息更好的完善學習方法,提高學習的成效。準確判斷學生合作學習和解決問題的能力,洞察學生的學習動態(tài)。
五、結語
利用數(shù)據(jù)挖掘技術,能幫助大學管理人員更好地分析數(shù)據(jù),從而將潛藏的、有用的信息和知識,從大量的數(shù)據(jù)中提取出來。為后面的決策優(yōu)化速度和準確性等。數(shù)據(jù)挖掘在教務系統(tǒng)中的運用,也需要通過慢慢的研究來進行進一步的提高。
參考文獻
[1]Jiawei HAN,Mieheline Kamber.數(shù)據(jù)挖掘慨念與技術[J].范明,孟小峰,譯.北京:機械工業(yè)出版社,2004:l-160.
[2]David Hand,Heikki Mannila,PadhraicSmv th.數(shù)據(jù)挖掘原理[J].張銀奎,廖麗,宋俊等,譯.北京:機械工業(yè)出版社,2003.
[3]劉紅巖,陳劍,陳國青著.數(shù)據(jù)挖掘中的數(shù)據(jù)分類算法綜述[J].清華大學學報汨然科學版,2002,1.
[4][美]融chard J.Roeger.數(shù)據(jù)挖掘教程[M].北京:清華大學出版社,2003.
[5]余英澤.一種新型數(shù)據(jù)分析技術——數(shù)據(jù)挖掘口].計算機與現(xiàn)代化,2000(1).
作者簡介:
高捷(1987—),女,江蘇淮安人,碩士,助教,江蘇財經(jīng)職業(yè)技術學院教師,研究方向:計算機應用技術。
蔡清龍(1981—),男,江蘇淮安人,碩士,講師,江蘇財經(jīng)職業(yè)技術學院教師,研究方向:財務管理。