摘要:本文主要論述了數據挖掘技術在高校教務管理中的應用,在闡述數據挖掘技術研究背景的基礎上,對其國內外研究現狀做了相關分析。
關鍵詞:數據挖掘技術 教務管理 應用研究
1 研究背景
近年來,很多領域都應用了數據挖掘技術,它能夠將系統中的數據最大化的加以利用,使其價值得到最大的發揮。特別在商業、金融、市場營銷等多個領域中,得到廣泛的使用。但是在教育領域中,主要體現在系統研究的教育管理信息中,數據挖掘卻很少被利用[1]。目前,高職學院在教育信息管理中,教育信息系統已經得到了多方面的認可,并在其功能和技術等方面逐漸成熟。但是,教育信息系統在能完好的保存信息的同時,卻不能夠得到充分的利用,絕大多數的數據都只是在數據庫中簡單的“堆放”,而沒有將這些數據隱性價值挖掘出來。數據挖掘技術(Data mining)在管理信息系統(MIS,Management Information System)中的應用起始于上世紀九十年代中期[2]。數據挖掘算法是根據數據創建數據挖掘模型的一組試探法和計算,常用的有C4.5算法,K-Means聚類算法等。每個教務管理系統的實際需求情況決定了應該使用什么樣的挖掘技術來實現相應的需求,因此數據挖掘技術在管理信息系統中的應用必須從實際情況出發選擇適合的數據挖掘算法。
2 國外研究及應用現狀
從國外對數據挖掘系統的研究來說,目前國外對高校教務管理信息系統數據挖掘子系統的研究的文獻也不少。特里肯(Turkmen,2011)指出信息系統與數據挖掘系統的融合方式,其中包括整體架構的設計、數據庫的設計、業務系統的實現等[3]。
國外高校數據挖掘子系統的發展主要分為五個階段。第一階段以簡單用于信息發現為特點,學校通過網站數據庫與自身有關的各種信息(這些信息多為靜態的,例如學校各項工作流程、教學管理流程、校規校紀、法律條文等)的簡單的關聯規則分析獲取有意義的知識。第二階段的主要特點是能夠實現簡單的教學質量分析功能。在第一階段的基礎上,學校通過學生對老師的評價、老師與老師間的評價和領導對老師的評價等信息綜合加權,實現對教學質量的總評價功能。第三階段的特點是對海量數據的綜合分析功能。隨著教務管理系統使用時間的增加,系統中記錄的數據也越來越豐富,從而形成了海量數據。如何處理這些海量數據成為了這個階段的主要特點。第四階段的特點是個性化挖掘階段。這個階段的主要特點是實現了針對學生個性特點設計的新的挖掘功能。第五階段,數據預測階段。將挖掘出來的信息作為依據,整合各方面資源進行數據預測。目前國外發達國家的高校教學管理信息化水平已經非常高了,他們的教務管理系統一般都擁有較為完備的網絡環境、先進的管理模式、高度的教學信息化水平等。歐洲各國高校的教務系統的普及率也超過了99%。完備的教務管理系統為數據挖掘子系統的開發提供了數據來源。
美國的高校教務管理信息系統中的數據挖掘子系統主要有三方面成就:第一,系統需求研究合理,系統設計選擇面向客戶需求的設計理念,而放棄了以往系統設計以部門組織結構為系統設計的主體的原則;第二,個性化需求挖掘。第三,挖掘功能豐富。例如,通過對學生成績的研究剖析,能夠了解到學生的課堂上的表現情況、平時課程練習的情況、先修課程的成績等,與考試成績進行細致分析,并得出某種相關聯的信息。經過這種方法,高??梢愿玫膶W生成績、課程安排進行合理的實現,并對學校的教學任務和目的都起到十分重要的作用。
新西蘭延續了“普遍存在的,無所不在”系統設計理念,將數據挖掘子系統設計成為基于大眾的、面向用戶的信息挖掘系統。使用對象的廣泛性、面向用戶以及獨創性成為了信息系統設計的三原則。
韓國的高校教務管理信息系統中的數據挖掘子系統主要有三方面成就:系統需求分析合理,每項教務信息挖掘功能都選擇使用較為成熟的數據挖掘算法實現;系統設計選擇面向客戶需求的設計理念,而放棄了以往系統設計以部門組織結構為系統設計的主體的原則;系統可以自動分析哪些學員不方便上網,從而建立自助服務機制,由義工組織負責為他們提供必要的服務。
3 國內研究及應用現狀
3.1 數據挖掘在管理信息系統中的研究與應用現狀。目前,在信息管理系統中,完善、成熟的多維分析軟件系統在我國還沒有出現,這已經成為廣大信息管理系統的用戶的迫切需求。在國內,數據挖掘被用于很多MIS系統(管理信息系統,Management Information System)中,它能夠幫助處理很多的日常事物,并通過多層面,多角度的方式,進行更好的處理,使得原來手工操作的事情,被計算機所替代[4]。例如,王海濤(2010)提出了一個基于數據發現的手機支付商城軟件的“供應流數據挖掘和信息流數據挖掘模塊”的整體架構設計[5]。該設計的優點是有效地利用了改進后的Apriori算法,將庫存積壓的禮品與注冊客戶的個人愛好有效地關聯了起來,其缺點是忽略了消費者的隱私問題。
3.2 數據挖掘在國內高校教務管理系統中的應用現狀。從數據挖掘工具在教務管理信息系統中應用的發展水平上來說,我國教務管理系統中數據挖掘的應用水平要落后于國外。但是,近年來,我國充分利用了后發優勢以及高校在數據挖掘方面的研究成果,教務管理系統中的數據挖掘的研究與應用水平發展非常迅速,個別高校自主開發的數據挖掘子系統已經接近甚至超過了國際先進水準。清華大學開發的“泰山教務管理系統”不僅綜合了常見的教務管理系統數據挖掘的所有功能,而且還增加了用戶個性化分析功能。人民大學在我國最早開發了教務管理系統,至2012年完成了第四次升級,真正將教學資源管理模塊和數據挖掘模塊融為一體,基于B/S與C/S混合架構的,功能強大的教務管理信息系統。此外,還有“西安交通大學教務信息管理系統”、“北京師范大學教務管理系統”、“國防科技大學教務管理系統”等都將數據挖掘功能單獨作為其一個子系統進行開發和使用。
目前我國學者對教務信息系統的研究主要集中在以下幾個方面:其一,重點研究數據挖掘與現有教務管理系統的整合的文獻。曹建(2009)提出了教務管理總體框架的SOA設計,將數據挖掘實際應用在總體框架中[6]。其優點是對系統架構做了較為合理的設計,但是C/S模式設計的缺點也很突出:系統不易移植,系統不易更新換代,界面缺乏人性化設計等。河北師范大學蔣偉偉提出了采用C/S方式進行數據挖掘和應用B/S結構將數據挖掘的結果進行發布,從而實現了混合結構的設計[7]。文章的思路獲得了廣泛認可,但是文章只是探討了混合設計的可行性,并沒有真正的提出具體的設計。其二,重點研究數據挖掘算法改進的文獻。隨著我國中小學以及高校陸續開發出來的教務管理系統越來越多,如何才能產生興趣度更高的數據挖掘知識成為了新的研究方向,因此出現了很多研究數據挖掘實效性的文獻。刑政權(2011)提出了基于數據挖掘的教務管理系統開發與應用。文中詳細分析了傳統Apriori算法、C4.5算法在教務管理系統中開發的不足,優化了這些算法,獲得了較好的效果。
4 總結
從數據挖掘工具在高校教務管理系統中研究水平上來說,我國部分高校的教務管理系統的數據挖掘研究水平是和國外大致相當的。因此,在教務管理系統開發的過程中,研究如何采用數據挖掘技術將教務管理系統中工作流產生的大量數據進行合理地知識發現是十分必要的,是有利于教務管理系統的升級與功能延伸的。
參考文獻:
[1]李晉宏等.北方工業大學綜合教務系統[J].東南大學學報.200年增刊.ISSN 1001-0505(32):245-247.
[2]R.Srikant, T .Imielinski and items in Large databases[J]. In A: Swami.MiningProceeding of the 2007(3) : 216 .
[3]Turkmen. Mining in Lin,Suh-Yin Lee.Web Applications.Fast Lexicographic Algorithm for Association Rule www.csie[J].nctu.edu.tw.2012(1):112-115.
[4]毛國君.數據挖掘技術與關聯規則挖掘算法研究[D].北京:北京工業大學,2013(11):14-17.
[5]王海濤.基于DM中關聯規則算法的思考[J].計算機與數字工程,2010,33(5):76-78.
[6]曹建.基于園區網絡的教務管理數據挖掘系統[D].四川:西南石油學院,2013(2):249.
[7]丁知斌,袁方.基于數據倉庫的數據挖掘技術在高校學生成績分析中的應用[J].河北大學成人教育學院學報,2009,12(6):19-21.q