占 小 憶
(安徽三聯學院 計算機工程學院,安徽 合肥 230601)
?
數據倉庫和OLAP技術在高校教學決策系統中的應用研究
占 小 憶
(安徽三聯學院 計算機工程學院,安徽 合肥 230601)
摘要:借助某高校教務系統中的教學數據,使用ETL(Extract-Transform-Load)技術把適合主題分析的數據抽取到目的數據倉庫,并使用OLAP(Online Analytical Process)技術對這些數據進行多角度分析,從而找出成績變化的趨勢,成功地分析了變化的原因,為該校的管理者提供了有效的決策依據和初步的決策建議。
關鍵詞:數據倉庫;教學決策;聯機分析處理;多維分析
計算機技術的發展使各大高校的教學管理基本完全走向信息化[1]。他們的管理系統大多是建立在面向事務的基礎上的,基本上能夠滿足日常教學的需求,如對學生成績的管理,對教學的安排,對考試的管理等等。但這種管理系統往往只是停留在管理的層面上,對于教學管理過程中出現的一些問題,比如同一個專業多個平行班成績出現較大的差距,再比如同一個專業不同年級的學生成績出現的下滑或上升的趨勢,學生報到人數在地區上有著什么樣的分布趨勢等等。類似這樣的問題通過管理系統是解決不了的,對于以上這些問題,可以通過建立相應的數據倉庫[2],然后利用OLAP[3]分析工具對隱藏在系統中的海量數據進行分析,找出其中的規律,從而幫助教學管理人員更好的作出決策。本文就是針對某高校近幾年積累下來的學生某些課程的成績數據,首先構建學生成績數據倉庫,然后利用OLAP工具對其進行多角度的分析,找出其中的規律,并發現了一些問題,供管理者參考。
1成績管理數據倉庫的設計
1.1分析需求,確定主題域
根據調查結果整理出以下幾個方面的分析需求:希望對全校的公共課做成績分析,如大學英語B級和計算機基礎這兩門公共課;希望能分析成績變化的趨勢。通過對以上需求進行歸納,發現分析的角度可以分為教師、課程、時間和班級四大類,而此需求所涉及的主題域實際上只有一個——成績。
1.2ETL的具體實現
數據抽取。確定了主題域后,接下來就從操作型數據庫中提取分析所需的數據[4]。在此只提取原教務管理系統中與成績主題相關的數據,源數據中的數據有可能會出現錯誤,根據不同的錯誤類型,在提取數據時要采取相應的手段來處理這些錯誤數據;對于原數據中部分記錄中的某些數據項出現空值或不規范值,可以利用系統的數據篩選功能將這些數據篩選出來再進行手工處理;對于一些可疑數據,則要看具體情況,如某個學生的學期平均成績,則要查詢該學生的所有課程成績,如有部分課程成績為空,則可認為該同學部分課程缺考,當以零分參加計算平均值,如果該同學所有成績都為空,則可認為該同學在該學期發生變更(如休學或退學),此時應當刪除該無效記錄;另外,抽取后的各表數據要保持一致性,如發現抽取后的學生信息表中的人數和成績表的人數不一致,即一張表中的記錄在另一張表中沒有對應的數據,則應刪除這些記錄,以免對后續的分析造成麻煩。
數據匯總和加載。從源數據庫抽取的數據大多是細節數據,如學生的成績數據存儲的是每學期每門課程的成績,而管理者在對基礎課成績做趨勢分析時需要的是每學期或每學年的成績數據,因此,還需要對抽取的數據在不同的維度層次上進行匯總。接下來將以上經過處理的數據加載到數據倉庫,本系統采用MicrosoftSQL Server中的DTS功能將數據導入目的數據倉庫。
1.3構建成績管理數據倉庫
維表和事實表的設計和事務型數據庫設計沒有區別,在此就不敘述維表和事實表的設計過程。星型模型是最流行的數據倉庫導出數據層的設計結構。星型模型通過使用一個包含主題的事實表和多個包含事實的非規范化描述的維度表來執行典型的決策支持查詢[5]。根據維表和事實表的設計,本系統采用星型架構。圖1是教學管理系統的維表和事實表的星型結構圖。

圖1 成績管理系統星型模型
2數據展示及分析
2.1學生維成績分析
學生維成績分析就是針對某個學生單科成績在不同學期所發生的變化或某個班級所有學生成績的分布趨勢。由于本課題主要針對實用英語和計算機兩門課程的成績分析,對學生維的成績分析沒有實際意義。因此,在此暫不做分析。
2.2教師維成績分析
教師維成績分析主要是把教師作為維度,從專業維、班級維和學年學期維來觀察分析成績的差異。例如,可以針對同一教師所授的不同班級學生做成績分析,雖然入學時各班級學生并沒有按照成績好壞來分班,各班的成績相差不大,后來可能受其它因素的影響導致同一門課程同一個授課老師,但是成績卻相差很大;還可以針對同一教師,將不同時期所帶班級的學生成績進行比較,找出差異,對于成績較好的學期可以總結出在這一段時間內教師的授課優點,對于成績較差的學期可以總結該段時間授課的缺點和影響成績的因素,例如是否有些學期教學周數較多,而有些學期周數較少造成課時的差異或者是否有不同專業該課程開設在不同學期造成的成績差異。圖2是教師維的分析。

圖2教師維成績分析
從圖2可以看出以下兩點:
第一,在平行班的教學中,10級計應1班和10級計應3班成績竟然相差十幾分,而這些班級是由同一教師授課的。究其原因,這些班級中是由不同的班主任管理的。不同的班主任,他們管理方式不同,班級文化不同,學生的學習氛圍不同,學習效果也就不同。如10級計算機應用專業3個班中2班的成績較低而3班的成績最高。經調查發現,3班的班主任對學生要求非常嚴格,不允許學生無故曠課,不隨意批請假條,還經常給同學召開班會,這樣,學生的學習氛圍很好,都愿意去學,自然成績就好。而作為平行班的10級2班班主任是另外一個老師,該班的管理較松散,學生的學習積極性很差,還有些學生經常曠課,整個班級的學習風氣很差,因此學習效果也就很差。針對此現象,學校應采取一定的措施綜合對班主任進行考評,而考評結果可以與待遇或年終獎金掛鉤,從而健全學校教職工的激勵機制。
第二,對于相同專業不同班級,不同老師所授課程的成績有時也有很大的差距。例如,同是10級郭常根老師所帶班級的平均分要比杜林老師的高出10多分,分析原因,原來是郭常根老師帶這門課程已有幾年的教學經驗,而杜林老師帶這門課程時間較短。此時學校要考慮在教學安排上對于課程安排盡量讓同一個老師帶相同的課程。同時學校在教學安排中要綜合考慮班級學生自身的素質、班主任和授課教師的因素。
2.3學年學期維分析
從學年學期維可以分析所有課程在不同時間的成績趨勢。圖3是所有學生的計算機基礎和實用英語B級在每學年的成績比較。可以看出,計算機基礎的成績在不同學年呈上升趨勢,而實用英語B級在2011-2012學年的成績較低。經過進一步分析,計算機基礎在2011-2012學年以后采取了激勵機制,授課老師比以前更加盡心盡責輔導學生操作。而實用英語B級2011-2012學年調換了幾個年輕老師授課導致成績下降。作為學院教學管理者,要想提高基礎課的成績就要進一步采取一些措施,例如將激勵機制同時應用到實用英語上,同時加強對年輕老師的培訓,使他們盡快成長起來,以提高基礎課成績。

圖3學年學期維切塊分析結果
3結束語
本文從某高校近幾年的部分學生成績相關數據出發,使用OLAP技術對該部分數據進行分析,從而找出成績變化的趨勢,成功地分析變化的原因,最終為該校的管理者提供了有效的決策依據和初步的決策建議。在此,該系統只是提供了少量的數據分析結果,我們可以將此方法推廣到其它課程,甚至是整個學校的教務系統,這將會更加有效地保障教學效果。
參考文獻:
[1] 張雪. 數據倉庫技術在高校信息系統中的應用[J]. 電子技術與軟件工程, 2014(21): 212.
[2] 何玉潔, 張俊超. 數據倉庫與OLAP實踐教程[M]. 北京: 清華大學出版社, 2008: 5.
[3] 夏火松. 數據倉庫與數據挖掘技術[M]. 北京: 清華大學出版社, 2011.
[4] 馬春艷, 曲偉峰, 化松收. 基于數據倉庫、OLAP和數據挖掘的智能決策支持系統研究[J]. 無線互聯科技, 2013(3): 132, 154.
[5] 陳志泊. 數據倉庫與數據挖掘[M]. 北京: 清華大學出版社, 2009: 43.
Applied Research of Data Warehouse and OLAP in the Decision-making System of Teaching in Universities
ZHAN Xiao-yi
(Anhui Sanlian University, Computer Engineering Department, Hefei 230601, China)
Abstract:In this paper, with the aid of a university educational administration system of teaching data, using the ETL (Extract-Transform-Load) technology to Extract suitable for the analysis of the theme data in data warehouse, and using OLAP technology to multi-angle analyses on these data thus we find out the performance change trend, analyses the reasons of the change successfully, in the end, provide effective decision-making basis and preliminary decision-making advice for the school managers.
Key words:data warehouse, teaching decisions, OLAP, multi-dimensional analysis
文章編號:1007-4260(2015)03-0117-03
中圖分類號:TP392
文獻標識碼:A
DOI:10.13757/j.cnki.cn34-1150/n.2015.03.031
作者簡介:占小憶,女,安徽懷寧人,碩士,安徽三聯學院計算機工程學院講師,研究方向為數據倉庫和數據挖掘。
基金項目:安徽三聯學院項目(2012012)。
收稿日期:2015-06-09
網絡出版時間:2015-8-25 15:40網絡出版地址:http://www.cnki.net/kcms/detail/34.1150.N.20150825.1540.031.html