王剛



中圖分類號:G4 ?文獻標識碼:A ?文章編號:(2020)-25-291
近年來,隨著中考網上閱卷工作的順利實施,我市逐漸積累了大量、詳細的中考成績數據;雖然每年會有專人對中考成績進行分析,但也沒有能夠全方位、多角度、跨年度地深入分析挖掘出中考成績背后所包含的潛在價值。基于傳統的簡單成績查詢,已經不能滿足日益增長的數據分析需求,而數據倉庫技術正是為了構建這種新的分析處理環境出現的一種數據存儲和組織方式。
一、數據倉庫簡介
數據倉庫是面向主題的、集成的、不可更新的(穩定性)、隨時間不斷變化(不同時間)的數據集合,把企業內部數據和外部數據進行有效的集成,生成分析性報告,為企業的各層級決策和分析人員所使用。數據倉庫具有面向主題的、集成的、時變的和穩定性的特點。
二、中考成績數據倉庫的設計
(一)中考成績數據倉庫的體系結構
對于數據倉庫的用戶來說,數據倉庫系統由數據源、數據倉庫的數據存儲、數據倉庫的應用工具、前端工具組成。
具體體系結構如圖所示:
內部數據源主要為歷年的中考報名和成績數據。外部數據源包括縣區、學校的教學管理相關信息,以及教師個人相關信息、教學手段方法等信息,和學生學習相關信息等。
(二)中考成績數據倉庫的模型設計
在進行數據倉庫的設計開發時,通常要建立概念模型、邏輯模型、物理模型三個層次的數據模型。
1.概念模型設計
進行概念模型的設計主要完成兩項工作:一是確定主題域。主題,簡單來說,就是用戶在使用數據倉庫時所關心的方面。主題域是決策者在使用數據倉庫分析時關心的一個個分析領域,包括分析問題的各種角度和從相應視角觀察分析到的事實數據。從某種意義上來說,主題域也就是為數據倉庫劃定的一個大致的系統邊界,確定主題域的工作也可以看作是為了設計好數據倉庫而對用戶進行的需求分析。因此,進行數據倉庫設計之前,要了解掌握哪些問題是用戶感興趣的?這些問題都需要什么樣的數據信息等?二是確定數據倉庫中各主題及其相關要素內容。主題域確定之后,就可以對每個主題具體應包含的要素、內容進行描述。數據倉庫的概念模型一般采用多維數據模型建模。在多維數據模型中,包含維度(觀察事物的角度)和事實(觀察得到的事實數據)兩種建模要素。一個主題表達為由多個維度和一組事實數據構成的一個星型模型。
按照建立中考成績數據倉庫的特點來說,主題域為教育管理與決策層關心的分析領域,包括教學管理、教師教學和學生學習等情況。即主題域主要包括教學管理分析主題、教師教學分析主題、學生學習情況分析主題。
(1)教學管理分析主題,主要是分析各縣區、各學校學生的總分、單科成績最高分、平均分;分析總分、單科各成績區段中各縣區、各學校人數占比情況;分析縣區學校單科成績中各班級的差異。
(2)教師教學分析主題,主要是對教師的教學水平、教學方法和手段的分析。包括分析教師的年齡、職稱、性別、學歷等個人因素,以及教師在教學過程中運用的教學方法和手段等對學生成績的影響。具體包括:①同一門課,縱向對比縣區、學校每名教師所帶班級的平均成績;②同一門課,橫向比較縣區、學校每名教師所帶的不同班級的平均成績。
(3)學生學習情況分析主題,主要是根據總成績和單科成績分析不同成績區段學生的日常學習情況差異。比如喜歡閱讀課外書、經常刷課外輔導試卷、經常和同學一起復習研究等個人或團體行為對學生成績的影響。
在本系統中我們選擇以教師教學分析主題作為該系統的分析主題。在教師教學分析主題中,包括時間維、考生維、教師維、縣區學校維、課程維和教師教學事實表。
基于教師教學分析主題的概念模型如圖所示:
2.邏輯模型設計
本系統中對教師教學分析主題進行分析。它的邏輯模型設計主要包括粒度層次劃分、數據表的合理劃分、關系模式的定義、提練表中數據等。在本系統中可以采取單一的粒度設計模式來進行粒度層次劃分。由于主題內各個關系表的數據量不是很大,因此不用進行表的分割。邏輯模型主要使用事實表和各維度表的關系模式來表達。本系統的多維模型采用星型模型。根據概念模型,在本系統中事實表為教師教學情況表,時間表、考生表、教師表、課程表和縣區學校表等為維表。基于教師教學分析主題的邏輯模型如圖所示:
3.物理模型設計
物理模型的設計是指數據在數據倉庫中的存放形式和數據的組織。物理模型是在邏輯模型在計算機中的具體實現方法,也是將前面設計的星型模型的事實表和維表都必須轉變為對應的物理數據表。主要包括表的數據結構類型、索引策略、數據存儲分配等。
在本系統中,基于教師教學分析主題物理模型,可以建立教師教學情況(Teacher_Teach_B)事實表,包括教師編號(Teacher_No)、學生的考生號(ksh)、課程代碼(CourseID)、縣市區代碼(xsqdm)、學校代碼(xxdm)、班級代碼(bjdm)等;并依據邏輯模型建立考生表(KSB)、教師表(TeacherB)、課程表(CourseB)、縣區學校表(XSQXXB)、時間表(YearB)等維表。
三、數據倉庫的構建
本文使用SQL Server 2008 R2數據庫系統構建數據倉庫。首先,創建數據倉庫數據庫。從各縣區、各學校上報的文本、EXCEL、DBF等格式的數據表中提取教師、學生相關的有用信息,結合每年的中考數據,將所有數據源的數據合并在一起,所有數據經過抽取、轉換和裝載3個過程(即ETL)過程,導入獲取的各類數據至數據庫中。其次,利用SQL Server 2008 R2的商業智能項目,根據分析主題以星型模型構建數據倉庫,加載數據庫中數據至數據倉庫,以構成OLAP立方體。最后,使用SQL Server Analysis Services實現數據分析。
四、結束語
學生成績不僅反映了學生的學習效果,更反映了一個地區和一個學校的教學質量,以及一個教師的教學水平與能力。本系統的設計圍繞每年的中考成績,利用數據倉庫技術可以將歷史數據和當前數據進行綜合分析,通過一系列分析,可以為縣市區和學校教學管理、教師教學方法和手段改進完善、學生學習模式改進等方面提供一定的支持。