鄺琬君
近來年,廣州市??多家技工學校開始建立和完善學籍信息管理系統。這些數據庫收集了大量的學生個人資料,通過聯機事務處理(OLTP)將其零散地收集于單個的事務數據庫中。這些數據是指導學校進行教學管理、提高教學質量的重要依據,因此必須建立相應的數據分析模型,設計出一系列的分析工具,把零散的數據轉換成可視的分析結果。
一、建立面向主題和歷史的數據
為了快速搭建學籍信息的數據分析平臺,使數據庫能更好地為數據分析服務,在分析過程中需要建立面向主題和歷史的數據做鋪墊。在分析設計中采用自下向上的數據構建策略,以提高分析結果的正確性和指導性作用。這種策略從最關鍵的部分開始,先以最小的資源完成當前需求,最快獲得回報,然后再不斷擴充。目的是使教學管理部門能合理安排教學計劃和教學資源;學生管理部門能動態更新學生的個人資料和學籍變更信息;就業推薦部門能及時了解學生畢業成績、專業資格證和身體狀況,從而合理地推薦學生就業等等。
二、數據體系結構分析
此體系結構把來自聯機事務處理(OLTP)的源數據,經抽取、轉換、裝載,將離散的外部數據集,配合歷史數據形成新的數據庫集合;以關系數據組織聯機分析處理(OLAP)存儲,用戶查詢工具和數據分析工具直接從數據集中訪問數據。管理平臺對數據庫中的數據進行管理、維護,分析結果可反饋至分析工具,也可在可視化查詢軟件中查看。在分析工具與數據庫之間簡化了OLAP服務的工作,多維數據結構直接融入到數據庫系統中,降低系統開銷,縮減了工作量。圖1為學籍管理數據庫的體系結構圖。

本系統采用C/S架構即客戶/服務器模式,服務器端采用SQL Server 2000數據庫管理系統,管理從其它數據源抽取、裝載的異構數據。將待分析的數據導入系統中,進行數據清理、概念分層、離散化、數值化等處理,用圖、表的形式表現、分析數據。為了使分析結果有更好的指導性作用,要使用合適的算法對數據庫中的數據進行分析和挖掘。通過修改算法中的參數,可以得到不同的分析結果;通過評價所得結果的可信度,循環調用最終獲取滿意的分析結果,用輸出結果指導教學管理實踐。
例如利用考勤信息收集的記錄,通過分析平臺后可以得出各類不同的情況和發展趨勢,利用這些結果可以作適當的調整;使用學生成績數據統計各學科各系的優良率、合格率,各系部按自己需求收取統計結果,指導、調整本部門的工作安排;通過學生綜合信息數據分析和整理,提供補考、畢業辦理以及推薦就業指導信息。還有很多類似的數據分析可以由分析平臺進行統計、分析得出所需的結果。圖2、圖3、圖4為其中幾類信息的簡要分析效果圖。

三、數據分析過程
在實際操作時,系統中的每個分析都必須是面向主題的,離開主題的分析結果就沒有了意義。下面以學生計算機基礎中級考證為主題詳細講述數據分析過程,檢查結果對于教學管理的指導意義。
1. 主題中包括一個事實表和三個維表
事實表是一個包含多屬性值的關系表,是數據庫的核心,通過數據轉換清理工具來提取有用的信息裝入事實表中。在事實表中,需要有度量值來作為數據分析的依據和尺度,度量值一般是數值型,可以進行求和、求平均等簡單的函數計算。本主題的事實表主要反映學生計算機基礎中級考證的成績,如果需要進行更復雜的計算,就需要通過程序中構造算法來實現。
2.考證成績是該主題分析中的度量信息,也是事實表中的事實數據
不同的分析角度對應為不同的維度表,下面的關鍵問題是如何進行層次的劃分。各維表中層次關系的確定是非常重要的,層次將維分成多個抽象層,有利于用戶從不同的角度觀察數據,同時為OLAP提供處理的依據。我們在確定維的層次關系時,主要根據學校組織機構及教學管理系統中與學生考證成績信息相關的表來確定。
(1)學生表。學生分別屬于各班級,而班級本身就存在層次關系,每一專業都包含了多個班級,而每一個教學體系又包括多個專業,這樣一來學生維的層次關系可以為:教學系—>專業—>班級—>學生,這個層次關系是按照概念分層組織的。計算機工程系想了解各班學生的考證通過率,以考核帶考證教師的教學質量、及時調整教學方法和教學計劃;而教務處則想了解全校學生的考證通過率情況,查看是否達到ISO的標準。
(2) 地區表。學生生源是學生的基本信息,從中可以發現不同地區學生的計算機基礎是不相同的。這一發現可以幫助我們改變教學計劃,對基礎較差的班級進行重點訓練,或適當增加課時以提高考證通過率。
(3)教師表。教師維的分析包括教師的姓名、性別、年齡、學歷、職稱、部門、教學經歷等信息。此信息可以顯示教師本身的素質和教學經歷,以合理分配課程,達到資源的最優化配置。
圖2-2采用星型模式來設計維表和事實表,該結構將分布于多張表的信息進行轉換和整合,提取和分析主題關系密切的屬性來形成維表。

學生學籍信息與教學分析、研究基于大量的原始數據積累,在每學年教學結束后根據實際過程進行系統的分析調整,在系統完善和成熟后還可以逐步擴展應用到整個教學過程中。
本系統的分析功能不僅是對學生信息庫、學生成績庫、教務管理庫的分析,還可以對學生的學習日志、教師的教學過程進行跟蹤和分析。系統數據庫的信息通過分析、提取、過濾和生成可視化結果,令學生學籍管理和教學管理產生的教學設計更合理、更具智能性。
(作者單位:廣州市公用事業高級技工學校)