嚴(yán)衛(wèi)
(常熟理工學(xué)院計(jì)算機(jī)科學(xué)與工程學(xué)院,江蘇常熟 215500)
基于數(shù)據(jù)倉(cāng)庫(kù)的高校就業(yè)信息管理系統(tǒng)
嚴(yán)衛(wèi)
(常熟理工學(xué)院計(jì)算機(jī)科學(xué)與工程學(xué)院,江蘇常熟 215500)
在現(xiàn)有的高校學(xué)生就業(yè)信息管理系統(tǒng)基礎(chǔ)上,增設(shè)了就業(yè)信息數(shù)據(jù)分析模塊,該模塊具有基本信息管理、后臺(tái)信息管理、維度分析、就業(yè)趨勢(shì)預(yù)測(cè)等功能.利用SQL Server 2005數(shù)據(jù)倉(cāng)庫(kù)技術(shù)創(chuàng)建多維數(shù)據(jù)模型,實(shí)現(xiàn)多維分析.
就業(yè);模塊;數(shù)據(jù)倉(cāng)庫(kù)
原就業(yè)信息管理系統(tǒng)作為就業(yè)平臺(tái),主要是獲取信息和發(fā)布信息,功能比較簡(jiǎn)單.筆者在現(xiàn)有的系統(tǒng)上開(kāi)發(fā)了一個(gè)數(shù)據(jù)分析模塊,運(yùn)用數(shù)據(jù)倉(cāng)庫(kù)及OLAP技術(shù)對(duì)高校就業(yè)信息數(shù)據(jù)進(jìn)行分析和處理,增強(qiáng)高校就業(yè)信息管理系統(tǒng)處理分析數(shù)據(jù)的功能.
1.1 高校就業(yè)信息管理系統(tǒng)的功能結(jié)構(gòu)
現(xiàn)有的高校就業(yè)信息管理系統(tǒng)由角色權(quán)限管理,單位信息管理,招聘信息管理,學(xué)生信息管理,供需見(jiàn)面會(huì)管理,校園專場(chǎng)招聘管理,信息發(fā)布新聞管理,專家?guī)旃芾淼炔糠謽?gòu)成.增設(shè)就業(yè)信息數(shù)據(jù)分析模塊后的高校就業(yè)信息管理系統(tǒng)功能結(jié)構(gòu)如圖1所示.
1.2 就業(yè)信息數(shù)據(jù)分析模塊的功能結(jié)構(gòu)
高校就業(yè)信息分析模塊的功能包括基本信息管理、后臺(tái)信息管理,維度分析以及就業(yè)趨勢(shì)四部分(如圖2).
(1)基本信息管理:主要包括單位性質(zhì)、就業(yè)行業(yè)信息、就業(yè)分布信息、教育情況信息、學(xué)生基本情況等信息的管理操作.
(2)后臺(tái)信息管理:主要是管理員對(duì)于已審核通過(guò)的用戶做權(quán)限增加或減少的設(shè)置以及賬號(hào)管理等操作.
(3)維度分析:按照實(shí)際需求情況,對(duì)數(shù)據(jù)進(jìn)行多方位的維度分析,最后以報(bào)表的形式展現(xiàn)出來(lái).
(4)就業(yè)趨勢(shì)預(yù)測(cè):詳細(xì)分析就業(yè)信息,通過(guò)數(shù)據(jù)導(dǎo)航和靈活的OLAP分析對(duì)其進(jìn)行趨勢(shì)預(yù)測(cè).

圖1 高校就業(yè)信息管理系統(tǒng)功能結(jié)構(gòu)圖
1.3 就業(yè)信息數(shù)據(jù)分析模塊的數(shù)據(jù)處理流程
就業(yè)信息數(shù)據(jù)分析模塊的處理流程是:把需要處理的數(shù)據(jù)庫(kù)和外部數(shù)據(jù)通過(guò)數(shù)據(jù)整理,進(jìn)入ODS數(shù)據(jù)庫(kù)元數(shù)據(jù),然后運(yùn)用OLAP的多角度分析后,最后以報(bào)表形式提供給決策者.數(shù)據(jù)處理流程如圖3所示.
操作數(shù)據(jù)源是整個(gè)系統(tǒng)的數(shù)據(jù)基礎(chǔ)也是系統(tǒng)體系結(jié)構(gòu)的最底層.一般來(lái)說(shuō),其來(lái)源是基于OLTP(On-Line Transaction Processing)的操作性數(shù)據(jù).
ODS(Operational Data Store)數(shù)據(jù)庫(kù)維持著一個(gè)分析型的環(huán)境,具有面向主題的特征,它由操作型環(huán)境中分散的DB記錄經(jīng)過(guò)濾后形成ODS系統(tǒng)的記錄系統(tǒng),向ODS系統(tǒng)中提供數(shù)據(jù).
OLAP分析服務(wù)器是一個(gè)經(jīng)過(guò)特殊設(shè)計(jì),用于支持和管理多維數(shù)據(jù)結(jié)構(gòu)的高性能、多用戶的數(shù)據(jù)處理引擎.多維數(shù)據(jù)結(jié)構(gòu)是將原始數(shù)據(jù)按維度進(jìn)行整理后所得的結(jié)果,其中的數(shù)據(jù)項(xiàng)訪問(wèn)需根據(jù)定義該項(xiàng)的維度成員來(lái)訪問(wèn).該多維數(shù)據(jù)結(jié)構(gòu)能夠靈活、快速地處理原始數(shù)據(jù),且對(duì)各種查詢具有一致的響應(yīng)速度. OLAP的應(yīng)用過(guò)程就是“數(shù)據(jù)一信息一知識(shí)一計(jì)劃一行動(dòng)”的過(guò)程.
1.4 就業(yè)信息數(shù)據(jù)分析模塊的邏輯模型設(shè)計(jì)
就業(yè)信息數(shù)據(jù)分析模塊的邏輯模型采用星型模型.星型模型是由中心向外輻射的結(jié)構(gòu),一個(gè)主題對(duì)應(yīng)一個(gè)星型模型,模型中心的對(duì)象稱為事實(shí)表(Fact Table),與之相連的對(duì)象稱為維度表(Dimen?sion Table).一個(gè)簡(jiǎn)單的星型模型由一個(gè)事實(shí)表和若干個(gè)維度表組成,如圖4所示.
事實(shí)表是由維度表的主鍵和度量值組成的,在做事實(shí)表時(shí)要注意兩點(diǎn):第一、事實(shí)表中要記錄數(shù)據(jù)分析用到的所有基本數(shù)據(jù).第二、數(shù)據(jù)的記錄方式要以業(yè)務(wù)需求為準(zhǔn),有什么樣的主題就要做什么樣的事實(shí)表.事實(shí)表中除了包括那些用于分析的數(shù)據(jù)外,還有一個(gè)或多個(gè)外鍵,他們是聯(lián)系事實(shí)表和數(shù)據(jù)維度表之間的紐帶.表1是畢業(yè)生事實(shí)表.
維度表中存放的是對(duì)事實(shí)表中度量的描述,里面的信息包括字段名稱、數(shù)據(jù)類型、長(zhǎng)度、主鍵、是否允許空、字段說(shuō)明.每張維度表除包含每一維的主鍵,還有說(shuō)明該維的一些屬性字段,維度表中的數(shù)據(jù)由維度表主鍵和描述實(shí)體的文本數(shù)據(jù)組成.
在就業(yè)信息分析模塊(圖5中)的邏輯模型結(jié)構(gòu)中,“畢業(yè)生”事實(shí)表位于模型連接的中心,存儲(chǔ)了大量的數(shù)據(jù),在“畢業(yè)生”事實(shí)表的周圍分別是“性別”、“專業(yè)”、“民族”、“畢業(yè)去向”、“單位名稱”、“學(xué)歷”、“培養(yǎng)方式”、“政治面貌”、“單位所在地”、“學(xué)籍變動(dòng)”、“畢業(yè)生”等11個(gè)維度表.

圖2 就業(yè)信息數(shù)據(jù)分析模塊的功能結(jié)構(gòu)圖

圖3 數(shù)據(jù)處理流程

圖4 星型模型結(jié)構(gòu)示意圖

圖5 就業(yè)信息分析模塊的邏輯模型

表1 畢業(yè)生事實(shí)表
通過(guò)就業(yè)信息數(shù)據(jù)分析模塊,可以實(shí)現(xiàn)數(shù)據(jù)導(dǎo)航和靈活的OLAP分析,包括切片、切塊、上鉆、下鉆和交互式圖表,為決策者提供了友好的圖形界面,為數(shù)據(jù)探查和決策制定提供了一個(gè)直觀的環(huán)境,使得各個(gè)層次的分析數(shù)據(jù)都可以流暢的在決策者面前呈現(xiàn).并可提供多種可視化方式來(lái)展示分析結(jié)果.數(shù)據(jù)分析效果如圖6、圖7.
本文對(duì)高校就業(yè)信息管理系統(tǒng)進(jìn)行了改進(jìn)設(shè)計(jì),增加了一個(gè)就業(yè)信息分析模塊,將數(shù)據(jù)倉(cāng)庫(kù)與OLAP技術(shù)應(yīng)用于高校就業(yè)信息數(shù)據(jù)分析中.和原來(lái)的系統(tǒng)相比,功能更加完善實(shí)用,尤其是對(duì)海量數(shù)據(jù)可以進(jìn)行多維分析,為高校管理層提供準(zhǔn)確的信息.

圖6 學(xué)科專業(yè)數(shù)據(jù)分析效果圖

圖7 圖形報(bào)表
參考文獻(xiàn):
[1]InmonW H.數(shù)據(jù)倉(cāng)庫(kù)[M].北京:機(jī)械工業(yè)出版社,2006:20-24.
[2]胡耀民,余明輝.商務(wù)智能系統(tǒng)模型的研究和應(yīng)用[J].計(jì)算機(jī)與現(xiàn)代化,2010(3):58-61.
[3]陳京民.數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)[M].北京:電子工業(yè)出版社,2007:93-100.
[4]Ralph K,Joe C.The DataWarehouse ETL Toolkit:Practical Techniques for Extracting,Cleanin[M].W iley,2004:29-48.
[5]張中平,徐佑軍.OLAP技術(shù)在電信領(lǐng)域中的應(yīng)用[J].計(jì)算機(jī)工程與設(shè)計(jì),2005,26(7):1950-1952.
[6]吳遠(yuǎn)紅.ETL執(zhí)行過(guò)程的優(yōu)化研究[J].計(jì)算機(jī)科學(xué),2007,34(1):81-83.
[7]朱德利.SQLServer 2005數(shù)據(jù)挖掘與商業(yè)智能完全解決方案[M].北京:電子工業(yè)出版社,2007:77-80.
[8]陳文偉,黃金才.數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘[M].北京:人民郵電出版社,2004:54-55.
[9]李紅良.智能決策支持系統(tǒng)的發(fā)展現(xiàn)狀及應(yīng)用展望[J].重慶理工大學(xué)學(xué)報(bào):自然科學(xué)版,2009,23(10):140-144.
[10]金芳.淺談數(shù)據(jù)倉(cāng)庫(kù)技術(shù)在電信行業(yè)中的應(yīng)用[J].長(zhǎng)春大學(xué)學(xué)報(bào):自然科學(xué)版,2009,19(6):68-69,75.
An Analysis of College Employment Information Data Based on the Data Warehouse Management System
YANWei
(School of Computer Science and Engineering,Changshu Institute of Technology,Changshu 215500,China)
Based on the study of College Employment Information Management System,the employment informa?tion analysismodule is added,which is capable ofmanaging basic information and background programs,analyz?ing data in various dimensions as well as forecasting career trends.Multi-dimensional analyses are realized by means of SQL Serve 2005 data warehouse technology ofmulti-dimensional datamodel.
employment;module;data warehouse
TP311.13
A
1008-2794(2012)08-0114-04
2012-05-21
嚴(yán)衛(wèi)(1980—),男,江蘇常熟人,助理實(shí)驗(yàn)師,碩士,研究方向:計(jì)算機(jī)技術(shù)、數(shù)據(jù)挖掘.