彭紅利PENG Hong-li;王艷WANG Yan
(①西安建筑科技大學(xué),西安 710055;②西安航空職業(yè)技術(shù)學(xué)院,西安 710089)
(①Xi'an University of Architecture and Technology,Xi'an 710055,China;②Xi'an Aeronautical Polytechnic Institute,Xi'an 710089,China)
我國的高等教育研究從20 世紀90年代到現(xiàn)在,經(jīng)過了信息時代開始走向一個新的階段,更加的國際化,在教育研究方面表現(xiàn)出越來越多的技術(shù)化和專業(yè)化?,F(xiàn)在的高等教育研究越來越多的使用到互聯(lián)網(wǎng)和數(shù)據(jù)庫,這就是研究技術(shù)化的集中體現(xiàn)。一些大學(xué)從很早的時候就開始基于計算機化和網(wǎng)絡(luò)化開展各項事務(wù),比如學(xué)生注冊選課系統(tǒng)、交費系統(tǒng)、工資系統(tǒng)、財務(wù)系統(tǒng)等,這對于高等教育研究來說是前進的一大步。而且在大學(xué)管理的很多個領(lǐng)域都可以應(yīng)用到這些理論和模式,比如規(guī)劃研究、學(xué)生事務(wù)的研究、財政狀況的研究、教師事務(wù)的研究等。這也是目前美國院校研究所涵蓋的六個主要研究內(nèi)容。
我國的商業(yè)智能技術(shù)要遠遠的落后于一些發(fā)達國家。與此有關(guān)的一些研究報告顯示,在2006年,世界上的商業(yè)智能系統(tǒng)的市場規(guī)模已經(jīng)達到了140 億美元。這個商業(yè)智能系統(tǒng)在國外被應(yīng)用的比較廣,而且很成功,比如借助了商業(yè)智能系統(tǒng)的cadbury 巧克力公司,它的市場份額就在很短的時間內(nèi)提升了2%等,還有很多這樣成功的應(yīng)用商業(yè)智能系統(tǒng)的案例。
現(xiàn)階段我國的高等教育信息化主要體現(xiàn)在三個方面:一是包括檔案、人事考勤等在內(nèi)的行政管理類;二是包括教務(wù)系統(tǒng)、就業(yè)管理、新生入學(xué)管理等在內(nèi)的教學(xué)教輔類;三是包括水電繳費、上機管理、門禁管理、校園網(wǎng)繳費在內(nèi)的一卡通應(yīng)用類。并且這每個系統(tǒng)之間都是一個獨立的個體,它們的結(jié)構(gòu)、分布情況都是不一樣的,這無疑會給信息的整理工作帶來很多的挑戰(zhàn)。如果高校的領(lǐng)導(dǎo)想整體的了解一下高校的狀況,沒有的一個直接的途徑,必須先進入每個系統(tǒng),然后再通過手工整理每個系統(tǒng)中的信息和數(shù)據(jù),最后匯總起來才可以。所以,現(xiàn)在很多的高校開始把各種應(yīng)用系統(tǒng)整合在一起,建立一種統(tǒng)一的信息門戶,實行單點登錄,只有這樣,數(shù)據(jù)的整合工作才能變得方便和快捷。
總之,雖然采用商業(yè)智能技術(shù)對高校的信息整合工作很有益處,但是現(xiàn)階段在我國的普及面還不是很廣,甚至一些高校還僅僅處在起步階段。所以以高等教育院校積極的普及這種商業(yè)智能系統(tǒng),為更多的用戶提供決策支持。
2.1 研究內(nèi)容
2.1.1 學(xué)生事物的研究 按系部或二級學(xué)院按班級對學(xué)生個人全部信息,學(xué)生每學(xué)期所選課程,學(xué)生每學(xué)期各門功課考試成績。
2.1.2 教師事物的研究 按系部或二級學(xué)院對教師個人信息,教師工資和課時費,教師每學(xué)期所上的課程,課程名稱和課時,教師每年的科研項目,發(fā)表論文。
2.2 關(guān)鍵技術(shù)
2.2.1 數(shù)據(jù)倉庫建立 數(shù)據(jù)倉庫實際上是一個“以大型數(shù)據(jù)管理信息系統(tǒng)為基礎(chǔ)、附加在這個數(shù)據(jù)庫系統(tǒng)之上地、存儲了從企業(yè)所有業(yè)務(wù)數(shù)據(jù)庫中獲取的綜合數(shù)據(jù)的、并能利用這些綜合數(shù)據(jù)為用戶提供經(jīng)過處理后的有用信息的應(yīng)用系統(tǒng)”,它絕不僅僅是一個簡單的信息庫。
ETL (ExtractionTransformationLoading) 就是抽取、清洗、轉(zhuǎn)換、裝載,是數(shù)據(jù)倉庫在實現(xiàn)過程中,將數(shù)據(jù)由數(shù)據(jù)源系統(tǒng)并向數(shù)據(jù)倉庫系統(tǒng)加載的主要過程。ETL 過程關(guān)系勤數(shù)據(jù)地質(zhì)量,這是非常重要的一個環(huán)節(jié),它是數(shù)據(jù)整合的解決方案,也是建立數(shù)據(jù)倉庫系統(tǒng)的關(guān)鍵一環(huán)。用戶從數(shù)據(jù)源抽取出所需的數(shù)據(jù)以后,經(jīng)過對數(shù)據(jù)清洗,最終按照預(yù)先定義好的數(shù)據(jù)倉庫的模型,將數(shù)據(jù)加載到數(shù)據(jù)倉庫中去。
2.2.2 聯(lián)機分析處理 1993年關(guān)系數(shù)據(jù)庫之父(EECodd)首先提出了聯(lián)機分析處理 (on -LineAnalytiealProcessing,oLAp),這是一種能夠為準確定義多維模型、操縱多維立方體提供技術(shù)基礎(chǔ)。這項技術(shù)是孕育用戶分析大型數(shù)據(jù)庫對數(shù)據(jù)包含信息深入洞察的技術(shù)。OLAP 具有匯總、合并和聚集的功能,它還能夠從不同的角度觀察信息,它是一種分析技術(shù)。但是在采用OLAP 的工具的時候需要其他分析工具的輔助,它雖然支持多維分析和決策,也可以進行深層次的分析,但只是靠OLAP 是不能的。
2.2.3 數(shù)據(jù)挖掘 通過分析和分類大量的歷史和存儲數(shù)據(jù),可以發(fā)現(xiàn)有效的數(shù)據(jù)模式與關(guān)系的過程就是數(shù)據(jù)挖掘(DataMining,DM),其中還包括過去和預(yù)測未來趨勢的有用信息。數(shù)據(jù)挖掘是一門涉及面很廣的交叉性學(xué)科,包括機器學(xué)習(xí)、數(shù)理統(tǒng)計、神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)庫、模式識別、粗糙集、模糊數(shù)學(xué)等相關(guān)技術(shù),同時它也是一種發(fā)掘型的工具、是一種決策支持的過程。數(shù)據(jù)挖掘可以做到聯(lián)機分析處理所不能做到的工作,它可以發(fā)現(xiàn)復(fù)雜精細的答案。
數(shù)據(jù)挖掘能夠作為一種依據(jù),利用預(yù)定的規(guī)則,它可以幫助挖掘和分析數(shù)據(jù)庫和數(shù)據(jù)倉庫中的已有數(shù)據(jù),然后識別與抽取出隱含的模式和有趣的知識,決策者在決策時往往會參考此項數(shù)據(jù)。從數(shù)據(jù)中發(fā)現(xiàn)模式是數(shù)據(jù)挖掘的目的,模式按照功能的不同可以被分成兩大類:預(yù)測型(Predictive)模式、描述型(Deseriptive)模式。
2.3 研發(fā)目標 在高等院校的校園網(wǎng)站上,根據(jù)用戶的不同需求,可以直接抽取原始數(shù)據(jù),生成相關(guān)的數(shù)據(jù)報表或者是數(shù)據(jù)分析圖。
項目將采用商業(yè)智能將高校信息系統(tǒng)中的數(shù)據(jù)轉(zhuǎn)化為知識,幫助學(xué)校高層領(lǐng)導(dǎo)做出一些重要決策。
3.1 技術(shù)方案 本項目的研究工作主要包括商業(yè)智能理論分析,商業(yè)智能活動圖如圖1 所示,商業(yè)智能架構(gòu)圖如圖2 所示。實現(xiàn)商業(yè)智能的步驟是建立數(shù)據(jù)倉庫、根據(jù)主題建立數(shù)學(xué)模型,數(shù)據(jù)挖掘及產(chǎn)生數(shù)據(jù)分析結(jié)果。
①在進行商業(yè)智能系統(tǒng)的總體架構(gòu)設(shè)計前,需要先進行需求分析。
②在數(shù)據(jù)倉庫設(shè)計的過程中,應(yīng)該注意一些問題。比如分析不同用戶的主題時,應(yīng)該先分析同類數(shù)據(jù)源和異類數(shù)據(jù)源的不同,并對用戶的需求進行一個充分的掌握;建立面向主題的數(shù)據(jù)倉庫時,應(yīng)選擇MicrosoftSQLServer2005數(shù)據(jù)庫管理系統(tǒng);海量的數(shù)據(jù)可能會對數(shù)據(jù)倉庫的應(yīng)用和性能帶來一定的影響,這時可以采取分區(qū)表技術(shù)解決。
③設(shè)計ETL 程序包應(yīng)該以SQLServer2005 的5515 服務(wù)為基礎(chǔ),然后創(chuàng)建一個中間數(shù)據(jù)庫,對多個業(yè)務(wù)系統(tǒng)數(shù)據(jù)源進行抽取、清洗、轉(zhuǎn)換、加載,在這個過程中也應(yīng)該考慮到ETL 程序包的執(zhí)行效率優(yōu)化的問題。

圖1 商業(yè)智能活動圖

圖2 商業(yè)智能架構(gòu)圖
④研究相關(guān)的OLAM 相應(yīng)理論,在數(shù)據(jù)倉庫的基礎(chǔ)上,利用SQLserver2005 的SSAS 服務(wù),創(chuàng)建了面對主題的多維分析模型,并對其進行了分析;以sQL server2005 數(shù)據(jù)挖掘的流程為指導(dǎo),在多維分析模型的基礎(chǔ)上創(chuàng)建了挖掘模型,面對探討的問題,討論了基于MierosoftsQLserver2005的決策樹算法,實現(xiàn)了基于OLAM 技術(shù)的各類指標的查詢、分析與挖掘。
⑤要想展現(xiàn)數(shù)據(jù)的多樣化,那么系統(tǒng)前端數(shù)據(jù)展現(xiàn)平臺應(yīng)該采用SQLServer2005 Reportserviees。
3.2 創(chuàng)新點
①提出將商業(yè)智能應(yīng)用于高校信息系統(tǒng)。目前商業(yè)智能系統(tǒng)已經(jīng)隨著高校校園信息化進程的推進而得到了廣泛的應(yīng)用,但是各應(yīng)用系統(tǒng)的數(shù)據(jù)是分布的、異構(gòu)的、彼此獨立的,信息不能互通。本項目研究有效解決各種應(yīng)用系統(tǒng)的數(shù)據(jù)整合問題。
②本項目提出了以數(shù)據(jù)倉庫技術(shù)為核心、以聯(lián)機分析處理技術(shù)和數(shù)據(jù)挖掘技術(shù)為手段的商業(yè)智能解決方案。它可以滿足各種不同用戶的需求,最終形在報表和統(tǒng)計分析圖,也可以用于指導(dǎo)學(xué)校高層領(lǐng)導(dǎo)的重要決策。
[1]蔣萌.中職學(xué)校數(shù)字化校園建設(shè)的實踐探索[J].浙江現(xiàn)代教育技術(shù),2009(01).
[2]劉小波,陳志民,葉志嬋,劉華日.無線網(wǎng)絡(luò)在數(shù)字化校園中的應(yīng)用[J].現(xiàn)代計算機(專業(yè)版),2010(04).
[3]楊福燕.多媒體網(wǎng)絡(luò)教學(xué)之探討[J].科技信息,2009(17).