徐琦
(陜西師范大學網絡信息中心,陜西西安710119)
基于大數據的高校數據整合模式研究*
徐琦
(陜西師范大學網絡信息中心,陜西西安710119)
面對“大數據”時代給高校數據整合帶來的挑戰,本文從組織維度、數據維度、技術維度三方面對高校數據整合模式進行研究,為高校數據整合工作提供新思路,嘗試建立高校數據統一規范管理的組織架構,通過對高校主要數據模型的梳理,提供統一的基于云的高校數據整合和共享平臺,實現高校內部數據的整合和共享,為教學、科研、管理提供數據決策支撐,提高高校的信息化水平。
數據整合;大數據;云存儲
隨著大數據時代的到來,高校的數據資源呈幾何級數的增長,但由于高校數據普遍存在缺乏統一的管理規范、數據一致性差、數據格式各異、數據鏈不完整的問題,使得大量優秀數據無法共享和利用,無法獲得更大程度的價值。在此背景下,基于大數據的高校數據整合模式研究,特別是消除高校的“信息孤島”,提高數據資源利用效率,使原來分散、利用率低下的教育資源得到更大程度的價值挖掘,為高校的發展戰略和決策提供科學的依據都有重大的意義。
研究機構“Gartner”給大數據的定義是,大數據是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。大數據的戰略意義不在于掌握龐大的數據信息,而是對這些含有意義的數據進行專業化處理。而高校面對大數據時代的到來,如何對高校招生、就業、教學、管理等各種實踐活動中產生的具有保存價值的數據進行大數據整合和繼承管理,并利用大數據處理技術進行這些信息的挖掘、整理、分析,為高校的發展提供決策支持,是下一步學校信息化發展的重點工作。
近年來,從國家、區域到高校等不同層面都在加快信息化建設步伐,建立學校內部統一的公共數據平臺,部分985、211重點院校已經初步建成了支撐學校日常運行的校級統一信息系統,建成了包括信息門戶、統一用戶管理與身份認證、統一權限管理與控制、數據共享與交換、綜合信息服務平臺等在內的公共基礎平臺,在信息化教學、資源和應用系統建設都有了長足的進步,但是高校數據整合工作仍然面臨著諸多難題和挑戰。
1.數據資產意識薄弱
數據作為高校重要的無形資產和戰略資源,其利用的水平高低可以直接反應一個高校的教學科研水平、管理能力,同時又是提高高校競爭力的有效手段。而高校內部還存在重視信息系統建設,對高校數據建設意識薄弱,沒有認識到數據也是高校的寶貴資產,將會在學校教學科研管理中發揮重要的作用,導致高校內部業務系統眾多,但數據并沒有統一管理制度,存在管理混亂、不一致的現象,有價值的數據資產不能發揮其重要作用。面對大數據的沖擊,要求高校內部從上到下不斷調整思維模式,在思想和行動上重視數據,樹立大數據、大檔案、大資源的思想意識,實現數據的統一管控,提高數據質量和數據的利用效率,提供安全、完整、統一的數據服務,為學校教學、科研、管理提供信息服務和技術保障。
2.數據缺乏規范性和統一管理
經過長時間的信息化建設,目前高校內部形成了多個業務系統,但這些系統之間在應用或數據等層面上是彼此分離的,分別采用了不同的架構及其開發技術。同時各業務系統的數據維護及管理工作缺乏統一管理,導致不同部門之間的數據存在不一致性、差異性,更有甚者兩個部門發布的數據甚至出現沖突的情況。因此確定數據的唯一性和權威部門、規范同一數據的格式及做好數據清洗和整理工作是高校數據中心整合過程中工作量最大也是最為重要的內容。
3.數據管理安全性不高
高校業務系統普遍存在各自為政、應用系統之間無法實現共享和利用、應用系統的數據存在服務器或存儲中、沒有統一的安全規劃、存儲的安全性無法保證等問題。有些高校已經有了數據中心,但是數據中心的數據管理缺乏安全性管理,普遍缺乏密級劃分,涉密數據和一般數據沒有區別對待,加密數據沒有做安全措施的防護。因此在高校數據整合過程中,如何加強數據的安全管理是亟待解決的重要問題。
4.數據在高校的價值沒有很好的體現
通過高校內部數據的整合應用,可以有效提高數據的利用率和價值,從而優化高校內部的管理結構,數據不僅僅在各自業務系統發揮作用,還可以通過對高校數據的有效整合并通過對這些數據的挖掘、分析和預測,從而優化高校內部的管理結構,如圖1所示,通過數據整合將高校內部行政、教學、服務等部門從繁雜的事務性管理中解脫出來,從而關注于本部門的業務職能,并為部門及整個學校的發展提供決策支持。

圖1 高校管理衍進圖
在此背景下,基于大數據的高校數據整合模式研究,可以統一數據的標準,規范數據的管理,提高數據的安全性,提高數據資源的利用效率,使原本分散、利用率低下的教育資源得到更大程度的價值挖掘,為高校的發展戰略規劃決策提供科學的依據。針對高校內部的數據整合,本文從三個維度進行了整合的模式設計,分別是組織維度、數據維度、技術維度。
1.組織維度
很多高校在信息化建設初期投入大量經費用于購置各種軟件、應用系統、鋪設網絡,卻并沒有對信息化工作進行統籌規劃,導致了很多部門的系統各不兼容,造成資源浪費,或是只注重信息化的形式,并不重視內容,導致很多信息化管理模塊內容空洞,更新速度慢,而且更為突出的是缺乏規范的管理機構,并沒有實現統一規劃、統一管理,影響了信息化的質量和效率。
考慮到各個高校實際情況的不同,組織維度上的整合也有所不同,但基本的組織原則可以歸納為:整體規劃、統一部署、分級把關。校級組織部門對數據的建立、使用,信息系統的開發、整合建立統一的規范和審批機制。部門級組織機構負責單位內部數據管理及與其他單位數據集成、整合的具體工作。根據各個高校信息化建設的推進情況,逐步建立完善校級、部門級的數據管理機構,從而為數據整合建立上下一致的組織管理體系。由于高校數據整合是一項全局性工作,涉及到學校的各個部門。各高校主要領導要牽頭成立專門機構,強化對數據整合工作的組織領導和統籌協調,制定工作制度,明確時間節點,劃分責任主體,加強考核督導,確保數據整合工作順利開展。
建議高校成立數據管理領導小組,該機構的主要職能是通過行政組織手段,遵循數據應用的基本規律,在充分利用現有數據基礎上,對學校數據進行整合、共享、利用和有效管理,解決數據碎片化、信息孤島問題,建立學校統一的數據中心,減少資源的浪費,保護高校的信息化投入,使得高校數據資源可以有效利用,為高校教學、科研、管理服務。該組織架構為:
(1)組長一名:由高校校長牽頭,保證其權威性。副組長一名,由分管信息化部門的副校長擔任,負責數據整合和管理工作的統籌、組織、協調和重大問題的決策。
(2)組內成員由高校各院系、處室分管信息化領導兼任,一方面保證學校整體部署數據整合工作的順利實施,另一方面可以及時反饋各部門數據整合過程中的問題。
(3)小組下設辦公室,掛靠高校信息化主管部門,具體負責學校數據資源整合共享管理的日常工作。
高校內各部門可以優勢互補,實現不同類型的大數據資源的優質整合。其次在高校內部各部門建立數據管理機構,將數據整合和管理工作常態化,該機構由各部門信息化分管領導直接領導,并對學校數據管理領導小組負責,貫徹學校數據整合的統一部署,協調部門內部工作。該機構的成員可以考慮二級單位原有的信息系統管理、網絡設備管理人員,避免部門內部人員的內耗,從而確保管理職能的統一、高效。另外,將各二級單位數據整合工作,納入各單位年終評價體系中,切實保障學校數據整合工作的效果。
2.數據維度
為充分挖掘大數據的潛在價值,高校數據整合首先明確哪些數據應納入移交范圍,歸檔范疇,區分基礎數據和專屬數據,從數據源頭保證數據的準確性和一致性。從高校業務和現有數據特性出發,凡是學校在招生、就業、教學、財務、黨政管理等各種實踐活動中形成的具有保存價值的數據都是數據集成管理的重點。
高校數據模式包括教育部發布的教育信息化行業標準在內的參照模型及數據,公共的標準以及滿足各業務部門需要的校級標準模型及數據,各項業務活動的共享數據集模型。共享數據模式主要包括:教職工數據子模式、學生數據子模式。
(1)以教職工為核心的數據模式
教工基本信息:職工號、姓名、出生年月、性別、工作年月、報到年月、民族、政治面貌、婚姻狀態、單位、職稱、學位、學歷、從事專業。
附加信息:工作經歷、學習經歷、家庭情況、配偶情況、獎勵情況、處罰情況。
考核信息:年度考核、崗位考核。
合同信息:檔案合同、崗位合同、引進合同、臨時合同。
教學信息:教學情況、導師信息、教學論文等。
科研成果:科研項目、科研成果、科研論文、專利等。
培訓培養:獎教金、攻讀碩博、在職培訓、繼續教育。
福利信息:三金、崗位津貼、基本工資。
人員變動:校內調動、干部任免、聘用信息、人員離校。
(2)以學生為核心的數據模式
學生基本信息:學號、姓名、民族、籍貫、政治面貌、院系、專業、身份證號、聯系方式。
附加信息:學習簡歷、家庭情況。
學籍信息:轉校、轉專業、休學、復學。
選課成績:選課、成績、已修學分。
獎懲信息:學生榮譽稱號、優秀畢業生、學生處分等等。
學生檔案:檔案接收、檔案傳遞。
畢業信息:畢業辦理、畢業證書、學位證書、協議書及去向。
活動信息:思想政治教育、社團活動、文體娛樂、能力培養、學生會活動。
一卡通:圖書館、食堂、財務、醫療保健。
住宿:住宿安排、住宿操行評定。
資助:貧困生信息、助學金、勤工助學、貸款、減免學雜費。
3.技術維度
數據的整合離不開技術的支撐,可以說高校信息化建設和數據的應用是伴隨著計算機信息技術的變革不斷發展的。傳統的高校信息化和數據應用采用的是網絡平臺統一建設,業務平臺各自建設的模式,在短短的幾年間,各高校的網絡基礎建設水平得到了快速的發展,萬兆核心、千兆出口,數據中心逐步建立,原有的網絡瓶頸、硬件性能得到了很大的改善。與之形成鮮明對比的是校園業務系統和數據應用在硬件設備、網絡帶寬極大改善的同時,并沒有對高校各部門的工作質量和效率進行有效提升,應用系統發揮的作用沒有取得預期的效果,同時硬件設備投資大、維護成本高和利用率低之間的矛盾,數據幾何基礎增長和數據利用率差、存儲分散、一致性差的矛盾日益突出。
隨著云計算概念的提出和應用,為高校數據整合提供了新的思路和技術支撐。云計算既是一種商業模式,也是一種技術模式。云計算主要包括IaaS(基礎設施即服務)、PaaS(平臺即服務)、SaaS(軟件即服務)三種服務模式。通過云計算技術對高校數據進行有效整合,最終在高校內部建立統一的數據中心平臺,其結構可以參考圖2。

圖2 基于云的高校數據中心平臺
(1)基礎數據平臺:主要解決數據存、取的問題,將現有各院系、各業務部門的系統公共數據進行整合、歸檔,例如:人事基礎信息、學生信息等,建立全校統一的基礎數據平臺。該平臺一方面為學校各個業務部門提供數據支撐,保持數據的一致性,另一方面各業務平臺在使用基礎數據的同時,又通過統一的數據接口更新平臺上的動態數據和相關文件,最后通過其平臺內部的數據整合機制,完成對數據的統一處理。
(2)業務支撐數據平臺:主要解決數據利用的問題,校內各部門根據業務需要在學校的統計規劃下建立各自的分系統,例如人事管理系統、學籍管理系統、就業分配系統等,系統從基礎數據平臺取得靜態數據,更新基礎平臺動態數據,并從基礎平臺中取得整合過的業務分析數據,為管理決策提供依據。
(3)管理決策數據平臺:是數據真正為決策服務所提供的支撐應用平臺,管理決策的數據平臺由決策的需求驅動,其決策可以是各部門內部決策,也可以是跨部門的校級決策,通過對業務支撐數據平臺和基礎數據平臺的整合數據進行分析,通過數據之間的關聯,預測業務發展的方向,找出決策需要的關鍵數據。
通過業務集成、數據整合來建立基于云的數據中心平臺,降低各個業務系統間的耦合度,增強業務系統間的協作關系;通過建立統一的數據標準,遵循數據間操作的規范協議,組成數據服務云,向其他業務系統提供數據服務;通過數據轉換、遷移、共享,將數據整合起來,消除高校信息化中存在的信息孤島現象,有效地提高數據的使用率。之后,如何將這些數據真正的利用起來,發揮重要的決策作用,是高校信息化下一步的重要工作。
本文基于大數據提出了高校數據整合模式,通過組織、數據、技術三個維度對高校數據整合進行了研究,為高校數據整合工作提供了新思路。高校數據整合水平不僅體現了高校教育信息化的程度,也反映了決策者的對現代教育發展趨勢高瞻遠矚的水平,更是衡量學校辦學能力和教學科研水平的重要標準之一。
[1]唐蓉君,熊忠陽.高校數據中心建設探索與實踐[J].中山大學學報(自然科學版),2009(3).
[2]李恒貝,唐惠燕,毛莉菊.基于數據整合的高校信息標準構建研究[J].中國教育信息化,2011(15).
[3]曾雪梅,許春,粟海.基于IDM的高校數據整合分析與實現[J].微計算機信息,2011(27).
[4]劉志亮,張金隆.基于教育云的教育信息資源整合框架研究[J].情報雜志,2013(10).
[5]楊文正,熊才平,江星玲,周杰.公共服務外包視角下教育信息資源供給模式研究[J].電化教育研究,2013(11).
[6]楊鹍.基于語義的金融行業大數據整合及處理技術[J].浙江大學碩士學位論文,2013.
[7]白如江,冷伏海.大數據時代科學數據整合研究[J].情報理論與實踐,2014(1).
[8]陳文東.高等教育信息資源共享中的政府角色研究[J].湖南師范大學碩士學位論文,2014.
[9]楊文正.基礎教育信息資源優化配置模式與機制研究[J].華東師范大學博士學位論文,2014.
[10]榮榮,楊現民,陳耀華,趙秋錦.教育管理信息化新發展:走向智慧管理[J].中國電化教育,2014(3).
[11]大數據[EB/OL].http://baike.baidu.com/link?url= VmbPEmbc4kU 9iDk I2zcpmR lHdrv5xbfX tV7EX 1f21oUv 9bxH0bqLs4XHvTviYUZEC83qvtheOeat8j-KQXNn8zk IV0xOuuOGdrFLsljf-Je.
(編輯:王曉明)
TP393
A
1673-8454(2015)15-0060-04
*項目支持:本文系陜西省2014年管辦評分離改革招標課題“基于大數據的高校數據整合模式和機制研究”(項目編號:GBPKT32)研究成果之一。