邵美科
摘 要:隨著大數據時代的到來,高校的數據資源呈幾何級數的增長,在此背景下,基于大數據的高校數據整合模式研究,尤其是消除高校的“信息孤島”,提高對數據資源的利用效率,對原本利用率低下且分散的數據資源進行更深層次的共享和挖掘,為高校的發展提供有效的決策支持逐步成為很多高校關注的重點。
關鍵詞:數據整合;高校大數據;數據共享平臺;數據集成
隨著信息化發展的日益加快,具有相應業務功能的信息系統越來越廣泛地應用于高等院校的科研、教學、管理等各個方面,依賴于便利有效的信息系統,高校信息化與數字化水平得到很大提高。但由于高校數據集成還處在建設初期,信息化建設前期缺乏長期整體規劃,信息資源獨立分散,標準不統一,數據冗余,信息化程度不同,信息孤島現象嚴重,難以進行基礎數據綜合查詢分析或決策支持。信息資源的難以整合,不但不利于高校資源的統籌應用,也不利于信息資源使用效率的提高。因此基于大數據的高校數據整合模式研究,提高數據資源的利用率,對原利用率低而又分散的教育資源進行更深層次的數據挖掘,進而為高校的發展戰略提供科學依據,對于支持高校信息化全面發展具有重大意義。
一、現狀分析
近年來,我國對信息化教育十分重視,2000年前后,國家挑選了部分重點大學進行信息化試點,但在數字化校園建設的早期,各學校對學校大數據整合的規劃較少,高校雖完成了多套應用系統的建設,但各系統在使用過程中積累了越來越多基礎數據。至“十一五”規劃期間,最先開始建設數字化校園的一批高校紛紛進行了數字化校園架構的調整,開始著眼于基礎平臺的建設,同時加強信息標準的制定和執行,提出了面向服務的建設思想。
按照信息化發展階段性要求,三大基礎應用平臺的建設符合預期規劃,統一身份認證平臺和信息門戶平臺實現了一站式服務,極大程度加大了用戶對于各業務系統的訪問便利度。為了充分利用學校的數據資源,提高現有應用系統數據資源的使用效率,對于數據整合模式的研究逐漸成為各高校研究的重點。
二、需求研究
完成對高校內大數據有機的整合和繼承管理,掌握學校各項活動中發生的龐大、海量數據,并利用大數據處理技術對這些信息資源進行挖掘、整理、分析,為學校發展提供決策支持,是下一階段高校信息化發展的重要任務。
(1)數據資產意識薄弱。
數據資源建設的意識相對薄弱,很多高校沒有充分認識到數據也會對學校的教學科研管理起到重要作用,現有業務系統繁多,業務系統之間相互獨立,數據無法共享,而且沒有全校性的數據標準,數據質量堪憂,數據資產不能發揮有效價值。
(2)數據管理缺乏規范性。
高校內部建設了多個業務系統,依據各部門的業務需求,其分別設計了信息系統建設標準和數據標準并采用了不同的架構和開發技術。但這些系統在應用及數據層面上彼此分離,導致各單位數據標準不一致,在數據共享平臺的建設過程中,不能有效分析數據庫表結構,在共享過程中時常出現匹配錯誤等現象。
(3)存在信息孤島。
在數據管理維護工作方面缺少高屋建瓴的規劃,各部門采用不同的業務系統,所有數據信息分別存儲在不同地域不同數據庫中,數據存儲具有分布性和異構性特點,且彼此之間不具備一致有效的數據格式和交換接口,形成了許多“信息孤島”。
(4)信息隊伍建設不足。
在信息化隊伍的建設方面仍面臨著許多問題。在高校建設方面,學校的投入主要在于對傳統業務部門的建設,而對于信息化的建設相對較少;在人才隊伍的建設方面,業務部門大多并沒有設立信息化管理人員,因此建設和維護能力相對薄弱。
三、模式研究
各高校的數據整合建設任務主要集中于數據庫管理和數據分析兩個方面。而對于高校數據中心的具體建設思路主要有以下三種不同的模式:
(1)數據集中模式。
數據集中模式需全面丟棄原有的系統,對于新數據中心要求統一制定新的信息標準,并開發統一應用平臺,建立的統一的數據庫用于存儲全校數據,位于架構中的各個應用子系統也需重新開發,各業務部門并沒有獨立的數據庫。
這種模式的優勢在于系統之間的耦合度較高,數據中心與子系統間易于實現無縫連接,因為無需第三方系統的接入,降低了建設和實施的難度。但這種模式開發周期相對較長,設計者需要充分掌握各業務部門不同的需求,后續的應用開發也完全依賴于同一家開發商,綜合成本較高。[3]
(2)數據共享中心。
大部分高校的應用系統功能完善,完全舍棄會造成資源的浪費,數據共享中心并不改變原有的應用系統的架構,而是通過提取系統中具有共享價值的數據信息實施系統的搭建。各部門仍在原有的業務系統中完成讀寫工作,而當部分數據的操作與共享數據相關時,應用系統將會通過前期的部署工作完成共享數據的錄入,達到數據層面上的互聯。數據共享中心的優勢在于,各部門可充分保留原有資源建設,后續應用只需明確其與共享數據庫的關系便可向數據中心提供新的數據子集,但此種模式要求對各業務系統的數據標準要求較高。
(3)分布式資源整合。
分布式資源整合有兩種主要工作模式:a.業務部門在本地系統中操作數據,應用系統則只會訪問本地數據;b.業務部門請求訪問其他部門的數據,應用系統則與數據中心進行互聯,通過數據中心達到對于其他部門數據資源的訪問。分布式資源整合模式搭建了一個資源索引庫,索引庫中存放收錄了各部門的共享數據,并明確了數據在網絡中所處的實際方位,原始數據仍位于各部門。當有用戶要求對共享數據進行訪問時,工作站將視圖框架傳至數據中心,數據中心準確地對所需數據的位置進行精確定位,將這些信息填入用戶請求的框架后返回給用戶。此類模式要求各個部門的數據庫架構設計、網絡運行狀態具有較高水平,對數據中心硬件要求最低,需結合多個不同的應用系統進行操作才可完成決策支持,對原系統會造成一定的性能影響,后續建設問題較多。
四、結論展望
隨著信息技術發展的不斷成熟,高校信息化發展迎來了空前的機遇。在信息化建設的過程中,基于大數據的數據整合工作雖任務繁雜但卻是最不可缺失的重要環節。有效的數據整合可以大大加快各部門的數據融合度,實現教學活動在時間空間上的擴展,教學模式上的創新,為提高科研工作水平,實現學校管理的現代化打下良好基礎。
參考文獻:
[1]戚麗,等.校園數據中心建設與管理方法的探索[J].教育信息化,2002.7.
[2]唐蓉君,熊忠陽.高校數據中心建設探索與實踐[J].中山大學學報,2009.3.
[3]吳士杰.數據整合技術在高校應用系統中的研究與實現[J].計算機光盤軟件與應用,2014.12.