濟南大學商學院 楊 振
大數據環境下高校信息系統開發模式探討
濟南大學商學院 楊 振
當今時代,隨著信息技術和管理科學的不斷發展,在云計算、物聯網、數據挖掘等技術興起的環境下,高校的信息量、數據量正以指數倍劇增,其形式也由最初的結構化數據向非結構化、半結構化轉變。這對于高校的信息管理工作帶來不少挑戰。因此,本文就大數據的含義、當下高校信息管理系統建設的缺陷以及必要性進行闡述,并就在當下形勢對高校信息系統建設提出建議。
大數據;信息管理
一般來說,大數據是指涉及信息、資料規模龐大,以至于目前的主流信息處理軟件或數據庫系統無法實現對其內容做有效地摘取、分析、處理、規整等行為的數據。他的特點最早由IBM公司整理歸納為4V。
海量(volume):即大數據的體積是龐大的。傳統數據量一般達到MB或者GB級,而大數據的數據量可以達到TB、PB乃至EB級別,可見其體積之龐大是前所未有的。
多態(variety):大數據的表現形式是多種多樣的。在日常應用中,傳統數據通常以結構化數據為主,即:存儲于數據庫中,可以通過二維表展示的數據。而大數據通常都是半結構(根據字段要求具有擴充性)以及非結構化數據(圖像、音頻、HTML等),因此其形式是多樣化的。
高速(velocity):大數據的處理速度極快,它遵循秒級定律,即數據處理結果所需時間要控制在秒級范圍內。而這也是與傳統數據的最大差別。
價值(value):在大數據環境下,數據海量,資源眾多,但其中真正有價值的信息相較于龐大的數據量確是少之又少,這就導致了大數據的價值密度較低,高效率的數據挖掘工具的開發與應用就成為亟待解決的問題。
不斷發展的社會以及復雜多變人類行為使這個世界上的數據每天都在呈爆炸式地增長。據國際數據公司(IDC)統計,2010年全球產生的數據量為為1.2ZB,2011年的數量增長到高達1.82ZB,相當于全球每人產生了200GB的數據量。同樣,IBM的研究報告也顯示,整個人類文明所獲得的全部數據中,有90%是過去兩年內產生的。而到了2020年,全世界所產生的數據規模將達到今天的44倍。具體到高校來說,亦然。通過挖掘這些海量的數據中有價值的信息,高校可以更加高效率地完成各項日常科研、招生以及人事管理等方方面面的工作。例如:在學生信息管理方面,通過挖掘學生的戶口所在地、年齡、畢業去向、專業班級等信息,可以在招生計劃和專業設置等方面做出合理決策。可見完善高校信息管理系統這一信息的主要載體,使之與當下的大數據時代更加契合的任務,是義不容辭的。
在技術層面上,大數據首先要有足夠的存儲空間,隨著分布式存儲系統以及存儲虛擬化等技術的不斷發展完善,存儲成本相對不斷降低,存儲效率也在不斷提高,這為大量數據集的儲備奠定基礎。其次,挖掘有價值的信息作為大數據時代的核心,也伴隨著數據挖掘技術的進步逐漸可行。當前大數據的主流處理方式是通過谷歌的mapreduce框架結構實現對數據集的大規模操作,同樣,Hadhoop、Bigtable等也推動了大數據分析處理的發展。
1.各部門各自為戰,形成信息孤島,數據冗余
當前高校信息系統建設大多依舊是各部門自行建設,沒有統籌的規劃和共享信息的平臺,這就容易形成一個個信息孤島。再加之數據量龐大,所造成的信息冗余、資金浪費逐漸成為高校發展的累贅,而改善或重建又需耗費大量資金和精力,可謂積重難返。
2.部分系統利用率較低,信息更新滯后,維護不及時
當下有的高校的部分引進的系統,存在利用率低的問題,系統功能繁多,真正用的上的卻只有一小部分,這就進一步導致了信息更新滯后,維護不及時的問題,這樣的系統基本形同空殼,維護之,白白浪費金錢;丟棄之,未免可惜。
3.新舊系統更替時拖泥帶水,系統間兼容性差,造成經濟浪費以及服務效果不佳
很多學校為應對大數據的環境,引進或開發了新的信息管理系統,但新舊系統間由于開發語言或數據結構等方面的差異,導致原數據無法導入新數據庫,或出現新舊系統無法兼容的問題。導致新舊系統并用,信息無法在系統間共享等現象,有的甚至在不同系統間使用不同登錄數據庫,給用戶的使用帶來諸多不便。
4.可擴展性差,不利于二次開發
由于信息量地不斷擴增,以及數據類型向半結構化甚至非結構化轉變,信息系統的數據庫亟待做出擴展,這就可能由于原信息系統沒有預見未來出現的問題而導致當前的可擴展性差的問題。
1.通過獨立因子分析法,全面衡量信息系統建設或修繕的價值性
獨立因子分析方法是通過對原始數據的相關系數矩陣進行分析,從而盡可能將多個評價指標轉化為相互獨立的,主要的幾個綜合評價指標的一種統計方法。[1]一般來說的評價指標有:前期評價指標、經濟效益評價指標、技術質量評價指標等。
2.從戰略角度出發,校內負責人要和技術人員緊密聯系,結合自身需求,個性化開發系統
由于缺乏校內領導與技術人員的溝通導致系統無法實現校方的期望,而技術團隊又不得不一次次改動,造成大量的人力、財力的浪費。在當下的大數據時代,信息量龐大,系統結構復雜,功能多樣,這種問題就更加凸顯。因此,項目領導需要與技術團隊做到密切的溝通,立足學校自身實際情況,切實地提出各種信息以及信息處理的各種需求。并在日后的使用過程中,也要不斷發現問題,漸進地,不斷地完善系統。
3.各部門統一構建,減少冗余和浪費,統籌管理
技術工作在高校信息系統構建中固然重要,但縱覽全局的立足于戰略角度的管理才是關鍵的前提。高校在構建信息管理系統時,應從宏觀角度出發,通過建立信息共享平臺,統一數據結構、編程語言,集中信息與公共數據庫,提高系統的可擴展性與開放性,實現“綜合的全面的信息服務平臺”。
綜上所述,在大數據環境下,高校信息管理系統不僅要在技術上實現突破,更要在管理上,從宏觀角度入手,縱覽全局,統籌規劃,并立足高校自身個性化需求,才能切實構建起高效、實用、利好用戶的高校信息管理系統。
[1]成雨含.高校新型信息系統建設方案和評測體系的研究[J].計算機技術與發展.2016.26(5):156-161