李占平++楊昱昺

摘要:目前高校檔案管理存在管理內容獨立、管理不全面、重館藏輕利用等問題,通過引入“云平臺+大數據”技術,實現高校檔案管理向全面化、智能化方向發展。
關鍵詞:高校;檔案管理;云平臺;大數據
一、引言
隨著信息技術的發展,我國高校教育信息化已日趨完善。高校每天從各個信息管理平臺產生了大量的電子文檔,特別是教學平臺產生的大量音頻視頻文件,日積月累,將給高校各信息系統的正常運行和檔案管理帶來巨大挑戰。以前針對大量的電子文檔一般采用措施是:增加硬盤存貯空間、提高硬件性能或只保留規定年限內的,其余刪除。目前,有一種新的解決方案:引入“云平臺+大數據”技術。云平臺可通過對大量普通PC機的集群,實現存貯空間的以快速低廉的成本進行擴充。大數據是以海量的信息、多種數據類型、知識密集度低等特征為高校檔案信息資源實現數據分析與數據挖掘提供技術上的支撐。
二、高校檔案管理現狀
目前高校檔案管理主要存在如下幾方面的問題:1、由于歷史原因,檔案管理信息系統一般都獨立存在,如:教師信息有教師信息管理系統、學生信息有學生信息管理系統、圖書館有圖書館信息管理系統、教學有專門的網站等,系統之間數據基本獨立。2、由于技術的限制,目前一般的信息管理系統都采用關系型數據庫存貯數據,對結構化數據信息存取比較方便,但對非結構化電子文件,如文檔、表格、網頁、音頻視頻等存貯比較困難,所以目前這些非結構化文件在檔案處理過程中,很多高校依然采用紙質或統一以普通文件存放,造成管理不全面。3、目前國內高校檔案管理中普遍存在“重館藏輕利用”的現象[1],檔案管理員對館藏數量比較重視,但對如何提高檔案信息的利用率及應用服務不夠重視。
三、高校檔案的特性
與一般檔案相比,高校檔案有其自身的特征,大致可歸納為如下幾個方面:
1、檔案形式廣泛、內容多樣。高校檔案包括教師個人檔案、教師教學檔案、教師科研檔案、學生個人檔案、學校行政檔案、各分院行政檔案、資產檔案、圖書資料檔案等。如果將目前網絡教學平臺資料、學校OA平臺各類文件、各分院網絡平臺資料也歸入檔案進行統一存貯管理,內容將更全面、豐富。
2、檔案存貯形式多樣。由于高校檔案來源廣泛,勢必造成有多種存貯形式,如教師個人檔案、學生個人檔案、資產檔案等以結構化數據存貯為主;但對不少教學資料檔案、行政檔案、圖書資料檔案、各類教師學生獲獎證書等,大多還以紙質形式存貯,或以電子掃描文件存貯;網絡教學平臺、學校OA平臺等發送的文件,一般以文檔、音視頻文件等形式存貯[2]。
3、檔案調用頻繁,利用率高。高校檔案大多都需要頻繁調用,如學生每學年的評優、每一屆畢業生的調檔;教師每年晉升職稱查檔;上級主管部門的教學評估和學校內部教學質量檢查調檔;學生轉專業、教師人事調動調檔等。
4、檔案價值密度較大。由于高校檔案資源主要來自校內已有的信息系統,從這些系統中獲取的資料格式規范、內容完整,其檔案信息的價值密度較高。
四、云平臺+大數據的應用
云平臺分公有云和私有云[3],主要用于解決大容量存貯問題。公有云目前常用的有阿里云服務器、騰迅云服務器、百度云服務器等,可通過租賃的方式獲取云空間。私有云目前常用Hadoop框架進行搭建,相對公有云,私有云的優勢在于采用自主管理,在擴充存貯空間方面相對比較方便,并能對數據、安全性提供有效控制。
大數據技術是在合理時間內完成海量數據的采集與處理,最后將處理結果反饋給用戶,給用戶決策提供幫助。大數據有4V特征,分別是:數量(Volume),即數據巨大,從TB級別躍升到PB級別;多樣性(Variety),即數據類型繁多,不僅包括傳統的格式化數據,還包括來自互聯網的網絡日志、視頻、圖片、地理位置信息等;速度(Velocity),即處理速度快;真實性(Veracity),即追求高質量的數據[4]。
根據高校檔案的特性,采用云平臺+大數據技術可以很好的解決目前高校檔案管理中存在的問題。圖1是結合“云平臺+大數據”的高校檔案管理系統設想。在該圖中,通過建立Hadoop私有云平臺,在該平臺下,采用HDFS和Database相結合的數據庫存貯方式,將結構化數據和非結構化數據進行分別存貯,根據需要由大數據引擎的數據處理層進行調配。HDFS和Database相結合的數據庫處理方式有利于充分發揮關系型數據庫和非關系型數據庫的優勢,使系統的處理效率更高。數據來源通過對已有的不同信息系統建立相應的接口進行處理,通過在休息時間由系統自動調用接口,更新高校檔案管理系統數據庫。在應用層,通過不同的業務訪問檔案管理系統時,可通過應用接口層訪問數據庫處理層,再由數據庫處理層訪問到HDFS/Database數據庫。
五、結束語
通過結合“云平臺+大數據”的高校檔案管理系統,由于將高校各種檔案管理或教學網站等信息系統的數據庫集成到一起,不但能解決目前高校檔案管理各自為戰,信息不全,且查詢不方便的問題,而且如果能引入大數據中的數據挖掘技術,還可找出檔案信息之間、用戶之間以及檔案與用戶之間潛在的邏輯關聯規則,從而能夠為學校教學、學生綜合素質評價提供幫助與決策。
參考文獻:
[1]李小晨. 大數據時代背景下的檔案管理探討[J].云南檔案,2013.6:48-50.
[2]陳峰,孫淼洋. 大數據在高校檔案信息管理中的應用研究[J].管理信息化,2015.7:54-55.
[3]孟宇,張濤,趙政文.數字檔案云平臺的構建與研究[J].微處理機,2013,34(6):49-52.
[4]石俊峰,周俐霞等. 大數據時代高校數字檔案資源管理研究[J].現代教育技術,2015.1:19-24.