徐娟+劉大巧+趙學敏+李國紅
【摘要】隨著高校規模的不斷擴大,高校在教學科研、人才培養及社會服務等過程中產生的數據以指數級速度增長,傳統的檔案存儲模式已經無法適應檔案數據增長的矛盾。與傳統的存儲模式相比,云存儲以其成本低、高效、海量存儲等優勢越來越受到人們的關注。但不可忽視的是使用云存儲模式實現高校檔案存儲也存在著一定的問題和風險。本文詳細分析了高校檔案云存儲實現的特點和優勢,此外針對可能存在的問題和風險,提出了相應的解決方案。
【關鍵詞】大數據;高校檔案;云存儲
高校檔案是高校教育教學活動的真實記錄,是高校從事教育教學活動、高校管理、教學科研工作必不可少的參考借鑒資料。高校檔案不僅是高校政策決策的重要保障,也是高校日常管理決策不可或缺的資源。
然而,隨著計算機網絡、云計算等信息技術的飛速發展,整個社會已經邁入了大數據時代,高校也不例外。在大數據背景下,高校學生的學籍、發表的論文、課程成績以及教師的基本信息、教學課件、發表的科研論文、參加的科研項目等會產生大量數據,同時還有實驗室設備、學校機房和行政部門產生的檔案信息等也會產生海量數據。除了在學生培養方面會產生海量數據外,高校行政管理活動、科研和學術交流、社會服務等方面也都會產生海量數據,這些數據數量大,數據結構多樣,數據來源廣泛,明顯具備了大數據的特征,對這些有價值的數據信息進行歸檔存儲,并確保在需要時能被有效地查詢和利用,這將成為高校檔案部門無法推脫的責任,同時也為高校檔案工作帶來巨大的挑戰。目前高校檔案管理面臨的最主要的兩個挑戰:一是如何為檔案數據提供足夠大的存儲空間。二是如何為用戶提供一個更安全、高效、方便的檔案訪問平臺。幸運的是,面對大數據帶來的挑戰,云存儲技術應運而生。簡潔地說,“云存儲”是將數據資源存放到網絡上供人們查詢的一種新興方案。用戶可以在任何時間、任何地方,通過任意可上網的設備方便地存取數據。現在許多國內外的大公司如微軟、亞馬遜和谷歌已經引入了相關的云存儲平臺服務。在大數據背景下,如果能將云存儲技術應用到高校檔案管理領域,不僅可以解決以上兩個挑戰,也將會為高效檔案事業帶來歷史性的變革。
一、云存儲在高校檔案管理中的優勢
(一)云存儲技術的應用,能降低高校檔案管理的成本,提高檔案資源的利用率。傳統的數據存儲都是靜態的,多用于存儲PB級以下的數據。若采用傳統的存儲架構,當存儲容量需求增加時,就需要添加新的存儲陣列。隨著需要管理的陣列數增加,存儲環境變得日益復雜,管理難度更大,需要的運營成本也隨之增加。而云存儲能夠實現動態擴展,按需求進行配置。各高校檔案館可以根據自身需求申請適當的存儲容量,無須額外的存儲設備,相比較傳統存儲模式,降低了購置設備的成本。存儲平臺的運行和維護工作由云存儲提供商完成,降低了高校檔案管理系統運行維護的成本。云存儲提供了一個較為開放的訪問平臺,用戶可以隨時隨地通過任何可上網的設備訪問檔案資源,這就解決了某些用戶由于時間、地點等因素限制而無法實時訪問檔案資源的問題,從而大大提高了高校檔案資源的利用率。
(二)云存儲技術的應用,能為檔案數據提供海量的存儲空間。隨著高校檔案信息化建設的不斷加快,高校檔案數據也由原來單一形式向電子文件、圖像、視頻、音頻等多種形式發展,高校檔案館要安全存儲這些數據,需要不斷擴充服務器和相應的存儲設備,這會給高校檔案館帶來很大的資金壓力。由云計算發展起來的云存儲平臺,用戶只需要利用幾臺可以上網的電腦終端就可以方便地上傳和下載存儲在云中的電子文件。云由成千上萬的存儲設備和服務器集群構成,它具有無限的存儲空間和海量的存儲能力,能夠更好地滿足檔案數據海量增長的存儲需求。
(三)云存儲技術的應用,能增強容災、異地備份能力。云存儲可以實現跨領域部署,并可以通過虛擬化技術實現多物理存儲節點、多應用系統和多業務服務協調的共享存儲構架。特別是當發生不可預測的數據災難時,通過云存儲的分布式備份功能可以實現檔案數據的快速恢復。同時,云存儲可實現數字檔案網絡在線異地備份,以上兩類功能可避免各高校檔案館單獨存儲檔案數據時遭遇停電、火災、水災、地震等特殊災難情況時可能帶來的檔案數據丟失和損失。
(四)云存儲技術的應用,能實現檔案數據中復雜數據類型的虛擬化存儲。采用云存儲所具備的虛擬化技術和大數據管理技術,能實現很好地復雜數據類型的虛擬化存儲。特別是針對特殊類型的檔案,如:電子期刊、古典文籍、照片資源、音頻視頻文件等。
二、云存儲在高校檔案存儲中的存在的問題和風險
(一)云存儲平臺的安全風險。高校檔案的保密性以及檔案工作的機密性決定了高校檔案存儲需要一個相對安全的存儲環境,現有的高校檔案存儲方式在檔案安全存儲方面有一定的優勢。首先,云存儲自身的虛擬化、無邊界性、流動性等特性,使得其面臨較多的安全威脅。其次,與傳統的存儲方式不同,云存儲是將數據信息存儲在云端,這對數據的存儲安全、傳輸安全、服務安全和訪問控制都帶來極大的挑戰。同時,云存儲應用導致網絡資源、信息資源、用戶數據和應用的高度集中,由此帶來的安全隱患與安全風險也較傳統應用高出很多。目前為止,還沒有任何一家云存儲供應商保證可以提供絕對安全的存儲平臺。此外,如果將不能公開的數字檔案以遠程方式存儲到云端,必定會引發檔案管理者的擔憂。
(二)云存儲的可靠性問題。大多數云服務供應商都對云存儲的安全性做出過承諾,但亞馬遜彈性云服務出現的服務中斷事件以及微軟出現的云數據托管中斷事件都表明用戶能否訪問到自己的云存儲數據取決于云服務提供商的服務是否可靠,一旦云服務供應商出現問題,用戶則無法正常訪問自己存儲在云服務上的數據,因此可靠性問題是目前云存儲急需解決的難題。
(三)缺乏可靠的國內云存儲供應商。現在大部分成功的云存儲供應商都是Google、微軟等國外品牌,盡管國內的一些IT公司正努力追求云存儲技術,但就技術水平和發展規模來看還存在一定的差距。當高校檔案選擇云存儲方式,云平臺就控制了檔案數據,這將會導致潛在的數據威脅行為,例如通過數據挖掘技術挖掘機密的檔案信息。因此,在某種程度上我們更希望找到一個具有獨立R&D 認證的國內云存儲供應商,最大程度地保證高校檔案的安全性和保密性。
(四)缺乏統一的云存儲技術標準。在技術層面,對于長期有效存儲數字檔案尚存在很多需要解決的問題,其中最重要的問題之一就是技術標準問題。想要實現數字文件長期、高效地存儲,必須制定一系列的統一的存儲標準。然而,到目前為止國際上還未形成一套公認的數字檔案信息長期保存的標準,這有可能導致在將檔案數據上傳到云端的過程中產生數據丟失、錯序等問題,從而直接影響檔案數據的完整性和一致性。
三、高校檔案云存儲實現的觀點
(一) 積極參與檔案云存儲設計。高校應該以檔案管理部門為領導,由各部門共同支持建立起一個較為全面的檔案管理系統,從而避免過多地依賴于云服務供應商。在檔案管理系統的核心設計以及資源建設過程中,高校內部應該制定一套統一的安全標準和機密性協議,所有的檔案管理人員都應積極參與檔案云存儲管理系統的設計與實現,學習云存儲相關的知識,建立一個規模合理的檔案管理系統。考慮到高校檔案的保密性要求,在云存儲供應商進行系統維護以及業務合作過程中需要建立一套嚴格的機密性協議,以降低檔案數據泄密的風險。
(二)建立高校檔案私有云。云服務按部署方式和服務對象范圍可以分為三類,即公共云、私有云和混合云。公共云通常適用于大規模和多用戶。相對于公共云和混合云,私有云的用戶完全擁有整個云中心設施,提供了更多地安全和保密等專屬性的保證,因此在安全性、法規遵從以及服務質量方面更加具有保障。高校檔案管理選擇私有云可以保障在使用云存儲技術的同時最大程度地維持對檔案數據的控制權,提高檔案的安全性和保密性。
(三)建立云存儲平臺下的檔案數據的安全備份策略。采用云存儲技術存儲高校檔案數據后,相應的備份策略也會發生根本性的變化,由脫機備份轉換為網絡在線備份。為了提高檔案數據的存儲安全和災難恢復能力,高校可以選擇對檔案數據進行多套備份,通過將檔案數據副本在本地、同城和異地進行備份的策略,實現檔案數據資源的多套多地備份,這不僅能夠提高檔案數據訪問的實時性和共享性,更加增強了檔案數據的容災能力。對于重要的、機密的高校檔案數據應該做好提前備份,一旦云存儲數據庫遭受致命損壞時,可以立即啟動備份系統以確保高校檔案數據的正常使用。
(四)加強云存儲人才的建設和培養。將檔案數據向私有云遷移時,需要采用成熟的技術方案,解決私有云的系統建設及運營管理安全工作。同時,應做好系統容災、數據備份,以及業務回退機制,以提高應對各類突發事件安全事件的處理能力,這些工作都離不開掌握相關技術的IT技術人員。管理檔案系統的IT技術人員不僅要有較為深厚的計算機背景知識,還需要熟悉檔案的相關知識。因此,高校檔案館建設要注重人才的建設和培養,做好人才的儲備工作。
四、結語
云存儲技術的出現為高校海量檔案數據的高效存儲和利用提供了新的平臺,為高校檔案的管理工作指明了新的發展方向,高校檔案管理工作者應積極投入到高校檔案私有云建設中,充分利用云存儲的技術優勢。同時,也要重視高校檔案云存儲中存在的問題和風險,尤其是檔案安全和保密問題,積極提出相應的策略。
本文系云南省檔案科技項目“基于Hadoop云平臺的高校檔案資源管理研究”(項目編號:2016-y-125-006)研究成果之一。
【參考文獻】
[1] Zhao Yi. Opportunities and risks: Electronic document management under cloud computingenvironment [J]. Journal of Archives and construction, 2013(10):4-7.
[2]張桂剛,李超,張勇,邢春曉.一種基于海量信息處理的云存儲模型研究[J].計算機研究與發展,2012(S1):32-36.
[3]朱悅華,何麗萍,丁建萍.“云檔案”信息資源共享系統研究[J].浙江檔案,2012(6):52-53.
[4]薛四新,陶水龍,崔偉.數字檔案館云計算建設模式的思考——以北京市區域性數字檔案館為例[J].檔案學研究,2012(3):62-64.