季益龍, 楊傳斌
(浙江師范大學 網絡安全與信息化建設辦公室,浙江 金華 321004)
云存儲是在云計算概念的基礎上發展起來的一種新的存儲方式,它是將大量不同類型的存儲設備通過軟件集合起來協同工作,共同對外提供數據存儲服務[1].隨著計算機技術和互聯網應用的快速發展,校園師生學習、工作所產生的數據正以幾何級數的方式增長.數字資源存儲的目的是為了用戶保存、獲取和分析數據,校園數字資源管理是實現智慧校園戰略的第一步,而數字教育資源的存儲與管理已成為一個亟待解決的難題.傳統校園數字存儲方式主要有2種:一種是自建式存儲系統,常見的平臺有師生ftp、網絡存儲平臺、自動備份系統等,但存在可獲取性差、動態擴展能力差、兼容與管理不便和安全可靠性不高等問題;另一種是公共服務網盤,常見的有百度云、360云盤、騰訊微云等,與傳統的存儲模式相比,在文件管理、移動訪問、多端同步和存儲容量等方面具有優勢,但也存在服務質量不可控、數據私密性弱、個性化定制差等問題.筆者分析了傳統存儲中實際存在的問題與需求,比較3種云存儲模式的性能優缺點,設計并實現一個基于混合云模式的校園云存儲系統.
云存儲目前在學術界還沒有一個權威的定義,但基本的共識是,云存儲不僅是一種存儲設備或技術,也是一種全新的服務[2].從服務對象和范圍來講,云存儲模式可以分為3種:公有云、私有云和混合云.不同的云存儲模式均有利弊,需要分析其優缺點,學校可根據自身的實際情況選擇最優方案.
公有云建立在校園局域網外部,放在一個共享的基礎存儲平臺,并且保障每個用戶的存儲、數據和應用都是邏輯分區、互不干擾.簡單地說,公有云就是云計算服務提供商為用戶提供服務的云存儲平臺.公有云模式具有建設成本低、數據共享、擴展性高等優勢,但在安全性、可靠性和版權等問題上存在問題.在云計算、移動互聯、CDN分發等技術迅速發展的背景下,公有云存儲發展迅猛,國外有亞馬遜提供的公有云服務Amazon Web Services、微軟發布的公有云計算平臺Widows Azure和谷歌推出的在線云存儲服務Google Drive[3],國內有阿里云、百度云、360云盤、華為網盤等,這些公有云存儲系統簡單易用,可以實現隨時隨地多種形式互聯,成為校園師生個人網絡存儲的工具.
私有云建立在校園局域網內部,通過局域網協議建立在機構內部提供云存儲服務,是一個可擴展的云環境.它建立在用戶專用的基礎構架之上,不同于公有云的開放生態圈,私有云運行在機構數據中心防火墻內,也可以部署在一個安全可靠的主機托管場所.私有云模式具有數據安全性高、服務質量可管控、統一管理和資源利用率高等優勢,但在建設成本、可擴展性和社會共享性等方面存在劣勢.私有云有2種形式:其一是軟硬件合體類型,云儲存運營商會提供專業的硬件和集成軟件,主要有IBM公司的XIV網格存儲系統,聯想公司的私有云存儲系統,愛數公司的Anyshare Cloud系統等;其二是純軟件安裝包,機構需要自身提供服務器和存儲設備,比較成熟的平臺有基于Hadoop的HDFS分布式系統[4],基于對象存儲的Swift[5]和由國內技術團隊開發的Seafile開源云存儲平臺[6].
混合云是建立在私有云和公有云服務之上的,是為特定用戶提供和管理一些內部資源和外部資源的云存儲環境[7].這種模式最大的優勢在于利用了公有云成本低的優勢,同時確保了高度敏感信息的保護.用戶根據不同業務性質來區分存儲對象,一些重要、核心或機密的數字資源放到機構建立的私有云存儲,而通知公告、公共業務和公開信息等則放在公有云存儲.混合云的概念不可能是一個簡單的混合服務的提供,如何正確有效地對公有云和私有云服務進行切換、融合是一個非常復雜的過程[8].這種模式也存在一些挑戰,如內部數據中心與公有云之間的連接問題、系統監測和管理方面的間接費用較高、多個單一故障點增加安全風險[9].
通過對上述3種存儲模式的分析,得出了公共云、私有云和混合云的異同點,并分別指出其適應范圍,如表1所示.

表1 3種存儲模式的不同特點及區別

圖1 一種校園混合云存儲系統的整體架構
混合云存儲系統本身的服務是將公有云和私有云存儲構成一個有機的整體[10].混合云存儲系統整體結構包括校園網和互聯網兩部分,將校園內部的私有云存儲服務和互聯網上的公有云存儲服務結合起來,為校園師生提供數字資源存儲服務.系統的整體架構如圖1所示.
私有云存儲服務部署在校園網上,包括用戶接口、文件服務器、數據業務服務器、WEB服務器、數據庫服務器等.用戶接口通常以3種方式為用戶提供云存儲服務:移動端、網頁端和客戶端.文件服務器提供底層用戶文件的存儲與訪問服務,私有的文件服務器不提供外網訪問接口,以保證數據安全;數據業務服務器、WEB服務器、數據庫服務器共同承擔核心業務服務,包括文件的上傳、下載、預覽等.公有云存儲服務將選擇主流的亞馬遜S3、微軟Azure、阿里云、百度云等云存儲服務商,實現各種服務調用功能.若用戶在校園網內,則數據操作通過校園網調用互聯網云存儲服務;若用戶在公網上,則數據操作直接在互聯網調用服務.云存儲服務商決定了整個系統的可擴展性和服務質量,需要根據服務模式、運行環境和費用等多種因素,選擇最適合的云存儲服務商.

圖2 一種校園混合云存儲系統的功能設計圖
系統通過單點登錄的方式從統一身份認證平臺中獲取所需的人員信息、部門信息、崗位信息和角色信息,并將存儲信息、操作信息及日志信息返回給統一身份認證平臺.如圖2所示,系統主要模塊包括:文件管理、文件夾管理、權限控制、作業收集、實時同步、系統管理和個性工具等配套子模塊.
2.2.1 文件管理模塊
文件管理是云盤系統的基礎業務,遵循文件存在本地、服務部署云端的原則.可以對文件實現上傳、下載、刪除、在線預覽、審閱、評論和分享等多種操作,擁有移動端、網頁端和客戶端等多種入口方式,實現文件管理共享、協作交流的場景.
2.2.2 文件夾管理模塊
通過文件的邊界屬性對文件夾進行分類(用不同的顏色表示不同屬性的文件夾):黃色代表個人文件夾,除本人外其他任何人都無法查看編輯;藍色代表協作文件夾,用于學校用戶之間的文件共享和交互;紫色代表部門文件夾,根據部門信息自動創建,用于部門之間的文件共享和交互;綠色代表外部文件夾,當需要外部協作時,可創建外部文件夾,用于與外部用戶的文件共享和交互.文件夾管理通過不同顏色,輕松實現文件安全管理.
2.2.3 權限控制模塊
當邀請成員加入共享文件夾時,可以進行權限設置.同專業教師之間可以設置為“編輯者”權限,課件共享給學生可以設置為“查看者”權限.根據文件訪問屬性可劃分為五級權限設置,分別為“所有者”“編輯者”“查看者”“預覽者”和“上傳者”.每種角色代表對文件的不同訪問權限,通過嚴密的權限控制,保障數字資源的安全可控.
2.2.4 作業收集模塊
作業收集是云盤系統根據學校自身特點設計的自定義功能,利用文件夾收集功能,可以實現指定文件夾作為作業收集目錄,創建任務并邀請班級的學生,學生在規定的時間內向老師上傳并提交作業相關的電子文檔,方便教師收集管理作業,學生之間作業也可設為互相不可見.
2.2.5 實時同步模塊
實時同步既可以進行大量文件的快速上傳下載,也可以通過同步端與云端文件保持實時同步.其中,移動端、網頁端或客戶端的本地文件一旦被修改,云端就實時更新,可以實現便捷、實時和快速的文件同步,文件的修改也無需頻繁地上傳下載.
2.2.6 系統管理模塊
主要包括用戶管理、使用統計、個性化設置和日志查詢等.用戶管理主要實現對云盤系統中用戶的增加、修改、刪除等操作.使用統計是對系統中的用戶數量、存儲情況、文件總數等使用情況進行統計.個性化設置是對系統的名稱、形象、安全等自定義設置.日志查詢是對時間、操作者、操作對象、客戶端詳情等內容的查詢.
2.2.7 個性工具模塊
個性工具是用戶根據學校特點提供的特色服務.全文搜索支持標題搜索、文件內容搜索、關鍵詞搜索、消息搜索等.在線編輯支持網頁端在無需下載文件的情況下直接實現在線編輯,編輯完成后自動保存到平臺.隨時消息可直接將文件分享到對方QQ、微信、郵箱、短信等各種溝通工具上,實現隨時隨地的文件分享.設備管理是指用戶對自身賬號的登陸設備進行管理,可禁止其他相關設備非法登錄系統,確保賬號安全.
依據設計的框架來部署系統,混合云存儲系統體系結構按層次可以劃分為4層:資源層、平臺層、應用層和用戶訪問層[11].資源層用于構建混合云系統的底層硬件,包括底層的服務器、存儲介質、網絡和云服務商等.筆者采用專用機架式服務器、高速多協議存儲方式和萬兆核心交換機,并根據學校自身特點及公有云的存儲大小、數據請求、數據傳輸流量、可用性、網絡傳輸速率等[12]相關參數選擇合適的云服務商.平臺層通過軟件集群對資源層進行整合封裝,實現用戶權限控制、數據存儲、數據安全等業務,為應用層提供平臺接口,軟件集群由物理服務器和虛擬機構成,3~5臺物理服務器分別部署混合云系統的業務服務、Web服務和數據庫服務,4~6臺虛擬機搭建Hadoop分布式文件服務器集群,完成對資源池的管理.應用層通過終端軟件為用戶提供云存儲終端接口,實現用戶的定制業務,該系統終端的后臺開發利用Java、Spring MVC、Hibernate、Jerasure等關鍵開發技術實現系統的功能,前端設計采用HTML5、jQuery、Ajax等主流技術,數據儲存技術包括Hibernate、HDFS、Redis等存儲數據表和教育業務的結構化數據.用戶訪問層是實現任何一個授權用戶都可以在任何時間、任何地點,使用不同的終端設備,按照標準的公有應用接口登錄云存儲平臺,享受云存儲服務,通常以3種方式為用戶提供云存儲服務:移動端、網頁端和客戶端.
通過對該系統的功能、性能、安全性、可擴展性等方面近一年時間的全面測試與使用,發現該系統應用功能完善,能實現高達百T級別的海量教學和科研資料安全統一的管理.性能上表現穩定,局域網內存儲數據的上傳、下載速度≥5 Mb/s,對系統訪問的響應性很高;系統采用碎片化存儲、3份加密保存、用戶數據隔離,確保系統的安全性;用戶數量可在后臺增加,存儲空間可實現動態擴容,功能基于云端統一升級,確保系統具有良好的可擴展性.
面對數字化環境和信息技術變化帶來的挑戰和機遇,混合云存儲系統的建設符合“互聯網+”時代要求,它可以更新管理理念、打造數字化存儲空間、改變傳統服務方式.存儲系統采用混合云模式部署,是“互聯網+校園”新發展階段的新思路,既可以打破傳統私有云開發周期長、更新困難、部署成本高的缺陷,又能滿足文件存儲、校園數據安全、動態擴展容量、移動應用、實時同步及作業收集各項功能的需求,讓其享受到更多的云端服務價值.