孟 宇,張 濤,趙政文
(1.西北工業(yè)大學(xué)軟件與微電子學(xué)院,西安 710072;2.西北工業(yè)大學(xué)計(jì)算機(jī)學(xué)院,西安 710072)
目前,云計(jì)算技術(shù)已經(jīng)開(kāi)始向開(kāi)放、互通、融合的方向發(fā)展。近年來(lái),各國(guó)政府紛紛將云計(jì)算技術(shù)與軟件產(chǎn)業(yè)的發(fā)展結(jié)合起來(lái),國(guó)內(nèi)的云計(jì)算技術(shù)開(kāi)始步入成熟期,大型企業(yè)已將云計(jì)算運(yùn)用到企業(yè)運(yùn)營(yíng)中。我國(guó)的數(shù)字化檔案館針對(duì)目前檔案數(shù)據(jù)分散管理及檔案資源利用率不高等問(wèn)題,借鑒國(guó)外電子文件管理策略,開(kāi)始將云計(jì)算技術(shù)引入到檔案數(shù)字化管理中,構(gòu)建基于云計(jì)算的數(shù)字檔案云系統(tǒng)平臺(tái),實(shí)現(xiàn)海量檔案數(shù)據(jù)資源的統(tǒng)一管理及共享,使用戶更方便、高效地利用檔案資源。
經(jīng)過(guò)近年的建設(shè)和發(fā)展,我國(guó)檔案信息化建設(shè)已經(jīng)取得了一定成就,很多省、市均建立了自己的數(shù)字檔案館,然而,省、市經(jīng)濟(jì)發(fā)展的不平衡和數(shù)字檔案建設(shè)策略的差異造成我國(guó)數(shù)字檔案信息化事業(yè)發(fā)展失衡,各檔案館各自為營(yíng),分散管理。現(xiàn)在,國(guó)內(nèi)的檔案信息化總的來(lái)說(shuō)存在以下幾方面問(wèn)題:
檔案資源分布不均:省級(jí)檔案館相對(duì)有更好的資源(包括管理員、檔案室和計(jì)算機(jī)設(shè)備等),而地方檔案館由于資金來(lái)源有限,往往面臨著設(shè)備老化等狀況,其網(wǎng)絡(luò)建設(shè)信息化資源配置也存在巨大差距。
檔案資源更新速度慢:各種信息技術(shù)飛速發(fā)展,要求數(shù)字檔案館能夠?yàn)橛脩籼峁┳钚碌臋n案檢索以及相關(guān)信息服務(wù)以適應(yīng)新形勢(shì)的發(fā)展,這給部分區(qū)域檔案信息化建設(shè)帶來(lái)了很大壓力。
檔案資源共享程度低:數(shù)字檔案管理的最終目的就是信息共享,但目前各區(qū)域檔案資源的共享程度仍然有限。
這些問(wèn)題造成了我國(guó)在數(shù)字檔案信息化建設(shè)過(guò)程中重復(fù)投入,資源利用率不高。云計(jì)算的出現(xiàn)將是我國(guó)數(shù)字檔案信息化平臺(tái)建設(shè)強(qiáng)有力的技術(shù)支持。將云計(jì)算引入數(shù)字檔案館,會(huì)使數(shù)字檔案館發(fā)生巨大變化。數(shù)字檔案館在原有軟、硬件發(fā)展的基礎(chǔ)上,利用云計(jì)算技術(shù)的應(yīng)用特點(diǎn),可建立一個(gè)統(tǒng)一、開(kāi)放、靈活的檔案信息化平臺(tái)。
利用云計(jì)算技術(shù)可以將各地方檔案館的檔案數(shù)據(jù)整合到檔案云系統(tǒng)數(shù)據(jù)中心的服務(wù)器中,制定統(tǒng)一的訪問(wèn)規(guī)則并對(duì)檔案資源進(jìn)行歸類、管理和定制,檔案用戶通過(guò)統(tǒng)一的訪問(wèn)界面即可訪問(wèn)來(lái)自各地的數(shù)字檔案資源。
“云”中大量的服務(wù)器集群可以容納TB級(jí)甚至PB級(jí)的檔案數(shù)據(jù),并可以隨時(shí)增加和更新。其超強(qiáng)的計(jì)算能力能更好地計(jì)算和分析海量數(shù)據(jù),并能夠?yàn)槌瑥?fù)雜的計(jì)算提供快速、高效的技術(shù)支持,為數(shù)字檔案館日益增長(zhǎng)的數(shù)據(jù)提供了解決途徑。
云計(jì)算避免了現(xiàn)今檔案館各自為營(yíng)的現(xiàn)象,消除信息孤島,在各檔案館之間構(gòu)建數(shù)據(jù)共享空間,通過(guò)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)聯(lián)通。這樣,各檔案館就可以分享檔案云系統(tǒng)的數(shù)據(jù)資源和基礎(chǔ)設(shè)施,實(shí)現(xiàn)數(shù)據(jù)的全面共享,一旦某臺(tái)服務(wù)器出現(xiàn)問(wèn)題,云中的服務(wù)器將在極短時(shí)間內(nèi)將數(shù)據(jù)拷貝到別的服務(wù)器中,啟動(dòng)新的服務(wù)器提供服務(wù),進(jìn)而提高了檔案資源的利用率。
利用云計(jì)算技術(shù),檔案館不用將大量投資用在硬件配置和更新上,只需支付相對(duì)低價(jià)的租賃費(fèi)即可獲得所需的各項(xiàng)服務(wù)。服務(wù)器的日常維護(hù)和升級(jí)由云服務(wù)提供商來(lái)提供,而且客戶端的配置沒(méi)有限制。這樣,數(shù)字檔案館的建設(shè)成本可以大大降低,可以將更多的時(shí)間和資金利用在開(kāi)展其他檔案業(yè)務(wù)上。
根據(jù)上述云計(jì)算在檔案館建設(shè)上的優(yōu)勢(shì),提出檔案云的概念,將有限的硬件和軟件集中起來(lái),把檔案館相關(guān)業(yè)務(wù)進(jìn)行包裝,對(duì)外提供相關(guān)檔案服務(wù)。為實(shí)現(xiàn)數(shù)字檔案的檢索利用和充分共享,檔案云應(yīng)對(duì)各層所提供的各種檔案資源進(jìn)行有效記錄和描述,建立檔案云的數(shù)字檔案索引庫(kù),用戶可根據(jù)對(duì)數(shù)字檔案的需求進(jìn)行檢索,從而完成后續(xù)的檔案管理等操作。
如圖1所示,檔案云由區(qū)域云組成,每個(gè)區(qū)域云由若干已存在的數(shù)字檔案館組成,將為各省、市級(jí)檔案館提供相應(yīng)檔案服務(wù)的政務(wù)中心或是檔案檢索中心進(jìn)行擴(kuò)充,每個(gè)區(qū)域云設(shè)立一個(gè)管理機(jī)構(gòu),實(shí)現(xiàn)對(duì)區(qū)域云資源的管理。最后,各個(gè)區(qū)域云互聯(lián)形成我國(guó)的檔案云,整個(gè)檔案云設(shè)立一個(gè)管理機(jī)構(gòu)進(jìn)行綜合調(diào)控和數(shù)據(jù)管理。

圖1 “檔案云”示意圖
檔案云的提出首先促進(jìn)了各地檔案資源整合,并能夠縮短數(shù)據(jù)集中過(guò)程,在檔案云的范圍內(nèi)向用戶提供更廣泛更迅速的檔案服務(wù)。其次可以在一定程度上提升檔案館建設(shè)進(jìn)程,通過(guò)集中優(yōu)勢(shì)硬件和在已有數(shù)字檔案館的基礎(chǔ)上建立云服務(wù),能夠加速經(jīng)濟(jì)欠發(fā)達(dá)地區(qū)檔案館的建設(shè),通過(guò)網(wǎng)絡(luò)提供高速、簡(jiǎn)潔的檔案服務(wù),方便數(shù)據(jù)共享。
檔案云是云計(jì)算技術(shù)在數(shù)字檔案領(lǐng)域的遷移,是檔案信息化的基礎(chǔ)架構(gòu),包含了數(shù)字檔案云系統(tǒng)所必須的一切軟硬件計(jì)算資源,向用戶提供以數(shù)字檔案為媒介的服務(wù)。在此首先介紹基于云計(jì)算的數(shù)字檔案云平臺(tái)系統(tǒng)的總體架構(gòu),然后討論基于該架構(gòu)的功能模塊和運(yùn)作模式。
一個(gè)通用的云計(jì)算平臺(tái)一般包括存儲(chǔ)設(shè)備、網(wǎng)絡(luò)設(shè)備、計(jì)算設(shè)備、安全設(shè)備等,并可提供多種服務(wù)模式,如基礎(chǔ)設(shè)施即服務(wù)(IaaS)、平臺(tái)即服務(wù)(PaaS)、軟件即服務(wù)(SaaS)等。檔案云系統(tǒng)利用網(wǎng)絡(luò)將地方檔案館分散的服務(wù)器整合成為大型的服務(wù)器集群,組成計(jì)算資源池,將各種資源包括計(jì)算服務(wù)、存儲(chǔ)服務(wù)、寬帶資源等都抽象成服務(wù),由檔案云體系中的軟件進(jìn)行統(tǒng)一管理。該體系中的檔案信息是分布式的,以數(shù)據(jù)流的形式分布存儲(chǔ)在各個(gè)數(shù)字檔案的節(jié)點(diǎn)上,這是檔案云的一個(gè)基本架構(gòu),主要分基礎(chǔ)設(shè)施、服務(wù)平臺(tái)、檔案云應(yīng)用和客戶終端,如圖2所示。

圖2 “檔案云”總體架構(gòu)
基礎(chǔ)設(shè)施主要是由云計(jì)算數(shù)字檔案管理應(yīng)用程序的數(shù)字管理節(jié)點(diǎn)、計(jì)算機(jī)專用網(wǎng)絡(luò)安全防火墻、公用和私有的硬件設(shè)施等構(gòu)成。將各級(jí)檔案館的服務(wù)器通過(guò)網(wǎng)絡(luò)互聯(lián)在虛擬軟件環(huán)境下,形成一個(gè)統(tǒng)一的軟件集群和數(shù)據(jù)存儲(chǔ)節(jié)點(diǎn),向上一層提供文檔的計(jì)算服務(wù)和存儲(chǔ)需求。
檔案云平臺(tái)提供的云環(huán)境包括用戶定制和構(gòu)建數(shù)字檔案館時(shí)基于Web云應(yīng)用所需的所有軟、硬件及中間件,使用戶更快更有效地開(kāi)發(fā)和部署自己的檔案館。
該檔案云系統(tǒng)將數(shù)字檔案館中查詢利用、檔案鑒定、虛擬檔案室等功能模塊封裝成云應(yīng)用,以服務(wù)的形式提供給用戶。用戶在使用檔案資源完成相關(guān)操作時(shí),無(wú)需搭建檔案館運(yùn)行環(huán)境或安裝相關(guān)軟件,只要在云終端登錄到檔案云系統(tǒng)的統(tǒng)一界面,通過(guò)付費(fèi)租用所需功能,便可完成相應(yīng)操作。
檔案云系統(tǒng)中的很多功能是其他功能運(yùn)行的基礎(chǔ),因此,將這些基礎(chǔ)功能進(jìn)行整合,構(gòu)建出檔案云系統(tǒng)基礎(chǔ)功能模塊,介于系統(tǒng)應(yīng)用層與平臺(tái)層之間,使檔案云應(yīng)用依靠基礎(chǔ)應(yīng)用層完成交付。

圖3 檔案云系統(tǒng)功能模塊具體設(shè)計(jì)
如圖3所示,“檔案云”SaaS應(yīng)用層依靠基礎(chǔ)應(yīng)用層實(shí)現(xiàn)交付,專注于虛擬化數(shù)字檔案館建設(shè)的業(yè)務(wù)需求。這種方式雖然犧牲了一些系統(tǒng)靈活性,但是能夠以較低的投入快速實(shí)現(xiàn)新功能,為平臺(tái)后期建設(shè)及功能拓展提供了便利。為實(shí)現(xiàn)“檔案云”系統(tǒng)的功能需求,在基礎(chǔ)應(yīng)用層中設(shè)計(jì)了一些功能模塊,這些功能構(gòu)成了軟件即服務(wù)平臺(tái)的關(guān)鍵技術(shù)。其中,系統(tǒng)包括大規(guī)模多租戶支持、定價(jià)收費(fèi)、認(rèn)證安全及可視化圖形引擎、報(bào)表引擎等組件作為基礎(chǔ)應(yīng)用服務(wù)平臺(tái)的關(guān)鍵技術(shù),與應(yīng)用層共同向用戶提供數(shù)字化檔案館的云服務(wù)。
數(shù)字檔案云系統(tǒng)是在傳統(tǒng)數(shù)字檔案館的基礎(chǔ)上,建立可伸縮的檔案云平臺(tái),使各中小檔案館利用網(wǎng)絡(luò)進(jìn)行資源共享,并可通過(guò)統(tǒng)一的服務(wù)接口定制自己的數(shù)字化檔案館,從而管理企業(yè)和政府現(xiàn)行的政策性文件和歸檔的歷史檔案信息。平臺(tái)中的服務(wù)可以是具體的服務(wù)器集群,也可以是數(shù)字檔案館的具體應(yīng)用。通過(guò)檔案云系統(tǒng)平臺(tái),用戶通過(guò)各種終端設(shè)備連接檔案云服務(wù),以按需付費(fèi)的方式定制所需功能,下面簡(jiǎn)單介紹一下系統(tǒng)中提供的云應(yīng)用。
檔案著錄是在編制檔案目錄時(shí),對(duì)檔案內(nèi)容和形式特征進(jìn)行分析、選擇和記錄的過(guò)程。本文中檔案云所提供的檔案數(shù)據(jù)著錄云應(yīng)用主要是將傳統(tǒng)的紙質(zhì)文檔轉(zhuǎn)換為數(shù)字化檔案,為之后的檔案查詢等其他操作提供基礎(chǔ)。
基于上述系統(tǒng)設(shè)計(jì)策略,如圖4所示,檔案云服務(wù)提供信息處理,文檔中轉(zhuǎn)、發(fā)布和訪問(wèn)以及對(duì)各種格式的數(shù)據(jù)存儲(chǔ),如數(shù)據(jù)庫(kù)、電子檔案等。作為檔案著錄人員可以通過(guò)網(wǎng)絡(luò)訂制應(yīng)用程序及防火墻的安全保護(hù),訪問(wèn)檔案云服務(wù)器提供的相應(yīng)應(yīng)用,進(jìn)行數(shù)字檔案的數(shù)據(jù)著錄過(guò)程。作為數(shù)據(jù)著錄管理人員的用戶通過(guò)網(wǎng)絡(luò)訪問(wèn)訂制的應(yīng)用程序直接訪問(wèn)檔案云內(nèi)部的節(jié)點(diǎn),繼而訪問(wèn)數(shù)據(jù)庫(kù)服務(wù)器,對(duì)數(shù)據(jù)進(jìn)行維護(hù)和審核。它可以實(shí)現(xiàn)文檔一體化管理,大大提高了檔案有效性,減少了工作量,避免造成檔案歸檔過(guò)程中的信息丟失。

圖4 數(shù)字檔案著錄云應(yīng)用示意圖
其主要工作流程是:多個(gè)數(shù)字檔案著錄人員通過(guò)網(wǎng)絡(luò)并發(fā)地訪問(wèn)該云應(yīng)用,進(jìn)行數(shù)據(jù)著錄,提交到檔案云中心分類存儲(chǔ),提高了著錄數(shù)據(jù)的有效性和完整性;同時(shí),著錄管理人員通過(guò)網(wǎng)絡(luò)可以查詢到已經(jīng)著錄成功的電子文檔,對(duì)其進(jìn)行審核,審核通過(guò)以后將數(shù)據(jù)存儲(chǔ),進(jìn)行信息共享。該數(shù)字檔案系統(tǒng)的正常運(yùn)轉(zhuǎn)提供完整的歸檔記錄和數(shù)據(jù)存儲(chǔ)支持,以及一個(gè)全新、開(kāi)放、有效的信息收集空間,使得數(shù)字檔案館的信息資源價(jià)值最大化。
檔案借閱查詢利用是信息利用和檔案管理的重點(diǎn)和難點(diǎn)之一,它是一個(gè)數(shù)字檔案館發(fā)布數(shù)據(jù)、檔案查詢和使用信息資源的技術(shù)平臺(tái),主要包括檔案查詢借閱平臺(tái)、庫(kù)房管理平臺(tái),用以提供檔案信息搜索、借閱申請(qǐng)、借閱管理、歸還管理、催還管理、查詢統(tǒng)計(jì)、圖形化庫(kù)房管理、庫(kù)房出入庫(kù)等功能。借助網(wǎng)絡(luò)平臺(tái),實(shí)現(xiàn)對(duì)檔案的查詢、借閱、歸還、統(tǒng)計(jì)、庫(kù)房進(jìn)行全過(guò)程管理,提高工作效率,方便檔案的查詢利用。
5.2.1 查閱管理
以簡(jiǎn)單搜索表單和分類導(dǎo)航頁(yè)面為主要查詢工具,面向?yàn)g覽器用戶實(shí)現(xiàn)簡(jiǎn)單查詢、組合查詢和分類查詢等功能,并且針對(duì)不同的用戶或角色,進(jìn)行查詢權(quán)限控制。云應(yīng)用提供的自助查閱受理和服務(wù)主要有:完成檔案利用者的在線注冊(cè)、資格審核、檔案查詢、檔案查閱審核、預(yù)約、借出和歸還、催還等功能。
5.2.2 庫(kù)房管理
主要是配合上述的查閱、查詢管理和服務(wù),提供實(shí)體檔案的出入庫(kù)管理、檔案物理位置信息服務(wù)和檔案庫(kù)房溫濕度、光照遠(yuǎn)程監(jiān)控管理等功能。在庫(kù)房瀏覽首頁(yè),將顯示所有庫(kù)房的整體排列,任意進(jìn)入一個(gè)庫(kù)房,將展示庫(kù)房?jī)?nèi)部的排架布置圖片,并顯示庫(kù)房名稱、庫(kù)房編號(hào)以及庫(kù)房長(zhǎng)和寬。繼續(xù)選擇,可以進(jìn)入下一級(jí)排架展示圖片,并顯示排架條碼、格子類型、規(guī)格與排架行列,同時(shí)也顯示其上實(shí)際安放的檔案。同時(shí)采用無(wú)線傳輸?shù)姆绞綄?kù)房中檔案出入庫(kù)的管理信息實(shí)時(shí)地更新在無(wú)線終端上,方便庫(kù)房管理人員進(jìn)行檔案存儲(chǔ)和管理。
檔案鑒定就是鑒別和判定檔案的價(jià)值,挑選出有價(jià)值的檔案交檔案機(jī)構(gòu)保存,剔除無(wú)保存價(jià)值的檔案予以銷毀。用戶通過(guò)網(wǎng)絡(luò)首先檢索需要鑒定的檔案加入待確認(rèn)鑒定列表中,檢查待確認(rèn)鑒定列表中的檔案信息,確認(rèn)檔案是否需要鑒定。若需要?jiǎng)t加入待鑒定列表,否則將檔案從待確認(rèn)鑒定列表中移除。檔案的鑒定和鑒定審核結(jié)束后,對(duì)確定需要對(duì)外公開(kāi)的檔案自動(dòng)公開(kāi),需要銷毀的檔案加入檔案銷毀列表,否則將檔案駁回重新鑒定,并填寫審核意見(jiàn)。通過(guò)對(duì)檔案鑒定流程的控制可以更方便對(duì)數(shù)字檔案進(jìn)行公開(kāi)和信息共享。
根據(jù)以上研究和分析,初步開(kāi)發(fā)出來(lái)的數(shù)字檔案館的檔案云平臺(tái),通過(guò)虛擬化軟件對(duì)底層的物理服務(wù)器進(jìn)行虛擬化部署和管理,構(gòu)建小型數(shù)據(jù)中心,形成小型虛擬資源池。中層的云基礎(chǔ)架構(gòu),則可以通過(guò)開(kāi)源的分布式計(jì)算模型,來(lái)構(gòu)建一種可擴(kuò)展、高性能的數(shù)據(jù)處理體系,從而完成數(shù)字化檔案資源建設(shè)的部署和管理等業(yè)務(wù)工作。而面向用戶的云終端的桌面顯示開(kāi)發(fā)技術(shù)及相應(yīng)的架構(gòu)技術(shù)則可以通過(guò)網(wǎng)絡(luò)編程技術(shù)完成配置和部署,建立個(gè)性化的云計(jì)算交互界面。

圖5 “檔案云”實(shí)現(xiàn)圖
在檔案云系統(tǒng)中,用戶只需為自己所需要的功能付費(fèi),因此,該系統(tǒng)建立了檔案云租戶管理功能,統(tǒng)一規(guī)范了各種云應(yīng)用的使用權(quán)限及計(jì)費(fèi)方式。
將云計(jì)算理念加入到數(shù)字檔案館的服務(wù)中,提出了一個(gè)基于云計(jì)算的數(shù)字檔案信息化平臺(tái)的構(gòu)建和運(yùn)作模式。利用檔案云的統(tǒng)一性、靈活性和開(kāi)放性將有助于加速數(shù)字檔案館的建設(shè)進(jìn)程,促進(jìn)檔案信息共享。目前該“檔案云”系統(tǒng)已在某省數(shù)字檔案館試運(yùn)行并獲得一定成效,但是將云計(jì)算充分運(yùn)用到數(shù)字檔案館中仍面臨巨大挑戰(zhàn)。
[1]馬張華.網(wǎng)絡(luò)信息資源組織[M].北京:北京大學(xué)出版社.2007.
[2]張建勛,古志民,鄭超.云計(jì)算研究進(jìn)展綜述[J].計(jì)算機(jī)應(yīng)用研究,2010,27(2):429 -433.
[3]劉振鵬,張寧,卞昭玲.云計(jì)算技術(shù)在檔案館中的應(yīng)用探討[J].蘭臺(tái)世界,2010(16):17-18.
[4]陶新權(quán),孫青,王亞.云計(jì)算在圖書館中的應(yīng)用[J].大學(xué)圖書館學(xué)報(bào),2010(2):54-58.
[5]張葉紅.“云計(jì)算”環(huán)境下圖書館信息資源共享模式初探[J].圖書館學(xué)研究,2010(11):30.
[6]王萍,張際平.云計(jì)算與網(wǎng)絡(luò)學(xué)習(xí)[J].現(xiàn)代教育技術(shù),2008(11):81-84.
[7]蔡學(xué)鏞.漫談云計(jì)算[J].程序員,2008(11):50 -51.
[8]Guangyou Xu,Yuanchun Shi.Pervasive Compute[J].Computer Learned Journal,2003,26(9):1042 -1050.
[9]Huai Jinpeng,Hu Chunming,Li Jianxin,et al.CROWN:SeviceorientedGrid Middleware System and Trust Management[J].Science in China(Series E:Information Sciences),2006:36(10):1127 -1155.