金俊蘭
(湖北師范大學,湖北 黃石 435002)
數字檔案館建設思考
金俊蘭
(湖北師范大學,湖北 黃石 435002)
在國家信息基礎建設中,穩步推進數字檔案館建設是當前形勢下多數國家的重要任務,我國亦不例外。數字檔案館雖然在我國已經有了十余年的發展,但目前仍處于初級階段,我國仍然需要不斷探索與思考,促進數字檔案館建設的進一步發展。本文主要從數字檔案館概念及相關研究入手,立足數字檔案館在新技術、新理念中的新發展,對數字檔案館建設進行思考。
數字檔案館;現狀;新發展;建設
隨著網絡信息時代的到來,數字檔案室成為衡量檔案室信息建設水平高低的標志。尤其最近幾年,信息方面新技術、新理念的發展使數字檔案室建設成為廣大學者研究的重要課題,隨之加強的還有各國對數字檔案室建設的投資力度,推進了數字檔案室的進一步發展。在這種熱潮中,如何促進我國數字檔案室的理性建設和可持續發展,是我國數字檔案室建設當前面臨的焦點問題。而在探討數字檔案室在新技術、新理念中的新發展及對數字檔案室建設進行思考前,我們首先應對數字檔案室及其相關研究有一定了解。
(一)數字檔案室概念、特點、優勢
關于數字檔案室概念的定義,目前尚不統一。概括來說,數字檔案室即指依托數字化形式而運行的信息文獻檔案室,通過數字技術對信息文獻進行收集、整理、保存和發布。利用數字技術,數字化檔案室可將各種不同載體的信息資源存貯于檔案室內,讀者只需要通過網絡即可對所需的信息進行查詢和傳播[1]。數字檔案室在形式上不僅可以以具體的社會機構或組織存在,同時還可以以虛擬的網站等數字信息集合的形式而存在。
數字檔案室的基礎為數字化信息資源,數字資源是指通過通信技術及多媒體技術等而獲取的信息資源總和,正是在這些數字化資源的支撐下,數字檔案室才沒有淪為空中樓閣。數字檔案室的傳遞手段為網絡化,在這種網絡化的傳遞中促使用戶對檔案室數字資源的共享得以實現。數字檔案室除了注重對網絡手段的利用外,還對多種信息技術加以應用,在多種信息技術的支撐下,為用戶提供了一個傳統檔案室中不可能提供的多庫連接的信息存取服務。此外,數字檔案室具有資源共享的特點,讀者對數字檔案室資源的訪問不用經過室員的中介作用同樣可以進行,很多人可同時對數據資源加以利用,在信息資源的獲取上既方便又快捷。
相對傳統檔案室以紙質文獻為主的室藏載體來說,數字檔案室的室藏中同時可以存在多樣的儲存介質,如磁盤、光盤、磁帶等,使讀者獲得更豐富是閱讀感受。數字檔案室在資源的儲存上對溫度濕度、亮度等儲存條件相對傳統檔案室來說較低,且可復制和備份,能夠促進檔案室文獻安全性有了大幅度提升[2]。與傳統檔案室相比,數字檔案室的存儲在紙質文獻的保存方面占用房屋的空間較少,且數字化形式儲存可節省很多人力。在信息資料的借閱與訪問上,數字檔案室可通過互聯網實時傳遞,比傳統檔案室要靈活很多,大大提高了檔案室信息使用效率。
(二)數字檔案室相關研究
數字檔案室當前的研究很多,但追溯到最初的研究時,最先正式將這一研究概念提出的是美國國家研究創新組織。在報告中,他們計劃對一種稱為數字檔案室系統的開放架構加以建立,通過該系統使檔案室可以實現為不同地區用戶提供服務,使用戶能夠以機讀形式存在的大量分布式信息資源方便地訪問。之后的將近30年里,雖然數字檔案室的研究越來越多,但其概念定義仍然沒有統一下來,不過在信息資源和服務上卻已經達成了兩點共識。即在信息資源上,數字檔案室的資源屬于集合資源,且內容海量呈分布式;而在服務上,數字檔案室具有傳統檔案室所無法完成的跨地域服務,對網絡訪問給予支持是其一大特點之一[3]。
數字檔案室研究當前已經具有相當大的規模,并成為檔案室研究中的重要組成部分。研究顯示,大量的數字檔案室系統已經開始投入使用,但在實際應用中,用戶面對眾多的獲取信息途徑反而開始出現選擇迷茫。對資源的查詢往往穿梭于多個系統之間,導致很多時間與精力的浪費。在當前的數字檔案室建設中,突出的需求即為資源的整合、集成和共享。在計算機和網絡不斷發展的過程中,數字檔案室技術也隨之經歷了不同的階段。數字檔案室系統最初為以書目為中心的檔案室自動化系統,之后演變為全文資源服務系統,再之后向多媒體數字檔案室轉變,發展到現在已經轉變為提供統一界面使用平臺給分散的資源與服務等[4]。不過,當前數字檔案室的服務仍然無法完全滿足實際的需求,還需要繼續研究建設。
(一)網格技術在數字檔案室中的應用形成了新型共享模式
網格出現在人們的視野之中,是以一種繼萬維網之后新型網絡平臺的姿態出現的。通過網格中間件,網絡可以被虛擬為巨大虛擬計算機,該計算機中包含各節點資源總合,網格應用層在使用接口上可由其提供透明和一致的使用接口,這種方式促使網格范圍內存儲資源、信息資源等高效、全面共享的實現。在網絡基礎上,用戶可對需要的資源加以使用且不需要對資源的具體位置和細節進行了解[5]。
網格技術在數字檔案室中的應用,從網絡基礎架構上為其提供了共享多種資源的途徑且是在不同系統之間的共享途徑。網絡技術可使孤立的系統有所轉變,在趨向網格節點的過程中不再孤立存在,促進數字檔案室資源實現普遍性共享,同時有利于推進數字檔案室實現服務復用目的。對數字檔案室中網絡技術的應用,國內外都有較多研究,DILIGEN T數字檔案室基本架構是其中比較有代表性的項目,該項目使網絡技術得以有機融入到數字檔案室技術中。
(二)數字檔案室集中模式的瓶頸被P2P技術解決
P2P是一種對等網絡,在該種互聯網模式下每個節點的地位在網絡中都是對等的,每個結點既充當服務器,為其他結點提供服務,同時也可反過來享用其他節點所提供的服務(見圖1)。在各個網絡節點中,P2P網絡中的資源和服務是以分散的形式存在的。在這種非中心化的模式下,信息的傳輸與服務的完成可以擺脫中間環節與服務器,而在節點之間就可以直接完成,這一特點對集中式服務器處理能力具有相當大的改善,彌補了其處理較為有限的缺點[6]。除了這點優勢之外,P2P的優勢還體現在分布式搜索的實現方面。在P2P技術環境下,可以直接而又實時地完成對等點之間的搜索,避免了傳統技術中數據產生實時性不高等缺點,在這一過程中還可以使集中式搜索中覆蓋廣度與深度不夠等突出問題得到解決。在當前的很多領域中,P2P已經開始廣泛地與網絡技術進行結合。對數字檔案室來說,P2P的應用能夠提供良好的支持給其分布式管理特性,在一定程度上實現分布式系統間的直接互操作,促進數字檔案室中文件內容、存儲容量等多種直接共享的實現。P2P數字檔案室,是用java實現的,其中的節點可以由每一個參與者所代表,可集中對高度分布的信息資源進行搜索,大大改進搜索效果。

圖1:P2P網絡模式
(三)SOA與Web服務支持為數字化檔案室提供了動態配置機制
SOA作為一種軟件設計方法,其在模式上主要是一種面向讀物的c/s模式,在其作用下一系列的功能單元被分解出來,這些單元組成了軟件系統需要實現的業務功能,其服務的實現主要依賴這些軟件組件的封裝作用。在松散耦合的關系中,SOA應用系統便在此前提下由許多“服務”和“服務消費者”組構形成,基于這一特點SOA不僅更加靈活,且伸縮性較強,而且在服務復用的功能中,應用系統能夠在不斷變化的用戶需求中實現快速迎合[7]。Web服務這種軟件系統是在一定的環境中形成的,具有互操作性,它的格式描述接口在處理上可以用機器進行,對基于XML的SOAP消息傳輸Web是給予支持的。在服務的理念上,Web與SOA的吻合性很高,且使基于HTTP的SOA應用系統能夠實現首次的動態構成。
在數字檔案室中,SOA與Web服務的應用從軟件架構上提供了一種“可動態配置”機制(見圖2)給數字檔案室,不僅使異構系統間互操作得以實現,而且促進了數字檔案室在客觀需求變化的適應上敏捷性大大增加。
SOA在數字檔案室中的應用,不斷增多是從2005年后開始,其中歐盟資助的DELOS為最具代表性項目。在公共領域對下一代數字檔案室體系進行研究與開發,是DELOS的主要宗旨。DELOS的兩大貢獻在于對第一個完整、規范的數字檔案室參考模型進行了頒布,同時對數字檔案室管理系統原型進行了建立。SOA與Web服務在數字檔案室中的應用,預示著數字檔案室動態配置大規模實現的開始。

圖2:SOA與Web3.0下的數字檔案室平臺
(四)云計算與云存儲在數字化檔案室中逐步應用
云計算的產生并非憑空而來,而是基于分布式處理、并行處理等這些技術基礎而產生的。云計算能夠催生虛擬超級計算中心,在這一過程中促使超級計算機的功能在更低的成本下實現。云存儲這一概念的出現,是基于云計算概念的延伸與發展,云存儲可以通過應用軟件實現集合并使各種不同類型的存儲設備協同工作[8]。數據存儲和管理,在云計算系統中為核心存在,當對其進行大量的云存儲設備配置時就會促使其向一個云存儲系統轉變。“云”的概念,在Yahoo、Amazon等互聯網服務提供者的推動下得到了很大發展。這些互聯網服務者還對云服務的提供加以嘗試,對用戶通過Web方式對“云”中資源的使用持允許態度,在這種推動下計算機計算、存儲能力可轉變為公用資源。我國云存儲市場規模,近年來也一直不斷上漲(見圖3),并逐漸應用于數字檔案室中。對數字檔案室的發展來說,云計算和云存儲使其擴充擁有了更多余地。在數據的處理、搜索和挖掘上,常用的SAN架構和標準的關系數據庫當前是存在一定瓶頸的,而當數據量達到PB級時這些瓶頸即可得到突破。在數字檔案室的建設中,云計算與云存儲當前的應用正在逐步進行,從數字化檔案室的發展形勢來看,在“云”上或遷至“云”上將會成為更多數字檔案室的建設趨勢。

圖3:我國2009—2014年云存儲市場規模狀況
(一)立足資源這一根本來對數字化檔案室進行建設
從數字檔案室的特點可知,信息資源為其建設基礎,數字化檔案室在建設過程中必須以資源為本。自建資源與購買資源是信息資源中的兩大組成部分,其中包括合建資源動態資源、專題信息庫等都屬于自建資源。對于尚未達到實用階段的自建資源,必須對其加強建設。動態資源通常產生于教學、科研活動中,是一種非正式的信息資源,但這類資源具有特殊的價值,所以在數字化檔案室建設中其組織、管理和發布都需要專業人員來進行。在資源的使用價值上,其主要的決定因素為資源的特色和質量,則兩大因素同時對數字檔案室的存在價值具有決定作用[9]。數字檔案室的資源建設,要對質量控制加以強調,根據既定標準揭示和利用資源,降低元數據二次加工的隱患。
(二)數字化檔案室建設要開放體系
在數字檔案室建設中,開放可謂其靈魂。作為一個虛擬的概念,數字檔案室對分布式管理系統的資源共享和服務雙重強調,這一強調對數字檔案室系統的開放性便有了較多要求。在對數字檔案室進行整體規劃和系統設計過程中,必須著重考慮開放性這一重要指標。在用戶界面的友好、功能齊全等方面,很多已經建成的數字檔案室系統均會考慮很多,但對其他系統如何實現對本系統功能和數據的共性卻很少考慮,這種“重內輕外”在數字化檔案室建設中是尤其要不得的,容易使其成為信息孤島[10]。面對未來,數字化檔案室建設必須立足大環境,通過合理地封裝與開放對世界數字檔案室建設經驗積極吸收,引導數字檔案室建設能夠與時俱進,始終走在大環境的前沿。
(三)數字化檔案室建設要重視集成工作
集成在數字檔案室建設中屬于主題式的存在,這里的集成主要指通過對可用資源與服務的充分利用,對數字檔案室進行開拓性地組合創新,構建特定的數字檔案室。在數字檔案室開發中,集成用于最終階段,通過集成將功能連貫的應用系統提供給用戶,在這一過程中數字數字檔案室的建設成果可以被更加直觀地呈現出來。在數字檔案室的集成工作中,開放信息源的多少具有重要影響,掌握足夠多的開放信息源是其建設必須,也是數字化檔案室建設集成的基礎[11]。數字化檔案室在建設的過程中,應立足現實中的已有條件正確選擇資源集成途徑,通過合作等方式將分散的資源和服務進行有機集成,通過資源的開放來實現彼此雙贏,形成整體化效應。
(四)數字化檔案室要做好安全保障工作
數字化檔案室建設還必須注意安全問題,基于計算機技術的數字檔案室在建設中會面臨著互聯網本身所具有的較多的安全隱患,尤其伴隨著數字檔案室系統的開放的不斷提高,其安全問題也隨之凸顯。數字檔案室的安全除了包括安全運行外,還包括安全使用。前者要求數字檔案室在建設中必須做好防止非法入侵及病毒破壞等工作,后者要求數字檔案室必須對資源的合法使用給予安全保障,其中后者是當前數字化檔案室建設中熱點和難點[12]。數字檔案室建設在對綜合的安全策略進行制定時,必須要考慮要用戶的方便性,同時還需要考慮不增加過多的額外流量。
在當前的社會發展中,數字檔案室相對傳統檔案室具有突出的優勢,與數字檔案室有關的研究成果也很多,數字檔案室建設是檔案室發展的必然趨勢。新技術在數字檔案室中的應用,進一步推動了數字檔案室的建設,不過在建設過程中數字化檔案室必須從自身現狀出發,立足資源建設根本,做到開放體系、廣泛集成,同時要好安全保障工作。
[1] 張紅亮.數字檔案室建設芻議[J].科學中國人,2015,(9):55-56.
[2]張金雁.數字檔案室建設與發展淺析[J].科技致富向導,2015,(6):128-130.
[3]朱長宏.淺談數字檔案室建設與發展趨勢[J].中文信息,2015,(6):89-91.
[4]夏立新,胡守敏,劉楓.我國數字檔案室研究十年:基于科研項目分析,2010,(5):40-42.
[5]李偉.萬丈高樓平地起——淺談網格計算基礎.http://www.iipl.fudan.edu.cn/research/gc.html,2009-12-08.
[6]趙捧未,郭利偉.基于Super-P2P的個人數字檔案室虛擬社區知識組織模型構建研究[J].情報理論與實踐,2010,33(6):77-79.
[7]孟優優.論檔案室數據共享與交換平臺的可行性--鑒于SOA的研究[J].數字化用戶,2014,(12):91-92.
[8]馬曉亭.云計算環境下數字檔案室數據安全存儲架構與策略研究[J].高校檔案室工作,2012,32(4):33-34.
[9] 李躍輝.淺析如何建設數字化檔案室[J].現代閱讀,2012,(2):88-90.
[10]周義剛.高校數字檔案室建設思考——以湖北大學檔案室為例[J].情報探索,2009,(5):104-106.
[11]裴亞欣.淺析如何做好數字檔案室管理工作[J].今日財富(金融發展與監管),2012,(5):62-63.
[12]劉洪,周明君,劉暉.對我國數字檔案室建設的三點思考[J].網絡安全技術與應用,2014,(3):230-232.
金俊蘭(1967-),女,副研究館員,主要從事檔案信息化、檔案信息開發與利用等研究。