李偉超 朱學芳
摘要首先介紹數字保存系統相關理論,然后主要從數字保存系統本身、數字資源生產與保存機構、用戶以及信息技術支撐等方面來分析影響數字保存系統質量的因素,最后探討了數字保存系統質量保證體系建設的問題。
關鍵詞數字保存系統數字資源影響因素質量保證體系
數字信息漸已成為信息資源的主流,數字資源是經過數字技術處理的、通過網絡以數字形式發布、存取、利用的信息資源總和。隨著社會各個領域的信息活動全面步入數字化網絡化的環境,數字資源已成為人們獲取知識、信息的重要載體。數字資源具有分布離散性、復合性、動態開放性、交互性、關聯性、嵌套性、集合性、可重組性、軟硬件強依賴性等復雜性特征。但數字資源不同于印刷型文獻,通常人們看不到其形態和格式等特征。它需要通過某種工具,例如數據庫,存儲在磁介質上,并利用一定的系統加以管理和提供服務。數字資源需要利用一定的系統加以保存,這個系統就是數字保存系統。
1數字保存系統
1.1數字保存系統概念
數字保存系統(Digital Repository,Digital Ar-chive,Digital Preservation Repository)又稱數字典藏、數字保存倉庫系統或數字倉儲系統,根據RLG與OCLC合作發表的《可信任數字保存系統屬性和職責》(2002年)中所述:可信任數字保存系統的使命是為現在和未來的目標用戶提供可信賴的、可長期存取所管理的數字資源。
開放檔案信息系統(Open Archival Information System,OAIS)模型認為,數字保存系統的目標是要確保被保存的信息對于目標團體而言是獨立可理解的,也就是說,應當確保目標團體在沒有信息生產者(專家)幫助的情況下,仍能夠獨立地理解被保存的信息。為了實現這一目標,在保存系統中既要保存存檔對象,也要保存針對對象的描述和說明信息。
Heery,Rachel和Anderson,Sheila在其撰寫的Digital Repositories Review中寫到,數字保存系統是數字資源的收藏集合。
數字典藏(Digital repository)作為一個系統,其目的是搜集和存儲數字信息資源以供長期保存和使用。一個數字典藏系統一般具有輸入輸出、存儲和檢索的功能。任何組織、機構和個人都可以建立自己的數字典藏系統。數字典藏系統中所收集的內容也可以是任何數字信息資源。
從以上表述可以簡單歸納出,數字保存系統主要保存內容是信息資源數字化的產品或原生型數字資源,或這兩種類型的復合。
1.2數字保存系統特征
Heery,Rachel和Anderson,Sheila經過分析認為,數字保存系統應具備如下特征:
(1)不論是內容創建者、擁有者還是第三方機構都可以在此存放數字資源;
(2)不但可以管理數字資源內容本身,還可以管理元數據;
(3)可以提供一系列最基本的服務,如數字資源導入、導出和存取控制等;
(4)必須是可持續的、可信任的,能夠提供較好的管理支持平臺。
另外,他們還認為,學術交流的日益增長是建立數字保存系統的動力,無論是機構數字資源保存系統,還是各學科資源的保存管理,都要盡可能地支持開放存取。
1.3數字保存系統構成
通常一個完整的數字保存系統應包含下列四部分:
(1)存儲數字資源的物理設備,如服務器、磁盤陣列、光盤庫和相關的交換和網絡設備等;
(2)用來管理被存儲的數字資源和有關系統設備的軟件;
(3)符合數字保存系統要求的物理環境,如館舍、防靜電、防塵和防潮等;
(4)數字資源長期安全保存的規章、條例,以及防災應對措施等。
另外,廣義地說,還應有一定的組織機構和具有數字保存系統管理技能和經驗的人員。
2影響數字保存系統質量的因素分析
數字保存系統主要保存數字信息資源,數字保存的目標是維持數字信息資源的長期可生存能力(要求被保存數字對象的比特流完整無缺并且能夠從它所存儲的載體之上讀取)、可呈現能力(指的是能夠將比特流轉變為一種可以被人看,能夠被計算機處理的能力)和可理解能力(包括提供足夠的信息使得這些被呈現的內容可以被目標用戶理解和認識)。對于影響其質量的因素進行分析,可有效地保證其保存數字信息資源的質量,為用戶的數字資源長期存取提供服務。因此,通過分析,影響其質量的因素大致有以下幾個方面:
2.1數字保存系統本身
首先從數字保存系統本身分析,數字保存系統本身的影響因素包括其性能指標、管理人員因素等方面,主要因素是其性能指標方面,一個完整的保存系統,其性能指標越高,相應存取數字信息資源的質量就越高,為用戶提供的服務就越可靠。
還有管理人員因素,即具有數字保存系統管理技能和經驗的工作人員。有時,人員因素比技術因素更重要,數字保存系統需要專門的技術人員和管理人員,并需要配備必要的專門管理制度,才會保障數字保存系統數字資源的存取服務。
2.2數字資源生產與保存機構
從數字資源生產與保存機構角度來分析,數字資源生產機構主要負責數字資源的生產與加工,數字信息資源的質量指其信息來源的質量,也指數字資源所包含的信息單元內容的質量。主要由生產機構負責,在數據生產(包括掃描、加工、描述與組織等)中涉及到數字資源格式的選擇,數字資源描述的規范性和標準化,數字資源的生命周期等問題,生產的數字信息資源的質量將影響到后面的數字保存環節。
數字保存機構是一個完備的組織管理系統,不僅可以保證數字保存系統的長期有效性,而且保證它所負責的數字資源的長期有效性,可以從機構規定、人力資源配置、可持續發展的資金保障、商業運作模式及投資風險管理等方面來保證數字信息資源的保存質量。
2.3用戶自身
數字保存系統主要目是為用戶的數字資源長期存取提供服務,其直接與用戶發生關聯,用戶本身的影響因素,主要包括對用戶需求分析的程度、用戶技能、用戶負擔、用戶反饋等方面都不可避免地影響數字保存系統提供存取服務的效果。
2.4信息技術支撐
從信息技術支撐角度分析,數字保存系統平臺、數據存儲、數字遷移、數據安全、系統監控與反饋、系統運行日志管理等方面都是影響數字保存系統質量的有關因素。
2.5其他因素
以上是影響數字保存系統質量的幾個重要因素,但不同的保存機構,不同形式的數字資源,其質量還受一些其他因素的影響。如數字資源產權管理、是否滿足有關通用的質量保證標準等。
3數字保存系統質量保證體系建設
美國的朱蘭(J.M.Juran)博士指出,質量保證就是對產品的質量實行擔保和保證。國際標準化組
織建議草案(ISO/TC176/DP8402)對質量保證體系的建議:質量保證體系就是共同保證產品,過程或服務滿足質量要求的組織機構、職責、程序、活動、能力及資源。
在建設數字保存系統質量保證體系過程中,通過分析影響數字保存系統質量的相關因素,有效地減弱它們的負面影響。質量保證體系的建設貫穿于質量管理實施的全過程,包括數字資源生產、數字資源保存等環節,質量保證過程不僅為數字保存系統的最終結果負責,而且還要對整個管理過程承擔質量責任。其目的是在質量保證體系中有效地實施全部有計劃、有系統的數字資源生產、保存等活動,為用戶提供數字資源存取服務提供可靠保證。
數字保存系統質量保證體系的要素主要包括:
(1)數字生產過程中的質量控制;
(2)數字保存系統的質量保證指標體系;
(3)數字保存系統的風險評估;
(4)數字保存機構部門質量管理業務標準化和質量管理流程程序;
(5)用戶利益的質量監督;
(6)其他質量保證措施。
較早明確提出對數字資源生產質量進行調控并探討質量調控過程的是美國學者Anne R.Ken—ney。之后,美國康奈爾大學圖書館在此基礎上對數字化生產質量調控步驟進行了比較詳細的論述。
數字保存系統本身可以被視為數字保存機構用來生產銷售的一類產品。根據朱蘭的“全面質量管理”觀點,產品質量不僅取決于各個生產環節,也體現在決策、設計、檢查、使用和服務等環節中。對數字保存系統來說,“決策”、“設計”和“服務”由保存機構實施,“生產”和“檢查”由數字資源生產機構實施(有的數字保存系統的數字資源生產者與保存者是同一個機構,有的則是不同機構),“使用”由用戶實施。另外,數字保存系統需信息技術的支撐。因此,數字保存系統本身的質量保證指標體系包括系統管理、系統性能、用戶服務和技術支持等四個部分。
數字資源長期保存過程中存在著許多風險,主要表現在硬件故障、軟件故障、管理漏洞及自然災害等方面,除以上常見風險外,數字資源長期保存過程還存在著諸如經濟、知識產權、人員組織等方面不可忽視的風險因素,需要引起有關研究領域的高度重視。對數字保存系統數字資源的存取風險進行有效的評估與預測。如有學者針對數字遷移的風險進行分析,提出作為一種數字資源保存策略,數字遷移的過程和結果都具有不確定性。為盡可能減少這種不確定性所帶來的風險,方法之一是構建一個風險管理框架。該框架將整個遷移過程分解為若干個可描述的且可計量的步驟,風險評估就是將風險分析過程進行結構化的一種方法。如果這種方法描述和使用得當,不同人對數字文件的相同信息進行評估,所得到的風險值應該基本相同。
數字保存系統質量保證體系是一個全程系統工程,它在不同部門、機構、用戶之間展開,是一個圍繞數字信息資源保存動態的、開放的系統,也是一個復雜過程,其核心是有效地保存數字信息資源,保證用戶的有效利用。
4結束語
本文通過分析影響數字保存系統質量的相關因素,積極探討數字保存系統質量保證體系的建設,旨在拋磚引玉,引起學者的關注和實踐者積極探索,促進數字保存系統各要素相互協調、相互配合、發揮整體功能和實力,數字保存系統也才能成為高效的存儲載體和媒介,保證數字信息資源存儲效能。