王艷翠 蔣南 周麗 王旻霞

【摘 要】檔案館的用戶本身擁有一個巨大的檔案知識庫,本文對旨在探索捕捉用戶知識并將其轉化為檔案知識的方法,并對愛沙尼亞國家檔案館將用戶知識轉化為檔案知識的實際應用開發情況進行了介紹。
【關鍵詞】數字化保存;開放數據;知識;眾包;OAIS
0 引言
檔案館的用戶本身擁有一個巨大的檔案知識庫。有一部分用戶已經參與了某些活動,還有一部分用戶對參與者有所了解,還有一部分用戶是某方面主題的專家學者,他們所擁有的知識足以能夠彌補檔案知識中存在的不足。開放檔案信息系統(OAIS)定義了由指定機構為了維護信息獨立而做出的長期保存行動是天經地義的。但在現實生活中要做到這一點卻是非常困難的 ,由于各種原因,信息的描述不夠詳盡、在預獲取或獲取過程中信息的結構不足。例如,如果生產者在組織歸檔時已不存在,那么就不可能達到提交信息時預期的質量水平;檔案館有興趣(或有義務)獲取這些記錄,可能的結果就是傳遞的信息低于理想質量。而事實上,檔案館已經獲得了這條信息質量優劣不等的各種記錄。愛沙尼亞國家檔案館對OAIS進行了改進:在數據獲取和數據管理功能條目之間補充增加一個新的鏈接從而能夠更有效地更新詳細的信息;從而研發出新的檔案信息系統——AIS2.0(檔案信息系統2.0)。
1 愛沙尼亞國家檔案館的檔案軟件
1.1 開放檔案信息系統
DIKW(數據、信息、知識和智慧)模型中有三個模塊從數據、信息和知識三個基本方面來劃分。檔案館藏的部分材料僅僅是內容片段——沒有明確關聯的、離散的事實,從而被認為是簡單的數據;部分館藏可以被視作是信息,因為它有內容并且相互關聯而且還是數據的集合,還有部分館藏被認為是相互關聯的(已收錄的)知識。在本文中,我們遵循OAIS精神。OAIS認為有可能在個人和個別系統的基礎上對知識進行合并,這就意味著在個人和系統之間的基礎上對知識庫的元素進行傳送。通過走近知識(如:根據語境聯系和組織來補充簡單的數據和信息),我們可以獲得更好的關于檔案收藏內容的概述,從而使我們建立更好的(更快、更準確、人性化、個性化等)獲取解決方案,并提供對已存檔知識的多方面、多角度的可獲取性。
1.2 愛沙尼亞國家檔案館的檔案軟件
愛沙尼亞國家檔案館設計的檔案軟硬件都適合應用OAIS系統。OAIS系統同樣用于管理模擬記錄和數字化記錄(具有明顯媒介差異的記錄)。目錄工具是媒介未知的——用記錄數字記錄的工具模擬記錄檔案描述的處理。
愛沙尼亞國家檔案館有一個電子檔案目錄——檔案信息系統。檔案描述通常具有以下典型特征:第一,背景——更多的傾向于水準描述,而不是綜合性描述。第二,僅用較少的數據填充較低級別的文件項目。第三,集合獨立:除了把背景改編成普通目錄外,沒有其他方式獲取記錄水平(即在不同集合找到相似的記錄)。鑒于以上情況,愛沙尼亞國家檔案館決定開發一個新的中心目錄系統,該系統是以分面分類法和眾包設計為核心,有助于用各個可能的方式把知識轉化成檔案。
1.3 OAIS系統中用戶——檔案的知識轉化
要建立這種知識轉化的理論基礎,我們需要一種方法采取用戶輸入并用它來更新檔案信息。OAIS認為需要用戶補充和更新現有的信息:重要的是OAIS的獲取和內部數據模型能夠足夠靈活的吸收這些新的描述,從而普通用戶群體能夠從這些研究中獲益。所有的詳細數據都是在數據管理和檔案存儲功能模塊中處理的。數據管理功能模塊不嚴格提供任何具體的知識,但它包含了更新檔案知識的一般邏輯。數據管理功能模塊負責檔案數據更新,更新包括加載新的描述性信息以及歸檔管理數據。數據管理功能模塊包括接收數據更新功能,它可以在數據管理的永久性存儲中增加、修改或刪除數據。根據OAIS的設想:“更新的主要來源是采集,它為新的檔案數據包提供描述性信息并管理系統更新和檢驗更新”。由于管理模塊涉及由定期審查而產生的系統相關信息,而不是檔案館藏的描述性信息,管理模塊在此不做討論。采集功能模塊協調數據管理和檔案存儲之間的更新。然而,實際上可能涉及一些難題:第一,OAIS設計的采集接收原則是:“一次一個集合”,但富集過程可能涉及來自多個集合/背景資源的最佳使用。第二,質量控制方面的異議:通常并不要求不同檔案機構的檔案保管員檢查提交信息包描述的準確性(這通常是檔案保管員作為生產方的責任),但在眾包情況下,用戶提出的更新描述在成為正式存檔說明的一部分之前進行手動檢查和確認。某些情況下,上述原因可能導致采集功能模塊通過眾包實現更新描述的功能不能夠升級。愛沙尼亞國家檔案館在一代數據管理功能模塊的基礎上進行了升級。在OAIS 模型中加入了一個“從獲取功能模塊”到“接收數據更新”直接連接功能(如圖中加粗虛線箭頭)。
【參考文獻】
[1]http://dlib.org/dlib/march16/karberg/03karberg.html.
[2]Archer P,Goedertier S, Loutas N(2012).D7.1.3-Study on persistent URIs, with identification of best practices and recommendations on the topic for the MSs and the EC.
[3]CCSDS(2012).Reference model for an open archival information system (OAIS), Consultative Committee for Space Data Systems, Magenta Book.
[責任編輯:朱麗娜]