◇ 文 / 臨滄市第二中學 罕杰
少數民族檔案文物古籍數字化標準建設初探
◇ 文 / 臨滄市第二中學 罕杰
少數民族檔案、文物、古籍是各少數民族社會歷史發展的真實記錄,是重要的民族文化資源和寶貴財富。多年來,在各級黨委、政府的關心重視和各職能部門的推動下,業務部門、相關機構針對檔案、文物、古籍的不同特點分別開展了數字化建設工作,取得了很大成績。但由于各部門、機構職能不同,工作側重點不同,所建立的數據資源標準各異,在一定程度上制約和影響了信息共享。其實,少數民族檔案、文物、古籍之間既有區別,又有聯系,一件少數民族紙質文書,在檔案館稱為檔案,在博物館稱為文物,在民族古籍部門稱為民族古籍,在圖書館稱為手稿:同一段少數民族舞蹈錄像在檔案館稱為聲像檔案,在民族博物館稱為田野調查錄像資料,在圖書館可能稱為音像出版物。因此,建設一個既包含大致統一,又兼顧行業門類特點的數字化標準是必要和可行的。對于不同機構而言,使用別的機構形成的少數民族檔案、文物、古籍數字化產品只可能是異構數據。開展標準化建設時,我們應立足于對異構數據的包容或兼容,重點把握好以下幾點:
一是求同。要概括各機構數字化標準中的共同部分及必須一致的部分,形成統一的標準。重點是文件數據格式和數據描述語言的統一。無論是掃描的產品還是數碼照片、數字錄音、錄像,各個機構必須統一或者采用市場通用的格式,其中復雜程度最高的是數字錄音和數字錄像文件數據格式,各機構不能使用專用文件格式,也是文件能被各個機構使用的基本要求,這是實現各行業系統信息共享的必要要求。在數據描述語言上,應使用適應能力比較強的語言,如XML(可擴展標識語言)就是一個比較好的選擇。
二是存異。標準化建設應尊重各個機構的管理傳統和標準體系。這主要是指描述信息的元數據設置和定義。在這方面是難以整齊劃一的,如圖書館和檔案館界之間都有自己的標準體系,各自都有龐大的系統,在它們之間統一標準是難以想象的,其復雜程度和成本都不允許這樣做。

展出的古籍 朱勇 攝
三是相互兼容。采用一定的技術方法,將各個機構的少數民族檔案、文物、古籍數字化產品進行再轉化或加工,以達到信息共享。基本的技術方法有:封裝,將異構的數據按統一標準進行封裝輸出,然后交換給其他機構,以便被其識別。這要求各機構共同制定數據封裝標準;元數據解析,制作功能性元數據解析標準,使各個系統形成的描述數據能在不同機構的系統下被“翻譯”、識別和讀取,從而實現信息共享,但這一方法的前提是各個行業系統必須有固定的標準,且隨著各自標準的發展,這個功能性元數據解析標準體系也要隨時更新和發展;轉換,即將來自不同機構的數據按自己的標準轉化為自己系統能識別的數據,這種方法的問題是不一定能完全達到要求,或者可能使數據受損。
鑒于此,筆者作如下建議:
第一,進行標準銜接。各行業形成自己系統化的少數民族檔案、文物、古籍數字化標準體系,是進行行業系統間信息共享的必要過程。目前,各個行業系統還有很多標準需要建立和完善,因為我們既不能跨行業制定標準,更不能在缺乏標準的前提下統一多行業標準,加快發展各行業系統的少數民族檔案、文物、古籍數字化標準是進行跨行業標準化協調工作的前提和基礎。
第二,建立標準建設合作組織,加強標準協調工作。應建立少數民族檔案、文物、古籍數字化標準建設聯席會議或標準協調委員會。由這個組織來協調各行業標準建設的進度、標準的設立和統一基礎性標準,組織開展實現信息共享的必要標準研究制定和技術開發工作。
第三,搭建開放式少數民族檔案、文物、古籍數字化核心元數據集制定平臺。開展少數民族檔案、古籍、文物數字化標準建設涉及領域多、工作量大、技術含量高、建設周期長,僅靠少數專家或機構難以保證工作效率。參照DC的架構,搭建少數民族檔案、文物、古籍數字化核心元數據集制定平臺是有效的工作措施,通過這個平臺吸納更多的人參與標準研究和制定,能更好地提高標準制定的效率和標準設立的科學性、適應性。目前圖書館和檔案部門在標準建設方面走在其他行業的前面,應充分發揮少數民族檔案、古籍、文物數字化標準協調的核心作用,組織好技術平臺和組織好技術專家的介入工作,其他各行業也應在標準建設合作組織的協調下,組織人員共同參與,使之不斷發展、壯大。
第四,共同制定數據“封裝”標準。應針對各行業已有的少數民族檔案、文物、古籍數字化標準,開展這些標準指導下形成數據的“封裝”標準制定工作。已有標準意味著相對規范的數字化成果的形成,制定數據封裝標準是使已形成成果盡快實現信息共享的客觀需要。目前,檔案部門在電子文檔管理方面就積累了較多的數據封裝標準制定經驗,有力地促進了異構電子文件的管理工作發展,這對建立少數民族檔案、文物、古籍數字化標準工作具有很好的借鑒作用。我們應盡快采用科學合理的方法,推動跨行業信息共享的早日實現。
(責任編輯 方紹榮)