鄭艷昆
中國現代文學館,北京 100029
淺述少數民族文字歷史檔案的數字化技術保護
鄭艷昆*
中國現代文學館,北京 100029
少數民族文字歷史檔案記載了本民族的發展歷史、風俗習慣和重大事跡等內容,不僅是一種寶貴的非物質文化遺產,而且也為我們更加深入和全面的了解少數民族歷史文化提供了至關重要的參考。但是由于這些文字歷史檔案的年代較為久遠,加上保護和管理工作不到位,因此許多文字歷史檔案出現不同程度的缺失、損毀問題。利用數字化技術將這些珍貴檔案進行數字化和電子化保存,逐漸成為少數民族文字歷史檔案保護的一種可行性途徑。
少數民族;文字歷史檔案;保護現狀;數字化技術
習近平主席在聯合國教科文組織總部的演講中指出:在繼承民族優秀文化的同時,促進民族文化現代化,以現代化引領民族文化,讓民族文化體現時代特征。少數民族文字歷史檔案具有價值珍貴性和保存困難性的特點,也直接決定了必須要改革檔案管理手段,加強保護力度,文章首先對少數民族文字歷史檔案的構成和保護現狀進行了概述,隨后就如何利用數字化技術實現對少數民族文字歷史檔案的有效保護提出了幾點建議。
理論上來說,所有刻有或記錄了少數民族文字的、并具有一定的文字研究和保存價值文物,都可以看做為文字歷史檔案。總體來說,少數民族文字歷史檔案的組成可以分為以下幾類:
第一類是古籍文書。其中古籍記錄的內容較為多樣,包括宗教、哲學、語言和歷史等。古籍的來源豐富,數量較多,占到了現階段少數民族文字歷史檔案中的40%以上。文書的來源途徑則相對單一,主要是少數民族部落或官方在處理民族事務過程中所積累下來的文件材料。雖然文書的存量較少,但是由于文書的書寫較為規范、內容較為準確,因此對于研究少數民族歷史文化有很大幫助。第二類是石刻碑刻。早期少數民族在科技、經濟等方面與漢族有一定差距,在造紙術推廣之前,少數民族的文字主要有石刻或碑刻形式記錄下來,例如云南省的《古吊橋納西文摩崖》,就是通過石刻形式記錄納西族歷史。另外,像青海、西藏等地區也發現大量刻有藏文的石經墻,都是文字歷史檔案的一種常見形式。
除了上述存量較大、較為常見的文字歷史檔案形式外,像印章、金屬或陶瓷器物、瓦片以及獸皮等,也都是記錄少數民族文字的一些常見載體,是少數民族文字歷史檔案的重要構成部分。
(一)文字歷史檔案缺乏系統梳理
早在20世紀50年代,國家就組織開展了不同規模的少數民族文字歷史檔案調查和統計工作。由于受技術條件、交通條件等因素的限制,因此調查工作的開展范圍十分有限。此外,長期以來少數民族對于文字歷史檔案保護工作的重視性不足,或是沒有意識到這些文字歷史檔案的價值,也造成了部分文字歷史檔案出現磨損、丟失或毀壞等問題,給檔案的統計和保護工作增加了難度。雖然國家針對少數民族文字歷史檔案的保護工作一直在進行,但是并沒有形成一個相對系統性的文字歷史檔案保護體系,檔案缺乏科學梳理、歸類無序化是現階段少數民族文字歷史檔案保護中存在的常見問題。
(二)文字歷史檔案丟失、損毀嚴重
通過上文分析可知,少數民族文字的保存形式多種多樣,竹簡、獸皮、石碑等都是文字的常見載體。這些文字歷史檔案在長期的保存過程中,由于自身特點或管理不當等原因的影響,容易出現不同程度的損毀問題。例如云南省麗江某處記錄有納西文的巖壁,因為雨水沖刷和風力侵蝕,受損面積超過80%,保護和研究價值都大打折扣。而像古籍文書、竹簡獸皮等容易館藏的文字歷史檔案,也會由于現年較長而出現蟲蛀、破損或字跡淡化而失去原有的價值。對于類似的文字歷史檔案來說,保存時間越久,保護難度越大。如何采用一種行之有效的文字歷史檔案保護措施,也成為現階段檔案館需要重點考慮的問題。
(一)數字化技術的特點
1.檔案信息的數字化。利用信息化設備將分布于不同載體上的少數民族文字轉移到計算機中,是實現檔案數字化保護的第一步。目前常用的檔案信息數字化手段有三種:其一是利用掃描儀實現文字錄入。掃描儀將收集到的圖形信息,借助于像素點陣轉化為二進制數據,然后再
由計算機轉化成文字或數字。掃描儀的優點在于掃描錄入速度快,但是容易出現亂碼現象;其二是鍵盤輸入。由專門的技術人員進行少數民族文字識別,然后通過鍵盤將文字輸入到計算機中,可以保證文字的準確性,但是處理速度較慢;其三是數碼相機拍攝錄入。原理類似于掃描儀,但是能夠最大限度的還原文字的原有字樣,不足之處在于拍攝過程中可能會對文字歷史檔案造成損害,一些珍貴文物不建議使用該方法。
2.檔案管理的數字化。文字歷史檔案管理的數字化,就是在完成錄入工作后,對數據庫中的文字歷史檔案進行加工、分類和保存。目前,國內針對少數民族文字歷史檔案處理的專業化軟件有多種,管理人員可以根據自身工作需要安裝并使用管理軟件。借助于管理軟件,一方面是能夠實現對的快速分類,分類標準包括文字內容、文字種類等,便于檔案管理人員掌握這些文字的基本情況;另一方面是對文字歷史檔案進行歸納整理,包括進行類別劃分、等級加密和設置訪問權限等。
(二)數字化檔案的挖掘利用
我們借助于數字化技術保護少數民族文字歷史檔案的目的,在于了解各少數民族的文化、歷史,并對這些檔案信息資源進行挖掘、開發和利用,為相關工作的開展提供參考和指導。
1.基礎檢索。信息快速檢索是檔案數字化技術的主要應用之一。由于少數民族文字歷史檔案的種類多、總量大,因此要想查找某一具體的檔案文件,往往需要花費較多的時間進行分門別類的查詢。而借助于數字化技術,管理人員只需要輸入文字歷史檔案的相關信息(標題、民族類別、入檔時間等),就能夠利用關鍵詞篩選的技術手段,在不到1秒鐘的時間內鎖定與關鍵詞相匹配的文字歷史檔案,大大提高了文字歷史檔案的查詢效率。
2.信息共享。信息共享是互聯網的一大應用特性。而基于互聯網建立而來的數字化管理系統,自然也繼承了信息共享的特性。這里的信息共享有兩個層次的涵義:其一是內部信息共享,主要是在信息化管理系統中通過信息共享提高管理效率,包括文字歷史檔案的查詢、管理等工作;其二是外部信息共享,包括與其他少數民族文字歷史檔案部門的聯網,或是社會單位成立的文字歷史檔案管理網站等,通過信息共享提高社會研究價值,提高少數民族文字歷史檔案的社會效用。
少數民族文字歷史檔案實現數字化管理之后,其檔案內容、管理軟件、數據庫系統等將轉化為磁盤、光盤等電子檔案進行保存,這又涉及到這些電子檔案的保護與延續問題。具體保護措施有:
(一)建立完善的數字化管理環境
如同文字歷史檔案的管理需要良好環境一樣,數字化設備的正常運行也離不開完善的工作環境。尤其是對于一些大型的檔案館,所需要的信息化設備數量較多,重視空間環境的保護就顯得尤其必要。總體來說,完善的數字化管理環境應當包括以下幾方面:一是保證機房空間環境充足。由于計算機或配套電氣設備運行過程中會有發熱現象,因此需要機房空間寬敞,便于進行通風散熱;二是要加強機房內部的溫濕度檢測,溫度過高或過低都會影響信息設備的運行性能;而空氣濕度如果超過30%則容易導致主機受潮,時間長了還可能導致線路板腐蝕。因此需要將濕度控制在30%以下。三是防電磁場干擾。要避30奧斯特以上的磁場;在存有重要檔案的庫區,應設置測磁設備;磁帶盒及檔案柜無磁性、防塵并帶有閉鎖裝置。
(二)實現少數民族文字歷史檔案的遷移
對較為特殊的少數民族文字電子檔案,必須以原始形成的格式進行還原顯示,可采用以下方式:(1)保存電子檔案相關支持軟件,即在保存電子檔案的同時,將與電子檔案相關的軟件及整個應用系統一并保存,并與電子檔案存貯在一起,恢復時,使之按本來的面目進行顯示;(2)保存原始檔案的電子圖像,目前普遍采用的掃描儀錄入和數碼拍照都可以在很大程度上還原文字歷史檔案圖像,可以根據需要進行針對性選擇;(3)保存電子檔案的打印輸出件或制成縮微品,這是最為穩妥的永久保存方法,通常對于價值較高的文字歷史檔案使用。
(三)加強對信息化檔案文件的保護
為確保少數民族文字電子檔案信息的可靠性,每年要對檔案載體進行檢測,采用等距抽樣或隨機抽樣的方式進行,樣品數量不少于10%,以一個邏輯卷為單位。(1)外觀檢查。確認載體表面是否有物理損壞或變形,外表涂層是否清潔及有無霉斑出現等。(2)邏輯檢測。采用專用或自行編制檢測軟件對載體上的信息進行讀寫校驗。通過檢測發現有出錯的載體,須進行有效的修正或更新。少數民族文字電子檔案應每4年拷貝一次,且原載體繼續保留的時間不少于4年。此外,還要建立相應的維護管理檔案,對電子檔案的檢測、維護、拷貝等操作過程進行記錄,避免發生人為的誤操作或不必要的重復勞動。
民族文化的傳承和弘揚是提高民族文化自信力、實現中華民族偉大復興的一項必備條件。少數民族文字歷史檔案記錄了少數民族的發展歷史、文化習俗和宗教信仰,具有豐富的研究和保護價值。面對少數民族文字歷史檔案遺失、損毀日益嚴重的現狀,必須要借助于信息化和數字化技術,實現在這些珍貴文字歷史檔案的保護。進而在此基礎上深入挖掘文字歷史檔案中有價值的信息,為下一步開展民族事務工作和促進全民族共同發展奠定基礎。
[1]朱如月,余敏章.淺談電子政務對檔案管理工作的機遇與挑戰——以松江區檔案局為例[J].中國科技投資,2013(A19):317-318.
[2]馬仁杰,張浩.論社會轉型期檔案信息化與檔案信息倫理建設[J].安徽大學學報(哲學社會科學版),2014,35(1):145-150.
[3]浙江省檔案數據庫建設調查組,韓李敏.檔案信息化建設數據質量是關鍵——浙江省綜合檔案館信息數據庫建設調查報告[J].檔案學研究,2012(03):45-48.
[4]王萍,趙丹陽.檔案知識門戶的構建——我國檔案信息化服務突破方向[J].圖書情報工作,2016,53(24):129-132.
G275.1;G
A
1006-0049-(2017)21-0001-02
鄭艷昆,女,中國現代文學館征集編目部,助理館員,研究方向:檔案資源建設。