關鍵詞:地方志;數字化;數據庫
摘要:地方志資源數字化是隨著科技進步而發展起來的全新領域,利用先進的技術將地方志資源進行數字化整理是今后地方志工作的趨勢。文章指出方志收藏單位在對地方志資源進行數字化過程中會存在標引著錄、圖像采集及數據庫建設等問題,并提出了相應的對策,論述了數字化對于地方志資源的保存、開發及研究具有重要的作用。
中圖分類號:G250文獻標識碼:A文章編號:1003-1588(2019)04-0087-03
地方志是中華民族特有的文化瑰寶,是文明傳承的載體之一,是記述一個地區自然、經濟、政治、社會、文化等方面情況及其歷史沿革的綜合文獻。在我國浩如煙海的文化典籍中,地方志占有很大比重,為研究我國各地的歷史地理、風土人情等提供了很多寶貴材料,我國很多重大的科研成果都得益于地方志資料。地方志是一座內容豐富的文獻寶庫,具有很高的開發利用和應用價值。我國現存的地方志卷帙浩繁、種類繁多、內容豐富,享有“地方百科全書”的美譽。過去,由于社會條件有限,特別是技術手段的落后,使地方志文獻資源難以被廣泛傳播。隨著電子信息技術的發展,依托新技術的古籍文獻數字化工作得以開展,為地方志資源的傳播、開發和利用提供了新模式。方志收藏單位對地方志資源進行數字化,既是經濟文化建設、學術研究的需要,又是時代對地方志整理工作的必然要求。目前,方志收藏單位在開展地方志資源數字化工作時還未形成統一標準和規范,仍有許多方面需要完善。
1地方志標引著錄
地方志標引著錄是數據庫檢索功能的依據,能提高文獻的查詢、利用效率,進一步增強地方志工作的科學性和技術性。因此,工作人員需要結合方志學、目錄學、地方志書籍本身的特點,對地方志數字化工作進行標引著錄。此外,地方志數字化工作也需要統一著錄標準和規范,為實現地方志資源共享奠定基礎。
2004年5月,《我國數字圖書館標準規范建設》課題組發布了《地方志描述元數據規范》和《地方志描述元數據著錄規則》草案?!兜胤街久枋鲈獢祿浺巹t》中的著錄項目包括名稱、主要責任者、主題、描述、出版者、其他責任者、日期、類型、格式、標識符、來源、語種、相關資源、時空范圍、權限、版本、載體形態、收藏歷史、館藏信息、體例、方志類型、一般附注及復本記錄等,共計23項元數據描述內容?!兜胤街久枋鲈獢祿幏丁范x了15個核心元素、4個古文獻系列資源類型核心元素和4個個別元素。
地方志數字化著錄包括古籍方志和新方志的著錄,但目前頒布的《地方志描述元數據規范》和《地方志描述元數據著錄規則》沒有對古籍方志和新方志的元數據著錄加以區分。新方志雖然在體例、內容等方面是古籍方志的延續,但也存在一些差別,如:新方志的內容和種類更加豐富,新方志的目錄更加細化明晰,章節、內容條目都有頁標示等,工作人員在著錄時需要認真記錄,方便后期的編輯、查詢和使用。方志收藏單位應根據古籍方志和新方志的特點,制定與之相應的描述規范和著錄規則,對它們進行標準著錄。
長期以來,地方志被看作是“博物之書”,由于各代都有編纂,其內容、體例多有延續,且涉及面廣、信息量大,研究者要想有效利用它們,就必須借助某種路徑,這種路徑就是地方志目錄。如果工作人員沒有對館藏新舊方志進行整理編目或目錄編制得不科學,就會影響日常管理和地方志資源的開發、利用。因此,工作人員對地方志資源進行科學分類,準確詳細地標引著錄,能讓研究者在最短的時間內獲取最多的信息,提高資源查詢效率,有利于擴展方志研究的深度和廣度。雖然目前的地方志描述和著錄規范、規則存在一些不足,但仍對方志收藏單位進行地方志數字化的標引著錄具有重要的指導意義。經過不斷的實踐反饋、修改完善及推廣執行,地方志數字化著錄將會實現標準化和系統化。
2地方志數字化圖像采集
地方志數字化是將紙質文獻轉換為具備高效、準確、快捷、便利及節約等特點的電子文獻,這需要工作人員對紙質文獻進行掃描并采集圖像。為了更好地保護地方志文獻特別是古籍方志文獻,工作人員在圖像采集過程中需要利用專業的數字化設備進行掃描,針對破損嚴重的書籍也應采取與之相適宜的解決方案。
趙莉莉:淺析地方志資源數字化
2.1古籍方志圖像采集
由于年代久遠,部分古籍方志有不同程度的損壞,如存在脆化、殘破、變形、霉變等情況,保護與利用的矛盾越來越凸顯,而數字化是目前解決這一矛盾的最有效方式。由于古籍方志的紙張易受高溫影響,工作人員在對古籍方志進行掃描時,應使用冷光源掃描儀,這不僅有利于保證掃描影像的品質,還能避免溫度過高對古籍方志造成不良影響。對于殘破、蟲蛀等較為嚴重的古籍方志,工作人員需要先修復再掃描,以避免在數字化掃描中加重對古籍方志的損壞。對于因紙質薄而出現透字情況的古籍方志,工作人員需要先用襯紙把兩個半葉(頁)隔開再進行掃描,避免掃描的圖像出現透字。對于裝訂線距離板框太近的古籍方志,工作人員需要采取拆書的方法,先掃描再及時進行裝訂還原。對于幅面較大或書籍里夾有大幅地圖的古籍方志,由于它們超出掃描儀的掃描范圍,工作人員需要先將大幅面古籍進行分段掃描,再使用軟件進行無縫拼接處理,形成與原古籍方志一致的完整圖像。數字化掃描既能保護古籍方志,又有利于傳播,已成為對古籍方志進行再生保護的有效手段。在進行數字化掃描時,工作人員需按照規范要求進行操作,妥善處理好透字、拆書、還原修復、圖像處理等問題。
2.2新方志圖像采集
新方志品種齊全,數量眾多,系統完備,方志文獻的功用已經不再局限于資治、教化、存史三個方面,已成為我國政治經濟發展必不可少的國情和地情資源寶庫,能夠促進歷史學、社會學、法學、地理學、生物學等學科的發展,具有非常重要的使用價值。加快新方志的數字化及推廣使用,是目前方志收藏單位開展地方志保存與管理工作的重要內容。
新方志成書的時間較短,一般保存的都比較完好,較少出現蟲蛀、破損及脆化等情況。但新方志的裝訂形式與古籍方志不同,一般采用平裝形式,一頁雙面印刷。隨著時間的推移,新方志也會出現破損、蟲蛀等問題,它們的修復難度較大。因此,數字化掃描不僅有助于新方志的開發使用,還有利于新方志的保存。
數字化掃描完成后,工作人員需要對采集的圖像進行糾偏、影像拼接等處理,保持頁面端正,最大限度地保證文獻資料的原始性。目前,數字圖像采集輸出儲存的格式不統一,有txt、doc、pdf、chm、hlp、exe、xml等格式,這些不同格式的文件需要專門的閱讀器才能讀取,相互之間也難以兼容。因此,方志收藏單位在做好地方志圖像采集的同時,需要統一輸出儲存格式,以實現跨平臺的資源共享。
3數據庫共享平臺建設
3.1數據庫建設模式
數據庫模式是目前文獻資源儲存、傳輸最便捷有效的方式,有利于有效開發、利用地方志文獻。目前,我國的文獻數據庫建設主要有三種模式,分別為圖像全文數據庫、文本全文數據庫、圖像加文本的圖文數據庫,這三種模式各有優劣。
圖像全文數據庫是指對書籍進行原文圖像掃描,并將掃描圖像進行存儲的建設模式。讀者通過網絡可獲取文獻圖像信息。圖像全文數據庫的優點是技術實現容易,運行成本低廉,能夠保持古籍文獻原貌及方便快速傳播,易于使用。其缺點是占據空間大,只能根據標引著錄的信息,如題名、作者、地名、年代等進行檢索,不能進行全文檢索。
文本數據庫是指通過人工錄入或使用軟件識別的方式將文獻內容轉換成文本字符的形式,并將錄入或識別的文字進行存儲的建設模式。讀者通過網絡可進行全文閱讀或全文檢索。文本數據庫的優點是存儲空間小,可進行檢索、排序、分析數據,可編輯,使用方便。其缺點是文字錄入難度較大,開發成本高,不能保持古籍原貌。
圖文數據庫是圖像版與文字版的結合,可以實現全文檢索、文本與圖像相互對照,研究者可根據需要隨時參考原文圖像。圖文數據庫是最理想的數字化文獻開發模式,但開發成本也相對較高。
3.2地方志數據庫建設
就地方志數據庫而言,圖文數據庫模式更高效、準確、快捷和便利。方志收藏單位可根據財力、人力等具體情況,循序漸進地開發建設地方志數據庫。
方志收藏單位進行古籍方志數據庫建設可根據實際條件,將地方志數據庫建設模式由圖像全文數據庫向文本數據庫過渡,并逐步轉換為圖文數據庫。由于新方志書籍中的異體字較少,其文本可在掃描后通過軟件識別圖像的方式獲取,且錯誤率較低,因此,新方志應以圖文數據庫模式進行建設,新方志的圖文數據庫還可采用圖像與文本合一的形式。
隨著信息化、網絡化時代的到來,地方志工作必須適應信息時代的發展要求,地方志數據庫建設勢在必行。方志收藏單位進行地方志數據庫建設需要適應信息時代實時共享、檢索方便、更新及時的要求,充分發揮地方志資源的作用。
4地方志資源數字化的價值
4.1有利于對地方志資源進行及時有效的保存與保護
對于現存的地方志資源,尤其是年代久遠的古籍方志,工作人員需要進行有效保護,利用現代網絡信息技術對這些地方志文獻進行數字化整理,最大限度地還原、保存其原始性,并通過電子文本的方式對其進行全面展示,方志收藏單位可對數字化的地方志資源進行永久保存。研究者可使用網絡電子版本開展研究,從而避免紙質文獻在使用時被損壞。
4.2有利于地方志文獻的研讀與使用,為其傳播和使用創造了新的條件
地方志電子文獻使用起來更為簡單便捷,讀者不必到專門的館藏機構尋訪,可通過相應的網絡平臺直接閱讀使用,從整體上降低了研究方志的成本。同時,更多的讀者可通過地方志數字共享平臺閱覽相關資料,既滿足了讀者的閱讀需求,又便于方志資源的廣泛傳播及方志知識的普及。
4.3為地方志研究工作提供了新思路
地方志資源數字化工作的開展,有利于推動方志編纂工作適應網絡化、信息化、數字化的發展模式,為提高工作效率、完善工作內容創造了條件。同時,數字化應用于地方志資源的整理與研究,便于研究者及時有效地搜集、比對、解析相關數據與信息,提高了查閱、分析資料的效率,為地方志研究提供了新方法、新思路。
5結語
大數據時代,地方志工作須與之相適應,信息化、網絡化將會是今后地方志工作的主流,即采用科學、快捷、高效的方式,利用信息化、網絡化的快捷優勢,最大限度地發揮地方志資源的功用,這是對今后修志工作者的新要求,也是時代的迫切需要。因此,方志收藏單位將地方志資源數字化不僅為地方志書保存提供了新方式,還能推動地方志整理與研究工作的順利開展,實現地方志資源共享,滿足廣大人民群眾的文化需求,促進經濟文化的發展。
參考文獻:
[1]倉修良.方志學通論[M].濟南:齊魯書社,1990:1.
[2]錢曉琴.地方志計算機數據庫建設初探[J].伊犁教育學院學報,2003(3):111-115.
[3]王憲洪.對北京方志數字化的思考[J].中國地方志,2008(5):10-13.
[4]巴兆祥.方志目錄學芻議[J].中國地方志,2003(3):7.
[5]潘星耀.淺談古籍數字化掃描工作需注意的問題[J].新世紀圖書館,2016(12):60-62.
[6]趙嘉朱.方志資源知識組織方法研究[J].數字圖書館論壇,2016(4):62-65.
[7]趙海良.淺議地方志文獻數字化標準建設[J].廣西地方志,2015(4):28-31.
[8]陳曉杰.地方志計算機數據庫的建立與維護[J].硅谷,2008(1):24.
[9]李衛東.地方志工作信息化網絡化建設探討[J].黑龍江史志,2007(9):17-18.
(編校:孫新梅)