趙莉莉
(云南省圖書館,云南 昆明 650031)
地方志的記載豐富詳實,現存古今地方志卷帙浩繁、種類繁多、內容豐富,享有“地方百科全書”的美譽。
過去,因為社會條件的限制,特別是技術手段的落后,地方志文獻資源難以廣泛傳播。隨著近年來電子信息技術的發展,依托新技術的古籍文獻數字化工作開始興起,為地方志資源的傳播、開發和利用提供新模式,“方志資源數字化既是今天經濟文化建設、學術研究的需要,也是時代對方志整理工作的必然要求。”①錢曉琴.地方志計算機數據庫建設初探[J].伊犁教育學院學報,2003(3):112.但現階段,相關古籍管理機構對于方志資源數字化整個流程還未形成統一標準和規范,仍有諸多方面的內容需要完善。
地方志標引著錄是數據庫檢索功能的依據,提高文獻的查詢、利用效率,進一步增強地方志工作的科學性和技術性,提高地方志工作效率和服務水平保障。因而,地方志數字化需要結合方志學、方志目錄學、方志書籍本身的特點進行地方志書的標引著錄,同時也需要有統一的方志著錄標準和格式,為實現志書資源共享奠定基礎。
2004年5月,科技部科技基礎工作專項資金重大項目《我國數字圖書館標準規范建設》課題組的徐周亞等發布《地方志描述元數據規范》和《地方志描述元數據著錄規則》標準草案。《地方志描述元數據著錄規則》著錄的項目有:名稱、主要責任者、主題、描述、出版者、其他責任者、日期、類型、格式、標識符、來源、語種、相關資源、時空范圍、權限、版本、載體形態、收藏歷史、館藏信息、體例、方志類型、一般附注、復本記錄,共計23項元數據描述內容。《地方志描述元數據規范》定義了15個核心元素,4個古文獻系列資源類型核心元素和4個個別元素。
地方志數字化著錄,包括古籍方志和新方志的著錄。但目前所頒布的《地方志描述元數據規范》和《地方志描述元數據著錄規則》沒有對古籍方志和新方志的的元數據著錄加以區分,新方志雖然體例、內容等古籍方志有著延續性,也存在一些較大差別,如隨著社會發展和多樣化新方志的內容和種類更加的豐富,新方志的目錄也更加的細化明晰,章節、內容條目都有頁標示,著錄時都需要認真記錄,以便后期編輯、查詢和使用。對于古籍方志和新方志的著錄應該根據其不同特點制定與之相應描述和著錄的規范、規則。
地方志長期以來被看作“博物之書”,由于是代有編纂,無論在內容、體例上多有延續性,且面廣、信息量大,想要有效地利用它,必須借助于某種路徑,這種路徑就是方志目錄學。如果對館藏新舊方志不進行整理編目或目錄編得不科學,勢必會影響日常管理和方志資源的開發、利用。①王憲洪.對北京方志數字化的思考[J].中國地方志,2008(5):10.因而,數字化中對地方志進行科學的分類、準確詳細的標引著錄,能讓我們在最短的時間內獲取最大的信息量,提高資料查詢效率,有利于擴展方志研究的深度和廣度。
雖然目前所具有的地方志描述和著錄的規范、規則存在不足,但對地方志數字化標引著錄具有重要的指導意義,經不斷的實踐反饋和修改完善并推廣執行,地方志數字化著錄將會實現統一、標準及系統化,更好的提供共享及服務。
地方志書由紙質文獻載體形式轉換為具備高效、準確、快捷、便利以及節約等多種優勢的電子文獻,首先必須對其紙質文獻進行掃描采集圖像。為了更好地保護地方志文獻特別是古籍方志,在地方志掃描圖像采集中我們需要專業的數字化設備和專業的技術人員進行掃描的數字化工作,對于嚴重脆化、破損、蟲蛀及夾字等情況書籍也應該采取與之相適宜的解決方案。
1.古籍方志圖像采集
古籍方志由于年代久遠,人為因素和自然因素的長期作用,部分古籍方志存在紙張風化粉碎、殘破、變形、霉變等不同程度的損壞,甚至破舊不堪,因此保護與利用的矛盾越來越突出,而數字化是目前解決這一矛盾的最有效方式。
古籍方志在數字化掃描時,考慮其保存時間長久,紙質易受高溫影響,掃描時需要冷光光源掃描儀,不僅有利于掃描影像的品質保證,也使得在掃描古籍時不會由于溫度過高對善本產生不良影響。對于殘破、蟲蛀等較為嚴重的古籍方志需要修復后再掃描,以防再數字化掃描中加重對古籍方志的損壞。而部分由于紙質較薄出現透字情況,一般的處理方法是以“襯紙”的方式把兩個半頁隔開,從而杜絕透字。部分方志古籍由于裝訂線距離板框太近,有時甚至重合,造成夾字現象,往往會用拆書來解決,掃描完成需要及時地裝訂還原。同時,還有部分古籍幅面較大,或書籍里夾有地圖等大幅頁面,超出掃描儀掃描范圍的古籍,需要將大幅面古籍進行分段掃描,最后使用軟件進行無縫拼接處理,形成與原始古籍頁面完整的圖像。
數字化掃描既能保存書籍原貌,又有利于便捷傳播,“已成為解決古籍再生保護性的最有效手段,在進行數字化掃描時,需按照規范要求操作,妥善處理好透字、拆書、還原修復、圖像處理等問題,加強專業人員業務培訓”。②巴兆祥.方志目錄學芻議[J].中國地方志,2003(3):6.
2.新方志圖像采集
“新方志品種齊全,數量眾多,系統完備,方志文獻的‘功用’已經不再僅局限于‘資治、教化、存史’三個方面,而是成了中國政治經濟發展必不可少的國情和地情資源寶庫,能夠促進歷史學、社會學、法學、地理學、生物學等學科的發展,具有非常重要的意義。”③潘星耀.淺談古籍數字化掃描工作需注意的問題[J].新世紀圖書館,2016(12):60.加快新方志數字化,推廣使用是當前地方志的重要工作。
新方志成書距今時間短,一般保存的書況都比較完好,較少出現蟲蛀、破損及脆化等情況。但新方志的裝幀形式與古籍方志不同,都是采用平裝形式,以一頁雙面印刷,這樣的書籍隨著時間的推移,以后出現破損、蟲蛀等問題時修復難度更大。因而現在對其進行數字化掃描,不僅有助于新方志的開發使用,更有利于新方志的保存。
數字化掃描完成后需要對采集圖像進行糾偏、影像拼接等處理,要求頁面端正,基本原則是最大程度保持文獻資料的原始性。
目前,數字圖像采集輸出儲存的格式不統一。“有常見的txt、doc、pdf等,也有chm、hlp、exe、xml等較少見的格式。這些不同格式文件格式,往往都需要各自專門的閱讀器才能進行瀏覽,相互之間難以兼容。”①趙嘉朱.方志資源知識組織方法研究[J].數字圖書館論壇,2016(4):61.因而,我們在做好地方志掃描圖像采集的同時,需要統一輸出儲存格式,或不同格式間轉換,以實現跨平臺間的資源共享。
數據庫模式是現在文獻資源儲存、傳輸最便捷有效的方式,“應用于地方志系統有利于有效地開發、利用地方志中的文獻信息資源,有利于提高人們對地方志的利用,有利于促進社會經濟、文化科學的發展”。②趙海良.廣西地方志文獻數字化標準建設[J].廣西地方志,2015(4):28.
1.數據庫建設
目前國內文獻數據庫建設主要有三種模式,分別為圖像全文數據庫、文本全文數據庫、圖像加文本的圖文數據庫,這三種模式各有其優劣。
圖像全文數據庫是將書頁進行原文圖像掃描,并將掃描圖像進行存儲,通過網絡為讀者提供文獻圖像信息服務。圖像全文數據庫的優勢是:技術實現容易,運行成本低廉,能夠忠實地長期保存古籍文獻原貌,同時能夠快速傳播,便于使用。其缺點是:占據空間大,只能根據標引著錄的信息如題目、作者、地名、年代等限制檢索,而不能進行全文檢索。
文本數據庫,是指將文獻內容轉換成文本字符的形式,一是通過人工錄入,二是經掃描成圖像后用軟件進行識別。將錄入或識別的文字進行存儲從而為讀者提供全文閱讀或者全文檢索服務。文本數據庫的優勢:存儲空間小,可以進行多角度、多范圍的檢索、排序、分析數據,并可以編輯,使用起來非常方便;其缺點是:文字錄入難度較大,開發成本高,不能保持古籍原貌。
圖文數據庫是圖像版與文字版的結合,可以實現全文檢索、文本與圖像相互對照,研究者可根據需要隨時參考原文圖像。圖文數據庫是最理想的數字化文獻開發模式,但其投入也相對較多。
2.地方志數據庫建設
對地方志數據庫而言,越是理想的數據庫模式就會更高效、準確、快捷和便利。然而,方志數據庫的建設一般還需根據館藏單位的財力、人力等具體情況而決定,循序漸進的開發建設。
古籍方志數據庫建設根據現實條件逐漸由圖像全文數據庫向文本數據庫發展,進而遞進為圖文數據庫的系統開發建設。對于新方志而言,應該以圖文數據的模式進行建設,新方志書籍中極少的繁、異字體,其文本形式可以經過掃描后通過軟件識圖像文字別獲取,且錯誤率低。新方志的圖文數據庫不宜圖像與文本分開而是合一形式,如采取雙層PDF等格式。
現在信息化、網絡化延伸到生活的每一個角落,地方志工作的發展必須適應信息時代的挑戰,地方志數據庫建設勢在必行。地方志數據庫建設需要滿足資料在網絡上的實時共享、檢索方便、更新及時的要求,充分發揮地方志的資源優勢。
隨著地方志資源不斷的深入研究和普及,而數字化應時而生,對推動地方志資源的保存、開發及使用等具有重要的價值。
(一)地方志資源數字化,有利于對方志資源進行及時有效的保存與保護
現存的方志資源,尤其是年代久遠的古籍方志,需要進行有效地保護。利用現代網絡信息技術對這些方志文本進行數字化整理,就是最大限度地還原其主要內容,用電子文本的方式全面展示,相關方志館藏單位可以對數字化的地方志資料進行永久保存。在此基礎上,今后研究者可直接使用網絡電子版本進行閱讀整理,從而避免在使用紙質文獻時所造成的損耗。保存與保護文獻,是地方志資源數字化的基本價值。
(二)數字化的地方志資源,更有助于學者和研究者研讀使用,從而為地方志文獻的流傳創造了條件
數字化地方志文獻使用起來更為簡單便捷,讀者不必到專門的館藏機構去尋訪,可以通過相應的網絡平臺直接閱讀學習,從整體上減少了研究方志的成本,同時,也使得更多的讀者可以通過數字地方志共享平臺閱覽相關資料。這既滿足了學者和研究者的研讀需求,同時也便于方志資料的廣泛傳播,是地方志資源數字化的重要價值。
(三)伴隨著數字化工作的全面開展,為地方志研究工作的展開提供了新的思路
數字化應用于地方志資源的整理與研究,便于編纂資料的收集與整理。對于研究者,利用數字化的地方志資源,可及時有效地搜集、比對、解析相關數據與信息,減少了原先查閱、分析資料所消耗的各種成本。與此同時,地方志資源數字化工作的開展,也有利于今后方志工作編纂適應網絡化、信息化、數字化的發展模式,為提高工作效率,完善工作內容創造了條件。改進舊有的方式,開展更具科技功效的工作新路徑,是方志數字化工作的創新價值。
21世紀是大數據的時代,地方志的工作須與之相適應,信息化、網絡化將會是今后地方志工作的主流,即“采用科學、快捷、高效的方式,利用信息化、網絡化的快捷優勢,發揮志書最大的實用功效,是今后修志工作者的新要求,也是時代的迫切需要。”①李衛東.地方志工作信息化網絡化建設探討[J].黑龍江史志,2007(9):17.因此,地方志資源數字化不應該僅僅是地方志書的保存的新方式,更應該是不斷地深入研究和挖掘,以高科技的方式開發利用好地方志資源,實現地方志資源共享,滿足廣大人民的文化需求,促進經濟文化的發展需要。