郭廣
(遼寧省圖書館,遼寧 沈陽 110015)
1.1 選題意義
家譜是一種記錄家族遷徙、發展的事跡和家族人物世系、傳記的書籍,是以特殊形式組織、編寫的家族生活史。它是傳統文化的折射和側影,既可以彌補正史、地方文獻之不足,也可以為人們提供尋祖認親的重要信息。中國家譜經過幾百年的發展,成為一種種類繁多、內容豐富、記事詳備的獨特史料,對我們今天弘揚民族文化,增強民族凝聚力,以及進行社會學、人口學、民族學、歷史學等學科的研究,都具有很大的作用。
1.2 選題價值
家譜屬于珍貴資料,具有很高的保存價值。在大量的古籍數字化開發實踐過程中,家譜數字化有利于解決古籍的“保護”與“利用”這對矛盾,是實現家譜再生性保護的有效途徑,有利于改善古文獻資源的服務工作,推動珍稀古籍的資源共享與學術研究。
2.1 地區特點
從地區即從家譜的籍貫來說,館藏家譜文獻覆蓋面廣,涵蓋全國19個省,兩個直轄市(北京和上海),其中以江蘇、浙江家譜居多,超過了總數的30%,其次是湖南、安徽和山東家譜,北方的家譜較少收藏。如表1統計。

表1
2.2 姓氏特點
從姓氏上來說,所藏家譜文獻姓氏眾多,共有106個姓氏。如表2統計。2.3 時代特點

表2
從時代上來說,所藏家譜文獻大部分纂修于清末至民國年間以及20世紀初。明代纂修的家譜只有兩種,清代纂修的家譜有146種,民國年間纂修的家譜有11種,20世紀初至今纂修的家譜有212種。其中清代纂修的家譜統計如表3所示。

表3 清代纂修的家譜統計表
2.4 版本類型特點
從版本上來說,所藏家譜文獻的版本類型多種多樣,統計如表4。

表4
清代纂修的家譜以刻本和活字本為主。
隨著網絡化、自動化、數字化等計算機技術的高速進步,傳統的圖書館也面臨著新的挑戰,人們已不再滿足于二次文獻的獲取,而是更迫切需要一種不受時間、地域限制的文獻閱讀方式,即從網上直接獲取一次文獻,于是進入了一個由傳統文獻信息資源轉向傳統與數字化信息資源相結合的新階段。3.1 館藏家譜數字化項目總體概況
遼寧省圖書館對其館藏清代家譜進行數字化處理,最終實現了網上多途徑檢索并通過電子書方式提供全文瀏覽功能。累計采集家譜圖片28萬3千多頁,打包電子版家譜圖書1700多冊,收錄并分類整理了家譜、宗譜、支譜、家乘、世系表等,共371種,著錄項目主要包含書名、卷數、始祖、始遷祖、名人、索書號等18個檢索字段,涉及姓氏106個,涵蓋全國19個省、兩個直轄市,對家譜姓氏源流進行完整著錄,真實地反映原始文獻的內容與特征,數據庫總容量441G。數據庫采用清華同方TPI數據庫加工發布系統,利用此系統的電子書加工、元數據加工、內容加工與發布子系統,實現了家譜數據庫完善的檢索功能,可進行全文瀏覽,全面揭示遼寧省圖書館館藏家譜的文獻全貌。3.2 館藏家譜數字化方法
根據前期的整理和調研工作及家譜圖書的特點,該項目在實施的過程中采用多種技術手段對家譜進行數字化處理,如對于不超過掃描儀掃描范圍的家譜,采用無邊距掃描對紙質家譜實行全文數字化,盡量減少對家譜原件的損傷。對于超過掃描儀范圍的大本家譜采用了專業數碼照相設備進行采集。在電子圖書的制作方面采用了清華同方TPI系統的電子書加工系統,此系統可以支持多種方式的掃描,并可以對書頁圖像進行批處理,然后自動生成目錄樹,進行背景處理,還可以高度壓縮,最后支持CAJ格式的電子書導出。后期將打包的電子書與元數據進行鏈接,只要在發布界面通過點擊書名即可進入電子書,進行全文瀏覽。
3.2.1 掃描的數字化要求
根據家譜圖書的特點,將家譜掃描的技術指標定為能靈活應用的TIFF格式。每冊書的每一頁作為一個圖片文件,圖片色彩模式采用灰度模式,精度為300dpi,對圖片進行無壓縮掃描。為了保證圖像能夠真實地反映原始文獻的內容與特征,對于家譜中涉及到多頁記錄的圖譜、家族地圖等,運用軟件Adobe Photoshop7.0拼接,以達到完整顯示。
3.2.2 照相的數字化要求
照相圖片的格式采用JPG格式,質量能夠很好地滿足數據庫的要求,符合打印標準。照相后,運用軟件光影魔術手或I See對掃描后的圖像進行手動加工,如銳化、去噪、糾偏、裁剪等優化處理。3.3 設置導航欄
為了便于數據的管理使用,我們對所采集的家譜數據進行了分類。通過多次論證和考察,將家譜數據庫的數據按照姓氏第一個字的首字母為分類標準,分類到二級類目。體現在發布界面是給讀者提供了一個導航欄,導航欄顯示從A~Z的26個英文字母,下設以姓氏為分類的二級類目。如:【浙江海寧市】海寧渤海陳氏宗譜,分類在C>陳>【浙江海寧市】海寧渤海陳氏宗譜。
3.4 內容著錄詳盡
該庫每條記錄均詳細著錄家譜的書名、卷數、編目員補充的附加題名、責任者、版本說明、書名與責任說明附注、冊數、外形尺寸、插圖、載體形態附注、始祖、始遷祖、名人、裝訂、備注、收藏者、索書號、以及編目員等信息,對家譜文獻的外在特征和內部特點進行了充分揭示。數據采用集中式管理,同一種家譜在庫中只存在一條書目數據,不同家族撰修的家譜以及同一家族在不同年代每一次的續修本各自著錄一條書目數據。
館藏家譜數據庫采用清華同方TPI數據庫加工發布系統,這對于我們來說是一個全新的嘗試,利用此系統的電子書加工、元數據加工、內容加工與發布系統,實現了家譜庫以姓氏、地區、單冊電子圖書的形式進行檢索、瀏覽全文的功能,而且與館藏其他電子數據庫統一在一個平臺上,方便了數據庫的管理。
4.1 TPI系統簡介
TPI系統即清華同方專業數據庫制作管理系統,是清華同方光盤股份有限公司為大中小型信息服務機構開發的一個以內容管理為核心的數字圖書館解決方案。TPI是基于非結構化文檔管理而開發的大型智能內容管理系統。
圖1為利用TPI系統構建的家譜數據庫流程示意圖。

圖1
4.2 家譜數據庫的發布
我們利用TPI自帶的發布模板,通過動態頁面技術的采用,實現了數據庫的自動發布,界面友好。讀者可以根據個人愛好、檢索策略等選擇不同的檢索手段,方便檢索。數據庫檢索系統采用Web界面,提供書名、卷數、編目員補充的附加題名、責任者等18個檢索字段,并且支持這些檢索字段的全部索引,即按打開的順序進行檢索。檢索信息快、準、全,既能成批簡單顯示,便于比較和取舍,又能單獨顯示詳細數據,能夠滿足讀者高查準率和高查全率的需求。同時能夠對這些字段進行合并檢索,即基本檢索、高級檢索和二次檢索,并具有全文圖片瀏覽功能,方便讀者了解所需家譜的詳細信息,全面揭示了遼寧省圖書館所藏家譜的文獻全貌。
5.1 圖書館員通過對古籍資源的收集、篩選、分類、組織和發布,可以使讀者直接獲取查詢主題,大大節約了信息獲取成本。
5.2 家譜數字化采用了館藏資源和虛擬館藏一體化建庫模式,用戶通過統一界面的檢索平臺就能最大限度地獲得信息。這是圖書館在網絡環境下一種比較可行的方法,也是評價一所圖書館在網絡環境下信息服務水平和能力的重要標志。
5.3 家譜數據庫文獻內容全面系統,圖文并茂,多角度地反映了館藏家譜的原貌。
5.4 古籍數據庫建設不能僅注意技術方面,還要注意用戶環境。不僅要圍繞建設數字化館藏和服務兩方面,更要從數字資源的結構上滿足用戶需求,家譜數據庫很好地做到了這一點。
[1] 洪其庚.家譜史話.鐘山風雨,2009(5).
[2] 管颯爽.家譜檔案的數字化生存.蘭臺世界,2008(21).
[3] 毛建軍.中國家譜數字化資源的開發與建設.檔案與建設,2007(1).