李 蓓
(中國國家圖書館,北京 100081)
民國時期,中國社會發(fā)生了急劇變化,形成了獨特的歷史景觀。 這一時期內(nèi)積累的大量書報刊、檔案、圖片、聲像資料等類型的歷史文獻具有鮮明的時代特征,作為反映當時政治、軍事等社會基本領(lǐng)域狀況的原始記錄及轉(zhuǎn)型期思想文化的特殊載體,具有重要的研究價值及鑒往知來的歷史意義。 對于民國文獻的搶救與保護日益受到社會關(guān)注,特別是國家圖書館聯(lián)合公共圖書館以及國內(nèi)各級各類文獻收藏機構(gòu)共同施行“革命文獻與民國時期文獻保護計劃”后,文化和旅游部、財政部以及業(yè)界、相關(guān)專家學者在民國文獻的原生性和再生性保護上給予了大力支持。伴隨文獻普查、海內(nèi)外文獻的征集出版、文獻保護技術(shù)研究等工作的有序推進,民國文獻的保護和利用取得了階段性成果。
筆者根據(jù)32家公共圖書館的官方網(wǎng)站、年鑒、年報等相關(guān)資料,將各館民國時期文獻數(shù)據(jù)庫建設(shè)情況進行梳理,如表1 所示。 河南、青海、寧夏、新疆、西藏、內(nèi)蒙古圖書館未檢到相關(guān)民國文獻數(shù)據(jù)庫,未計入以下調(diào)研數(shù)據(jù)。

表1 民國文獻數(shù)據(jù)庫建設(shè)情況統(tǒng)計
以調(diào)研情況來看,26家公共圖書館已開發(fā)數(shù)據(jù)庫的總量近200個,自行開發(fā)數(shù)量的占比超一半。 筆者按照各館所屬省份,劃分為華北、華東、東北、華中、華南、西北和西南地區(qū)7 大地理區(qū)域,就各地區(qū)內(nèi)自建資源較為典型的圖書館數(shù)據(jù)庫情況作簡要說明。
1.1.1 華北地區(qū)公共圖書館
從民國文獻數(shù)據(jù)庫的自建和外購數(shù)量分布來看,國家圖書館在數(shù)量比重上最為均衡。 資料顯示,國家圖書館2019年館藏數(shù)字化建設(shè)資源46 005 種,其中民國時期文獻12 785 種,種數(shù)位居第二位,占比27.8%[1]。 較早開發(fā)且已成規(guī)模的“民國圖書數(shù)字化資源庫”“民國中文期刊數(shù)字資源庫”,目前分別提供63 000 余種民國圖書、4 597 種民國期刊,并本著“邊建設(shè)、邊服務”的原則持續(xù)增加更新。
1.1.2 華東地區(qū)公共圖書館
上海圖書館研發(fā)的“民國時期期刊全文數(shù)據(jù)庫(1911—1949)”和“中國近代報紙數(shù)字文獻全庫”在建庫成效上較為突出。 前者目前可對22 882 種近代期刊進行全文檢索[2],后者收錄1850—1951年間的4 000份中英文報紙,不僅包括眾多知名大報,還特別收錄了近千份獨具特色的小報[3],較為完整地呈現(xiàn)了中國近代報紙業(yè)風貌。 南京圖書館利用其70 余萬冊民國藏書,圍繞圖像資源開發(fā)的專題數(shù)據(jù)庫比例達到67%。
1.1.3 東北地區(qū)公共圖書館
遼寧省圖書館藏有豐富的東北地方文獻。 該館自2000年利用縮微膠片、數(shù)字化等方式對館藏民國文獻實施再生性保護,至2001年底便完成民國圖書書目數(shù)據(jù)庫的回溯建庫任務[4],為后續(xù)持續(xù)進行館藏資源建設(shè)奠定了基礎(chǔ)。 據(jù)筆者統(tǒng)計,2014—2020年間,該館自建數(shù)據(jù)庫數(shù)量由39個增至65個[5]。 從橫向?qū)Ρ冉嵌龋刂?020年,已建成民國相關(guān)數(shù)據(jù)庫19個,在該地區(qū)乃至全國范圍內(nèi)占據(jù)絕對的數(shù)量領(lǐng)先優(yōu)勢。
1.1.4 其他地區(qū)
除上述地區(qū)圖書館外,筆者查詢到的自建有民國文獻數(shù)據(jù)庫的主要還有華南地區(qū)的廣東省立中山圖書館以特色文獻館藏資源建成“解放前廣東報刊”“解放前廣東輿圖”等書目數(shù)據(jù)庫,西北地區(qū)的陜西省圖書館“陜西省圖書館館藏民國報紙目錄”“陜西近代報紙(含影印本)目錄”等,西南地區(qū)的重慶圖書館“重慶圖書館民國期刊書目信息”“老照片資源庫”,華中地區(qū)的湖北省圖書館“辛亥革命專題資源庫”等。 以上列舉圖書館的數(shù)據(jù)庫資源總量在相應地理區(qū)域中的占比分別為79%,67%,50%,73%,在地區(qū)范圍內(nèi)各具示范和代表性。
數(shù)字出版商業(yè)機構(gòu)順應民國文獻保護及資源建設(shè)之勢,加之商業(yè)用途考量,集中技術(shù)資源以推出近代文獻數(shù)據(jù)庫特別是民國文獻為主的數(shù)據(jù)庫產(chǎn)品。調(diào)查范圍內(nèi)有5家商業(yè)機構(gòu)的數(shù)據(jù)庫產(chǎn)品因收錄內(nèi)容豐富、特點鮮明,文獻開發(fā)程度較高,得到多家公共圖書館的認可并被購入使用,具備較大的市場影響力,如表2 所示。

表2 商業(yè)數(shù)據(jù)庫概況
公共圖書館通過對各收藏單位的民國文獻資源進行整合,建立聯(lián)合共建共享數(shù)據(jù)庫,主要有國家圖書館“革命文獻與民國時期文獻聯(lián)合目錄”“地方館老照片”等。 截至2020年年底,前者已匯集由37家普查成員單位共同合作完成的70 余萬條普查數(shù)據(jù),包含民國圖書30萬種,民國期刊1.4萬種,民國時期報紙4 000 余種。 后者目前收錄重慶圖書館的《“巴蜀古鎮(zhèn)”圖文資源庫》、新疆生產(chǎn)建設(shè)兵團文化中心的《新疆生產(chǎn)建設(shè)兵團發(fā)展歷史圖片》、上海圖書館的《近代上海歷史老照片》等,旨在推動資源共建共享。 此外,廣東省立中山圖書館聯(lián)合香港中央圖書館和澳門中央圖書館共建的“粵港澳古籍民國文獻網(wǎng)上資源共享平臺”,囊括粵港澳3家圖書館現(xiàn)有民國文獻、地方文獻等特藏全文數(shù)據(jù),以分布共享方式為三地讀者提供數(shù)字資源服務。
調(diào)查樣本中,全文數(shù)據(jù)庫所占比重0%~30%的公共圖書館有6家,31%~60%的有9家,60%以上的10家。 專題數(shù)據(jù)庫的占比在3個區(qū)間段所對應的公共圖書館數(shù)量分別為10家、9家、7家。 從建設(shè)角度,專題數(shù)據(jù)庫較全文數(shù)據(jù)庫的開發(fā)空間更大。 2021年的《革命文獻與民國時期文獻保護計劃“十四五”時期規(guī)劃綱要》將加強文獻數(shù)字化與專題資源庫建設(shè)列為主要規(guī)劃內(nèi)容[6],不少館藏總量豐富的公共圖書館將建設(shè)的重點轉(zhuǎn)向?qū)n}數(shù)據(jù)庫。 商業(yè)數(shù)據(jù)庫方面,有尚品大成開發(fā)的以新中國成立前出版的中國各地古方志為收錄對象的數(shù)據(jù)庫,亦有僅對英文類資料做全文揭示的ProQues 公司“近現(xiàn)代中國英文報紙庫”。
盡管專題數(shù)據(jù)庫在建設(shè)內(nèi)容、主題、形式上呈現(xiàn)多元化,但在專科文獻上的建設(shè)情況并不理想,極少數(shù)針對專業(yè)學科方向進行探索和開發(fā)。 已知的有國家圖書館“民國圖書館學文獻數(shù)據(jù)庫”,匯輯內(nèi)容可細分為圖書館學、文獻學、目錄學等15個單元部分,對圖書館發(fā)展史、圖書館學學術(shù)史領(lǐng)域以及其他社會科學具有重要研究價值。 現(xiàn)階段,公共圖書館及商業(yè)機構(gòu)對專科文獻的關(guān)注程度較低,存在服務性不強、與受眾需求脫節(jié)的問題,對專業(yè)文獻的利用及圖書館社會服務效能造成一定不利影響。
基于能為了解和研究近代中國提供不同角度、立場的史料參考,民國時期報刊的利用需求漸增。 自建及商業(yè)數(shù)據(jù)庫在收錄資源的文獻類型上以期刊和報紙為收錄對象者居多,主要包括國家圖書館“民國報紙資源庫”、上海圖書館“中國近代報紙數(shù)字文獻全庫”、南京圖書館“江蘇地區(qū)老報紙數(shù)據(jù)庫”等。 而商業(yè)數(shù)據(jù)庫在資源建設(shè)方向的選擇上與公共圖書館具有同質(zhì)性,建有兼收報紙和期刊的“瀚堂典藏——近代報刊數(shù)據(jù)庫”,只輯錄期刊的“大成中共黨史期刊數(shù)據(jù)庫(-1949)”,單純收錄報紙的“ProQuest 歷史報紙”。
報刊類數(shù)據(jù)庫在建庫數(shù)量上多且體量大,可以說報刊資源得到了較有效的開發(fā)整理[7],但資源內(nèi)容重復建設(shè)現(xiàn)象隨之日益突顯。 以近代史上較具影響力的《申報》《大公報》為例,已知上海圖書館的“全國報刊索引——中國近代報紙全文庫”對這些報紙進行了全文開發(fā),時代瀚堂公司“瀚堂典藏—近代報刊數(shù)據(jù)庫”同時收錄了《申報》《大公報》,尚品大成公司亦將《申報》收入其“大成申報數(shù)據(jù)庫”。 由重復開發(fā)造成的人力、物力、財力等資源上的浪費和損失成為不可忽視的問題。
依照上文7 大地理區(qū)域劃分,以文獻資源入藏豐富的國家圖書館、遼寧省圖書館、上海圖書館和南京圖書館為代表的華北、東北、華東地區(qū)內(nèi)共15家公共圖書館,建設(shè)民國文獻數(shù)據(jù)庫總計128個,占全部數(shù)據(jù)庫總數(shù)的67%,在建庫總量上明顯優(yōu)于其余四大區(qū)域的總和。 由此,民國文獻資源儲備與數(shù)據(jù)庫開發(fā)程度成正相關(guān)。 資源總量豐富者建庫形勢普遍趨好,反之,文獻資源平均占有量小,是不少公共圖書館在落實民國文獻資源建設(shè)中客觀存在的一大困境。
上述已開發(fā)的民國文獻數(shù)據(jù)庫普遍對數(shù)據(jù)庫檢索途徑與功能設(shè)計加以重視。 國家圖書館“民國圖書數(shù)字化資源庫”設(shè)置書名、責任者、出版者、關(guān)鍵詞等檢索途徑,提供在線閱讀、檢索結(jié)果數(shù)據(jù)分享功能。“中國歷史文獻總庫·近代報紙數(shù)據(jù)庫”除提供全文閱覽、篇目定位,還具備熱區(qū)顯示、特色導航等功能。“書同文古籍數(shù)據(jù)庫”已實現(xiàn)內(nèi)部資源整合,并設(shè)計了校勘、添加標注、手寫輸入等輔助功能,實現(xiàn)編輯、下載、復制打印的全電子化作業(yè)。 在簡繁體字關(guān)聯(lián)檢索及圖文對照功能上與“瀚堂典藏——近代報刊數(shù)據(jù)庫”相似。
優(yōu)化數(shù)據(jù)庫服務功能的初衷在于便利讀者檢索且提高數(shù)據(jù)庫使用率。 但由表1 可知,調(diào)查樣本中提供公開訪問的數(shù)據(jù)庫數(shù)量占比僅有29%,對數(shù)據(jù)庫訪問權(quán)限有限制的占絕大多數(shù)。 另外,筆者檢索到的全文數(shù)據(jù)庫,除國家圖書館“民國圖書數(shù)字化資源庫”“民國報紙資源庫”“民國中文期刊數(shù)字資源庫”設(shè)為全網(wǎng)公開訪問資源外,其余皆設(shè)有館外訪問限制,這在一定程度上制約了數(shù)據(jù)庫的推廣使用。 而數(shù)據(jù)庫的訪問限定是保護數(shù)據(jù)安全及版權(quán)的重要手段,如何達到二者間的平衡是未來數(shù)據(jù)庫建設(shè)需要解決的問題。
以減少重復開發(fā)造成資源浪費、均衡各區(qū)域公共圖書館的文獻資源配置為出發(fā)點,首先,建議開展全國范圍內(nèi)的民國文獻資源統(tǒng)籌。 由民國時期文獻保護工作辦公室實施推進,建立文獻資源數(shù)字化建設(shè)政策及制定統(tǒng)一標準[8]。 資源建設(shè)標準規(guī)范的建立不僅具有戰(zhàn)略意義,也可為下一步實現(xiàn)資源統(tǒng)一揭示和開放共享提供條件,為資源管理奠定基礎(chǔ)。 地區(qū)層面,國家圖書館、上海圖書館等各區(qū)域中心館,應利用地位優(yōu)勢發(fā)揮引領(lǐng)作用,在充分摸清區(qū)域內(nèi)各館館藏情況的基礎(chǔ)上,對資源進行必要的整合并合理配置。其次,繼續(xù)推進聯(lián)合共建共享數(shù)據(jù)庫建設(shè)。 可考慮集中商業(yè)機構(gòu)、其他公益機構(gòu)的力量進行聯(lián)合運作,通過公共圖書館之間、公共圖書館與商業(yè)機構(gòu)之間,以及公共圖書館與檔案館、博物館等其他機構(gòu)間,建立溝通和合作共識,進一步推進資源的共知與共享,相互間充實所需資源的同時達到更廣維度的資源宣傳效果。
未來公共圖書館應考慮在專科文獻的整理及其自建庫上多做工作,為專業(yè)學科或領(lǐng)域研究提供系統(tǒng)的專業(yè)資料,同時在采選商業(yè)數(shù)據(jù)庫的方向把握上更有專業(yè)側(cè)重。 以開展中共黨史專業(yè)學科數(shù)據(jù)庫建設(shè)為例,黨的十八大以來,習近平總書記高度重視黨史學習的教育與研究,曾多次強調(diào)“把紅色資源利用好、紅色傳統(tǒng)發(fā)揚好、紅色基因傳承好”的重要性。 民國文獻中記載了中國共產(chǎn)黨曲折發(fā)展的歷史進程,包括中國共產(chǎn)黨在建立時期、北伐戰(zhàn)爭時期、土地革命戰(zhàn)爭時期、抗日戰(zhàn)爭時期、解放戰(zhàn)爭時期等關(guān)鍵歷史時期的重要資料。 公共圖書館可對這些紅色資源進行深度挖掘式整理與細顆粒度的信息揭示,建立以數(shù)字化為基礎(chǔ),以紅色文化內(nèi)涵為核心、以數(shù)據(jù)庫服務為依托的數(shù)字資源紅色陣地。 一方面,利用數(shù)字資源開發(fā)的手段加大對紅色文獻的保護力度;另一方面,則為研究中共歷史上的重要理論、執(zhí)政實踐經(jīng)驗,以及對當代中國政治的研究提供重要史實參考和理論依據(jù)。 所謂欲知大道,必先為史,通過黨史專科文獻數(shù)據(jù)庫的開發(fā)利用使珍貴史料發(fā)揮出巨大的現(xiàn)實意義,提升文獻的可視度和社會服務效能。
設(shè)置訪問權(quán)限作為數(shù)據(jù)庫權(quán)益管理模式,在版權(quán)及數(shù)據(jù)保護上起到重要作用,但與此同時也使讀者獲取資源的渠道和途徑受到限制,還很可能影響到讀者對圖書館的使用頻率以致讀者逐漸流失。 建議加強數(shù)據(jù)庫技術(shù)革新,數(shù)據(jù)庫方采取添加水印等保護措施[9],在版權(quán)保護范圍內(nèi)放寬文獻資源的訪問限制,既符合數(shù)據(jù)庫方利益又利于讀者的合理使用。
民國文獻數(shù)據(jù)庫建設(shè)是一項長期系統(tǒng)工程,可豐富數(shù)字資源服務內(nèi)容、補充紙質(zhì)館藏資源的不足,同時對紙本民國文獻的保護起到重要作用。 對館藏民國文獻的深度挖掘及專業(yè)性知識投入,不僅有利于滿足普通讀者閱覽的需求,也利于滿足考證研究的社會需要。 為此,筆者基于現(xiàn)階段民國文獻數(shù)據(jù)庫建設(shè)的發(fā)展情狀,就探求數(shù)據(jù)庫構(gòu)建的新路徑展開分析思考,以期促進民國文獻的整理研究以及數(shù)據(jù)庫建設(shè)在公共服務效能上獲得理想成果。