穆衛國,段曉林
(上海師范大學 圖書館,上海 200234)
公共圖書館民國文獻自建數據庫研究
穆衛國,段曉林
(上海師范大學 圖書館,上海 200234)
公共圖書館是民國文獻的主要收藏機構,近年來,已建成大量全文和專題數據庫,但目前尚沒有文章對這些自建數據庫進行相關研究。重點介紹國家圖書館、上海圖書館、南京圖書館、重慶圖書館、遼寧圖書館等幾家民國文獻館藏量較大的公共圖書館的數據庫建設概況,分析公共圖書館民國文獻數字化開發現狀,指出存在的問題,并提出對策建議。
民國文獻;自建數據庫;公共圖書館
民國文獻是指1912—1949年間出版的各類圖書、期刊、報紙、檔案、手稿、書札、海報、老照片、電影、唱片、日記、傳單、商業契約和票據等文獻資料。民國文獻數量眾多、內容豐富,它不僅記錄了民國時期各學科的發展成果,反映當時的政治、經濟、軍事、文化狀況,還記載了中華民族爭取民族獨立與國家振興的光輝歷程,具有重要的史料和學術價值。公共圖書館是民國文獻的主要收藏機構,根據相關統計,目前藏書量最多的是上海圖書館,約有民國文獻109萬冊;其他依次為南京圖書館約有70萬冊,國家圖書館約有67萬冊(件),廣東省立中山圖書館約有25萬冊;藏書量超過10萬冊的圖書館還有遼寧省圖書館、重慶圖書館、湖北省圖書館等。[1]其他民國文獻館藏較多的公共圖書館還包括首都圖書館、天津圖書館、浙江省圖書館、湖南省圖書館等。
為搶救和保護民國時期珍貴文獻,繼承和弘揚優秀文化,2011年,國家圖書館聯合國內各文獻收藏單位,策劃了“民國時期文獻保護計劃”項目,2012年啟動。隨著“民國時期文獻保護計劃”的推行,民國文獻的調查、保護、影印出版、數據庫建設越來越受到各級、各類型圖書館的重視,尤其是藏量巨大的公共圖書館,開始大力加強民國文獻的保護、利用和開發。在數據庫建設方面,目前絕大部分公共圖書館都已建成館藏民國文獻書目數據庫;一些館藏豐富的圖書館,則更加重視全文數據庫和專題數據庫建設,它們通過充分利用和挖掘自有館藏,建成包括館藏圖書、期刊全文庫、專題圖片庫、專題資源庫等數量眾多、各具特色的自建數據庫。
1.中國國家圖書館
中國國家圖書館(簡稱“國家圖書館”)是國家的總書庫,共收藏民國文獻67萬冊(件),作為全國最大的民國文獻收藏機構之一,國家圖書館不僅承擔著文獻保存和保護的重任,而且在民國出版物的數字化開發利用和保護方面更起著引領和主導作用。
在民國文獻的數字化建設上,國家圖書館利用自身豐富的館藏資源,自2000年起啟動民國圖書數字化項目,目前已建成的綜合性全文數據庫有“民國圖書數字化資源庫”和“民國中文期刊資料庫”,專題數據庫有“民國法律數字化資源庫”和“東京審判資源庫”。
綜合性全文數據庫方面,“民國圖書數字化資源庫”目前收錄22個大類、15373種民國圖書的全文影像資源,每年仍在不斷更新和增加。該庫提供“題名”“責任者”“出版地”“出版者”和“主題詞”5種檢索途徑。同時,也可以根據圖書所屬類別逐級瀏覽,每類圖書可瀏覽至三級類目?!懊駠形钠诳Y料庫”目前可提供4351種期刊的電子影像全文瀏覽,由于期刊具有定期或不定期連續出版的特點,因此在檢索途徑上,除與“圖書庫”相同的“題名”“責任者”“出版地”和“出版者”檢索方式外,還提供按“出版時間”的檢索途徑。
在專題數據庫方面,國家圖書館建成“民國法律數字化資源庫”。民國時期前后歷時38年,其間曾先后出現過多個政權,它們在執政期間制定并頒布了大量法律、法規和其他規范性文件,從不同角度反映了當時的政治、經濟、軍事、外交、文化等諸多方面的歷史原貌,其中許多珍貴的歷史文獻是研究中國近代史、中華民國史、中國革命史和中國法制史的重要文獻來源。國家圖書館對館藏民國法律文獻進行整理和數字化,建成“民國法律數字化資源庫”。該庫包括民國各個時期存在政權的法律、法規文件8112篇,總計29087頁,并將不斷更新,提供“篇名”“公布單位”“文獻出處”“關鍵詞”和“主題詞”5種檢索途徑,可在線閱讀全文。國家圖書館建成的另一種專題數據庫是“東京審判資源庫”,該庫于2011年起由國家圖書館與上海交通大學合作建立的東京審判研究中心搜集、整理東京審判相關文獻史料建設而成?!皷|京審判資源庫”以海外征集的東京審判等對日戰犯審判資料為基本素材,充分利用已有的民國時期文獻研究、整理和出版成果,下設庭審記錄、證據文獻、判決書、影像記錄等8個子庫,內容包括從海外征集到的東京審判庭審記錄4.9萬頁,中英文判決書各1200頁,證詞、證據文件4949份,庭審現場歷史照片384張。該庫通過利用現代信息技術手段,將已出版的80卷《遠東國際軍事法庭庭審記錄》、3卷《索引、附錄》、3卷本《遠東國際軍事法律判決書(中英文版)》和1卷《東京審判圖片集》中的全部內容進行全方位揭示,將對日戰犯審判的原始資料和研究成果逐步展開,再現對日戰犯審判的重要歷史事實,極大地便利了讀者使用,促進了史料文獻面向公眾的推廣。
同時,國家圖書館利用國家中心館的地位優勢,整合國內民國文獻資源,建立聯合數據庫平臺,如“地方館民國文獻”“民國時期文獻聯合目錄”和“革命歷史文獻聯合編目中心資源庫”?!暗胤金^民國文獻”整合了包括上海圖書館、首都圖書館、湖北省圖書館、廣西壯族自治區圖書館、云南省圖書館等在內的近10家公共圖書館的館藏圖書、期刊、報紙等民國文獻?!懊駠鴷r期文獻聯合目錄”是民國時期文獻保護計劃工作的數據發布即展示服務平臺,于2012年建設開發,截至2016年匯集了來自國家圖書館、首都圖書館、重慶圖書館等20家公共圖書館的民國書目數據近30萬條。[2]“革命歷史文獻聯合編目中心資源庫”包含25家圖書館的書目數據和館藏信息,總量達到1萬余條。
另外,國家圖書館還鏈接了人民出版社“日出東方——馬克思主義中國化90年大型電子圖書展”,展出1921年以來出版的著作文獻1萬余冊。
目前國家圖書館已建成的民國數據資源庫,全部采取開放存取方式,提供公開訪問,在圖書館網站免費注冊并經實名認證后即可實現在線瀏覽。
2.上海圖書館
上海的出版中心地位在清末即已經形成。民國時期,上海成為中國近代新型知識分子的集結地,其全國出版中心的地位繼續強化。據當時的數據統計,1936年,僅商務印書館、中華書局和世界書局三家出版機構的出版量就已占當時全國出版量的70%以上,1920—1935年間,上海有出版機構130~140家。[3]巨大的出版量給文獻收藏機構帶來了豐富的資源,上海圖書館收藏民國文獻約109萬冊,為全國之最。創立于1955年的《全國報刊索引》[4]是上海圖書館(上??茖W技術情報研究所)主管主辦的信息服務品牌,近年來致力于成為中國近代報刊數字文獻資源的權威知識服務體系,相繼挖掘開發了包括“民國時期期刊全文數據庫”“中國近代中文報紙全文數據庫”等在內的多種民國文獻數據庫。目前通過這個平臺,已經服務到300多家國內和海外的公共圖書館、高校圖書館以及情報研究機構、社科院等,[5]在國內外民國文獻數字化整理領域已經有非常大的影響力。
在書目數據庫方面,上海圖書館建成一批數據庫。其中包括依托“全國報刊索引”平臺建成的“民國時期期刊篇名數據庫(1911—1949)”,目前該庫數據量達900余萬條,每年計劃新增數據80萬條以上。另外,在上海圖書館網頁上,還可檢到“舊日文書目數據庫”,[6]收入上海圖書館館藏舊版日文文獻(1949年前)8萬余冊,其中90%是圖書,10%是日文舊期刊、各類小冊子和其他非正式或非公開出版物;“館藏舊版西文文獻目錄數據庫”[7]收入文獻54241條;“近代文獻聯合目錄數據庫”[8]現有書目記錄2萬余條,所收文獻均為國家圖書館和上海圖書館已經全文數字化的內容;“上海年華——中國現代電影期刊全目書志”[9]收錄1921—1949年間發行的電影雜志300種,每種寫有詳盡的提要,并配以相應書影和內頁,附有發刊辭和目錄。
在全文數據庫建設方面,上海圖書館以“全國報刊索引”為平臺研發的“民國時期期刊全文數據庫(1911—1949)”較為有影響,該庫收錄1911—1949年間出版的2萬余種期刊、90余萬篇文章,目前推出到第十一輯,內容集中反映這一時期的政治、軍事、外交、經濟、教育、思想文化、宗教等各方面的情況。
上海作為近代中國的出版中心,諸多出版于此的報紙都在近代中國報業中扮演了重要角色。上海圖書館依托館藏,在報紙方面,通過“全國報刊索引”平臺推出“字林洋行中英文報紙全文數據庫(1850—1951)”和“中國近代中文報紙全文數據庫”等大型全文庫。
字林洋行是19世紀英商在上海創辦的最主要的新聞出版機構,也是當時英商在華最大的報業印刷出版集團。它旗下的一系列中英文報紙,具體詳盡地記載了近代中國百年的社會場景,從不同視角解說了曲折的歷史進程,是一座尚待挖掘的文獻寶庫,具有不可替代的學術價值和史料價值。依托上海圖書館豐富的館藏資源,“全國報刊索引”歷時5年,打造了“字林洋行中英文報紙全文數據庫(1850—1951)”,收錄《北華捷報》《字林西報》《上海新報》《滬報》《漢報》《消閑報》《字林西報行名錄》等中英文報紙。作為歷史檔案的重要組成部分,該數據庫不僅真實生動地還原了珍稀史料風貌,還豐富了報刊數字資源,為研究近代中國提供了彌足珍貴的材料。
“中國近代中文報紙全文數據庫”已推出《新聞報》和《時報》?!缎侣剤蟆纷?893年創刊伊始,因其在報館營業策略、報紙內容編輯上的突出特色,迅速發展成力能匹敵《申報》的大報?!缎侣剤蟆钒l行逾半個世紀,內容繁復,特色鮮明,是上海圖書館獨特的館藏,為研究者深入挖掘歷史提供了堅實的基礎?!敖袊形膱蠹埲臄祿欤盒侣剤?1893—1949)”收錄了上海圖書館該報的完整珍稀館藏,合計約36.5萬版?!稌r報》1904年6月12日在上海創刊,在上海與《新聞報》《申報》呈三足鼎立之勢。該報注重時評,刊載小說眾多,后期更有大量的體育新聞與圖片報道,內容豐富,特色鮮明。除上述兩種報紙外,“中國近代中文報紙全文數據庫”即將推出的還有《百種精選小報》以及英文報紙《大陸報》《上海泰晤士報》《大美晚報》等。[2]
上海圖書館各種全文數據庫的推出,為相關研究者提供了全新的研究視角,全面拓展了研究視野。其將報紙資源按正文、廣告、圖片三大類劃分,為研究者提供了極大的便利,有效揭示了報紙精髓。另外,以“全國報刊索引”為平臺,通過熱區分色顯示的方式定位不同的文章類型,并提供每版報紙的目錄以供查閱,一系列人性化的功能令讀者用戶的查閱工作變得方便精準。
上海圖書館在專題數據庫建設上也很有特色,開發了“近代民國中醫藥專題數據庫”“上海圖書館藏淞滬抗戰圖片庫”[10]等專題庫。前者從近代民國期刊中精選中醫藥專題數據17萬余條,收錄《杏林醫學月報》《中醫雜志》等著名中醫藥學期刊,是海內外專家學者研究近代中醫藥史重要的檢索工具;后者選錄館藏中、英、日語歷史文獻中刊載的相關圖片8000余幀,以圖片形式再現兩次淞滬戰役的全貌。
同時,上海圖書館網站還鏈接了國內一些公共圖書館民國文獻相關數據庫,如“天津圖書館縮微文獻影像數據庫”“寧波圖書館寧波特色數據庫”“海德堡大學晚清和民國時期中國女性雜志資料庫”“《嶺南學報》數據庫”等。
3.南京圖書館
南京圖書館也是我國目前館藏民國文獻最豐富的公共圖書館之一。據統計,現有民國文獻約70萬冊,其中民國時期出版的圖書7萬余種、約40萬冊,期刊近萬種,報紙千余種,民國線裝刻本也有近3萬部,另有兩千多冊油印本和稿本。其中政府出版物數量之多、范圍之廣在全國獨占鰲頭。另外,各個時期共產黨領導人的著作、各個革命時期的宣傳刊物等革命書刊也為一大特色。
南京圖書館自2007年開始對館藏民國文獻進行數字化保護利用,截至目前,已完成《司法院公報》《南京市政公報》等公報類文獻5413冊,民國油印本1458冊,稿本477冊,革命書刊4885冊的全文掃描。[11]已完成全文掃描的民國文獻數字版,主要用于出版和供讀者閱讀。
目前,南京圖書館已建成的民國文獻數據庫以圖片資料庫為主,其中“中國近代文獻圖像數據庫”取材于館藏歷史文獻的精品,是集史料性、學術性和觀賞性為一體的綜合性中國近代文獻圖像數據庫,收錄1840—1949年的歷史照片和圖像,內容涵蓋政治、經濟、軍事、文化、科技、教育等15個大類,截至2015年底,已完成圖像掃描12萬幅,圖像處理11萬幅,文獻標引10多萬條。該庫通過南京圖書館網站和江蘇文化網同步發布,供讀者免費檢索使用。其他與民國文獻相關的數據庫還有“抗日戰爭歷史圖庫”“百年商標”“老商標老廣告數據庫”“紅色記憶圖片數據庫”“百年人物”等多個專題數據庫。
此外,南京圖書館與北大方正公司合作,建成“民國時期建筑圖像數據庫”“民國時期文化發展圖像數據庫”等一些專題庫。[12]
4.重慶圖書館
重慶作為中國抗戰時期的首都、國際反法西斯戰爭三大指揮中心之一的遠東指揮中心,是當時中國的政治、經濟、軍事、文化和外交中心。重慶圖書館的前身——羅斯福圖書館得其地利之便,收集了大量珍貴的民國文獻,現藏民國文獻10余萬冊,包括民國時期圖書7萬多種,10萬余冊,其中抗戰版圖書2.7萬多種、6萬多冊,民國時期期刊5000余種、2萬多冊,民國時期報紙300余種、7000多冊,是中國二戰時期圖書、期刊、報紙收集最齊全、藏量最多和最完整的公共圖書館之一。除抗戰文獻外,民國時期政論出版物、各個時期共產黨領導人的著作、革命時期的宣傳刊物等革命書刊,也是其一大收藏特色。
重慶圖書館建成的書目數據庫包括“民國圖書書目數據庫”(收錄圖書數據61747條)和“民國期刊書目數據庫”(收錄期刊數據142萬條)。另有“重慶圖書館館藏革命文獻目錄(1919—1949)”,收錄中國共產黨在革命實踐中形成的各類文獻,特別是非正式出版物中的油印或石印的小冊子和單張文獻450余種。三個書目數據庫,均可以下載電子表格形式的目錄。
全文數據庫方面,重慶圖書館是國內較早完成民國文獻全文數字化的圖書館之一,其“民國文獻全文數據庫”始建于2006年,收錄民國期刊5727冊、144萬篇,民國時期圖書6.2萬冊。[13]2008年1月正式投入使用的“館藏民國文獻檢索系統”有機結合書目數據庫和全文數據庫,提供書名、題名、責任者、內容提要、中圖法分類號、關鍵詞、條碼號、任意字段等多種查詢途徑,可以簡單檢索、高級檢索及查詢檢索歷史,并可以進行同義詞和相關詞的檢索,進而可以全文下載閱讀。2012年3月,重慶圖書館啟動民國報紙全文數字化工程。[14]2014年,重慶圖書館研發的以館藏抗戰文獻為基礎的“中國抗戰大后方3D數字圖書館”正式建成。[15]
5.遼寧省圖書館
遼寧省圖書館前身是1948年成立于哈爾濱的東北圖書館,是東北地區最大的公共圖書館,民國文獻的收藏十分豐富,現擁有民國圖書2.8萬余種、4.4萬余冊,其中不乏極具歷史價值和文獻價值的珍稀文獻。
2000年起,遼寧省圖書館對館藏民國文獻采取了縮微復制、數字化等再生性保護措施,并已取得一定成效。書目數據庫方面,遼寧省圖書館2001年底即完成了民國圖書書目數據庫的回溯建庫工作,建成“遼寧省圖書館館藏民國圖書數據庫”。全文數據庫方面,2007年以來相繼完成《盛京時報》和《東北日報》的數字化。[16]專題數據庫建設上,根據圖書館網頁的相關資料顯示,有關民國的專題庫比較多,而且很有特色,主要有“張學良專題數據庫”(1700條)、“九一八事變專題圖片庫”(圖片998幅,資料索引733篇)、“遼寧三十年代著名作家作品數據庫”(篇名數據3058條)、“館藏建國前東北地區期刊庫”(期刊550種,篇名數據23萬條)、“中國共產黨黨史圖片集”(1274篇)、“東北抗戰事件庫”(數據400多條)、“東北抗戰圖片庫”(1300余幅)、“東北抗戰人物庫”(700多人)、“東北抗戰書目庫”(目次標引300余種)、“抗戰書目庫”(1500余種)以及“舊日文書目數據庫”“館藏‘滿鐵’圖書資料數據庫”等。
6.國內其他公共圖書館
除上述5家圖書館外,經過不完全統計,目前查詢到的有自建全文、專題或書目庫的市級以上公共圖書館20余家。
廣東省立中山圖書館全文數據庫有“縮微文獻全文數據庫”(包含民國時期的期刊968種,新中國成立前報紙490種)和“孫中山全文數據庫”;書目數據庫有“孫中山文獻庫”“解放前廣東報紙庫”“解放前廣東輿圖庫”等;文摘數據庫有“建國前廣東期刊庫”;圖片數據庫有“廣東歷史圖片庫”“廣東辛亥革命歷史圖片庫”“廣州歷史圖片庫”等。
首都圖書館以近百年館藏為依托,建成歷史文化多媒化資源數據庫“北京記憶”,包括以經典文獻為主的“北京文匯”,以老照片為主的“舊京圖典”,以金石拓片為主的“燕都金石”,以歷史地圖為主的“京城輿圖”,以報刊資料為主的“昨日報章”和以老戲單子為主的“舊京戲報”等。
天津圖書館目前建成“民國期刊數據庫”(收入期刊63種)、“民國報紙數據庫”(收入《益世報》)和“民國圖書數據庫”(收入圖書176冊)。
浙江圖書館建成“民國報紙數據庫”(收錄《正報》和《當代日報》,其余報紙尚在補充和完善中)和“民國期刊數據庫”(收入民國期刊206種)。
其他公共圖書館自建有民國文獻數據庫的還包括湖北省圖書館“辛亥革命”“中國共產黨武漢斗爭史”,黑龍江圖書館“抗日戰爭文獻”,湖南圖書館“辛亥革命專題資料庫”,陜西省圖書館“西安事變數據庫”,江西省圖書館“江西二次國內革命戰爭時期史料”,廣西壯族自治區圖書館“廣西民國照片”“廣西民國人物”,寧波市圖書館“《申報》寧波史料(1872—1949)”“寧波市圖書館館藏地方報紙(1899-1999)”,桂林圖書館“廣西抗戰文化”“廣西紅色歷史文化·抗戰文化”,大連圖書館“館藏‘滿鐵’資料全文數據庫”“館藏羅振玉學術全集數據庫”“館藏舊報刊目錄數據庫”等。
1.基本實現館藏民國文獻書目檢索
在全國圖書館縮微復制中心的協調下,2001年開始,民國圖書現存狀況調查工作在公共圖書館范圍內啟動,全國有22家省級公共圖書館參與了此次調查。據相關報道,截至2007年底,所有參與館均完成了館藏民國圖書的清點和編目工作。[17]據筆者在各圖書館網站的檢索,可檢到圖書館專門建有民國文獻書目庫的主要有遼寧省圖書館“館藏民國圖書數據庫”“館藏建國前遼寧期刊數據庫”,廣東省立中山圖書館“解放前廣東報紙庫”“建國前廣東期刊庫”,首都圖書館“民國圖書書目檢索”等。其他未找到專門民國文獻書目數據庫的圖書館,如湖北省圖書館、黑龍江圖書館、廣西壯族自治區圖書館、陜西省圖書館等,在OPAC上可直接進行檢索。另外,一些民國文獻藏量較大的圖書館,如浙江圖書館、安徽圖書館、四川圖書館,目前只有書目數據庫,未見對文獻進行進一步開發和整理的全文或專題數據庫。
2.基于館藏和地方文獻開發全文數據庫
公共圖書館的全文數據庫建設通常以館藏資源為基礎,一些實力較強、收藏民國文獻較多的圖書館,通過縮微數字轉化或自建的方式實現館藏文獻的全文數字化,如浙江圖書館“民國期刊庫”、重慶圖書館“民國文獻全文數據庫”、廣東省立中山圖書館“縮微文獻全文數據庫”以及天津圖書館“縮微文獻影像數據庫”等。
公共圖書館在特色文獻,尤其是地方版老報紙的數字化建設上,也有所建樹。規模較大的當屬上海圖書館“字林洋行中英文報紙全文數據庫(1850—1951)”和寧波市圖書館“館藏地方報紙(1899—1999)”。前者收入《北華捷報》《字林西報》《上海新報》《滬報》等7種中英文報紙,后者收入《甬報》等29種地方老報紙。另外,首都圖書館“北京記憶·昨日報章”收入《北平日報》《京報》等共22萬頁;天津圖書館的《益世報》,遼寧圖書館的《盛京時報》《東北日報》,浙江圖書館的《正報》《當代日報》等,也都已建成全文數據庫。
3.專題數據庫建設各具特色
除館藏全文數據庫建設外,公共圖書館的自建數據庫的館藏特色和地方特色顯著:有充分挖掘館藏或征集海外資料建成的專題數據庫,如國家圖書館“民國法律數字化資源庫”“東京審判資源庫”,遼寧省圖書館“館藏‘滿鐵’圖書資料數據庫”,上海圖書館“近代民國中醫藥專題數據庫”等;有充分體現地方特色的圖片型數據庫,如廣西壯族自治區圖書館“廣西民國人物”“廣西民國照片”,廣東省立中山圖書館“廣東歷史圖片庫”“孫中山全文數據庫”,遼寧圖書館“東北抗戰圖片庫”“東北抗戰人物庫”,南京圖書館“中國近代文獻圖像數據庫”等;有史料型數據庫,如江西省圖書館“江西二次國內革命戰爭時期史料”,寧波市圖書館“《申報》寧波史料”等。另外,還有匯集文獻、史料、圖片于一體的綜合型專題數據庫,如重慶圖書館“中國抗戰大后方3D數字圖書館”,湖南圖書館“辛亥革命專題資源庫”,遼寧省圖書館“張學良專題數據庫”“‘九一八’專題數據庫”,首都圖書館“北京記憶”,桂林圖書館“廣西紅色歷史文化·抗戰文化”,陜西省圖書館“西安事變數據庫”等。
4.部分實現資源共享
通過文化部、財政部2011年推出的“數字圖書館推廣工程”,部分民國文獻數據庫,如國家圖書館“地方館民國文獻”、人民出版社“日出東方——馬克思主義中國化90年大型電子圖書展”等,在一些圖書館數字虛擬網運行;上海圖書館等公共圖書館網站也鏈接共享了“海德堡大學晚清和民國時期中國女性雜志資料庫”“天津圖書館縮微文獻影像數據庫”“寧波圖書館寧波特色數據庫”“大連圖書館特殊館藏數據庫”等幾種民國文獻數據庫資源。這些資源的共建共享,充實了地方館的數據庫資源,也為資源宣傳、使用提供了便捷條件。
1.應重視數據庫重復建設現象,加強統籌規劃
目前已建成的民國文獻數據庫,基本上是各圖書館依托自有館藏進行的全文數據庫建設。由于沒有統一的協調和規劃,各館的數字資源也出于自我保護等原因幾乎都不提供共享,因此,每個圖書館在建全文庫時無法下載或使用到他館的電子數據,只能利用自己的紙質資源進行掃描或拍照,造成數據庫數據的重復建設。同時由于掃描或拍照多多少少會對紙本文獻造成一定程度的損壞,因此,數據重復建設,不僅浪費大量人力,而且也非常不利于民國紙質文獻的保護。
國家圖書館、上海圖書館、南京圖書館等,作為全國或區域中心館,在公共圖書館的民國文獻數字化開發上具有引領和主導地位,因此,下一步的民國文獻數據庫建設,迫切需要各中心館發揮引領和統籌作用,通過文獻普查,了解各館文獻資源狀況,立項規劃,統一實施數字化建設,讓各館之間有更好的合作和協調,共同建設,共享資源。
2.應通過購買獲取綜合性數據庫,注重專題庫建設
目前,在公共圖書館進行的全文數據庫開發方面,以學科主題建成的專題全文數據庫,主要有國家圖書館“民國法律數字化資源庫”“東京審判資源庫”,上海圖書館“近代民國中醫藥專題庫”等,數量不多。從大部分已建有全文數據庫的圖書館來看,基本上是按文獻類型而不是按學科專題建設的館藏綜合性全文庫,比如天津圖書館“民國期刊數據庫”、浙江圖書館“民國期刊”、重慶圖書館“民國文獻全文數據庫”等。
目前,可通過購買獲取的綜合性的民國文獻數據庫,已有“民國時期期刊全文數據庫”“民國時期文獻總庫”“大成老舊刊數據庫”等10余種,[18]這些數據庫收錄文獻的范圍和數量非常大,遠遠超過單一圖書館的館藏,完全可以滿足讀者需求,各館已沒有自建綜合性數據庫的必要。因此,公共圖書館應在專題或??莆墨I的挖掘式整理開發方面做更多的考慮,或者按時間范圍、地域區間,或者按學科分類,建設專題文獻匯編型數據庫,為學科或某一領域的研究提供更全面和專業的資源。目前國家圖書館“民國文獻保護計劃”已把建設一批高質量的民國文獻專題資源庫作為主要的規劃列入其“十三五計劃”,說明專題數據庫的建設已經開始受到關注并將有統籌地推進。
3.應放寬用戶訪問限制,擴大遠程訪問范圍
目前公共圖書館開發的絕大多數民國文獻全文數據庫,可以提供免費全文瀏覽的只有國家圖書館的“民國中文期刊資源庫”和浙江省圖書館的“民國期刊”等少數幾種,大多都設有館外訪問限制;如果不是本館IP,基本無法提供全文閱覽,更沒有任何一個數據庫可以提供下載服務。
當前網絡開放資源越來越多,讀者獲取資源的渠道和途徑已經不僅僅限于圖書館,對已有數字資源的限制只會使讀者日漸遠離圖書館。文獻的開放獲取已經成為圖書館發展的必然趨勢,圖書館花大量人力和物力建設的館藏數字資源,若不能被用戶知道并便捷使用,將是極大的浪費。因此,圖書館在數據庫建成后,應更多考慮如何在有效保護知識產權的前提下最大程度地放寬用戶限制,使數字資源實現最大化的共享和使用。
在擴大數字資源使用范圍方面,上海圖書館也提供了一些可資借鑒的經驗。上海圖書館近年著力打造了“市民數字閱讀整合服務平臺”,讀者持證即可通過互聯網和局域網訪問絕大部分的數字資源。同時,配合到各個高校的巡回辦證活動,讓更多的讀者擁有該館借書證,免費遠程使用該館的數字資源,這些資源也包括了部分上海圖書館自建的非商業用途的民國文獻數據庫。
在全面開放獲取尚不能完全實現的情況下,公共圖書館通過向特定的、有潛在資源使用需求的人群發放借書證的方式開放大部分數字資源的遠程使用,有意識地擴大數字資源的用戶范圍,而不是僅局限于到館讀者,這也不失為提高數據庫開放程度的一種有效方式。
4.應加強標引深度和檢索功能,打造使用更便捷的數字資源
當前公共圖書館開發的一些民國文獻數據庫,在檢索和閱讀功能的開發上因用途的不同而有著很大的區別。比如上海圖書館開發的“民國時期期刊全文數據庫”“字林洋行中英文報紙全文數據庫”,基于商業用途的需要,文獻標引深度和內容揭示程度較高,檢索功能和檢索途徑的設計比較完善,不僅提供作者、刊名、年份檢索,還可以從篇名、作者、分類號等各種途徑組配檢索;不僅可以在線瀏覽圖片文件,也提供PDF下載服務。另外借助其數據庫提供的文獻導航、索引導出、主題導引、文獻類型分類檢索等功能,可以輕松獲取民國期刊及其發表的論文、圖片乃至廣告的聚類結果,自動獲取文獻來源、作者、出版時間等數據信息,為開展民國時期相關學科的研究提供有參考意義的數據支持。
但大部分公共圖書館自行開發的數據庫,功能的開發并未受到充分重視,存在文獻標引深度和內容揭示程度較淺、檢索功能較弱、檢索途徑單一等問題;在通常情況下,只進行了刊名、出版者、出版地等基礎數據的標引。比如國家圖書館的“民國中文期刊資源庫”,只能用刊名檢索、按期瀏覽,沒有提供篇名、作者的檢索途徑。另外,其數據庫的閱讀界面和閱讀功能也較弱,基本上都只能在線瀏覽,不提供下載和打印。標引的欠缺、功能的不完善,使數據庫的友好性、閱讀體驗和使用效率大打折扣。
因此,公共圖書館在民國文獻數字化的過程中,不能僅僅滿足于完成館藏文獻全文圖片的掃描,還有必要發揮圖書館員在文獻標引、檢索方面的專業優勢,在設計理念和功能開發上下足功夫,[19]讓民國文獻館藏變成讀者更加便捷使用的數字資源。
5.應借力新版民國文獻,加快數據庫建設
文獻的影印出版和數據庫建設,前期的工作基本上是相同的,都需要對原版文獻進行圖片掃描,因此數據庫的建設完全可以利用已出版影印文獻的圖片作為基礎數據來源。國家圖書館在這方面有所嘗試,其開發的“東京審判資源庫”即是運用現代信息技術手段對國家圖書館出版社出版的《遠東國際軍事法庭庭審記錄》《遠東國際軍事法律判決書(中英文版)》和《東京審判圖片集》進行的全面揭示。
但是,從公共圖書館數據庫建設的整體現狀來看,基本上很少依托影印版紙質文獻開展。據粗略統計,2000年以來整理和影印出版的新版民國文獻叢書有600余種,所包含的民國時期原版圖書大約5萬種,原版期刊1000余種,檔案幾十萬卷。國家圖書館出版社作為最主要的民國文獻出版機構,出版了大量的影印版民國文獻,形成了民國時期文獻資料叢編系列,抗日戰爭文獻史料叢編系列,目錄、圖錄、索引等二次文獻系列,等等,共六大出版系列。但國家圖書館的數據庫建設并沒有如影印文獻出版一樣繁榮,紙質文獻的出版資源沒有在數據庫建設上得到很好的利用,相互之間沒有形成相輔相成的關系。
紙質出版與數據庫之間相互利用后臺數據的借力方式,也許是由于版權、銷售等諸多因素影響而并沒有得到廣泛運用,但公共圖書館在數據庫的建設中設法利用新版影印文獻已有的基礎數據而不是重新掃描原始文獻獲取數據,既是對原始文獻的保護,也是加快數據庫建設的有效途徑,同時也可減少資料調研和收集的時間、人力成本,這值得我們在下一步的數據庫建設中認真思考。
[1] 王雅戈.民國文獻整理研究進展[J].圖書館建設,2011,(3).
[2] 段曉林.民國文獻整理與研究的現狀及其方向——回眸與展望:民國文獻整理與研究國際學術研討會綜述[J].圖書館雜志,2017,(3).
[3] 曾經無比耀眼的上海出版業,如今能否重振雄風[EB/OL]. http://www.sohu.com/a/111150248_178249. 2017-06-04.
[4] 全國報刊索引.關于我們[EB/OL]. http://www.cnbksy.cn/news/footCategory?id=21. 2017-05-14.
[5] 陸健.傳承與服務——上海圖書館近代報刊文獻的數字資源建設[J].上海高校圖書情報工作研究,2017,(1).
[6] 上海圖書館——舊日文書目數據庫使用說明[EB/OL]. http://search.library.sh.cn/jiuriwen/. 2017-05-14.
[7] 上海圖書館——館藏舊版西文文獻目錄數據庫使用說明[EB/OL]. http://search.library.sh.cn/jiuxiwen/Help.htm. 2017-05-14.
[8] 上海圖書館——近代文獻聯合目錄數據庫使用說明[EB/OL]. http://search.library.sh.cn/lhml/help.htm. 2017-05-14.
[9] 中國現代電影期刊全目書志[EB/OL]. http://memoire.digilib.sh.cn/SHNH/. 2017-05-14.
[10]上海圖書館館藏淞滬抗戰圖片庫[EB/OL].http://memoire.digilib.sh.cn/SHKZ/. 2017-05-14.
[11] 全勤.南京圖書館民國文獻保護與開發研究[J].國家圖書館學刊,2014,(2).
[12] 張慧.淺析“中國近代文獻圖像數據庫”的圖片標引[J].科技情報開發與經濟,2012,(23).
[13] 黃登.重慶圖書館數字化民國文獻檢索系統功能及服務模式探討[J].重慶圖情研究, 2012,(1).
[14] 陳佳香.重慶圖書館館藏民國文獻源流、特色及數字化[J].數字與縮微影像, 2014,(3).
[15] 重慶推出“中國抗戰大后方3D數字圖書館”[EB/OL]. http://www.ndlib.cn/tggcxwzt/201409/t20140910_89538.htm. 2016-07-12.
[16] 劉家強.遼寧省圖書館藏舊報紙數字化管見[J].圖書館學刊,2013,(8).
[17] 張軍.百歲民國圖書——從出版發行到保護搶救[J].圖書館工作與研究,2011,(1).
[18] 段曉林.民國文獻數據庫開發現狀研究[J].圖書館學研究,2016,(20).
[19] 段曉林,蔡迎春.高校圖書館民國文獻自建數據庫調查與分析[J].上海高校圖書情報工作研究,2016,(3).
(責任編輯:申 浩)
Public Library Databases about Literature of the Republic of China
MU Weiguo, DUAN Xiaolin
(Library, Shanghai Normal University, Shanghai 200234, China)
The public libraries are the main storage institutions of the literature of the Republic of China. In recent years, a large number of full-text databases and specific databases have been built by some key public libraries in China. However, there is no research on these self-built databases. The paper introduces the general situation of the self-built databases about literature of the Republic of China including National Library, Shanghai Library, Nanjing Library, Chongqing Library and Liaoning Library, analyses the current situation of digital development, points out the problems in database construction, and then puts forward some suggestions.
literature of the Republic of China, self-built database, public library
2017-01-08
長三角地區高校圖書館聯盟——圖書情報研究基金一般項目“民國文獻影印出版與館藏發展實證研究”;上海師范大學“文科振興”項目“民國文獻整理與研究發展報告”
穆衛國,陜西西安人,上海師范大學圖書館,主要從事圖書館學研究。
G250.74
A
1004-8634(2017)04-0094-(08)
10.13852/J.CNKI.JSHNU.2017.04.012
段曉林,云南昆明人,上海師范大學圖書館副研究館員,主要從事文獻學研究。