●陳 瑜(國家圖書館,北京 100081)
日本國立國會圖書館“近代數字圖書館”項目介紹及分析
●陳瑜(國家圖書館,北京100081)
[關鍵詞]日本;國立國會圖書館;明治大正圖書;著作權;服務
[摘要]“近代數字圖書館”項目是日本國立國會圖書館數字圖書館建設中的一個重要項目。為了解日本國立國會圖書館對館藏近代資料的建設和服務情況,本文對該數據庫的建設背景、資源內容以及服務等進行了介紹,并分析了其特點。
日本國立國會圖書館(以下簡稱“國會館”)是日本唯一有權收藏國內全部出版物的法定呈繳本圖書館。國會館藏有明治、大正、昭和時期大量圖書及期刊資料。為了更好地保護文獻和向公眾提供服務,國會館1998年啟動“近代數字圖書館”(Digital Library from the Meiji Era)項目,對館藏的明治(1868.01.25~1912.07.30)、大正(1912.07.30~1926.12.24)時期的書籍進行數字化,同時通過各種途徑解決其網絡信息傳播權,將解決版權書籍的圖像全文、目錄、編目等信息發布在專門網站上,為公眾提供瀏覽、復印等服務。
1.1“近代數字圖書館”建設背景
據統計,國會館館藏有明治及大正時期出版的圖書、期刊等文獻資料約62萬冊。這些近代圖書大多是國會館傳承自帝國圖書館的藏書,其中包含了很多著名作品的初版圖書,此外,還有照片集、畫冊、觀光手冊、地方志等。如明治三十三年出版的《日本之名勝》、明治四十三年出版的《日本風景風俗寫真帖》等。這些資料反映了明治、大正時期的政治、經濟、文化等,是極具歷史文化價值的珍貴資料。
為了在數字時代更好地實現保存和繼承文化遺產、提供信息的職能,從20世紀90年代起,國會館開始大力建設數字圖書館。1989年,國會館發布了《國立國會圖書館數字圖書館構想》,為之后的數字圖書館建設指明了方向。在本世紀初制定的《數字圖書館發展計劃》中,國會館將“構建數據庫”列為三大發展目標之一。
為了保護原始資料,讓更多的人能夠便捷使用并同時豐富數字資源,國會館2002年正式啟動“近代數字圖書館”項目,開始對館藏明治、大正時期的資料進行數字化,同時著手處理版權問題。2002年,借關西圖書館開館之際,國會館的“近代數字圖書館”專題網站正式上線。
1.2“近代數字圖書館”數據庫資料內容及數量
“近代數字圖書館”最開始解決的是明治時期圖書的版權,2007年開始大正時期的圖書,2009年開始追加昭和時期的資料。“近代數字圖書館”數據庫的資料類型主要為圖書和期刊。啟動之初,收錄資料的學科僅限于人文和社科,從2003年起擴大到自然科學、工業、產業、語言等學科以及少兒類資料。截至2013年6月底,學科領域已涵蓋社會科學、歷史、地方志、哲學、文學、自然科學等。具體包括工學、工業4.2%,產業9.5%,藝術、體育6.1%,語言6.5%,文學12.6%,總記1.2%,哲學13.7%,歷史、地理12.6%,社會科學24.9%,自然科學8.8%。[1]
截至2013年2月,“近代數字圖書館”數據庫共包含文獻資料約34萬冊,具體如下表。[2]

表“近代數字圖書館”數據庫資料數量
1.3著作權處理流程
日本《著作權法》第五十一條規定:“版權持續到作者死后(如系集體作品,則是最后死亡的作者死后)再經過五十年的期間。”第二十三條規定:“1.將其作品進行廣播或者有線廣播的權利,屬作者專有。2.使用電訊接收設備公開轉播被廣播或者有線廣播的作品的權利,屬作者專有。”第六十七條第一款規定:“如果通過相當的努力仍然無法和作品權利人取得聯系,可以接受文化長官裁定,在提供一定補償金的基礎上進行使用。”清洗數據庫收錄的作品的版權是“近代數字圖書館”項目非常重要的環節,需要保證數據庫中的作品均已進入公有領域,或取得了權利人授權,或取得文化長官裁定。
2000年至2005年,國會館集中對“近代數據庫”的圖書版權進行了處理,調查了73,000名權利人的生卒年,確定約20,000名權利人的作品已經進入公有領域,53,000多名權利人生卒年不明或作品尚在版權保護期內;聯系了其中能獲取聯系方式的權利人約500人,共取得300多人的授權許可。其余39,000多人的作品進行了文化長官裁定。以這樣的處理方式共清洗出106,000種明治時期出版圖書的著作權。[3]
處理版權時,國會館力求對權利人進行全面清洗,使用的資料權威準確。清洗作品權利人時,除了有封面、扉頁、著作權頁、封底、書脊記載的著作權人,還有序文、后記、插圖、題字等含有的權利人;調查權利人卒年時,同時考察了別名和筆名;調查時注意考察作品的發表年、作品內容、著者經歷等,以區分同名同姓的人。調查著作權人卒年的資料力求權威準確,除了使用一般的人名辭典外,還查閱了記載著作權人活動領域、出身地、作品發行地等相關資料,并充分利用網上數據庫等。通過以上的調查方式,清洗出70,202名著作權人中16,969人的卒年,確定共有16,968人的作品進入公有領域。
1.4“近代數字圖書館”資料的數字化
將資料數字化是“近代數字圖書館”項目建設的另外一個重要環節。“近代數字圖書館”資料數字化遵循國會館的資料數字化通用標準——《國立國會圖書館資料數字化手冊》。[4]數字化的大概流程為:選定數字化對象、調查對象資料(種數、尺寸、顏色信息)、制作數字化樣本說明書、制作數字化樣本、質檢樣本、數字化作業(拍照、掃描等,原則是外包)、質檢、保存原始資料以及數字化數據。國會館于2005年制定了資料數字化標準,在長期實踐過程中形成了規范的流程,確保了數據質量以及數字化工作效率。1.5“近代數字圖書館”網站的服務
“近代數字圖書館”專題網站2002年上線,為讀者提供瀏覽、檢索、復印等服務。近10年間,此網站各項功能不斷改進,讀者使用起來更加便捷。改進的功能主要體現在三方面。(1)瀏覽功能。“近代數據庫”最初上線時,瀏覽單本書籍每幅圖像尺寸是固定不變的,改進后,每幅圖像能以5%的比例放大或縮小,范圍可從1%至200%。頁面設置有按鈕,能按順時針或逆時針方向旋轉圖像,或讓圖像按適當比例顯示。此外,使用者還能設定頁面左側顯示或隱藏目錄、卷次信息以及著者、出版者、出版日期、公開范圍、取得授權方式等元數據信息。(2)檢索功能。在“近代數字圖書館”網站上,讀者不僅能按“日本十進分類法”瀏覽資料,還能進行簡單檢索或詳細檢索。詳細檢索的檢索詞包括“關鍵詞”、“題名”、“目錄”“著者或編者”、“出版地”、“出版者”、“出版年月”等。2009年,國會館將“近代數字圖書館”的目錄信息嵌入到NDL-OPAC中,2012年,又與“國會館數字化資料”的系統進行了整合,讓讀者能夠更加便捷地檢索到資料。(3)打印功能。“近代數字圖書館”設置有PDF格式打印功能,后來陸續增加了全屏時顯示打印按鈕,打印頁數從10頁增加到20頁,并且可調節圖像濃淡。
2.1注重版權的處理
由于日本法律對尚在版權保護期內圖書、期刊等復制權、網絡信息傳播權實施保護,國會館在開展“近代數字圖書館”項目時,非常重視對版權的清洗與處理。在發布到互聯網上時,采用“先解決權利,后使用”的方式,確保發布到互聯網上的資料著作權無瑕疵。首先,國會館調撥和組織人員,專門負責清洗與解決版權。在清洗權利人時力求全面,如果查找到相關聯系人,就逐一聯系,爭取取得授權。其次,一方面,國會館依靠文化長官裁定制度解決了大批孤兒作品在互聯網上傳播的權利問題,另一方面,積極推動相關法律修訂,為讀者在館區內閱讀尚未進入公有領域的資料提供了法律保障。此外,若遇到公布在互聯網上的資料出現問題后,國會館成立了專門的處理機構,詳細調查,作出相應處理,確保在版權沒有問題的前提下提供服務。
2.2注重工作的持續性
國會館2002年啟動“近代數字圖書館”項目,之后逐步增加和擴大數字化圖書及期刊的數量以及類別范圍。首先,集中處理版權,解決大批量圖書及期刊資料的版權問題;其次,逐漸將處理完版權的資料發布到互聯網上,分步驟、分階段地開展工作。在大批量資料處理完版權并數字化公布到互聯網后,每年分2~3次將版權保護期滿的作品發布到互聯網上。截至2015年,此項目已持續進行了13年,成為一項常規化工作。項目的持續進行使國會館館藏圖書、期刊等資料的版權狀態得到清洗,將進入公有領域的資料及時發布到互聯網上提供給讀者。
2.3注重讀者使用的便利性
“近代數字圖書館”項目根據一定標準對處理完版權的圖書進行數字化,發布到互聯網上供讀者使用。讀者在具體查看每本書時有很多便于他們使用的功能。如,畫面可以以縮略圖顯示,進行順時針或逆時針旋轉,設置了點擊即可獲得URL地址的按鈕等,這些功能還在不斷得到改進。[5]此外,由于“近代數字圖書館”的書目數據灌入到“國立國會圖書館數字館藏”、“NDL search”等各類檢索系統中,讀者能通過這些搜索引擎查找和獲取資料。以上對畫面與數據的處理,提高了讀者使用“近代數字圖書館”的便利性。
我國民國圖書記錄了民國時期社會政治經濟等狀況,具有很高的研究價值。1986~1997年間,書目文獻出版社以國家圖書館、上海圖書館、重慶圖書館的館藏為基礎,出版了《民國時期總書目》,共收錄1911~1949年間中國出版的中文圖書124000余種。北京、上海、重慶是民國時期的三大出版中心,這三地圖書館的圖書具有代表性。據主持者王潤華先生判斷,《總目》的收書率為90%左右,也就是說,民國圖書總數量應在137000余種左右。近年來,隨著數字圖書館的發展,國家圖書館、上海圖書館、重慶圖書館均開始對館藏民國文獻進行數字化。但由于民國圖書的版權難以清理,僅有國家圖書館將部分民國文獻發布在互聯網上,上海圖書館、重慶圖書館以局域網服務方式為主。對日本國會館“近代數字圖書館”項目的分析,可以對我國民國圖書的數字化與互聯網服務工作有所借鑒。
3.1梳理民國圖書版權,增大在互聯網上發布比例
國家圖書館藏有民國圖書、期刊和報紙總計67萬冊(件)左右。其中,民國圖書約為45萬冊(件),期刊20萬冊(件)。目前,讀者卡登陸能瀏覽全文的圖書為8,172種、8,884冊,期刊為4,351種。[6]比起所藏的資源總量,發布的資源總量還較少。上海圖書館與重慶圖書館雖然對部分民國文獻進行了數字化,重慶圖書館還建立了“民國文獻數據庫”,但主要還是在館區內的局域網向讀者提供服務。還需要進一步擴大民國文獻數字化的范圍,并清理與解決民國圖書的版權問題,將清理完版權的民國圖書發布在互聯網上,與廣大讀者見面。
3.2將梳理民國圖書版權的工作常規化
國家圖書館自2008年啟動“公有領域圖書篩查”項目起,就對所藏民國圖書是否進入公有領域進行篩查。到目前為止,這項工作已經進行到第六年,確定已經進入公有領域的圖書100,000余種。今后可以將該項目作為一項常規工作,并逐漸擴大和增加清理范圍與數量,持續篩查進入公有領域民國圖書的版權。[7]此外,國家圖書館還可以建立民國圖書版權狀態登記制度,登記民國圖書等資料進入公有領域的時間。一旦進入公有領域,就立即將其納入公有領域圖書服務范圍。版權處理工作的常規化可以讓民國資料版權處理工作有序化,逐步厘清大量民國資料的版權狀態。
3.3進一步提高讀者使用的便利性
目前,國家圖書館持卡讀者可以通過卡號與密碼登陸,在網上查看民國圖書以及民國法律文獻。今后,可以采取各種措施讓讀者使用起來更加便捷。比如:在更顯著的位置對民國文獻進行推介,進一步簡化訪問步驟;建立統一的民國文獻搜索引擎,使讀者更易于檢索;進一步改進全文閱讀的界面等,使更多的讀者能夠發現和利用民國文獻這座寶庫。
[1]田中久徳.國立國會図書館における取組みと課題[EB/OL].[2015-05-19]. http://www.bunka.go. jp/seisaku/bunkashingikai/kondankaito/denshishoseki/02/ pdf/shiryo_1.pdf#search='%E5%.
[2]國立國會図書館.近代デジタルライブラリー資料あれこれ[EB/OL].[2015-10-09]. http://kindai. ndl.go.jp/ja/shiryo_arekore_index.html.
[3]北野任一.電子図書館と著作権——近代デジタルライブラリー事業における著作権処理の事例紹介[EB/OL].電子図書館講座.(2009-10-30)[2015-04-15].https://library.naist.jp/mylimedio/dllimedio/showpdf2.cgi/DLPDFR007380_P1-15.
[4]國立國會図書館.國立國會図書館資料デジタル化の手引き[EB/OL].[2014-11-12].http://dl.ndl.go.jp/view/download/digidepo_1000812_po_digitalguide050330.pdf?contentNo=1.
[5]國立國會図書館.近代デジタルライブラー明治.大正の書物の世界へ[J].國立國會図書館月報,2010(2):14-18.
[6]邱崇丙.《民國時期總書目》述評[J].北京圖書館館刊,1995(Z1):109-115.
[7]呂淑萍,張若冰.國家圖書館公有領域圖書著作權篩查實踐[J].國家圖書館學刊,2014(4):53-57.
[收稿日期]2015-03-16[責任編輯]張雅妮
[作者簡介]陳瑜(1982-),女,國家圖書館館員,發表文章6篇,研究方向:日本數字圖書館、數字資源建設、數字資源版權。
[文章編號]1005-8214(2015)12-0085-03
[文獻標志碼]B
[中圖分類號]G250.76