程衛華 李 冉
(1曲阜師范大學圖書館,山東曲阜 273165;2曲阜師范大學外國語學院,山東曲阜 273165)
隨著大數據和互聯網+時代的到來,海量的文獻資源如圖書、報刊、圖片、音頻、視頻等均被數字化,同時,知識的獲取、整合、分析和呈現也以數字化的方式得以實現。在將數字化技術應用到傳統的人文社會科學研究的同時,數字人文(Digital Humanities)將信息技術與人文學科知識充分融合,繼而展開一系列跨學科的研究、教學和出版的新型學術模式,是一種“全球性的、超越歷史和媒介的創建知識和意義的路徑”[1],更是“一種由高效計算和人文交流需求共同決定的描述性實踐、一種建模或模擬的方式、一種推理的途徑和一系列本體化的約束”。[2]
數字人文在全世界范圍內方興未艾,引起國內外學界的眾多關注。在國外,圖書館數字人文建設已初具規模,在館藏資源數字化、虛擬館藏資源管理與服務、數據庫管理與服務、跨學科學術研究和創新的支持服務等方面均有成效。目前國外圖書館成熟的數字人文建設和服務不僅可以為研究者提供知識獲取和拓展的新模式、新工具和新的應用方法,還可以啟發研究者的創新力和重構知識架構。
國際數字人文研究的蓬勃發展推動了我國數字人文研究的持續進步。2011年隨著我國第一個數字人文研究中心落戶武漢大學,我國各數字人文研究中心相繼成立,各種人文資料專題數據庫的建設如火如荼。然而,數字人文作為一個新興的研究領域,其實踐遠在理論之前。對于如何合理性地建設數字人文中心、提供完善的配套服務以及數據庫的持續發展等問題,我們仍需學習、借鑒國外成功項目的經驗。
我國對國外圖書館數字人文研究的相關進展情況早有涉獵,如從數字人文與圖書館之間的密切關系、圖書館如何通過數字人文為科研服務及其實現途徑等角度進行了歸納總結,并指出國內圖書館應學習和借鑒國外成功項目的經驗[3-5]。其中,多數研究為個案的剖析和思考,如朱華順的《美國圖書館數字人文案例研究及啟示》[6]、盛興軍的《數字環境下大學圖書館的空間變革與服務轉型》[7]以及廖軍的《美國高校圖書館的典型數字學術服務與啟示》[8]等。這些個案分析基本上都圍繞著美國圖書館數字人文建設,極少會提及其他國外圖書館。然而,只有廣泛地借鑒和吸取其他國家和地區的成功經驗,才能使我國數字人文建設少走彎路。此外,大多數個案分析也只針對高校圖書館,并沒有著眼于國家圖書館,無法發揮圖書館數字人文為讀者服務的最大優勢。因此,本文將以法國國家圖書館數字人文建設為個案,通過文獻調查和文獻分析的研究方法,探析其在數字基礎設施建設、數字創新和數字支持和服務等方面的突出特點,以期為我國圖書館數字人文建設提供參考。
法國國家圖書館(Bibliothèque nationale de France)歷史悠久,其前身為查理五世所創立的法國皇家圖書館。[9]在經歷了900多年的歷史更迭后,法國國家圖書館發展至今由七所分館組成,每所分館的特色、館藏以及面向的讀者群都各有不同。其中五所分館(密特朗圖書館、黎塞留圖書館、阿斯納圖書館、歌劇院圖書館—博物館、蓬皮杜圖書館)面向大眾開放,另外兩所則主要用于文獻資源的保管和整理。
法國國家圖書館收藏和保管著眾多的法國文獻資料和文化遺產,并一直致力于推廣和傳播法國文化。密特朗總統曾致力于將法國國家圖書館建設成“世界第一圖書館”,“這座全新的圖書館將覆蓋人類知識的各個學科領域,供所有的人使用,應用國際上最先進的信息傳遞技術,能提供遠程查閱和檢索服務并與歐洲其他諸國建立網絡關系”[10]。法國國家圖書館現有15000000冊的圖書和雜志,同時還有海量的手稿本、版畫、攝影、圖片、地圖和平面圖、樂譜、錢幣、獎章和紀念章、有聲資料、視頻資料、多媒體資源、裝飾品和服飾等,且數量每天都在源源不斷地增加。法國國家圖書館以一種百科全書式的精神收藏了囊括所有社會人文、自然科學和造型藝術等各個學科的資源。每年約有15萬冊的資料通過法定送存、購買或捐贈的方式進入館藏。
相比科研和教學等目標,法國國家圖書館更著眼于民族歷史文化遺產的傳承和推廣,他們希望在科技飛速發展的新時代,數字化能夠成為發揚歷史文化遺產的有力工具和手段,將人類的過去與未來,傳統與現代更好地融合在一起。為此,早在1988年,雅克·阿塔里(Jacques Attali)就提出了“新型”(un genre entièrement nouveau)[11]大規模圖書館的概念,其首要任務就是數字化,即數字圖書館Gallica的成立。經過了數十年的不斷探索和努力,Gallica數字圖書館已初具規模,并在數字資源建設、數字技術創新應用、高效便捷的數字服務環境等方面取得明顯成效。
從2009年起,法國國家圖書館與多家國家或國際級研究中心展開合作,尋求館藏資源的數字化發展和籌建各類數字人文項目,本文將簡單介紹其中部分項目。
密紋唱片數字化項目從2012年開始,目的是將1949年至1962年期間的46000份密紋唱片數字化,其中包含多種音樂類型,如古典音樂、爵士樂、通俗音樂和世界音樂等。[12]從2014年起,密紋唱片由索尼集團下屬的門農檔案服務公司(Memnon Archiving services)提供技術合作。超過36000份唱片被數字化并由法國獨立音樂發行代理商Believe Digital負責其在多個音樂在線平臺的播放。所有音樂均可在法國國家圖書館的閱讀室隨意收聽,聽眾也可以在Gallica數字圖書館中收聽音樂的部分片段。該項目不僅使即將消失的音樂資源得到長久保存,也將音樂進行提取和歸類,定期推送對音樂發展至關重要的曲目,從而使現代聽眾和學者對近代音樂有了更全面的理解和闡釋。
特藏數字人文項目是法國國家圖書館與科研機構聯合策劃,旨在對“歷史文化遺產和經典”的再復制。[13]該項目較好地解決了圖書館所面臨的“藏”與“用”的矛盾,將那些因為媒介脆弱而不得不珍藏的資源進行數字化倉儲式儲存,一方面實現了資源的有效保存,另一方面也方便世界各地的研究者使用。事實上,特藏數字人文項目還幫助研究者將相關信息和資源進行識別、提取、交叉和分析,真正實現了跨學科資源互動。比如,在版畫數字人文項目中,法國國家圖書館將法國著名版畫家皮埃爾·羅什(Pierre Roche)、貝爾特·莫里索(Berthe Morisot)以及梵高等藝術家的版畫作品統一實現數字化再現,同時,也向研究者提供了版畫的繪制背景的相關信息,使研究者從歷時和共時兩種維度欣賞這些版畫作品。此外,法國國家圖書館手稿部創建了普魯斯特手稿資料數字人文項目。該項目不僅將普魯斯特生前手稿原件進行數字化保存,而且還建立普魯斯特語料庫,使得研究者可以發現作家在每一份手稿中的調整和他在不同文獻信息中的語言特點,幫助研究者從詞匯、短語、語義和句法等語言層面上對普魯斯特的語言進行研究。類似的數字人文項目還有音樂部的哈莫數字人文項目(programme Rameau)、阿斯納圖書館的中世紀彩色手稿數字人文項目等。法國國家圖書館針對特藏的不同特性分別與多家研究公司或研究所聯合成立特殊工作室,旨在使特藏數字人文項目內容豐富化和多樣化,如地圖和平面圖部門與大日本印刷公司(Dai Nippon Printing)合作利用3D技術將55份世界地圖數字化,使之立體呈現。
針對2012年3月1日法國頒布的有關20世紀末出版的圖書管理的法律條文的相關規定,法國國家圖書館推出了ReLIRE數字人文項目(Registres des livres indisponibles en reedition électronique)。該項目鼓勵那些還未進入圖書市場的圖書以數字化的方式再版和銷售。[14]ReLIRE所挑選的圖書需經過由作家和出版商代表所組成的委員會一致同意,這些圖書由法國國家圖書館出版,讀者可以在網站上免費閱讀。截止到2016年3月,ReLIRE數字化項目共出版215000本電子圖書,預計到2023年出版500000冊電子圖書。ReLIRE與出版商協會聯合組織成立了FeniXX項目,該項目保證了電子圖書的商業化傳播。該項目與一般的數字人文項目不同,它不僅保存和整理了數字資源,而且在更大程度上挖掘了潛在數字資源。
為了傳承和推廣世界歷史文化遺產,法國國家圖書館一直參與多個歐洲或國際數字化合作項目[15],如國際敦煌項目(International Dunhuang project,簡稱IDP),該項目是一項卓有成效的古文獻數字化國際合作項目。近二十年來,該項目聯合世界各地的敦煌西域文獻收藏機構和圖書館,共同開展西域敦煌文獻保護、編目和數字化工作,利用統一的平臺發布文獻信息與圖像,便于廣大讀者和研究者使用文獻資源。歐洲遺產生物多樣性圖書館項目(BHL-Europe)為期三年(2009-2012),旨在開展對歐洲生物多樣化文獻資料的數字化工作。該項目成員來自于歐洲28個主要的自然歷史博物館、植物園、圖書館和研究機構。與巴黎索邦大學Fabulas數字研究團隊合作的Le LABEX OBVIL數字化項目,旨在研究寓言這一文學體裁的歷史發展、傳承、轉變和延續等。此外,還有與英國圖書館(British Library)合作的“克里斯蒂娜·德·皮桑手稿數字化項目”(le programme de numerisation de manuscrits de Christine de Pisan),將兩國國家圖書館所收藏的近800份中世紀手稿原件進行數字化保存和編目。
法國國家圖書館幾乎滿足了圖書館為數字人文所能提供的各項服務,從資源導航到工具應用,從項目維護到數字保存,以及元數據管理、版權處理、學術評估以及數字出版等服務內容。可見,法國國家圖書館數字人文的建設真正實現了數字人文的核心價值,即“開放、合作、溝通、多元、操作”[16]。在大數據時代,法國國家圖書館致力于縮減信息鴻溝、促進信息交流、維持資源共享、去除學術霸權和保持知識的客觀中立立場。通過對法國國家圖書館數字人文建設情況的梳理和數字人文服務工作的分析,筆者認為法國國家圖書館數字人文服務在以下三個方面的經驗具有借鑒價值,適當地汲取這些經驗可以在某種程度上推動和促進我國圖書館數字人文建設。
4.1.1 圖書館應該擔負起宣傳和教育的責任,普及數字人文理念
我國的圖書館數字化建設已經如火如荼,但是普通讀者對于數字人文的了解和認知還有待提高,圖書館應該擔負起宣傳和教育的責任,普及數字人文的理念,使更多的讀者了解數字人文,并學會如何通過數字人文來獲取更多的資源和信息。我國并沒有較為成熟的數字人文培訓課程,可以適當借鑒法國國家圖書館定期推出的數字人文項目培訓系列活動,這些活動可以幫助讀者梳理數字人文的內在資源和學習資源檢索等相關知識。法國國家圖書館一直將自己視為知識獲取者和提供者之間的橋梁和媒介,始終將讀者的需求放在首位。為此,法國國家圖書館定期推出一系列的文化活動,包括展覽、教育服務、演出和參觀等。這些活動使得眾多讀者和研究者得以更透徹地了解圖書館的館藏和運作模式,以便他們更快地查詢到所需資源。此外,法國國家圖書館還在不斷拓展其讀者范圍,如向中小學生和兒童開放其文學圖書中心。隨著互聯網時代和數字化時代的到來,法國國家圖書館也在不斷調整自己的服務模式,增加多種形式的服務類型。[17]比如,在Gallica數字圖書館中,圖書館工作人員會精心挑選和推送每個學科或知識點的經典書目。此外,對于有特殊需求的研究者,Gallica圖書館和眾多研究所保持合作關系,為他們提供所需資源或相關的跨學科資源等。再者,Gallica數字圖書館和歐洲乃至世界眾多圖書館發展了館際互借服務,不僅方便了法國讀者和研究者借閱其他圖書館的館藏資源,而且也使其他國家的讀者享有法國國家圖書館的資源。最后,法國國家圖書館數字化建設打破了有形的圖書館疆域,使讀者在任何互聯網終端都可以查詢所需要的資源,真正做到了知識共享,也實現了傳承和發揚歷史文化遺產的目的。
4.1.2 圖書館應加強與國家或國際研究機構和研究人員的合作,共同創建數字人文項目,開展跨學科研究
數字人文項目的特點就是以開放和學習的態度去接受具有不同學科背景的研究者和研究項目,通過相互學習和合作,不斷拓展數字人文研究的廣度和深度。圖書館是各類學科知識的匯聚地,而數字人文從本質上也是跨學科的研究,因此,圖書館的數字人文建設應該秉承促進學科交流,實現人文學科研究范式的轉型的理念,加強各學科與數字人文之間的關聯,滿足人文學科研究方法的創新。法國國家圖書館于2012年成立法國國家圖書館合作伙伴分支機構(BnF-Partenariats),該機構主要負責圖書館數字化項目的合作關系協議。目前法國國家圖書館的主要合作機構有:ProQuest,主要負責1470年至1700年間約計28000本古書或印刷品的數字化;Believe Digital和門農檔案服務公司(Memnon Archiving services),主要負責超過46000份密紋唱片的音頻數值化和保存;Immanens,主要負責法國國家圖書館收藏品的紙質本和手稿的數字化和在線查閱。
4.1.3 圖書館應爭取多方面的資金資助,為數字人文建設提供持續動力
法國國家圖書館數字化的建設和發展離不開大量資金的支持。[18]其中,有些資助面對的是不同館藏資源的數字化,如“圖書國家中心信用資金”(Financement par Crédit du Centre National du Livre,簡稱CNL),該資金從2007年約計每年平均投入六百萬歐元。CNL一方面資助印刷品的數字化項目,同時也為圖書館數字資源保存系統SPAR(Système de préservationd’ archivageréparti )中的數字化管理和ReLIRE數字化項目提供資金支持。“企業藝術行為資金”(Financement par Actions de Mécénat d’entreprise),該資金從2009年開始,并包含不同種類的投資項目。如在2009年該資金投入15萬歐元用于350份阿拉伯、土耳其和波斯手稿的數字化儲存與管理。此外,2015年,大日本印刷公司(Dai Nippon Printing)投入資金將11世紀至19世紀的地圖和天體圖通過3D成像技術得以數字化。“個人藝術行為資金”(Financement par Actions de Mécénat individuel)于2011年由法國國家圖書館友好協會發起,旨在推動“認領一本書”(Adoptez un livre)的活動,截止2017年,超過600本著作通過該活動被數字化。
數字人文的基礎設施由數字人文研究的三個層次構成,即文獻資源服務機構,數字化技術、設備和專家以及數字人文的分享和界面等,這三個層面的良好運作使數字人文實現可持續發展。[19]從法國國家圖書館數字人文的發展歷程中,可以發現數字人文基礎設施建設的三個方面均有明顯優勢:
4.2.1 實現了數據的開放性,充分保障了數字人文的發展
圖書館的核心建立在資源和管理上。為了使圖書館具備在數字時代持續推廣歷史文化遺產的功能,法國國家圖書館利用其資源數量大、收藏范圍廣和資源整合強的特點,對其館藏資源進行了數字加工和處理,通過數字化手段為古老和傳統的資源注入新的活力,也使某些特殊和珍貴的歷史文化資源面向大眾,使之得到社會大眾和專家學者的更多關注,進而推動歷史文化資源的建設和保護。通過對館藏資源的數字化轉化和管理,可以提升館藏資源,尤其是有些稀缺和珍貴資源的價值,最大限度地發揮其影響力。二十年間,法國國家圖書館將自身海量的館藏資源進行數字化,其中,法國國家圖書館的特色館藏是其數字化的首要目標,目前已擁有3500000份無版權數字化資料、1000000份授權數字化資料(其中含700000份視頻資源)、1519T的有聲資源、668T的互聯網檔案等,這些數據每年都在持續增加。[20]此外,法國國家圖書館面向全球305所圖書館、大學和科研機構提供其數字化資源。然而,由于知識產權和版權的規定,20世紀的大部分資源雖然已經陸續數字化,但并不向大眾免費提供。這項持續了近二十年的數字資源建設可以分為三個階段,每個階段都使用不同的技術手段和并嚴格遵守相關的版權法律。2002-2005年為圖像掃描,主要選擇各學科中影響力大的著作。2005-2009年采用了Google的批量化圖書掃描技術,從2007年開始,OCR技術也開始應用于數字化資源中。批量化圖書掃描可以不必再甄選所要數字化的圖書。從2009年起,迎來了更大規模的圖書掃描,而且資源內容更加豐富多樣。此外,館藏音像資源的數字化也從1998年開始。法國國家圖書館的數字化資源建設的另一個特點便是將傳統資源數字化和未來數字化資源相融合。隨著電子資源的出現,伴隨著出版渠道和資源平臺的增加,法國國家圖書館也不斷更新其資源收藏和管理模式。目前,各類非紙媒資源約占每年總資源收藏量的40%。此外,法國國家圖書館還從互聯網各類資源中收藏了超過668T的資源和數據。
4.2.2 注重工具軟件的研發和制作,為數字人文提供穩定的設備和技術
法國國家圖書館的資源加工平臺、資源倉儲系統、數據挖掘統計和可視化工具等已較為成熟。比如,從2013年起,法國國家圖書館就著手在總檢索的公共接口中采用FRBR數字編目模型(Fonctional Requirement for Bibliographic Records)。[21]這種新的編目模式借鑒開發關系型數據庫的“實體—關系”模型,從編目的實體及其屬性和關系的角度來實現書目記錄的功能需求。不同于傳統書目記錄扁平化和單一化的特點,FRBR創建了書目記錄之間和著錄對象之間的立體互動關系。此外,法國國家圖書館更是不斷探索FRBR編目模型,相繼開發了針對套書、卷集和系列叢書的編目模式FRAD和針對叢書內容主題的編目模式FRSAD。FRBR編目模式的不斷創新使它不僅適應互聯網使用者的習慣,而且也可以面向特殊檢索需求,如青少年檢索、圖像和圖片檢索以及音樂檢索等。互聯網使用者更傾向于通過人物、概念、作品、地點等書目記錄信息來檢索和查找資源,而不是通過傳統的圖書檢索來尋找圖書所在位置和圖書目錄等信息。FRBR編目模式具有兩大優勢:一是更貼合使用者對參考資料信息的檢索習慣,二是便于將資源的所有信息統一保存管理,如書籍的作者、翻譯者、是否數字化、不同版本或不同出版社等各種相關信息。
4.2.3 數字資源的長期維持和穩定發展
現代圖書館的功能已經遠遠超過了整理和保存文獻資料,而是朝著歷史文化的傳播拓展不斷前進。圖書館作為數字人文項目和多種數據庫的建設者,還需要繼續承擔數字人文研究成果推廣和運營的任務,為數字人文的倉儲、檢索和分享提供穩定和持久的平臺。為了解決數字資源的不斷增加和多樣化所引發的數字化資源儲存這一關鍵問題,法國國家圖書館推出了“數字資源保存系統”(Système de préservationd’archivageréparti,簡稱SPAR)。[22]經過多年的不斷研發和試驗,SPAR系統已經良好地實現了數字化資源的長久安全儲存問題。這一系統于2005年開始使用,依照OAIS(Open Archival Information System),PAIMAS(Producer-Archive Interface Methodology Abstract Standard),METS(Metadata Encoding & Transmission Standard),PREMIS(Preservation Metadata Implementation Strategies)等國際權威信息系統和元數據封裝標準。SPAR并不是簡單的大批量數據倉儲系統,除了保證數據的安全外,它還持續監督數據使用情況。為了保證數據訪問的連續性,SPAR會及時按照操作系統和閱讀系統來調整和轉換數據。
數字人文的發展需要更多的虛擬服務,與目前圖書館實體的館內服務形成了互補,虛擬服務不僅可以彌補圖書館傳統服務在資源整合方面的不足,又可以提升圖書館在跨學科服務方面的水平。法國國家圖書館數字人文虛擬服務的創新性主要體現在其沖破了傳統圖書館服務模式的藩籬,提倡以數字人文+傳統的雙重服務模式上。這種創新的服務模式主要表現在三個方面:
4.3.1 數字資源的開放性
Gallica是法國國家圖書館的數字人文圖書館,它包含各種資源的數字資源,如各種圖畫類或文章類的紙質版資源、手寫稿、有聲資源、視頻資源以及地圖等。[23]Gallica數字圖書館可供讀者查閱300多萬份的文獻資料。Gallica數字圖書館向互聯網使用者開放與在館用戶同樣的資源和提供同樣的查閱服務。2012年初,Gallica內部資源向公眾開放打破了傳統圖書館服務的界限,并沖破了受到知識產權保護而未被法國國家圖書館公開的資源。由此,Gallica數字圖書館成為數字資源傳播的主要平臺,它不僅歡迎讀者獲取和查閱海量的數字資源,而且還源源不斷地儲存合法的電子書籍。2012年,Gallica Labs試用平臺正式試用,并于同年和次年推出IOS和Android系統的手機應用軟件。Gallica仍在提供更多樣化的服務,滿足使用者在不同終端設備的需求。此外,Gallica還在各種社交平臺上(blogue,Facebook,Twitter,Pinterest)不定期推出各種閱讀文章以及信息提醒等,以期獲得更多讀者關注。
4.3.2 數字資源檢索的便利性
法國國家圖書館目前擁有Data檢索服務[24]。Data.bnf.fr是法國國家圖書館從2011年推出的一項檢索服務,并得到了廣大使用者的認可,每日查詢量達到10000人次,成為法國國家圖書館網站第四個被經常點擊的子網站。該檢索頁面適用于不同瀏覽器,并提供法國國家圖書館不同類型資源的查詢業務(Gallica數字圖書館、館藏總目錄、圖書館典籍和手稿資源等)。此外,網頁瀏覽者可以通過該頁面查閱到與主題相關的其他網頁以及鏈接地址等。
4.3.3 數字資源的人性化服務
法國國家圖書館保證向其閱讀室中的讀者提供一個個人獨立工作空間。[25]在閱讀室中,讀者不僅可以參閱紙質資料,也可以隨時獲取數字化資源。閱讀室為讀者提供有線或WIFI服務,使其可以通過圖書館網頁或Gallica數字圖書館檢索網頁獲取資源。2014年推出的AVEC(Apportez Votre Equipement personnel de Communication)活動鼓勵讀者帶著個人移動設備進入閱覽室以便更好地獲取圖書館數字資源。隨著對查詢信息等大數據資料的提取和分析,法國國家圖書館不斷調整檢索目錄,使各種學科資源呈現跨學科趨勢。
此外,法國國家圖書館也注重對館員數字人文服務能力的培養,集中體現在數據管理、對用戶技術能力的指導、研究讀者大數據的挖掘分析、數據知識的創新和再利用、數字人文成果的分享以及團隊協作服務等方面。隨著我國圖書館向數字化方向發展,數字人文資源比重日益增加,數字學術需求將逐步突顯,這就必然要求圖書館早日實現服務轉型,從傳統服務模式下向數字學術支持服務模式轉變,要求館員具備一定的館藏資源數字化處理能力、數字化技術應用能力和數字化團隊協作能力等。