李業根
(中共江西省委黨校圖書館,江西南昌 330108)
公版文獻資源是超出版權(主要是財產權)保護時效之外的文獻資源的統稱。 版權是現代文化產業發展和繁榮的重要基石,但版權保護某種程度上也提高了公眾獲取作品的門檻,形成了版權人與公眾利益之間的緊張關系[1]。 設置版權保護期限,可以拓展文化公共領域,促進知識增殖和文化繁衍[2],平衡版權人和公眾之間的利益沖突。 在我國,一般文化產品的版權保護期限為作者終生及去世后50年。 過了版權保護期限的作品即進入公有領域,出版、流通和交易過程無需再承擔版權成本。
人類漫長的歷史積累了無數公版文獻作品,這些作品傳承社會文明,傳播知識文化,是全人類公有共享的知識寶庫。 近年來,世界各國日益重視傳統文化的發掘、保護和傳承,其一個重要著力點即是對公版文獻資源的系統化整理、數字化開發和開放式利用。 不少國家設立了全面整理出版傳統文化典籍的項目,更有許多大型的公版文獻資源數據庫產品問世。 如美國國會圖書館主導開發的世界數字圖書館項目(The World Digital Library),法國國家圖書館數字圖書館項目(GALLICA),中國國家圖書館的“中華古籍資源庫”、CALIS 管理中心的“高校古文獻資源庫”等。 一些社會公益組織也積極參與開發公版文獻資源,例如“古騰堡計劃”“國際樂譜典藏計劃”“公版影像典藏計劃”等。
雖然公版文獻資源數字化開發項目眾多,成就斐然,但公版文獻資源數字化開發的相關理論研究卻較為稀少,同時公版文獻資源數字化開發過程中的雜亂無序、重復低效等問題也日益嚴重,公眾獲取各類公版文獻資源的門檻依然較高,公版文獻資源數字化開發利用工作亟待整理和規范。
優秀傳統文化是國家民族的靈魂,代表著一個國家民族獨特的精神標識,是國家文化軟實力的根基和源泉。 改革開放以來,黨和政府一直重視對傳統文化的整理保護,2017 年發布的《關于實施中華優秀傳統文化傳承發展工程的意見》,更是提出要構建中華優秀傳統文化傳承發展體系,協同推進傳統文化的研究闡發、教育普及、保護傳承、創新發展、傳播交流。 高校、社科院所相繼成立有關國學、傳統文化、儒釋道思想的學術研究機構,電視廣播、報紙雜志、網站及多媒體視聽平臺紛紛打造傳統文化專欄頻道,公眾了解學習傳統文化的熱情越來越高,國學熱潮持續升溫,國學教育、國學消費蓬勃興起,傳統文化復興已成燎原之勢。
公版文獻是傳統文化的重要載體,傳統文化研習熱潮迅速傳導到了公版文獻消費市場,帶動了公版書籍的暢銷[3]。 由于讀者消費需求增加,加上公版書不存在稿費、版稅支出,出版成本較低,公版書整體出版規模以及單品銷量都呈現快速增長趨勢。20 世紀80 年代,我國每年平均出版古籍整理圖書400 種左右;近年來特別是十八大以來,每年平均出版古籍整理圖書增至1800 種左右。 “中華經典名著全本全注全譯叢書”銷售量達到420 萬冊,“中國古典名著譯注叢書”銷量近120 萬冊。[4]據當當公布的數據顯示,其銷量前五十的圖書中,公版書所占比重越來越多,從2016 年的9%上升至2018 年的15%,增長超過60%。[5]公版圖書高漲的消費熱情以及對傳統文化復興的強烈愿景,推動了公版圖書資源系統化整理和數字化開發進程,不僅發行了大量數字化的公版圖書,而且還誕生了一大批公版文獻資源數據庫。
縱觀出版業發展的歷史,技術的革新和迭代在每一個階段都發揮著至關重要的作用。 造紙術與手工印刷技術的發明,形成了第一次出版革命;機械化印刷與造紙技術以及編輯專業化技術的出現,推動了第二次出版革命;當前以計算機信息技術為基礎,編輯技術、復制技術、介質技術、發行技術的數字化、網絡化、自動化與一體化,則開啟了第三次出版革命[6]。 數字技術本質上是一種具有處理、存儲、傳輸、呈現信息功能的通用技術,數字技術賦能使得傳統出版業朝著數字化轉型方向發展,并逐步形成了一種全新的數字出版業態,利用數字技術進行內容編輯加工,并通過網絡傳播數字內容產品。 數字技術具有自生長性和融合性的技術屬性、可編輯與可擴展的內容屬性,開放性和關聯性的結構屬性[7],與公版文獻資源規模極為龐大、數量不斷增長、內容相互關聯的特點相契合,數字出版為公版文獻資源的全面整理、集中展示、便捷檢索和有效利用提供了成熟的解決方案。
隨著信息技術的快速迭代發展,公版文獻數字出版也在快速進化革新。 內容制作經歷了從人工錄入到慢速掃描,再到高速掃描錄入;產品介質從軟盤到光盤、U 盤、磁盤,發展到到現在的鏡像站、云存儲;閱覽方式從單機版到局域網版,發展到在線版、多終端版、移動版。 從數字出版單本公版圖書到數字出版成套公版圖書,發展到出版大型公版文獻數據庫產品,在這一過程中,高速掃描技術、文字識別技術、智能校對技術、數據庫技術的成熟和應用發揮了巨大作用,實現了公版文獻資源數字化開發的規模化、產業化,公版文獻數字化產品日益豐富,推動了公版文獻資源的普及和利用。
由于沒有版權掣肘,公版文獻資源成為一種全民所有、開放共享的文化資源,其數字化開發也引來了多方關注,呈現出多路并進、共同開發的景象,公版文獻數字產品供給日益豐富。 這其中,公益組織、學術機構、數字出版商是主要的開發力量。
秉持資源共享、消除知識貧富鴻溝的愿景,公益組織率先投入對公版文獻資源的數字化開發工作。美國的古騰堡計劃(Project Gutenberg)是最早的公版文獻資源數字化項目,創建于1971 年,由志愿者制作公版電子圖書并向公眾免費開放。 國際樂譜典藏計劃(International Music Score Library Project)成立于2006 年,主要收錄失去版權保護的音樂樂譜掃描影像,建立免費樂譜資源庫。 網易公司2018 年發起公版影像典藏計劃,致力于成為“公版影像百科全書”。 此外,日本的青空文庫、美國的Making Of America(MOA),以及中國哲學書電子化計劃、中國京劇戲考等等,都是影響較大、收錄資源較多的公版文獻資源數字化開發公益項目。
學術機構、圖書館參與公版文獻資源數字化開發,重在歷史文獻的整理、保護和研究利用。 中國國家圖書館建成的公版文獻資源庫,包含古籍、方志、碑帖、民國文獻、西夏文獻、趙城金藏、甲骨影像等公版文獻。 上海圖書館主管主辦的“全國報刊索引”數據庫,收錄了大量近代期刊、中英文近代報紙以及圖片。 作為CALIS 二期專題特色庫重點項目的“高校古文獻資源庫”,由北京大學圖書館牽頭,聯合南京大學、北京師范大學和四川大學圖書館共同建成,收錄的公版資源包括古籍圖書、古籍元數據、書影和全文圖像。 中國社科院國家哲學社會科學文獻中心建成的古籍庫,收錄大量經、史、子、集、志各類古籍文獻。
數字出版企業期望通過公版文獻資源的數字化開發獲取商業利潤,在人員、資金、技術等各方面強有力的投入和保障下,數字出版商很快將公版文獻資源數字化開發帶上了產業化發展、商業化運營的軌道。 相較公益組織、學術機構的公版文獻資源數字化開發,數字出版商推出的產品規模更大、增長更快、服務也更周到。 表1 是我國目前10 種較有影響的公版文獻商業數據庫基本情況。

表1 10 種商業古籍全文數據庫一覽表
數字技術、“互聯網+”重塑了公版文獻資源的形式、組織及獲取方式,也深刻影響了文獻信息服務的內容、手段、方式等一系列形態表現。 由于年代久遠,公版文獻資源雖然總量巨大,但單種文獻往往存量不多,甚至有不少圖書屬于珍本孤本,以往主要保存于藏書樓、圖書館,或散佚民間,公眾閱覽研究極為不便。 在“互聯網+”時代,公版文獻的資源基礎、技術手段、用戶環境都發生了深刻變化。 通過大規模的文獻整理和數字化開發,公版文獻數字化產品的推出有效緩解了資源匱乏的問題,文獻檢索和傳遞的門檻大為降低,文獻資源分布的不平衡性大為改善。 公版文獻即便是珍本孤本,都從稀缺資源變成了人人皆可獲取的普通資源,公版文獻服務也從封閉的機構走向廣闊的社會,成為開放的、社會信息服務鏈的一環。
“互聯網+”的最終目標是鏈接一切[8],傳統的線性通道變成網狀聯結。 “互聯網+”打破了公版文獻資源傳統的信息閉塞環境,推動了公版文獻資源的流動傳播,對公版文獻服務的主體內容也進行了重新構建。 傳統的公版文獻服務主要提供作為知識載體的圖書資料,“互聯網+”拓展了公版文獻服務的深度和廣度,轉變為提供建立在公版文獻研究基礎上的知識服務。 通過挖掘文獻之間的各種關聯,大量的文獻在“互聯網+”環境下編織成多維關聯的文獻知識圖譜;利用多文本鏈接,用戶能夠快速往返于每一個知識節點,從而獲取更全面的文獻信息。同時,大數據、“互聯網+”提供了對用戶精準畫像的條件,憑借對用戶注冊、檢索、消費、互動、評論等信息的綜合分析,識別出用戶的信息偏好、文獻需求及行為習慣,公版文獻服務實現了從“人找書”被動式服務到“書找人”主動式服務的轉變。
公版文獻規模龐大,記錄了人類發展錯綜復雜的歷史全貌。 單本公版文獻價值有限,只有對公版文獻進行系統整理和全面開發,“整體大于局部之和”,才能充分實現公版文獻作為整體的研究利用價值。 但目前公版文獻的全面開發,面臨精準識別的困境,包括古籍文獻的版本識別和近現代文獻的版權識別兩個難題。 古籍文獻版本多,內容在傳抄翻刻過程中往往會有細微變化,如何找到并識別出其中的祖本和善本,避免版本上的良莠不齊和內容上的以訛傳訛,是公版文獻數字化開發者需要克服的難題。 世界各國對公版作品的認定均采用“超過版權保護期的作品”這一標準,年代久遠的古籍文獻基本可以明確已經進入公有領域,但民國以來的現當代作品,由于出版環境復雜、著作權人信息不詳,很難確認作品是否已經進入公有領域[9]。 公版作品認定,需要明確的事實包括:(1)作者是公民、法人或其他組織;(2)自然人作者的死亡時間;(3)法人或其他組織作品的首次發表時間;(4)作者所在國;(5)作品起源國;(6)作品被要求保護國;(7)其他事實。 由于作品數量太多,要掌握所有上述信息,工作量無疑很大,需要付出的成本高昂。 目前,世界各國均未設置專門的官方機構清查公版文獻,只能依靠于民間組織或企業經營者,公版文獻資源數字化開發項目普遍并未遵循嚴格的公版作品認定程序,即便是古登堡計劃,也是按照按伯爾尼公約規定的期限推后一定時間來認定公版與否。 由于公版文獻版本和版權屬性識別的困難,以及公版文獻數量龐大且不斷增長,導致公版文獻資源的全面數字化開發難以實現,仍有大量的的公版文獻存在檢索利用的困難和散佚的風險。
習近平指出,公共資源不能為少數人壟斷享用[10]。 公版文獻資源作為一種社會公共文化資源,理應由全體社會成員公有共享。 對公版文獻資源進行數字化開發并免費向所有公眾開放使用,可以最大限度體現公版文獻公共資源屬性,達到充分利用人類文明成果、消除知識貧富差距、推動社會文明進步的目的。 為了實現這一目標,眾多熱心公益的個人和機構投入公版文獻資源數字化開發工作中。 古騰堡計劃、國際樂譜典藏計劃、青空文庫、中國哲學書電子化計劃等等,代表了眾多民間組織和個人的公益宏愿,通過多年的實踐行動,取得了令人矚目的成就。 但是,相對于創建者宏偉的目標,面對浩如煙海的公版文獻資源,這些項目目前的成績仍較為有限。 缺乏完善的公益鏈和公益生態,就很難建立起公益事業的可持續發展機制[11]。 公版文獻數字化開發公益項目普遍面臨資金不足、管理松散、人員隊伍不穩定、設施設備不完善等問題,一旦外部支持減少或停頓,項目進展就會遲緩不前,或半途而廢,陷入生存困境。 古騰堡計劃發展至今,只上線了6 萬余冊圖書;公版影像典藏計劃建設數年,只收錄了600 余件作品。 與之對比,以市場模式運作的公版文獻資源數字化商業項目,在獲得企業充足的資金投入后,應用先進的文獻數字化技術,將文獻數字化工作改造成高效快速的工廠流水線,上線的公版文獻資源在規模和總量上都遙遙領先。 公版文獻資源數字化公益項目承載著眾多參與者的美好愿景,如何解決發展過程中遇到的資源、經費、人員短缺等種種問題,關系著項目能否可持續發展以及最終能走多遠。
公版文獻資源蘊含豐富的市場價值,被喻為“誰都想吃的唐僧肉”[12],自然受到資本市場的青睞。 以市場模式運作的公版文獻資源數字化開發,可以優化資源配置,彌補公益開發資源不足的短板,建立起公版文獻資源數字化開發的市場調節機制,有效促進公版文獻資源的整理、保護、傳承和利用。 但是,資本有逐利的本能,市場開發追求的重要目標是利潤,與公眾期待的公版文獻知識共享的公共資源屬性存在價值沖突。 公版文獻資源商業數據庫的主要客戶是各級各類圖書館、科研單位,其使用對象通常限于內部讀者和職工。 出版商利用其公版文獻資源整理開發的先發優勢,在占據了一定的市場壟斷地位之后,數字資源價格往往逐年上漲,已經使不少采購單位不堪重負[13]。 部分公版文獻資源商業數據庫對個人用戶開放,但設置了較高的收費門檻,如中國基本古籍庫個人版年卡價格為1000 元,卡限內只能檢索和瀏覽,下載還需另外付費;中華經典古籍庫個人版年卡價格3500 元。 雖然市場上公版文獻數字資源總量增加,但普通公眾獲取資源的難度依然較高。 公版文獻有可能逐漸淪為資本逐利的工具,加深知識差距的貧富鴻溝,達不到資源共有、知識共享的目的。
政府公版文獻資源開發是指以政府財政撥款為經費來源、各類行政事業單位和科研機構主持或參與的公版文獻開發,是政府公共文化服務建設的重要內容。 政府以委托代建的方式,通過項目申請或招標,將公版文獻資源數字化開發項目交由科研單位、圖書館或其他學術機構進行開發,其成果一般為公版文獻資源數據庫,屬于公共文化服務產品,面向公眾開放使用。 政府開發擁有較為充足的經費保障、人員隊伍和可供調配的公版文獻資源,能夠產出較為成熟的公版文獻資源數字化產品,但同時也面臨效益不高的問題。 由于缺乏成本核算,沒有基于收益的績效壓力,政府開發的公版文獻資源數據庫產品使用率并不高。 公共文化服務強調社會效益而非經濟收益,使用率越高其效益也越高,但有些單位開發的公版文獻數據庫僅對內部人員開放,對外部用戶則設置了各種限制使用門檻。 例如作為CALIS二期專題特色庫重點項目建成的“高校古文獻資源庫”,將用戶分為普通用戶、閱覽室用戶、圖書館館員三級,普通用戶無法查閱高精度圖像,也無法打印、下載文獻資源。 北大圖書館“祕籍琳瑯——北京大學數字圖書館古文獻資源庫”規定,普通用戶獲取庫中古文獻圖像或全文,需要支付費用后再傳送內容給用戶。 復旦大學的“民國書刊”數據庫,只有認證用戶才能使用。 此外,政府公版文獻資源數字化開發項目眾多,但各個項目之間缺乏協同共享,導致部分公版文獻重復數字化、項目成本上升、數字化產品格式不統一等問題,浪費了社會資源,也增加了公眾檢索使用公版文獻的難度。
無序存在的海量公版文獻不僅保存、管理、檢索和使用困難,還有可能在沒有察覺的情況下遺失和損壞,甚至徹底湮滅。 對公版文獻資源進行全面整理和數字化開發勢在必行。 古籍數字化開發應與全國古籍整理出版規劃領導小組密切合作,對收集到的古籍文獻進行審慎鑒別,強化對版本的校勘和選擇,挑選出古籍的祖本和善本進行數字化開發。 民國以來的現當代公版文獻的價值不遜于古籍文獻,在整理和保護上不應存在厚古薄今思想。 國家圖書館2008 年啟動了一項持續多年的“公有領域圖書篩查項目”,對以民國圖書為主的疑似公有領域圖書進行版權篩查,甄別了大量公版文獻[14]。 全面整理現當代公版文獻資源,應成立一個類似古籍整理小組的全國性工作機構,整合各方力量,信息共享,持續開展公有領域圖書篩查,將公版文獻的整理開發工作制度化、規范化。 要充分利用現代信息技術,建設全國統一的文獻資源信息數據庫,建立完善的版權信息管理機制,錄入每件作品的出版信息,尤其是涉及版權的相關信息。 借助大數據,通過與其他數據庫進行數據關聯,交叉比對,快速篩查作品是否已經進入公有領域。 要建立全國統一的文獻版權信息查詢平臺,公開作品版權信息,減少版權糾紛,為公版作品的數字化開發和利用提供信息依據。 對于新出版作品,主管部門可以未雨綢繆,實行版權注冊登記制度和電子稿呈繳制度,強制要求出版機構注冊登記版權,并提交一份文獻的電子版文件,若干年后作品進入公版領域,電子版作品即向公眾開放使用,自動成為全民共享的公共文化資源。
扶持公益項目,是公共服務供給側改革的重要內容[15]。 社會組織和個人創建的公版文獻資源數字化開發公益項目,是對文化領域公共服務的有益補充,也是滿足公眾精神文化需求的有效路徑之一。政府應鼓勵社會組織、企業和個人參與公版文獻資源公益開發,制定相應的扶持政策,引導其專業化運作、常態化發展。 公益生態環境決定公益項目能否長期可持續健康發展,是由社會組織、社會工作、志愿者、社區、政府和其他關聯主體互動作用所構成的公益服務輸送體系[16],各種資源要素在體系內各個互動主體之間流動和整合,形成主體間相互作用的公益生態鏈。 公版文獻資源數字化開發公益項目中,社會組織、政府、志愿者、文獻擁有者、資金捐獻者、用戶等是公益生態主體,而公版文獻、資金、技術、設備、場地等則屬于資源要素。 建設良好的公版文獻數字化開發公益生態環境,首先要保持項目的開放性,主體之間的互動和資源要素的流動要保持暢通,各主體以互利的方式共同進化;其次要促進各主體之間良好的合作關系,為實現公版文獻數字化開發的整體目標履行各自職責;最后,要通過制度創新、信任關系以及新技術的采用,降低各主體之間互動交易的成本,提高生態鏈的運轉效率。 從實踐層面看,政府主管部門應與公版文獻資源數字化開發公益組織保持聯系和提供服務,完善公益項目管理的制度建設,及時幫助解決公益組織遇到的問題。政府可以購買公版文獻資源公益項目的開發成果,使其成為政府公共文化服務建設的一部分,解決公益項目資金短板。 企業贊助公版文獻開發公益項目,可以按規定予以相應的稅務減免,鼓勵企業長期持續資助公版文獻資源的數字化開發。 鼓勵學術機構、圖書館與公益組織合作,充分利用學術機構、圖書館的資源優勢,提供收藏的公版文獻資源供公益組織進行數字化加工和開放使用。 公益組織要增強其項目的開放性和透明度,通過項目的社會效益前景、取得的成就以及健全的管理制度來贏取社會信任,從而獲得持續的資金捐助和更多志愿者參與。
《中共中央關于全面深化改革若干重大問題的決定》提出應發揮市場在資源配置中的決定性作用,通過市場規則、市場價格、市場競爭實現資源配置的效益和效率最大化。 我國從上世紀八十年代開放文化市場,經過幾十年的努力,實現了文化產業的大繁榮大發展,證明市場對文化資源配置的有效性和高效率。 公版文獻資源符合“公地喜劇”模型,對其開發利用只會增加資源效益而不會減少資源總量,在需求增大而供給不足的情況下,必然會吸引商業資本介入開發。 目前比較知名的公版文獻商業數據庫已有數十個,主要收錄從先秦到民國的典籍、史料、方志、書畫、期刊、報紙等,涵蓋范圍廣,文獻總量大。 市場開發促進了公版文獻資源的整理和保護,推動了文獻數字化技術的發展和應用,為社會公眾和研究者提供了檢索使用公版文獻的更多渠道。 但是,資本是把雙刃劍,其追逐利潤的本性也會帶來諸多負面效應,目前即存在資源價格高、用戶負擔重的問題。 在鼓勵資本介入公版文獻資源市場開發的同時,政府要采取措施,規范企業行為,防范企業因過度逐利而可能造成的公眾獲取使用公版文獻門檻增高、難度增大問題。 針對當前部分公版文獻商業數據庫定價較高的問題,政府有關部門應調查其是否濫用市場壟斷地位或事實上形成壟斷價格,拆分或引進更多企業進行公版文獻數字化開發,形成良性競爭,鼓勵企業優化資源配置,采用新技術降低開發成本,合理定價,減輕用戶經濟負擔。 國有或集體所有企業從事公版文獻數字化開發,應將社會效益與經濟效益并重,以社會效益為先,承擔更多建設文化強國的社會責任,為公眾便捷獲取使用公版文獻創造條件。 要堅持有效市場和有為政府有機結合,既要發揮市場配置資源的決定性作用,提高公版文獻開發的效率和效益,又要加強政府的公共服務和市場監管職能,有效治理公版文獻開發中的壟斷和資本無序擴張亂象,避免社會資源的低效配置和重復浪費。
公共資源屬于全民所有,保障每一個公民平等地獲得基本公共資源的權利,是政府義不容辭的責任和義務[17]。 黨的十九屆五中全會提出要在2035年把我國建設成為文化強國,要實現這個目標,必須加強國家重大文化設施和文化項目的建設,創新實施文化惠民工程,推進公共文化服務體系建設。 公版文獻資源的數字化開發,可以作為政府提升公共文化服務的一項重要任務,將其建設成為覆蓋城鄉、惠及全民的知識基礎設施工程,筑牢公共文化服務資源根基,充分發揮公版文獻對傳播傳統文化、共享文明成果、建設文化強國的作用。 政府首先要做好公版文獻資源數字化開發的規劃設計,統籌各方力量,協調部署,有序推進公版文獻資源的開發利用。應建立全國性的公版文獻資源管理機構,明確公版文獻資源數字化開發目標,完善工作機制和管理制度,做好經費預算和任務分配。 其次要加強公版文獻資源數字化開發的技術和工具研發,規范公版文獻資源數字化開發流程,統一質量標準,搭建公版文獻資源網絡發布平臺。 學術機構、圖書館等利用公共財政進行公版文獻資源數字化開發,應在統一的規劃部署之下進行,摒棄狹隘的部門利益和保護主義,開展廣泛的合作交流,協同配合,成果共享,避免各自為陣,閉門開發。 政府應加強對公益組織、出版企業的管理和服務,在統一的規劃部署下協調各方參與公版文獻資源數字化開發,強化協作共享,優化資源配置,防止低效無序和重復開發。 可以通過項目招標、委托代建的方式,讓企業承擔公版文獻資源數字化項目,提高開發效率。 最后,要強化公版文獻資源數字化開發成果驗收,建立相應的考核反饋機制,加強公版文獻資源的宣傳推廣和使用。 政府主導的公版文獻資源數字化開發成果,屬于公共服務資源,應向全體公眾免費開放使用。 要為公眾使用公版文獻數字化資源提供便利,簡化操作流程,提高服務效能,不斷提升公版文獻資源使用的社會效益。