任 靜,林衛東,李洪梅
(山東省圖書館,山東 濟南 250100)
紅色文獻是指1921年7月中國共產黨成立至1949年10月新中國建立之前由中國共產黨機關或各根據地出版、發行、制作的各種文獻資料,涵蓋圖書、期刊、報紙、檔案等,包括老一輩無產階級革命家著作中具有代表性的版本,中國共產黨從誕生到掌握政權期間的一些重要出版物以及檔案文獻、偉人名人手跡、標語、票證、傳單等多種文獻類型,還有國統區、敵占區刊行的進步書刊及偽裝本等,具有重要的文獻價值和收藏價值,是民國文獻的重要組成部分。
數字化技術的迅猛發展為紅色文獻的挖掘和整理提供了平臺,繼民國文獻數字化建設后,隨著國家對紅色文獻的重視,許多民國文獻數字化開發公司如愛如生、大成、古聯等,也開發了一批內容豐富、檢索便捷的紅色文獻數據庫。紅色文獻數據庫相對于民國文獻數據庫來說,開發相對較晚,數據庫功能更加成熟。公共圖書館和部分高校圖書館是紅色文獻的主要收藏單位,也陸續開發了一批紅色文獻全文數據庫、書目數據庫和專題數據庫。這些紅色文獻數據庫的開發,不僅有效保護了圖書館等收藏機構的紙質文獻,而且為中共黨史、新聞傳播學、歷史學、文化學和紅色文化教育等特色學科和專業提供教學和科研支撐,同時,為普通大眾和研究者在互聯網上提供紅色文獻服務研究提供便利。
紅色文獻綜合性全文數據庫大都是收錄資源較全,檢索功能便捷,并且有一定市場影響力的產品。
“愛如生紅色歷史文獻數據庫”是國內外第一個圖文并茂全文檢索的紅色文獻數據庫,總計收錄300余種文獻,完整收錄《紅色中華》《新中華報》《新華日報》等紅色報紙。
該庫的“三窗點選式”全圖頁面可以瞬間切換,強大的檢索系統可以實現毫秒級全文檢索。
“大成中共黨史期刊數據庫(—1949)”是國內建設較早的紅色文獻數據庫,收錄270多種期刊1萬多期。該庫的按篇檢索提供題名、作者、刊名3個檢索項,按刊檢索提供刊名、年代、創刊地、單位4個檢索項,支持繁體字檢索。收錄期刊有《八路軍軍政雜志》《東北畫報》《激流》《解放》《民主青年》《秦鐘》《群眾》《中蘇文化》等。
“紅色文獻數據庫”收錄紅色圖書、期刊、報紙約 6 500 余種,并持續擴充內容。該庫具備全文檢索功能,檢索結果能夠在圖像中精準定位,其中的紅色報紙和紅色期刊都可實現篇目單獨下載。紅色圖書包括毛澤東《論持久戰》的各種版本;紅色期刊包括當時延安出版的《布爾塞維克》《解放》《八路軍軍政雜志》等;紅色報紙包括《邯鄲日報》《冀中導報》《新洛陽報》《豫西日報》等。
“紅色報刊檔案數據庫”是由北京國圖書刊服務有限責任公司開發,收錄由中國共產黨直接領導或間接創辦的黨報黨刊,包括《群眾》《解放日報》等重要紅色報刊和檔案資料。該庫可提供20余萬條文獻,并且包含約3萬余幅圖片。
古聯“紅色經典報刊庫”主要收錄中國共產黨直接或間接領導及參與創辦的報刊,是彌足珍貴的黨史資料。該庫包含106種報刊,可以實現全文檢索。其中包括《黨的生活》《犁頭》《勞動界》《勞動與婦女》《布爾塞維克》《北方紅旗》《中國青年》《八路軍軍政雜志》等珍貴報刊。
“延安時期紅色文獻數字研究平臺”是延安大學圖書館建設的綜合性紅色文獻研究平臺,整合了延安時期的圖書、報刊、檔案、圖片和音視頻數字資源,多數文獻資料都是首次解密、公開出版,具有珍貴的史料價值。該平臺共包含3個數據庫,其中,“延安時期中共中央機關報全文數據庫”歷時3年,實現了紅色報紙OCR識別,輔以人工加工基本保證了文字識別的準確率,這在眾多紅色文獻數字化項目中實屬難得。

圖1 《延安時期中共中央機關報全文數據庫》報紙全文數字化界面
“中國抗戰大后方3D數字圖書館”由重慶圖書館建設,收錄近5萬種數字藏品,包括抗戰時期出版的各種報紙、雜志、期刊、名人手跡以及重慶圖書館收集的抗戰時期的圖片和視頻資料。該圖書館利用3D虛擬現實技術像讀者展示珍貴文獻資料,是國內第一家抗戰文獻3D專題數字圖書館。
從上述對綜合性全文數據庫的介紹可以看出:第一,從數據庫收錄資源的文獻類型上看,以期刊、報紙和圖書全部為收錄對象的數據庫較多,有“愛如生紅色歷史文獻數據庫”“延安時期紅色文獻數字研究平臺”“紅色文獻數據庫”,專門收錄期刊的只有“大成中共黨史期刊數據庫(—1949)”,專門收錄報刊的是古聯“紅色經典報刊庫”。第二,從數據庫收錄資源的數量看,圖書收錄最多的是“中國歷史文獻總庫——紅色文獻數據庫”,收錄圖書 6 500 余種;期刊收錄種類最多的是大成“中共黨史期刊數據庫(—1949)”,收錄期刊1萬多期;報紙收錄種類最多的是“中國歷史文獻總庫——紅色文獻數據庫”,收錄報紙70余種;檔案收錄最多的是國圖“紅色報刊檔案數據庫”。第三,目前已開發的紅色文獻數據庫都非常注重檢索功能,“紅色文獻數據庫”可全文檢索、篇目間迅速跳轉、瀏覽與下載同步完成,還具備復制、引用、筆記、收藏等個性化功能,配備聯機詞典、紀年查詢、專名查詢等輔助工具;“延安時期紅色文獻數字研究平臺”可以用不同的文獻資料類型作為導航,并且具有簡單的數據分析功能。
若干圖書館還建有一些非常有價值的紅色文獻書目數據庫,這些書目數據庫是開展紅色文獻研究、開發、利用最基礎的資料來源。例如,延安大學的“延安時期紅色文獻數字研究平臺”就是以書目數據為基礎,最終建成一個綜合性文獻服務研究平臺。紅色文獻書目數據庫包含了紅色文獻的諸多基本著錄信息,如題名、責任者、出版社、復本數、刊期、館藏情況等,可分為全國性的書目數據庫和地方性的書目數據庫。紅色文獻全國性的書目數據庫有中國國家圖書館的“革命歷史文獻聯合編目中心資源庫”,包含 10 964 條書目數據,成員館有25家省市級公共圖書館和高校圖書館。該庫提供題名、著者、年代、收藏單位、館藏量等檢索入口,包含題名與責任、版本項、出版項、載體形態項、主題、收藏單位等基本信息,可以查看標準名格式、字段名格式和MARC格式的數據信息。該庫收錄的紅色文獻都是各成員館館藏中比較有代表性的紅色文獻,并不是全面收錄,因此,該庫雖是全國性的聯合目錄但不能替代地方性的書目數據。
地方性的書目數據庫是各紅色文獻收藏單位根據地方紅色文獻的特點建設的,通過地方性的書目數據可以更有針對性地了解地方紅色文獻收藏情況,對地方紅色文獻研究具有重要意義。地方性的書目數據庫有上海圖書館建設的“上海圖書館藏革命歷史文獻數據庫”,包含 6 700 余種各類珍貴紅色文獻,其中,最具代表性的是毛澤東的著作、單行本、手跡、照片,共收錄 1 390 種 4 100 余冊;湖北省圖書館建設的“館藏革命文獻目錄”,收錄革命文獻 1 095 種;遼寧省圖書館收藏的東北抗戰文獻比較豐富,建設的“東北抗戰書目庫”收錄東北抗戰圖書書目信息300余種;廣東省立中山圖書館建有書目數據庫“孫中山文獻庫”;重慶圖書館是抗戰時期國民政府的陪都,留下了豐富而珍貴的革命歷史文獻,“重慶圖書館館藏革命文獻目錄(1919—1949)”收錄中國共產黨在革命實踐過程中形成的圖書、報紙、期刊、油印或石印的小冊子和非正式出版物等各類文獻;天津圖書館革命文獻雖然數量和種類不多,但是,其中有些版本價值較高,是不可多得的珍貴文獻,在其網站的特色館藏欄目中建有“革命文獻書目數據庫”,該庫可查詢包括館藏革命文獻的題名、責任者和索取號,并提供封面圖;湖南省圖書館的特色館藏是與毛澤東相關的紅色文獻,建設有“館藏毛著版本書目數據庫”。
紅色文獻專題數據庫大多是從紅色文獻資料中析出建設的,專題數據庫的建設主要集中在公共圖書館,公共圖書館紅色文獻專題數據庫數字化建設現狀具體概況如表1所示。

表1 紅色文獻專題數據庫數字化建設現狀

續表1
在這些專題數據庫中,中國國家圖書館“抗戰時期圖片資源庫”收錄了約1.3萬張抗戰時期圖片,揭示了中國軍民與盟軍共同抵御日本侵略的歷史場景,展示了6個欄目,分別是中國遠征軍、軍民抗戰、日軍暴行、對日受降和對日審判等;“上海圖書館藏淞滬抗戰圖片庫”從館藏的中、英、日語歷史文獻中選錄兩次淞滬戰役相關圖片達 8 000 余幀;南京圖書館的“抗戰歷史圖片數據庫”包含日本早期侵略、全面抗戰、持久抗衡、日軍侵華暴行、國際關系、光輝勝利、抗戰文化等幾個專欄;陜西省圖書館的“陜甘寧邊區紅色記憶多媒體系列數據庫”分人物、事件、延安精神、革命舊址遺址紀念地和研究文獻5個子庫,集歷史文獻、圖庫、聲像資料、參考書目等為一體,設有讀者互動欄目,具備全文檢索功能;吉林省圖書館的“東北抗日聯軍人物志數據庫”包含344條數據;遼寧省圖書館建立了多個專題數據庫,如“張學良專題數據庫”包含611幅圖片、相關文獻索引733條,“九一八事變專題圖片庫”包含圖片998幅,資料索引733篇,“中國共產黨黨史圖片集”包含 1 274 個圖片,“東北抗戰事件庫”包含數據400多條,“東北抗戰圖片庫”包含 1 300 余幅圖片,“東北抗戰人物庫”包含700多人的介紹等。
紅色文獻也散見于民國文獻數據庫中,包含在民國文獻數據庫中的紅色文獻,基本不能實現一次性檢索,查找單篇紅色文獻時至少需要提供紅色文獻的題名或責任者等信息。
包含紅色文獻的綜合性全文數據庫的有“抗戰文獻數據平臺”,紅色文獻是平臺的重要內容,該平臺于2017年10月開始試運行,承諾永久向社會免費開放。平臺收錄200多種圖書、報紙、期刊、圖片等各種資源的紅色文獻,種類多樣,其中包括抗戰時期重要的紅色期刊《火線》《中國農村》《解放》《群眾》《戰線》《共產黨人》《海沫》《真理》《現代婦女》等,紅色報紙《救亡日報》《新中華報》《太岳日報》《抗戰日報》《解放日報》《抗敵報》等,報刊收錄相對較全。煙臺圖書館于2020年10月啟動館藏珍稀歷史文獻數字化項目“煙臺圖書館珍貴歷史文獻數據庫”,該數據庫包含館藏圖書、報紙、期刊等膠東紅色文獻,其中,紅色圖書200多種,紅色期刊10余種,該庫于2021年7月左右面向讀者開放。
包含紅色文獻的書目數據庫有大連圖書館建設的“館藏舊報刊目錄數據庫”,收錄有《民主青年》《文林》《友誼》《學習生活》等多種紅色期刊;北京師范大學建設的“中文珍稀期刊題錄庫”中收錄館藏283種期刊,其中,收錄50余種中國共產黨各級黨組織創辦的紅色期刊,如《邊區政報》《共產黨人》《共產國際月刊》《全民抗戰》等;湖南圖書館建設的“館藏縮微文獻書目數據庫”包含新中國成立前的部分紅色期刊和紅色報紙;中國人民大學建設的兩個書目數據庫“民國時期圖書資源庫(1912—1949)”和“民國時期期刊資源庫(1912—1949)”,都包含解放區出版物和國統區出版的進步刊物,其中不少是獨有或存世極罕的珍品;廣東省立中山圖書館的“解放前廣東報紙庫”也包含部分紅色報紙。
包含紅色文獻的專題數據庫有南京圖書館的“百年人物圖片數據庫”收錄部分共產黨人的詳細生平介紹和重要獨照及合影;湖南圖書館的“湖湘人物數據庫”包含了共和國領導人、英雄模范、解放軍將領的相關資料;廣西壯族自治區圖書館的“廣西民國照片數據庫”“廣西民國人物數據庫”也包含部分紅色文獻內容。
此外,很多圖書館雖然沒有建立單獨的數據庫,但是開展著紅色文獻的整理工作,如首都圖書館2003年完成了館藏紅色文獻的掃描工作,掃描了《抗敵報》《紅色中華》《八路軍軍政雜志》《解放》《紅旗》《紅旗周報》等報刊;南京圖書館自2007年已完成革命書刊 4 885 冊的全文掃描;山東省圖書館也完成了館藏200余種紅色報刊的全文掃描工作,主要用于出版和供讀者閱讀。
目前,紅色文獻數字化正在持續建設中,針對以上紅色文獻數字化的建設概況,圖書館等收藏單位在進行紅色文獻數字化建設規劃時可以考慮以下5點建議。
民國文獻數字化建設要早于紅色文獻,各個數據庫都有自己的資源特色。目前,建設的紅色文獻綜合性全文數據庫有一部分就是民國文獻數據庫的子數據庫,如“古聯紅色經典報刊庫”“愛如生紅色歷史文獻數據庫”“大成中共黨史期刊數據庫(—1949)”“中國近代期刊全文數據庫——紅色文獻專題數據庫”“中國歷史文獻總庫——紅色文獻數據庫”等,都是在成熟的數據庫建設的基礎上建立的單獨的紅色文獻子數據庫。因此,在紅色文獻數字化建設時,可以借鑒這樣成功的經驗,統籌規劃紅色文獻數字化建設。
目前,紅色文獻數字化建設主要以期刊、圖書為主,尤其是期刊資源得到了有效的開發和整理,綜合性全文數據庫中基本上都包含了期刊資源。但是,在紅色文獻數字化開發中,各類型數據庫中收入報紙的品種和數量均不多。從目前已建成的紅色文獻數據庫來看,除了期刊、圖書和報紙,只有部分數據庫有少量檔案、手稿、非正式出版物等,但仍有大部分資源未納入數字化建設的范圍。針對目前的開發現狀,應該拓寬紅色文獻類型,適當加強其他文獻類型資源的建設,爭取將所有紅色文獻類型都逐步納入數字化建設。
紅色文獻數據庫在開發的過程中,存在對某些類型資源過度開發以及大量重復建設等問題。例如,古聯、大成、紅色文獻數據庫、紅色報刊檔案數據庫、延安時期紅色文獻數字研究平臺等都包含《八路軍軍政雜志》《群眾》等期刊。從全國范圍來看,收藏紅色文獻的主要有圖書館、檔案館、軍事科學院、革命紀念館、高校圖書館、私人收藏家等。目前,需要摸清家底編纂《全國紅色文獻聯合目錄》或包含國外藏品在內的《紅色文獻聯合目錄》。另外,也需要建立地方性的聯合目錄,因為紅色文獻存在數量少、類型雜、分布廣、偽裝多等特點,地方性的聯合目錄要盡量收全,而且要與全國性的聯合目錄有效銜接,這樣在數字化時才能有效避免重復建設。
紅色文獻包括圖書、報紙、期刊、檔案、手稿、傳單等多種文獻類型,數字化時需要分別對待,在數字化建設的各種標準中,涉及圖像掃描加工、數據標引、建庫后期增補完善等多方面問題。首先,是掃描標準的制訂,不論哪種文獻類型最好選擇24位彩圖掃描,圖像存儲可根據文獻不同選擇JPEG、JPEG2000、TTFF和GIF作為存儲格式,發布格式建議選擇JPG、JPG2000格式,或將其轉化為PDF格式,為資源的后期開發和長期保存奠定基礎。其次,是主題內容的標引,需要進一步分析內容,注重局部內容的主題揭示,提供多途徑的知識發現服務。再次,是建立數據庫之后也要定期對數據內容持續修訂增補,種類動態添加,使系統動態建設逐步完善。只有建立統一標準,才能為后期的資源共享打下基礎。
專題數據庫建設可以借力紅色文獻的影印出版,近年各大出版社出版了很多紅色文獻專題匯編。例如,國家圖書館出版社出版的《辛亥革命稀見文獻匯編》(全45冊)、《民國時期山東革命根據地紅色期刊匯編》(全50冊)、山東人民出版社出版的《山東黨的革命歷史文獻選編1920—1949(全10卷)》、上海書店出版社出版的《不忘初心——上海市檔案館藏紅色文獻選萃》等,這些大型紅色文獻匯編基本上通過協調多個圖書館,遠遠超過某個單一圖書館的館藏和文獻整理水平,甚至調用私人原版文獻編纂影印而成,其專業性和學術性更強。但是,已有的影印紅色文獻匯編價格偏高,很難滿足讀者的需求,圖書館可以考慮利用已出版的影印版紅色文獻,建設自己的專題數據庫,這樣,就可以加快專題數據庫的建設,更好地為讀者服務。