錢琴 張毅



摘 要:紅色文獻是老一輩無產階級革命斗爭的真實記錄,大力發展建設紅色文獻數據庫對于提升民族凝聚力,弘揚愛國主義精神有著重要意義。華東師范大學圖書館采用基于國際圖像互操作框架IIIF的開源特藏資源管理系統Omeka技術,對館藏紅色文獻進行加工整理,通過功能和特點的具體分析,結合具體案例,探索紅色特藏資源數據庫建設之路。
關鍵詞:紅色文獻;特藏;IIIF;Omeka
引言
2021年是中國共產黨成立100周年,習近平總書記在黨史學習教育動員大會上強調:“加強新時代大學生黨史學習教育,對于引導大學生大力發揚紅色傳統、傳承紅色基因,賡續共產黨人精神血脈,增強開拓前進的勇氣和力量,具有重要戰略意義。”各高校通過一系列紅色主題展覽,紅色故事經典誦讀,讓紅色基因根植于青年一代心中。紅色文獻作為先進文化思想的精華是我們研究紅色文化的重要資料,圖書館對于紅色文獻應做好收集、整理、記錄、展示和傳承,建立特色數據庫,可以使珍貴的紅色文化遺產得到長期有效的保護。本文將系統梳理總結高校圖書館紅色文獻研究動態,研究摸索圖書館自建紅色文獻數據庫共享展示平臺,為紅色文化建設與保護提供借鑒。
一、文獻調查分析
筆者通過在中國知網調研檢索,時間從2000年1月至2021年9月,主題為:“紅色文獻”并含“數據庫”,“紅色文獻” 并含“數字”,“紅色文獻”并含“圖書館”為條件,檢索得到共計104篇文獻,其中包含紅色文化29篇,紅色文獻20篇,數據庫建設11篇,文獻資源數字化3篇,圖1從文獻的發表年度可以看出,紅色文獻的保護與研究得到越來越廣泛的共識。
二、高校圖書館紅色特藏資源數據庫調查分析
1.背景與調查
新中國成立前,紅色資源廣泛認可界定范圍為:中國共產黨成立至新中國成立前,中國共產黨機關以及根據地出版的各種書籍和雜志等。由于年代久遠,以及當年的印刷技術,紙張質地等,很多文獻出現破損毀壞,紙張非常脆弱等現象,已不適合借閱瀏覽,不能發揮其歷史價值和教育意義,如何讓紅色文獻“活起來”,發揮其文明傳承價值成為亟待解決的問題,因此,圖書館對于紅色文獻數據庫的開發刻不容緩。
目前,各館藏機構特藏數據庫主要集中為:民國時期資源庫、地方歷史文獻庫、古代地方志、古籍庫、書畫庫等,新中國成立前,紅色文獻數據庫并不多。整理紅色文獻對于高校思想政治教育、科研教輔、校園文化建設具有重要意義。筆者調查到有紅色特藏數據庫的高校分別有:中國石油大學發布的紅色文獻數據庫、井岡山大學圖書館建立的“井岡山特色文獻資源庫”、延安大學圖書館發布的“延安時期中共中央機關報全文數據庫”、上海市委黨校圖書館發布的“晉綏日報”數據庫,此外還有如萬方數據開發的《紅色文化專題數據庫》以及陜西人民出版社開發的《紅色檔案——延安時期文獻檔案匯編》等。
2.存在的問題
通過調研發現,各館藏機構以及認識到紅色資源開發的重要性,但現有資源平臺在功能設計、開放共享方面仍存在以下幾個問題。
(1)現有的數據庫功能單一,平臺利用率低。目前,現有的數字資源平臺資源尚不全面,一部分數字平臺僅支持簡單的瀏覽,或不提供圖像瀏覽,大部分特藏資源只對本校讀者服務,紅色文化輻射力和影響力甚微。
(2)缺乏多元異構數字資源共享利用平臺。各館藏機構采用的技術框架、資源格式和應用程序各不相同,由于沒有統一標準,這些已經進行數字化處理的資源被封鎖在信息“孤島”里,不同平臺數字資源難以交換共享。
(3)少有圖像資源深入挖掘功能。注釋對于相關學術數據庫具有很大的推動作用,目前,大多數庫僅提供簡單瀏覽、縮放等操作,缺乏圖像資源研究者和提供者溝通的橋梁,無法支持與資源互動,對原始文獻挖掘的深度不夠,鮮有能夠實現內容注釋、添加評語等功能。
三、華東師范大學新中國成立前紅色文獻數據庫實踐
1.新中國成立前紅色文獻資源現狀
華東師范大學目前有專門的紅色文獻資料庫,文獻室中的一些資料由于年代久遠,存在著不同程度的破損,紙張非常脆弱,為更好地發揮紅色文獻的歷史價值和教育價值,圖書館已對部分圖書進行數字化處理,以便從標題、分類、出版社,作者等方面進行檢索。目前已數字化105本,總計10895頁,其中最早為1926年5月出版的《中國共產黨五年來之政治主張》,其中不乏老一輩無產階級革命家毛澤東、朱德等著作如《在延安文藝座談會上的講話》《論解放區戰場》經典紅色文獻以及一些外國記者如詹姆斯·貝特蘭、斯諾等一批外國著名作家、記者的著作。
2.設計與創新
華東師范大學新中國成立前紅色文獻數據庫采用Omeka發布平臺,結合國際圖像互操作框架(IIIF),對于館藏資源和海量紅色資源進行統一整理收割與共享,建立多元異構數字圖像資源一站式整合平臺。
(1)Omeka發布平臺。Omeka是一個免費開源的網絡發布平臺,基于Omeka圖書館、博物館、檔案館等機構可以實現數字資源收集、展覽、網絡發布等。具有強大的可擴展性和靈活性,對于特藏資源集成化展示建設有著廣泛的應用。華東師范大學新中國成立前紅色文獻數據庫采用資源管理與發布的Omeka系統,下載omeka classic版本,上傳安裝所采用的Apache服務器,并下載安裝Finalshell服務器網絡管理軟件,連接已設置的主機和端口。完成Omeka的安裝部署之后可在后臺進行系統一般信息的設置,如管理員郵件地址、站點名稱、站點描述等信息。Omeka 作為支持IIIF的資源管理系統,可在其官網PLUGINS選項中下載安裝所需的插件Universal Viewer瀏覽器作為IIIF的功能實現。
(2)國際圖像互操作框架技術。國際圖像互操作框架(IIIF)基于HTTP技術,提供各類應用程序編程接口(Application Programming Interface,API)以實現對互聯網圖像資源的開放收割與處理。各機構可以加入全球共享同盟(IIIF-C)來實現本機構的資源共享,只要下載安裝相關API,將自身資源在這些成員單位上進行共享展示。用戶只需安裝專門瀏覽器(Universal Viewer)即可使用這些數字資源。Universal Viewer瀏覽器在文化遺產機構中較為流行,它可以演示不同類型的媒體資源,如數字圖像、音頻、視頻等。本庫采用 Universal Viewer瀏覽器實現電子書的深度縮放瀏覽,旋轉、分享、注釋、保存,還可以對圖片進行轉化修改。任何通過IIIF方式發布的紅色資源,都可以通過IIIF-manifest連接,使讀者可以瀏覽全球的紅色資源。
(3)數據庫框架設計。新中國成立前紅色文獻數據庫設計一共分為4層,底層為數據層:數據來源主要是館藏紅色資源,以及采用IIIF發布的紅色資源。第二層為Omeka特藏資源管理發布平臺,主要負責元數據的接入、處理、圖像數據的上傳、圖像資源發布等,第三層為IIIF層,在Omeka系統插件區中通過下載安裝IIIF專用瀏覽器UnivesalViewer,在瀏覽器中添加manifest地址,可以實現IIIF資源無縫連接,以此收割海量紅色資源。頂層為展示層,紅色資源可以實現深度縮放、平移、搜索、比較、分享等功能,頁面右側有元數據查看功能。
3.新中國成立前紅色文獻數據庫系統實施
經過系統的前期部署,新中國成立前紅色文獻數據處理主要分為兩個部分,圖像數據和元數據的處理與導入,以及網頁主題設計。
第一部分為圖像數據的上傳,在上傳之前首先用圖像批量處理軟件DjVuToy將所有的DjVu文件全部轉換成TIF圖像文件,此部分轉換圖片時需將每個文件按序建立文件夾,將不同書籍轉換的文件放入不同文件夾中,共計105個文件夾,本機存放路線,例如:D->zhuanhuan。
Omeka系統的所有圖片資源設置為4個文件夾,分別為:fullsize,original,square_thumbnails,thumbnails,其中original文件夾用來存放所有圖片的源文件,打開finalshell,將此前批量轉好的105個文件夾復制至路徑finalshell->omaka-main->files->original-> D->zhuanhuan中。
此外圖片的處理還涉及兩個部分:
一、做縮略圖。本網站采用的Universal Viewer瀏覽器在左側使用縮略圖預覽模式,使得讀者瀏覽閱讀時更為便捷。縮略圖的處理如下,使用命令行調用ImageMagick對目錄圖片進行處理,使用到的ubuntu命令行為:for file in*/*.tif;do convert-thumbnail 164x200^-quality75%$file ${file%%.*}.jpg;done,在同一目錄下生成,源圖片和縮略圖可以同時然后復制到fullsize,square_thumbnails,thumbnails三個文件夾中去。
二、圖片加學校圖書館水印。首先將水印文件:logo.png提前放在:/var/www/sy/目錄下,再次使用ubuntu命令行:find -type f -exec bash -c ‘[[ -n “$(file -bi “$1” | grep tif)” ]] && composite -gravity center ?-geometry +1+1 ? /var/www/sy/logobig.png ? “$1” tif:”$1” - {} \; ? 即可將所有源文件加上水印,使得水印和源圖片融為一體。
第二部分為元數據的導入。此部分共建立6張表與Omeka數據庫的批量導入,分別為omaka_element_texts.xlsx,omeka_files.xlsx,omeka_items.xlsx,omeka_records_tags-ok.xlsx,omeka_search_texts.xlsx和omeka_tags.xlsx。其中omeka_files.xlsx為每張圖片存放的物理地址,omeka_tags.xlsx為每篇文章的標簽分類,有出版年份、出版社等。6張表做好后打開navicat,連接IP地址,在omeka_main目錄下先復制備份,然后再導入表。
第三部分為網站主題選擇。Omeka官網上可以下載不同風格的主題頁面或者可以自己設計主題,Omeka官網提供了12種不同風格的主題頁面,通過下載源文件,然后存放在omaka-main/themes目錄下即可使用。本網站采用的“ The Daily”風格,用戶可以自由配置該主題,通過改變頁面顏色、logo文件,以及設置頁面圖片尺寸和頁面顯示設定等操作。本網站最終頁面展示12本書,每行4本,一共3行。頁面布局簡潔大方,讀者使用時一目了然,非常適合小型網站書展模式。此外網頁采用終端自適應設計,在各類移動設備上也能輕松展示,隨時隨地獲取資源。
四、結論與展望
當前,開發共享各類特藏資源的學術研究、文化教育以及文化遺產的保存得到廣泛共識。IIIF提供了一個統一的收割和管理分布于世界各地的不同數字資源的協議,通過IIIF的使用,可以使得圖像資源存儲機構突破自身資源限制,經過IIIF發布的圖像可以極為方便地進行互操作,實現和其他館藏機構之間的圖像資源的共享利用,最終形成全國高校圖書館紅色資源共建,優勢互補的共享平臺。
參考文獻:
[1]賈翠玲.延安時期紅色文獻搜集整理與數字化建設[J].延安大學學報,2016
[2]付躍安.國際圖像互操作框架(IIIF)及在數字資源集成中的應用[J].圖書館論壇,2020
[3]吳加琪 基于Omeka的專題數字文化資源小型收集網站建設研究[J].現代情報,2017
[4]張 毅,陳 丹.基于Omeka與IIIF的特藏資源庫建設研究與實踐[J].大學圖書館學報,2020
(作者單位:華東師范大學圖書館)