李 倩,肖文美
(南京林業大學 圖書館,江蘇 南京 210037)
特藏資源是一種珍貴的文化遺產和學術資源,具有很高的歷史、文化和學術價值。在館藏資源同質化越來越嚴重的今天,加強圖書館特藏資源建設是彰顯圖書館特色的重要手段。隨著特藏資源的不斷擴大和數字化進程的加速,特藏資源數據庫成了特藏資源的主要管理平臺。特藏資源多以圖像為載體,然而特藏資源數據庫中的圖像管理和展示面臨著諸多問題,如圖像的高效訪問和處理、圖像的共享和重用、圖像的可視化展示和交互式探索等。數字化技術為特藏資源的保存和利用提供了全新的途徑和手段,但數字化展示方式的創新與優化仍然是特藏資源數據庫建設的重要研究方向。
國際圖像互操作框架(International Image Interoperability Framework,IIIF)是一種圖像互操作標準,可以提供高效的圖像訪問和處理服務,支持多平臺互操作性,提高數圖像的互操作性和可重用性。IIIF標準在文化遺產資源領域中得到了廣泛應用,為特藏資源的數字化展示提供了新的思路和解決方案。將IIIF標準應用于特藏資源數據庫建設,對于提高特藏資源的數字化展示效果和用戶體驗,實現特藏資源從數字化到數據化、智能化具有重要意義。
IIIF是由一些數字圖書館和博物館組織共同制定的開放標準。該標準的制定始于2011年,最初由斯坦福大學、哈佛大學、牛津大學等機構聯合制定。截至2023年,IIIF 社區已經擁有超過100個成員機構,包括圖書館、博物館、檔案館和數字人文研究機構等。這些機構通過共同參與標準的制定和推廣,推動了數字文化遺產領域的開放和互操作性發展。
IIIF通過制定一系列技術規范和協議,實現了對不同圖像資源的統一訪問和使用。IIIF API的實現工作可以分解為核心API和附加API。核心API中,Image API主要用于訪問和傳輸圖像資源。它允許構造參數化URL來獲取圖像的特定區域和大小,從而支持縮略圖和深度縮放查看。它還指定了一種獲取圖像信息(info.json)的方法。Image API 可以通過Apache、Nginx等標準Web服務器實現,也可以通過專門創建的圖像服務器實現。Presentation API用于描述和呈現圖像資源,在實現 Presentation API時會創建一個被稱為演示清單的json文檔,它包括向用戶呈現整個資源所需的所有信息。附加API中,Authentication API主要用于用戶認證和授權,Content Search API允許在資源內進行搜索,Change Discovery API描述對IIIF內容資源的更改以及要獲取的這些資源的位置。
1.2.1 提供高效的圖像訪問和處理服務
IIIF提供了高效的圖像訪問服務。在 IIIF 中,所有的圖像都可以通過URL來獲取。它可以將大型的高清晰度圖像分割為多個小圖像,根據需要動態加載和顯示,從而提高圖像的訪問效率和速度。同時,IIIF提供了包括JPEG、PNG、TIFF等在內的多種圖像格式選項,可以根據用戶需求靈活地選擇圖像格式,滿足不同應用場景的需求。IIIF支持圖像的多分辨率展示。這種技術使得圖像可以根據需要切換不同的分辨率。通過IIIF提供的API,用戶可以快速、流暢地查看高分辨率的圖像,而不需要等待圖像加載。IIIF支持圖像的裁剪、旋轉、縮放等操作,用戶可以在不下載圖像的情況下,通過IIIF直接對圖像進行處理,極大地提高了圖像處理的效率。
1.2.2 支持豐富的圖像元數據描述
IIIF通過Presentation API定義的元數據描述模型,可以為圖像資源提供詳細的描述。這些元數據可以提供關于圖像資源的更多信息,如作者、版權信息、采集日期、地點等。這些信息為數字圖像的管理、分類和使用帶來了便利。IIIF支持多種元數據格式,如EXIF、XMP和Dublin Core等,使得IIIF能夠適應不同的應用場景,可以方便地與其他應用程序進行集成。此外,IIIF還支持擴展元數據,用戶可以根據需要定義自己的元數據模型,以滿足不同領域的需求。IIIF提供了標注和注釋的功能。通過IIIF提供的API,用戶可以輕松地添加、編輯和查看標注和注釋,大大促進了圖像資源的共享和協作。
1.2.3 具有多平臺互操作性
IIIF提供了一個開放的標準化圖像訪問協議,使不同平臺之間的圖像訪問變得更加簡單高效。如果一個圖像在IIIF服務器上可用,那么用戶就可以通過不同的IIIF客戶端訪問該圖像。此外,IIIF還支持基于HTML5技術的圖像嵌入和共享。這使得用戶不僅可以在網頁上嵌入IIIF圖像,還可以在不同的平臺上共享和訪問這些圖像,極大地提升了圖像資源的傳播力度。IIIF具有高度的互操作性。通過IIIF提供的API,用戶可以對來自不同機構和組織的圖像資源進行統一的訪問和處理,而不需要使用不同的軟件或API來處理不同的圖像資源。
作為一個開放、透明、社區驅動的項目,IIIF吸引了全球許多機構和個人的參與,促進了IIIF標準的實現和發展。在符合框架標準的前提下,機構或用戶可以根據自身需求選擇或自行開發相關應用。圖像服務器和圖像瀏覽器是IIIF的2個核心組件。截至2023年4月,GitHub上的IIIF存儲庫提供了15個圖像服務器和16個圖像瀏覽器的具體實現。
圖像服務器主要用于處理和存儲數字圖像資源,并提供統一的基于Web的接口,使得這些圖像資源可以被全球范圍內的 IIIF客戶端實時檢索和利用。用戶可以選擇Apache、Nginx等標準的Web服務器簡單實現Image API,也可以使用專門的圖像服務器來實現更復雜的功能。常見的圖像服務器包括:Cantaloupe、Loris、IIPImage等。圖像瀏覽器主要用于對圖像資源進行檢索、瀏覽、標注、分享和復用。常見的圖像瀏覽器包括:OpenSeaDragon、Mirador、Universal Viewer等。
IIIF在國外大學圖書館中有著豐富的實踐案例。哈佛大學、斯坦福大學、牛津大學均是IIIF標準的發起者,他們與耶魯大學、普林斯頓大學、康奈爾大學一起參與了多個IIIF應用程序的開發和使用文檔的編輯工作。哈佛圖書館基于開源Mirador項目開發了新型圖像查看平臺Harvard Library Viewer作為IIIF圖像瀏覽器。用戶不僅可以通過它使用翻頁導航、目錄、全文搜索、打印、IIIF兼容文檔的比較等多項功能,還可以在Harvard Library Viewer上非常方便地進行文本識別。耶魯大學圖書館使用了Universal Viewer作為圖像瀏覽器。其支持根據深度縮放請求,靈活地返回圖像片段,解決了通過Web瀏覽高質量的大型圖像問題。Digital Bodleian不僅為用戶提供了Mirador和Universal Viewer 2種圖像瀏覽器,還提供了符合IIIF規范的清單下載,實現了圖像數據的共享和復用。
在國內也有許多機構嘗試將IIIF應用到特藏資源建設中。廈門大學圖書館使用了基于ZendFramework3.0框架的開源平臺Omeka S建設特藏數字資源管理平臺,采用Loris2作為圖像服務器,提供高質量圖像的訪問接口;采用OpenSeadragon作為圖像瀏覽器,提供了在線瀏覽、比對及縮放等服務,使得特藏資源得以更好地利用和分享[1]。復旦大學圖書館將IIIF技術應用到印譜特藏資源的展示中,建設了“印藏”數據庫。該數據庫以林章松先生的印學資料館松蔭軒所藏的印譜為基礎,整合了其他私人收藏,匯聚了1 400多種歷代印譜。“印藏”數據庫采用了基于開源Mirador項目的新圖像查看平臺“易圖”作為圖像瀏覽器。用戶可以通過“易圖”實現圖像的訪問、標注及對比研究。華東師范大學圖書館將IIIF技術應用到“近代教科書數據庫”的構建中。數據庫使用了Omeka的經典版本,采用Universal Viewer作為圖像瀏覽器,實現了對2 800本近代教科書的35萬張圖像資源的保存、管理、發布、揭示與共享[2]。
南京林業大學圖書館作為全國林業文獻信息收藏最完整的圖書館之一,其館藏書刊資源部分來自原金陵大學、中央大學以及華中農學院,包含了大量民國時期的林業類書刊、工作報告、手稿。民國時期的館藏文獻受其紙質載體限制,老化速度非常快,大部分都已泛黃變脆。圖書館難以直接提供民國時期文獻的閱覽服務,用戶在使用這部分文獻時存在著諸多障礙。為此,圖書館使用非接觸式高清掃描儀對民國時期的林業類館藏文獻進行了數字化。
民國時期的林業數字化文獻包含了大量的圖像資源,需要創建特藏數據庫系統對其進行精細化管理,并創建符合國際通用標準的元數據格式。系統需要從多維度對圖像資源進行揭示,并為讀者提供檢索功能和圖像瀏覽工具。因為館藏的民國林業文獻并不完整,而互聯網上提供了部分民國時期的林業文獻資源影像,如CADAL、全國報刊索引近代期刊數據庫、中國林業信息網等,為了實現數據的共享和復用,系統需要支持IIIF標準,為實現林業文獻數字資源的多平臺互操作提供支撐。
民國時期林業特色館藏數據庫系統架構包括4個主要組件:數據存儲、IIIF圖像服務器、Web服務器和前端用戶界面。
數據存儲分為2部分:元數據存儲和圖像存儲。元數據存儲部分存儲每個資源的描述信息包括:資源的標題、作者、日期、主題、地點、類型等信息。元數據需要采用標準的元數據格式,如Dublin Core或MODS等,以便與其他系統互操作。圖像存儲部分存儲每個資源的圖像文件。圖像文件需要采用符合IIIF規范的格式,如JPEG2000等,以提供資源的高清影像。
IIIF圖像服務器是支持IIIF協議的關鍵組件之一。它需要能夠根據IIIF請求生成相應的圖像,以供用戶進行瀏覽和處理。該圖像服務器需要采用符合IIIF規范的軟件,如Loris等,以支持IIIF協議的圖像縮放、剪切、旋轉、標注等操作,并提供高效的網絡傳輸。
Web服務器是將元數據、圖像和IIIF服務整合起來的組件。它需要支持多種網絡協議,如HTTP、HTTPS等。Web服務器需要能夠根據用戶的請求,從元數據存儲和IIIF圖像服務器中獲取相應的數據,并將其整合為IIIF請求的響應。Web服務器還需要支持基于IIIF的高級檢索和目錄瀏覽功能,以方便用戶查找和瀏覽資源。
前端用戶界面是用戶訪問和使用特色館藏數據庫系統的入口,它需要提供符合人機工程學的用戶界面設計和易用性。前端用戶界面需要采用符合IIIF規范的JavaScript庫和框架,以提供諸如縮放、旋轉、標注、對比等功能,方便用戶進行瀏覽和研究。
考慮到開發成本與可擴展性,系統采用了開源項目Omeka。Omeka是一個用于創建數字展覽和在線圖書館的開源軟件平臺,可以幫助用戶輕松創建和發布數字資源。Omeka提供了許多可擴展的插件和主題,可以根據需要進行自定義配置和擴展。Omeka還支持多種標準元數據格式,如Dublin Core、MARC和MODS等。考察了Omeka的不同版本后,本文選擇Omeka Classic作為民國時期林業特色館藏數據庫系統的管理平臺。
由于Omaka只支持Linux操作系統[3],因此筆者選擇安裝了Ubuntu18,并根據要求安裝了Apache2作為HTTP服務器,開啟了apache的mod_rewrite,安裝了MySQL5.7作為數據庫服務器,安裝了PHP7.2和mysqli、exif等擴展,安裝了ImageMagick圖像處理軟件用于調整圖像大小。完成操作系統安裝和環境部署后,將下載的omeka3.1.1安裝文件解壓至apache網站目錄,并設置相應的目錄權限;修改數據庫配置文件db.ini設置MySQL數據庫的名稱、用戶名和密碼;在瀏覽器地址欄輸入http://127.0.0.1/即可啟動Omeka安裝程序。Omeka提供了圖形化的安裝界面,按照引導操作完成安裝。在瀏覽器地址欄輸入http://127.0.0.1/admin/進入后臺管理頁面,Omaka后臺提供了對站點一般信息、安全、搜索、元素集、條目類型元素、API、外觀等選項的配置功能。
Omeka系統通過插件提供對IIIF的支持。從Omeka官方網站的插件頁面下載Universal Viewer 2.6,將其解壓到Omaka安裝目錄的plugins文件夾下后,在Omaka后臺的插件頁面就可以識別到這個插件,并對其進行配置管理。
最后,在后臺管理頁面進行資源元數據導入和圖像文件的上傳。
本文探討了IIIF在特藏數據庫建設中的應用實踐。IIIF作為圖像互操作標準,可以有效地解決特藏數據庫中的圖像管理和展示問題,實現圖像的快速訪問、多樣化展示和交互式探索,提高了用戶的使用體驗和滿意度。未來,隨著特藏數據庫的不斷發展和完善,IIIF在特藏數據庫中的應用將變得越來越普遍。同時,IIIF標準也將不斷完善和發展,為特藏數據庫更多類型資源的管理和展示提供更加豐富和多樣化的功能和服務,為特藏資源的保護和傳承作出更加積極的貢獻。