吳 濤
(洛陽師范學院圖書館,河南 洛陽 471022)
在網絡化、數字化環境下,數字資源日益成為教育活動和創新研究的主要信息源。我國“九五”至“十一五”期間,“中國高等教育文獻保障系統(CALIS)”、“大學數字圖書館國際合作計劃(CADAL)”、“中國高校人文社會科學文獻中心(CASHL)”、“國家科學數字圖書館”和“中國數字圖書館”等一批數字化項目的相繼確立或完成,促進了高校數字圖書館建設的全面提升和有效共享。然而,在眾多數字化項目中,藝術院校圖書館數字化建設項目相對較少,藝術資源網絡利用明顯滯后。筆者于2010年7月選擇我國藝術教育排名靠前的9所美術學院、8所音樂學院圖書館為對象,對其自建數據庫情況進行了網絡調研(見表1、表2)。無獨有偶,2008、2009連續兩年,張麗霞等人分別以《中國一流大學圖書館特色資源探微》[1]和《中國一流大學圖書館“特色資源”跟蹤調查與研究》[2]介紹了我國一流大學圖書館的數字資源庫建設情況,綜合對比調查結果,藝術院校圖書館數字化建設無論在規模上還是在數量上均較落后,存在以下問題:
●藝術數字圖書館數據庫總量偏少。主要依靠引進或購買,且多為中文綜合性數據庫,如書生、超星、CNKI、維普等;藝術專業特點不夠突出;重復建設、資源浪費現象嚴重。
●自建數據庫以館藏資源為主,具有一定的專業特色,近年來雖然增長較快,但品種類目雜亂、規模小。
●自建數據庫“各自為政”,建庫軟件、技術標準不統一;建設質量良莠不齊;開放性、互動性差。
●國內藝術專業商業數據庫缺失導致各館擁有的藝術類商業數據庫品種匱乏。經費緊張又使得外文藝術數據庫的引進受到阻礙。

表1 藝術院校圖書館數據庫統計

表2 藝術院校圖書館自建數據庫列表
藝術院校圖書館不僅擔負藝術教育的重要使命,也是國家創新體系信息基礎設施的重要組成部分。針對我國藝術院校圖書館數字化建設的現狀,應從國家數字化信息整體發展的戰略高度盡快制定發展規劃。制定和完善從資源采集、組織、管理、安全、永久保存到服務利用一系列藝術數字圖書館標準規范,進一步擴大藝術數字資源建設的范圍和數量。建議國家職能部門,有組織有計劃地重點整合、挖掘國內外各類信息服務機構、教學科研機構、商業服務機構和高校成員館的可利用藝術信息資源以及各類信息網站豐富的藝術信息,逐步構建擁有海量數字資源的、具有高技術水平的國家藝術資源中心,以中心集成系統與云計算平臺等技術手段建設功能完善、資源豐富、技術先進的分布式藝術數字圖書館網絡;深化技術支撐環境建設,為藝術數字網絡圖書館建設提供有力的技術保障。同時,不斷強化藝術數字資源服務體系建設,依據相關知識產權的法律法規,為全國藝術院校和社會文化藝術部門提供數字資源服務,以充分發揮教育資源的社會效益;不斷加強藝術數字圖書館領域的對外合作與交流,以開放的姿態在全球范圍開展包括資源、技術、人才、服務等多方面的交流與合作,提高我國藝術數字圖書館在國際上的影響力,促使我國在大規模藝術數字圖書館建設和信息服務領域向世界先進水平邁進。
數字化圖書館本質上是一種現代技術條件下的圖書館網絡,是圖書館網絡的擴展。國外最著名的例子莫過于美國的OCLC(聯機計算機圖書館中心)。1967年美國俄亥俄州12所大學圖書館合作建立俄亥俄州大學圖書館中心時,其目的在于緩解各館經費緊張的局面并實現資源共享。但伴隨與美國國會圖書館合作實現聯機編目和書目數據的數字化,其網絡規模隨之擴大。特別是20世紀90年代初,OCLC在實現了圖書館業務信息數字化的基礎上,發展了數字化多媒體的全文檢索系統SiteSearch和SiteSearchWebZ,使其連接和檢索的網絡數字圖書館規模快速增加。據最新統計,通過該系統可檢索覆蓋各領域和學科的數據庫多達70個,用戶來自109個國家和地區的55000多個圖書館,收集館藏信息10億多條,并和用戶館的館藏資源進行整合,OCLC現已成為世界規模最大的圖書館網絡[3]。值得關注的是OCLC和美國國會圖書館在書目控制和數字化方面的密切合作,使其逐步成為美國國家數字化圖書館網絡,為其發展奠定了組織基礎;網絡技術和SiteSearch系統的研發為其發展提供了技術支撐。
目前,我國數字化圖書館建設雖然還處于初期階段,但也不乏成功案例。“國家科學數字圖書館”和“中國數字圖書館”、CADAL、CASHL等一批數字化項目的建設,從“組織”模式到“技術”支撐,有著符合中國國情且值得研究和借鑒的經驗。數字圖書館標準與規范建設項目(CDLS)[4]針對數字圖書館資源加工、描述、組織、服務和長期保存制定的我國數字圖書館發展戰略與框架、數字圖書館核心標準規范體系及其開放建設與開放應用機制,為藝術數字圖書館的建設提供了從構建策略到技術標準的一系列參照體系。CALIS“全國高校專題特色數據庫項目”[5]的成功實踐,也為建設“國家藝術資源中心”積累了經驗。
國家藝術資源中心的建設遵循“分散建設、統一檢索、資源共享”的原則,在“組織”層面上,由國家藝術資源中心門戶(管理機構)系統和分布式的藝術數字圖書館(骨干館和基層館)系統兩部分組成。“國家藝術資源中心”由國家性的、能夠協調三大系列圖書館(公共圖書館、高校圖書館和科學院圖書館)的管理機構擔任;“骨干館”由館藏藝術資源豐富、現代化程度高的大型圖書館(重點藝術院校圖書館、國家大型藝術館和博物館)擔任;“基層館”為遍布全國的中小型圖書館。骨干館和基層館在一個平行的網絡結構上,其為中心門戶提供資源信息的功能與權限是一樣的,它們根據各自的館藏特色和網絡建設需求,分工協作。骨干館以其豐富的館藏資源和技術、人才實力,成為網上數字信息的主要提供者;基層館通過網絡連接,一方面享受“中心”和骨干館的信息業務服務,一方面憑借館藏特色參與建設。在“技術”層面上,各藝術院校統一建庫標準、統一元數據集和服務功能要求。藝術資源中心門戶系統采用OAI協議收割參建單位的元數據,建立藝術特色元數據庫,以中心集成系統與云計算平臺等技術手段在統一系統框架下形成系統之間的信息共享和信息交換機制,實現全國藝術數字圖書館的資源整合并與國際互聯網對接(其建設模型見圖1)。

各藝術院校數字圖書館既是藝術數字圖書館網絡的組成部分,又是獨立的、服務功能完備的集數字化館藏資源、網絡虛擬資源、商業數據庫、聯機目錄為一體的數據庫網絡平臺。如美術數字圖書館由美術作品檢索系統、美術家信息檢索系統、美術文獻檢索系統、美術作品展示與欣賞系統、數字圖書、期刊、虛擬資源等組成。其中,美術作品檢索系統、美術文獻檢索系統和美術家信息檢索系統是自建數據庫最具館藏特色的核心組成部分(見圖2)。

為確保建庫質量與實現資源共享,建庫系統應采用先進、成熟的技術平臺。該平臺與“國家藝術資源中心服務系統”一起形成統一元數據集和分散對象數據的二級系統構架,與中心服務系統遵循相同的標準和規范。建庫平臺應具備的基本功能:①對象數據加工和各類電子資源的導入與格式轉換功能。②原數據標引功能:系統能夠預置原數據模板;用戶可根據特色庫規范注冊新的原數據格式,并自定義模板;提供多種原數據格式的轉換工具;編輯器模板的功能菜單應齊全并有較強的適用性;具有對著錄內容進行全域修改等功能。③保存和輸出功能:系統應有審校功能,可按文獻類型分庫保存原數據。可選擇導入導出格式,具有單個和批量導出功能。④統計與檢索功能:可對用戶著錄進行統計;提供基本檢索、高級檢索、二次檢索等檢索方式。⑤信息發布功能:提供多種發布模板,也可自建發布模板。⑥系統管理及維護功能等。目前國內數據庫加工系統有TPI、TRS、麥達、方正、快威、義華等10余種。建庫系統的選擇應以遵循“先進性、標準化、開放性、安全性、易用性和可擴展性”為原則[6]。
藝術數字圖書館數字資源來源主要包括3部分:一是館藏藝術品實物,如文物、雕塑、書法、繪畫作品等;二是紙質文獻,如圖書、期刊、繪畫、書法、古籍、拓片、畫冊等。三是原生數字文獻,如選購的商業電子文獻或數據庫、搜集的網絡文獻等。所謂基礎數據的整合就是依照“我國數字圖書館標準規范建設”的標準,通過掃描或數碼照相、圖像處理、OCR識別、數據庫平臺轉換、壓縮等方式將上述各類文獻加工、合成為具有完整信息的適應數字圖書館需求格式的圖像數據,經過分類、標引、建立導航,歸類到數據庫各子庫中的過程。其中,數字圖像的加工、標引與檢索是有別于一般文獻數字化的焦點和難點,是數字資源建設的基礎。《數字資源加工標準與操作指南》[7]是我國數字化工作的權威指導體系,所有參建單位必須遵循該標準,對同一資源類型數據的編碼、格式、標識、主要參數(分辨率、色彩位深、文件格式、壓縮率等)、應用級別(檔案典藏級、復制加工級、瀏覽級等)、安全保護(數字水印、加密方案)等屬性內容統一加工標準與操作規范,才能有效保障加工生產的數字對象具有可靠的質量和通用性。
4.3.1 靜態圖像標引與元數據設計
圖像檢索技術發展到現在大致經歷了兩個階段:基于文本的檢索和基于內容的檢索。因此,數字化圖像的標引也因循兩種方案:一是對數字圖像源采用基于傳統的、按其學科分類的、文本方式的方法對其進行加工、標引與存儲;二是對數字圖像源采用基于圖像內容的標引方法進行加工、標引與存儲。
●基于文本方式的圖像標引與元數據設計
基于文本的圖像標引是在對圖像進行分析的基礎上,先對圖像文件建立相應的關鍵詞或描述字段,按照元數據方案和規范著錄與標引,將圖像的存儲路徑與關鍵字段對應起來,以結構化查詢語言(SQL)或超鏈接方式進行檢索,其實質是把圖像檢索轉化為與圖像對應的技術成熟的文本檢索。該方法關鍵在于關鍵字段的選取和描述性元數據的建立。
關鍵字段的選取是從目錄學的角度,對圖片內容的諸多著錄項目依照一定的著錄法則選取關鍵詞進行著錄標引,同時兼顧到圖片數據庫元數據制訂時圖片元素名稱與著錄項目的對應關系。關鍵字段選取的數量和揭示文獻的準確度決定了標引的深度和質量。
元數據是關于數據的數據。元數據包括結構型元數據、管理型元數據和描述性元數據。其中,描述性元數據是用來描述或識別信息資源的元數據。都柏林核心元數據集(簡稱DC)因其簡潔性、易于理解性和可擴展性,成為國際通用標準。我國CALIS中心發布的11種元數據規范及其著錄規則,即是參考DC制定的元數據標準。它基本涵蓋了各種文獻資源類型元數據的參照需求。但由于它對著錄對象的描述深度不夠,不能勝任專指度較高的檢索。國外的CDWA、VRA和REACH是3種專門針對藝術類可視資料的元數據標準[8]。目前,在國家沒有制定和出臺藝術類可視資源元數據標準的情況下,可以根據不同資源對象的特點選用已發布的元數據規范與規則,制定所需的元素和修飾詞,或者從其他元數據標準中復用擴展元素或修飾詞,建立元數據方案,報請國家藝術資源中心門戶核查、批準和統一收集。以便在“中心”的統一管理下,形成相對統一的元數據標準,以有利于將來整合到國家制定的統一元數據標準體系中。
數字圖像資源庫元數據方案設計和標引的操作過程大致是:首先根據元數據規范制定適合建庫需要的圖像資源對象元數據著錄工作單,依據工作單在建庫系統中分別建立不同的數據庫子庫,并在不同的子庫中建立相應的元數據模板。然后,將分門別類的圖像數據在其歸屬的子庫元數據模板中,進行標引和著錄,繼而建立關鍵詞和圖像文件的鏈接與對應關系;用戶通過數據庫平臺的導航索引或關鍵詞索引及其他檢索功能實現所需圖像文件的獲取。
●基于圖像內容的圖像標引與檢索技術
基于內容的圖像標引是直接根據圖像內容的各種特征來提取特征向量,并在圖像存入圖像數據庫的同時,將其相應的特征向量經過編碼后也存入與圖像數據庫相連的特征庫。在圖像檢索時,對查詢圖像進行分析并提取該圖像的特征向量,與其特征庫中的特征向量匹配,進而獲取圖像。具體來講,在建立圖像數據庫端,系統直接對輸入圖像的內容進行分析,根據系統所支持的各種圖像數據描述模型提取圖像的視覺特征(圖像的顏色、輪廓、形狀、紋理和空間特征)保存在特征庫中,并對特征庫建立索引(采用特征索引結構技術,諸如直方圖、顏色矩、顏色集等多種表征圖像特征的方法)以提高檢索效率。在用戶查詢端,用戶通過查詢接口(采用圖像的用戶查詢技術)表達其查詢后,系統將查詢要求用系統所支持的視覺特征中的一種或幾種的組合來表示。圖像匹配模塊根據系統相似性度量的算法計算查詢特征與特征庫中對應的每組特征的相似程度,把所得結果由大到小排序后得到一個匹配圖像序列返回給用戶。在檢索過程中,可以通過人機交互,對檢索的結果逐步求精,不斷縮小匹配集合的范圍,從而定位到目標。
4.3.2 動態視頻圖像的標引與檢索原理
動態視頻圖像的標引過程包括片斷截取、建立描述框體和運動對象分層描述等幾個步驟。首先對一段視頻圖像分段抽樣,抽取有代表性的特征,然后通過框體把動態片斷同已有的靜態圖像一樣對待,將視頻圖像運動變化的部分從背景中分離出來單獨描述。視頻圖像被典型地分割為一幀幀的系列圖片。視頻圖像中的鏡頭分割是視頻分析中的最基本內容,主要目的是識別鏡頭的切換。鏡頭切換有突變和漸變,突變是指一個鏡頭與另一個鏡頭之間沒有過渡,漸變是指一個鏡頭到另一個鏡頭的過渡過程沒有明顯的鏡頭跳躍。視頻分割成鏡頭后要從每個鏡頭中抽取代表幀,代表幀是描述鏡頭的關鍵因素,它反映了鏡頭的主要內容。兩個鄰近的幀在視頻分割突變的時候,在像素模式上有很大的不同,因此,選取代表幀是視頻圖像處理的重要環節,這一環節做好了,就可以像處理靜態圖像一樣,對視頻圖像進行檢索。
信息發布是利用平臺系統的“數據庫發布向導”的發布模板進行設計和發布的。
①首先選擇要發布的數據庫,配置數據庫版權信息,選擇“數據庫發布”菜單命令和適合內容發布的模板。
②定制發布字段。在發布模板中設置圖像檢索的概覽字段和細覽字段。可將數字圖像元數據的全部字段引入庫字段表中,根據要求,在編輯字段工具欄中設置必備字段和可選字段。
③配置檢索選項。分為分類檢索和字段檢索兩種,分類檢索是根據字段分類信息,從分類導航樹上檢索出符合某一分類的文獻。導航類目為讀者提供了多種檢索途徑。系統自帶中圖法分類導航樹,也可根據需要自建其他分類導航樹。在選定分類體系的基礎上,系統自動生成導航樹,只要將記錄拖動到相應的結點,系統就可記錄下對應的分類號,建立導航檢索。字段檢索則是按字段信息進行的檢索,分專項檢索和組合檢索。專項檢索對某一特定的字段檢索,組合檢索可使用戶利用多種運算符構造的檢索式(比較運算符、邏輯運算符、屬性運算符、限定運算符和加權運算符等)進行檢索。
④選擇和設計發布頁面。一般而言,系統自帶多種發布頁面模板,也提供自行設計功能。數據庫界面是數據庫內容信息展示的平臺和窗口,其信息檢索途徑是否清晰方便、結果顯示是否快捷明了、“簡介”和“使用說明”是否清楚明白、背景字段顏色設計的好壞,將直接影響數據庫的使用效果。
分布式高校藝術數字網絡圖書館的建設是一項系統工程,需要系統化的支撐機制。硬件設施和技術保障只是其支撐機制的基礎。此外,還涉及明確的建設目標、任務和責任、強有力的資助政策、相適應的知識產權保護政策,保障建設順利進行的組織機構和運行機制、科學有效的評價機制和完善的監督管理機制、人才培養機制及其開放的對外合作交流機制等。藝術數字圖書館建設是藝術院校圖書館發展的必經之路。“國家藝術資源中心”的建設不僅能夠滿足我國藝術教育、藝術創新和社會主義精神文明建設對藝術信息的需求,而且對于弘揚中國文化有著深刻的戰略意義。
[1] 張麗霞,李明珍,劉旭.中國一流大學圖書館特色資源探微——以清華、北大等16所大學圖書館為例[J].情報雜志,2008(9):66-68.
[2] 張麗霞.中國一流大學圖書館“特色資源”跟蹤調查與研究[J].圖書情報工作,2009(10):77-80.
[3] 清華大學OCLC服務中心.OCLC簡介.[2010-08-05].http:∥www.lib.tsinghua.edu.cn/service/OCLC.htm l.
[4] 中國數字圖書館標準規范建設.[2010-08-10].http:∥cdls.nstl.gov.cn/cdls2/w3c/.
[5] 中國高等教育文獻保障系統.[2010-08-10].http:∥www.calis.edu.cn/calisnew/calis_index.asp?fid=3&class=5.
[6] 索傳軍.論數字館藏的質量評價[J].中國圖書館學報,2004(4):43-44.
[7]《我國數字圖書館標準規范建設》課題組.《數字資源加工標準與操作指南》研究報告.[2010-08-20].http:∥cdls.nstl.gov.cn/2003/Whole/TecReports.htm l.
[8] 肖瓏.元數據格式在數字圖書館中的應用[J].大學圖書館學報,1999(4):18-24.